звідки ШІ отримує інформацію

Звідки ШІ отримує свою інформацію?

Ви коли-небудь чухали потилицю і думали… звідки ж це все береться ? Я маю на увазі, що ШІ не нишпорить у запилених бібліотечних стопках і не переглядає непомітно короткометражки на YouTube. Проте якимось чином він видає відповіді на всі питання — від лайфхаків з лазаньєю до фізики чорних дір — ніби всередині є якась бездонна картотека. Реальність дивніша і, можливо, цікавіша, ніж ви гадаєте. Давайте трохи розберемося з нею (і так, можливо, розвінчаємо пару міфів по дорозі).


Це Чаклунство? 🌐

Це не чаклунство, хоча іноді так здається. Те, що відбувається «під капотом», — це, по суті, прогнозування шаблонів . Моделі великих мов (LLM) не зберігають факти так, як ваш мозок тримається за рецепт печива вашої бабусі; натомість вони навчені вгадувати наступне слово (лексему) на основі того, що було попереду [2]. На практиці це означає, що вони чіпляються за зв'язки: які слова поєднуються разом, як зазвичай формуються речення, як цілі ідеї будуються, як риштування. Ось чому результат звучить правильно, хоча — чесно кажучи — це статистична імітація, а не розуміння [4].

То що ж насправді робить інформацію, згенеровану штучним інтелектом, корисною ? Ось кілька речей:

  • Різноманітність даних – отримання даних з незліченних джерел, а не з одного вузького потоку.

  • Оновлення – без циклів оновлення швидко застаріває.

  • Фільтрація – в ідеалі виловлювання сміття до того, як воно просочиться всередину (хоча, будемо реалістами, ця сітка має дірки).

  • Перехресна перевірка – спираючись на авторитетні джерела (наприклад, NASA, ВООЗ, великі університети), що є обов’язковим елементом більшості посібників з управління штучним інтелектом [3].

І все ж, іноді воно впевнено вигадує. Ці так звані галюцинації ? По суті, відшліфовані нісенітниці, вимовлені з серйозним обличчям [2][3].

Статті, які вам, можливо, буде цікаво прочитати після цієї:

🔗 Чи може штучний інтелект передбачати номери лотереї
Дослідження міфів та фактів про прогнози лотереї на основі штучного інтелекту.

🔗 Що означає цілісний підхід до ШІ
Розуміння ШІ з урахуванням збалансованих поглядів на етику та вплив.

🔗 Що Біблія говорить про штучний інтелект
Вивчення біблійних поглядів на технології та створення людини.


Швидке порівняння: Звідки береться ШІ 📊

Не кожне джерело однакове, але кожне відіграє свою роль. Ось короткий огляд.

Тип джерела Хто ним користується (ШІ) Вартість/цінність Чому це працює (або ні...)
Книги та статті Великі мовні моделі Безцінний (мабуть) Щільні, структуровані знання просто швидко старіють.
Вебсайти та блоги Майже всі штучні інтелекти Вільний (з шумом) Дикий сорт; суміш блиску та повного сміття.
Академічні статті Штучні інтелекти, що потребують багато досліджень Іноді платний доступ Строгість + достовірність, але викладено у важкій термінології.
Дані користувача Персоналізовані штучні інтелекти Дуже чутливий ⚠️ Чіткий крій, але безмежні проблеми з конфіденційністю.
Веб у реальному часі ШІ, пов'язані з пошуком Безкоштовно (якщо онлайн) Зберігає актуальність інформації; недоліком є ​​ризик поширення чуток.

Всесвіт навчальних даних 🌌

Це фаза «навчання в дитинстві». Уявіть, що ви даєте дитині мільйони книжок з казками, вирізок з новин та «кролячих нір» Вікіпедії одночасно. Ось так виглядає попереднє навчання. У реальному світі постачальники послуг об’єднують загальнодоступні дані, ліцензовані джерела та текст, згенерований тренером [2].

Зверху: кураторські приклади з людської точки зору – хороші відповіді, погані відповіді, підштовхування у правильному напрямку – ще до того, як почнеться підкріплення [1].

Застереження щодо прозорості: компанії не розкривають кожну деталь. Деякі обмеження пов'язані з секретністю (інтелектуальна власність, проблеми безпеки), тому ви отримуєте лише часткове уявлення про фактичну ситуацію [2].


Пошук у реальному часі: Додатковий топінг 🍒

Деякі моделі тепер можуть зазирнути за межі своєї навчальної бульбашки. Це називається генерацією з доповненим пошуком (RAG) – по суті, витягування фрагментів з активного індексу або сховища документів, а потім вплетення їх у відповідь [5]. Ідеально підходить для швидкозмінних даних, таких як заголовки новин або ціни на акції.

У чому проблема? Інтернет — це одночасно геніальність і сміття. Якщо фільтри або перевірки походження слабкі, ви ризикуєте потраплянням небажаних даних назад — саме про це попереджають системи управління ризиками [3].

Поширений спосіб вирішення проблеми: компанії підключають моделі до власних внутрішніх баз даних, тому у відповідях посилаються на поточну політику управління персоналом або оновлену документацію продукту, а не на іронічну реакцію. Подумайте: менше моментів «о-о», більше достовірних відповідей.


Точне налаштування: крок полірування ШІ 🧪

Сирі попередньо навчені моделі незграбні. Тому їх потрібно точно налаштувати :

  • Навчання їх бути корисними, нешкідливими, чесними (за допомогою навчання з підкріпленням від людського зворотного зв'язку, RLHF) [1].

  • Шліфування небезпечних або токсичних країв (вирівнювання) [1].

  • Коригування тону — дружнього, офіційного чи грайливо-саркастичного.

Це не стільки полірування діаманта, скільки спричинення статистичної лавини, щоб поводитись більше як співрозмовник.


Невдачі та невдачі 🚧

Не будемо вдавати, що це бездоганно:

  • Галюцинації – чіткі відповіді, які є відверто неправильними [2][3].

  • Упередженість – вона відображає закономірності, закладені в дані; може навіть посилювати їх, якщо її не контролювати [3][4].

  • Без власного досвіду — може розповідати про рецепти супів, але ніколи не куштувала жодного [4].

  • Надмірна впевненість – текст викладається так, ніби знає, навіть коли це не так. Структури ризиків наголошують на позначенні припущень [3].


Чому це відчувається як знання 🧠

У нього немає переконань, немає пам'яті в людському розумінні і, звичайно ж, немає власного «я». Однак, оскільки він плавно зв'язує речення, ваш мозок зчитує це так, ніби розуміє . Те, що відбувається, — це просто масштабне прогнозування наступного жетона : обробка трильйонів ймовірностей за частки секунди [2].

Ефект «інтелекту» – це емерджентна поведінка, яку дослідники називають, трохи жартома, «стохастичного папуги» [4].


Аналогія для дітей 🎨

Уявіть собі папугу, який прочитав усі книги в бібліотеці. Він не розуміє історій, але може переробити слова у щось мудре. Іноді це влучно, іноді нісенітниця, але з достатньою кмітливістю не завжди можна помітити різницю.


Підсумовуючи: Звідки береться інформація у ШІ 📌

Простими словами:

  • Масивні навчальні дані (публічні + ліцензовані + згенеровані тренерами) [2].

  • Точне налаштування за допомогою людського зворотного зв'язку для формування тону/поведінки [1].

  • Системи пошуку даних при підключенні до потоків даних у реальному часі [5].

Штучний інтелект нічого не «знає» — він передбачає текст . Це і його суперсила, і його ахіллесова п'ята. Суть? Завжди перевіряйте важливу інформацію з надійним джерелом [3].


Посилання

  1. Оуян, Л. та ін. (2022). Навчання мовних моделей для виконання інструкцій з використанням людського зворотного зв'язку (InstructGPT) . arXiv .

  2. OpenAI (2023). Технічний звіт GPT-4 – поєднання ліцензованих, публічних та створених людиною даних; мета та обмеження прогнозування наступного токена. arXiv .

  3. NIST (2023). Структура управління ризиками штучного інтелекту (AI RMF 1.0) – походження, надійність та засоби контролю ризиків. PDF .

  4. Бендер, Е.М., Гебру, Т., Макміллан-Мейджор, А., Мітчелл, С. (2021). Про небезпеки стохастичних папуг: чи можуть мовні моделі бути занадто великими? PDF .

  5. Льюїс, П. та ін. (2020). Генерація з доповненим пошуком даних для знаннєво-місткого НЛП . arXiv .


Знайдіть найновіший штучний інтелект в офіційному магазині помічників зі штучним інтелектом

Про нас

Повернутися до блогу