Ви коли-небудь чухали потилицю і думали… звідки ж це все береться ? Я маю на увазі, що ШІ не нишпорить у запилених бібліотечних стопках і не переглядає непомітно короткометражки на YouTube. Проте якимось чином він видає відповіді на всі питання — від лайфхаків з лазаньєю до фізики чорних дір — ніби всередині є якась бездонна картотека. Реальність дивніша і, можливо, цікавіша, ніж ви гадаєте. Давайте трохи розберемося з нею (і так, можливо, розвінчаємо пару міфів по дорозі).
Це Чаклунство? 🌐
Це не чаклунство, хоча іноді так здається. Те, що відбувається «під капотом», — це, по суті, прогнозування шаблонів . Моделі великих мов (LLM) не зберігають факти так, як ваш мозок тримається за рецепт печива вашої бабусі; натомість вони навчені вгадувати наступне слово (лексему) на основі того, що було попереду [2]. На практиці це означає, що вони чіпляються за зв'язки: які слова поєднуються разом, як зазвичай формуються речення, як цілі ідеї будуються, як риштування. Ось чому результат звучить правильно, хоча — чесно кажучи — це статистична імітація, а не розуміння [4].
То що ж насправді робить інформацію, згенеровану штучним інтелектом, корисною ? Ось кілька речей:
-
Різноманітність даних – отримання даних з незліченних джерел, а не з одного вузького потоку.
-
Оновлення – без циклів оновлення швидко застаріває.
-
Фільтрація – в ідеалі виловлювання сміття до того, як воно просочиться всередину (хоча, будемо реалістами, ця сітка має дірки).
-
Перехресна перевірка – спираючись на авторитетні джерела (наприклад, NASA, ВООЗ, великі університети), що є обов’язковим елементом більшості посібників з управління штучним інтелектом [3].
І все ж, іноді воно впевнено вигадує. Ці так звані галюцинації ? По суті, відшліфовані нісенітниці, вимовлені з серйозним обличчям [2][3].
Статті, які вам, можливо, буде цікаво прочитати після цієї:
🔗 Чи може штучний інтелект передбачати номери лотереї
Дослідження міфів та фактів про прогнози лотереї на основі штучного інтелекту.
🔗 Що означає цілісний підхід до ШІ
Розуміння ШІ з урахуванням збалансованих поглядів на етику та вплив.
🔗 Що Біблія говорить про штучний інтелект
Вивчення біблійних поглядів на технології та створення людини.
Швидке порівняння: Звідки береться ШІ 📊
Не кожне джерело однакове, але кожне відіграє свою роль. Ось короткий огляд.
Тип джерела | Хто ним користується (ШІ) | Вартість/цінність | Чому це працює (або ні...) |
---|---|---|---|
Книги та статті | Великі мовні моделі | Безцінний (мабуть) | Щільні, структуровані знання просто швидко старіють. |
Вебсайти та блоги | Майже всі штучні інтелекти | Вільний (з шумом) | Дикий сорт; суміш блиску та повного сміття. |
Академічні статті | Штучні інтелекти, що потребують багато досліджень | Іноді платний доступ | Строгість + достовірність, але викладено у важкій термінології. |
Дані користувача | Персоналізовані штучні інтелекти | Дуже чутливий ⚠️ | Чіткий крій, але безмежні проблеми з конфіденційністю. |
Веб у реальному часі | ШІ, пов'язані з пошуком | Безкоштовно (якщо онлайн) | Зберігає актуальність інформації; недоліком є ризик поширення чуток. |
Всесвіт навчальних даних 🌌
Це фаза «навчання в дитинстві». Уявіть, що ви даєте дитині мільйони книжок з казками, вирізок з новин та «кролячих нір» Вікіпедії одночасно. Ось так виглядає попереднє навчання. У реальному світі постачальники послуг об’єднують загальнодоступні дані, ліцензовані джерела та текст, згенерований тренером [2].
Зверху: кураторські приклади з людської точки зору – хороші відповіді, погані відповіді, підштовхування у правильному напрямку – ще до того, як почнеться підкріплення [1].
Застереження щодо прозорості: компанії не розкривають кожну деталь. Деякі обмеження пов'язані з секретністю (інтелектуальна власність, проблеми безпеки), тому ви отримуєте лише часткове уявлення про фактичну ситуацію [2].
Пошук у реальному часі: Додатковий топінг 🍒
Деякі моделі тепер можуть зазирнути за межі своєї навчальної бульбашки. Це називається генерацією з доповненим пошуком (RAG) – по суті, витягування фрагментів з активного індексу або сховища документів, а потім вплетення їх у відповідь [5]. Ідеально підходить для швидкозмінних даних, таких як заголовки новин або ціни на акції.
У чому проблема? Інтернет — це одночасно геніальність і сміття. Якщо фільтри або перевірки походження слабкі, ви ризикуєте потраплянням небажаних даних назад — саме про це попереджають системи управління ризиками [3].
Поширений спосіб вирішення проблеми: компанії підключають моделі до власних внутрішніх баз даних, тому у відповідях посилаються на поточну політику управління персоналом або оновлену документацію продукту, а не на іронічну реакцію. Подумайте: менше моментів «о-о», більше достовірних відповідей.
Точне налаштування: крок полірування ШІ 🧪
Сирі попередньо навчені моделі незграбні. Тому їх потрібно точно налаштувати :
-
Навчання їх бути корисними, нешкідливими, чесними (за допомогою навчання з підкріпленням від людського зворотного зв'язку, RLHF) [1].
-
Шліфування небезпечних або токсичних країв (вирівнювання) [1].
-
Коригування тону — дружнього, офіційного чи грайливо-саркастичного.
Це не стільки полірування діаманта, скільки спричинення статистичної лавини, щоб поводитись більше як співрозмовник.
Невдачі та невдачі 🚧
Не будемо вдавати, що це бездоганно:
-
Галюцинації – чіткі відповіді, які є відверто неправильними [2][3].
-
Упередженість – вона відображає закономірності, закладені в дані; може навіть посилювати їх, якщо її не контролювати [3][4].
-
Без власного досвіду — може розповідати про рецепти супів, але ніколи не куштувала жодного [4].
-
Надмірна впевненість – текст викладається так, ніби знає, навіть коли це не так. Структури ризиків наголошують на позначенні припущень [3].
Чому це відчувається як знання 🧠
У нього немає переконань, немає пам'яті в людському розумінні і, звичайно ж, немає власного «я». Однак, оскільки він плавно зв'язує речення, ваш мозок зчитує це так, ніби розуміє . Те, що відбувається, — це просто масштабне прогнозування наступного жетона : обробка трильйонів ймовірностей за частки секунди [2].
Ефект «інтелекту» – це емерджентна поведінка, яку дослідники називають, трохи жартома, «стохастичного папуги» [4].
Аналогія для дітей 🎨
Уявіть собі папугу, який прочитав усі книги в бібліотеці. Він не розуміє історій, але може переробити слова у щось мудре. Іноді це влучно, іноді нісенітниця, але з достатньою кмітливістю не завжди можна помітити різницю.
Підсумовуючи: Звідки береться інформація у ШІ 📌
Простими словами:
-
Масивні навчальні дані (публічні + ліцензовані + згенеровані тренерами) [2].
-
Точне налаштування за допомогою людського зворотного зв'язку для формування тону/поведінки [1].
-
Системи пошуку даних при підключенні до потоків даних у реальному часі [5].
Штучний інтелект нічого не «знає» — він передбачає текст . Це і його суперсила, і його ахіллесова п'ята. Суть? Завжди перевіряйте важливу інформацію з надійним джерелом [3].
Посилання
-
Оуян, Л. та ін. (2022). Навчання мовних моделей для виконання інструкцій з використанням людського зворотного зв'язку (InstructGPT) . arXiv .
-
OpenAI (2023). Технічний звіт GPT-4 – поєднання ліцензованих, публічних та створених людиною даних; мета та обмеження прогнозування наступного токена. arXiv .
-
NIST (2023). Структура управління ризиками штучного інтелекту (AI RMF 1.0) – походження, надійність та засоби контролю ризиків. PDF .
-
Бендер, Е.М., Гебру, Т., Макміллан-Мейджор, А., Мітчелл, С. (2021). Про небезпеки стохастичних папуг: чи можуть мовні моделі бути занадто великими? PDF .
-
Льюїс, П. та ін. (2020). Генерація з доповненим пошуком даних для знаннєво-місткого НЛП . arXiv .