Що таке тренер зі штучного інтелекту?

Штучний інтелект іноді здається магічним трюком. Ви вводите випадкове запитання, і бам — за лічені секунди з’являється витончена, відшліфована відповідь. Але ось у чому вся суть: за кожною «геніальною» машиною стоять реальні люди, які підштовхують, виправляють та формують її по ходу справи. Цих людей називають тренерами ШІ , і робота, яку вони виконують, дивніша, кумедніша та, чесно кажучи, людяніша, ніж більшість людей вважає.

Давайте розглянемо, чому ці тренери важливі, як насправді виглядає їхній повсякденний день і чому ця роль розквітає швидше, ніж хтось передбачав.

Статті, які вам, можливо, буде цікаво прочитати після цієї:

🔗 Що таке арбітраж на основі штучного інтелекту: правда, що стоїть за модним терміном
Пояснює арбітраж на основі штучного інтелекту, його ризики, переваги та поширені помилкові уявлення.

🔗 Вимоги до зберігання даних для штучного інтелекту: що вам дійсно потрібно знати
Охоплює потреби у сховищі даних, масштабованість та ефективність систем штучного інтелекту.

🔗 Хто батько штучного інтелекту?
Досліджує піонерів штучного інтелекту та витоки штучного інтелекту.

Що робить тренера зі штучного інтелекту надійним? 🏆

Це не робота, де потрібно тиснути на кнопки. Найкращі тренери спираються на досить дивне поєднання талантів:

Терпіння (багато) – Моделі не навчаються за один раз. Тренери постійно вводять одні й ті ж виправлення, поки вони не закріпляться.
Виявлення нюансів – саме вміння розпізнавати сарказм, культурний контекст чи упередженість надає людському зворотному зв’язку переваги [1].
Просте спілкування – половина роботи полягає в написанні чітких інструкцій, які штучний інтелект не зможе неправильно прочитати.
Допитливість + етика – хороший тренер ставить під сумнів, чи є відповідь «фактично правильною», але соціально невідповідною – головна тема в нагляді за ШІ [2].

Простіше кажучи: тренер — це частково вчитель, частково редактор і трохи етик.

Ролі тренера ШІ з першого погляду (з деякими особливостями 😉)

Тип ролі	Хто найкраще підходить	Типова оплата	Чому це працює (або ні)
Маркувальник даних	Люди, які люблять дрібні деталі	Низький–Середній $$	Абсолютно важливо; якщо мітки недбалі, страждає вся модель [3] 📊
Спеціаліст з RLHF	Письменники, редактори, аналітики	Середній–Високий $$	Ранжує та переписує відповіді, щоб узгодити тон та ясність з людськими очікуваннями [1]
Тренер домену	Адвокати, лікарі, експерти	По всій карті 💼	Обробляє нішевий жаргон та периферійні випадки для галузевих систем
Рецензент безпеки	Люди, які цінують етику	Середній $$	Застосовує рекомендації, щоб ШІ уникав шкідливого контенту [2][5]
Креативний тренер	Художники, оповідачі	Непередбачуваний 💡	Допомагає ШІ відтворювати уяву, залишаючись у безпечних межах [5]

(Так, форматування трохи безладне — як і сама робота.)

День з життя тренера зі штучного інтелекту

Тож як виглядає сама робота? Менше — це гламурне кодування, а більше:

Ранжування відповідей, написаних штучним інтелектом, від найгіршої до найкращої (класичний крок RLHF) [1].
Виправлення непорозумінь (наприклад, коли модель забуває, що Венера — це не Марс).
Переписування відповідей чат-бота, щоб вони звучали природніше.
Маркування гір тексту, зображень чи аудіо – де точність дійсно важлива [3].
Дискусія про те, чи є «технічно правильно» достатньою нормою, чи правила безпеки повинні мати перевагу [2].

Це частково мучительно, частково головоломка. Чесно кажучи, уявіть, що ви вчите папугу не просто говорити, а й перестати використовувати слова трохи неправильно — ось така атмосфера. 🦜

Чому кросівки важливіші, ніж ви думаєте

Без людського керування, ШІ б:

Звучить жорстко та роботизовано.
Поширювати упередженість безконтрольно (страшна думка).
Зовсім бракує гумору чи емпатії.
Будьте менш обережні в делікатних контекстах.

Тренери – це ті, хто непомітно впроваджує «брудні людські речі» – сленг, теплоту, час від часу незграбні метафори – водночас встановлюючи захисні огорожі для безпеки [2][5].

Навички, які дійсно мають значення

Забудьте про міф про те, що вам потрібен ступінь доктора філософії. Найбільше допомагає:

Письменницькі + редагувальні роботи - Відшліфований, але природно звучачий текст [1].
Аналітичне мислення — виявлення повторюваних помилок моделі та їх коригування.
Культурна обізнаність – знання того, коли фразування може бути неправильним [2].
Терпіння – бо ШІ не сприймає все миттєво.

Бонусні бали за багатомовні навички або спеціалізацію в певній галузі.

Де з'являються тренери 🌍

Ця робота стосується не лише чат-ботів — вона проникає в кожен сектор:

Охорона здоров'я – правила написання анотацій для пограничних випадків (відображено в рекомендаціях щодо штучного інтелекту в охороні здоров'я) [2].
Фінанси - Навчання систем виявлення шахрайства без зараження людей хибними тривогами [2].
Роздрібна торгівля – Навчання асистентів розмовляти сленговим жаргоном покупців, дотримуючись при цьому тону бренду [5].
Освіта – Формування репетиторських ботів таким чином, щоб вони були заохочуючими, а не поблажливими [5].

По суті: якщо ШІ сидить за столом, то на задньому плані ховається тренер.

Етична частина (це не можна пропустити)

Ось тут це і стає важливим. Якщо його не контролювати, ШІ повторює стереотипи, дезінформацію або щось гірше. Тренери зупиняють це, використовуючи такі методи, як RLHF або конституційні правила, які спрямовують моделі до корисних, нешкідливих відповідей [1][5].

Приклад: якщо бот пропонує упереджені рекомендації щодо роботи, тренер позначає це, переписує правила та стежить, щоб це не повторилося. Це і є недогляд у дії [2].

Не дуже весела сторона

Не все так гладко. Тренери мають справу з:

Монотонність – нескінченне навішування ярликів набридає.
Емоційна втома – перегляд шкідливого або тривожного контенту може мати негативні наслідки; системи підтримки мають вирішальне значення [4].
Відсутність визнання – користувачі рідко усвідомлюють існування тренерів.
Постійні зміни – інструменти розвиваються безперервно, а це означає, що тренери повинні йти в ногу з часом.

Однак багатьох захоплює те, що ми формуємо «мізки» технологій.

Приховані MVP ШІ

Отже, хто такі тренери зі штучного інтелекту? Вони є містком між сирими алгоритмами та системами, які дійсно працюють для людей. Без них ШІ був би схожим на бібліотеку без бібліотекарів — тонни інформації, але майже неможливою для використання.

Наступного разу, коли чат-бот розсмішить вас або змусить вас відчути себе напрочуд «налаштованим», подякуйте тренеру. Це тихі фігури, які змушують машини не просто обчислювати, а й з’єднуватися [1][2][5].

Посилання

[1] Оуян, Л. та ін. (2022). Навчання мовних моделей для виконання інструкцій з людським зворотним зв'язком (InstructGPT). NeurIPS. Посилання

[2] NIST (2023). Система управління ризиками штучного інтелекту (AI RMF 1.0). Посилання

[3] Норткатт, К. та ін. (2021). Поширені помилки позначок у тестових наборах дестабілізують показники машинного навчання. Набори даних та показники NeurIPS. Посилання

[4] ВООЗ/МОП (2022). Керівні принципи щодо психічного здоров’я на робочому місці. Посилання

[5] Бай, Ю. та ін. (2022). Конституційний ШІ: нешкідливість від зворотного зв'язку ШІ. arXiv. Посилання

Знайдіть найновіший штучний інтелект в офіційному магазині помічників зі штучним інтелектом

Про нас

Повернутися до блогу

Країна/регіон