Як генеративний штучний інтелект сприяє розробці ліків?

Генеративний штучний інтелект сприяє відкриттю ліків, генеруючи молекули-кандидати, прогнозуючи їхні властивості та ефективніше досліджуючи біологічні гіпотези. Він дозволяє командам розширити можливості генерування ідей, надаючи більше можливостей для експериментального тестування.

Чи може генеративний штучний інтелект зменшити кількість експериментів, необхідних для розробки ліків?

Так, генеруючи широкий спектр молекул-кандидатів та гіпотез перед тестуванням, генеративний штучний інтелект дозволяє командам проводити менше «сліпих» експериментів, що зрештою максимізує ефективність процесу розробки ліків.

Які ключові переваги використання генеративного штучного інтелекту у розробці ліків?

Ключові переваги використання генеративного штучного інтелекту у розробці ліків включають швидші цикли ітерацій, покращене генерування гіпотез, розширені спільні обговорення між дисциплінами та можливість визначення пріоритетів експериментів на основі обґрунтованих прогнозів.

Яких запобіжних заходів слід вживати під час використання генеративного штучного інтелекту для розробки ліків?

Вкрай важливо забезпечувати жорсткі обмеження, перевіряти результати як гіпотези та підтримувати всебічну відстежуваність підказок та рішень, щоб запобігти потенційному неправильному використанню або неправильній інтерпретації результатів.

Як команди забезпечують надійність результатів генеративного штучного інтелекту?

Команди повинні розглядати результати генеративного штучного інтелекту як гіпотези, що потребують перевірки, підтверджувати їх за допомогою аналізів та ортогональних моделей, а також застосовувати фільтри для усунення безглуздих результатів, перш ніж продовжувати будь-які експериментальні плани.

Які типи молекул може допомогти виявити генеративний ШІ?

Генеративний штучний інтелект може допомогти у відкритті як малих молекул, так і біологічних препаратів, генеруючи послідовності-кандидати, пропонуючи модифікації та маршрути синтезу на основі заздалегідь визначених обмежень.

Чи потрібен людський нагляд під час використання генеративного штучного інтелекту для розробки ліків?

Так, людський нагляд є важливим для керівництва процесом, перевірки отриманих результатів та забезпечення відповідності висновків біологічним та хімічним знанням, що робить процес прийняття рішень більш надійним.

Які обмеження повинні бути враховані командами під час використання генеративного штучного інтелекту?

Команди повинні знати, що генеративний штучний інтелект іноді може видавати правдоподібні результати, які є неправильними. Технологія також може мати упередження, засновані на навчальних даних, що призводить до потенційних ризиків для якості результату.

Яка роль генеративного штучного інтелекту у відкритті ліків?

Коротка відповідь: генеративний штучний інтелект головним чином прискорює раннє відкриття ліків, генеруючи молекули-кандидати або послідовності білків, пропонуючи шляхи синтезу та висуваючи гіпотези, що підлягають перевірці, завдяки чому команди можуть проводити менше «сліпих» експериментів. Він працює найкраще, коли ви застосовуєте жорсткі обмеження та перевіряєте результати; якщо розглядати його як оракул, він може вводити в оману з упевненістю.

Ключові висновки:

Прискорення: Використовуйте GenAI для розширення генерації ідей, а потім звузьте її за допомогою ретельної фільтрації.

Обмеження: Вимагати діапазони властивостей, правила створення каркаса та обмеження новизни перед генерацією.

Валідація: Розглядайте результати як гіпотези; підтверджуйте за допомогою аналізів та ортогональних моделей.

Відстеження: реєструйте підказки, результати та обґрунтування, щоб рішення залишалися доступними для аудиту та перегляду.

Захист від зловживань: запобігання витокам інформації та надмірній впевненості за допомогою управління, контролю доступу та перевірки людиною.

Яка роль генеративного штучного інтелекту у відкритті ліків? Інфографіка

Статті, які вам, можливо, буде цікаво прочитати після цієї:

🔗 Роль штучного інтелекту в охороні здоров'я
Як штучний інтелект покращує діагностику, робочі процеси, догляд за пацієнтами та результати лікування.

🔗 Чи замінить штучний інтелект радіологів?
Досліджує, як автоматизація розширює радіологію та що залишається людським.

🔗 Чи замінить ШІ лікарів?
Чесний погляд на вплив штучного інтелекту на роботу та практику лікарів.

🔗 Найкращі інструменти лабораторії штучного інтелекту для наукових відкриттів
Найкращі інструменти лабораторії штучного інтелекту для пришвидшення експериментів, аналізу та досліджень.

Роль генеративного штучного інтелекту у відкритті ліків, одним словом 😮💨

Генеративний штучний інтелект допомагає командам розробників препаратів створювати молекули-кандидати, прогнозувати властивості, пропонувати модифікації, пропонувати шляхи синтезу, досліджувати біологічні гіпотези та скорочувати цикли ітерацій, особливо на ранніх етапах відкриття та оптимізації потенційних продуктів. Nature 2023 (огляд відкриття лігандів) Огляд Elsevier 2024 (генеративні моделі в de novo розробці ліків)

І так, він також може впевнено генерувати нісенітниці. Це частина угоди. Як дуже захоплений стажер з ракетним двигуном. Посібник клініциста (ризик галюцинацій) npj Digital Medicine 2025 (галюцинації + система безпеки)

Чому це важливіше, ніж люди визнають 💥

Багато досліджень – це «пошук». Пошук у хімічному просторі, пошук у біології, пошук у літературі, пошук взаємозв'язків структура-функція. Проблема полягає в тому, що хімічний простір… по суті, нескінченний. Звіти про хімічні дослідження 2015 (хімічний простір) Ірвін і Шойчет 2009 (шкала хімічного простору)

Ви можете витратити кілька життів, просто пробуючи «розумні» варіації.

Генеративний ШІ змінює робочий процес з:

«Давайте перевіримо, що ми можемо придумати»

до:

«Давайте створимо більший, розумніший набір варіантів, а потім протестуємо найкращі з них»

Йдеться не про виключення експериментів. Йдеться про вибір кращих експериментів. 🧠 Nature 2023 (огляд відкриття лігандів)

Також, і це недостатньо обговорюється, це допомагає командам спілкуватися між різними дисциплінами. Хіміки, біологи, фахівці з DMPK, фахівці з обчислювальної техніки… у кожного є різні ментальні моделі. Пристойна генеративна система може слугувати спільним блокнотом для малювання. Огляд Frontiers in Drug Discovery 2024.

Що робить генеративний ШІ гарною версією для розробки ліків? ✅

Не весь генеративний ШІ створений однаковим. «Хороша» версія для цієї області — це не стільки яскраві демонстрації, скільки нецікава надійність (нецікавість тут є перевагою). Nature 2023 (огляд відкриття лігандів)

Гарна система генеративного штучного інтелекту зазвичай має:

Заземлення предметної області: навчено або адаптовано до хімічних, біологічних та фармакологічних даних (не лише до загального тексту) 🧬 Огляд Elsevier 2024 (генеративні моделі)
Обмеження першого покоління: воно може підкорятися таким правилам, як діапазони ліпофільності, обмеження каркасу, особливості сайту зв'язування, цілі селективності JCIM 2024 (моделі дифузії в de novo розробці ліків) REINVENT 4 (відкритий каркас)
Усвідомлення властивостей: воно генерує молекули, які є не тільки новими, але й «не смішними» в термінології ADMET ADMETlab 2.0 (чому важливі ранні розробки ADMET)
Звітування про невизначеність: воно сигналізує, коли це припущення, а коли воно є надійним (навіть приблизний діапазон довіри допомагає) Принципи валідації QSAR ОЕСР (область застосування)
Контроль «людина в циклі»: хіміки можуть швидко керувати, відхиляти та направляти результати Nature 2023 (робочий процес + контекст технологій відкриттів)
Відстежуваність: ви можете побачити, чому виникла пропозиція (принаймні частково), або ви дієте наосліп згідно з рекомендаціями ОЕСР щодо QSAR (прозорість моделі + валідація)
Обладнання для оцінки: докінг, QSAR, фільтри, перевірки ретросинтезу - все підключено 🔧 Nature 2023 (огляд відкриття лігандів) Машинне навчання в CASP (Coley 2018)
Контроль зміщення та витоків: щоб уникнути непомітного запам'ятовування навчальних даних (так, таке трапляється) USENIX 2021 (вилучення навчальних даних) Vogt 2023 (проблеми новизни/унікальності)

Якщо ваш генеративний ШІ не може впоратися з обмеженнями, це, по суті, генератор новизни. Весело на вечірках. Менше веселощів у програмі боротьби з наркоманією.

Де генеративний штучний інтелект вписується в процес розробки ліків 🧭

Ось проста ментальна карта. Генеративний ШІ може зробити свій внесок майже на кожен етап, але він працює найкраще там, де ітерації є дорогими, а простір для гіпотез величезний. Nature 2023 (огляд відкриття лігандів)

Поширені точки дотику:

Виявлення та перевірка мішеней (гіпотези, картування шляхів, пропозиції щодо біомаркерів) Огляд Frontiers in Drug Discovery 2024
Ідентифікація хітів (доповнення віртуального скринінгу, генерація хітів de novo) Nature Biotechnology 2019 (GENTRL)
Оптимізація лідів (пропонування аналогів, багатопараметричне налаштування) REINVENT 4
Доклінічна підтримка (прогнозування властивостей ADMET, іноді підказки щодо рецептури) ADMETlab 2.0
CMC та планування синтезу (пропозиції щодо ретросинтезу, сортування маршрутів) AiZynthFinder 2020 Coley 2017 (комп'ютерний ретросинтез)
Робота зі знаннями (синтез літератури, огляди конкурентного середовища) 📚 Шаблони 2025 (LLM у розробці ліків)

У багатьох програмах найбільші перемоги походять від інтеграції робочих процесів, а не від того, що якась окрема модель є «геніальною». Модель – це двигун, а конвеєр – це машина. Nature 2023 (огляд відкриття лігандів)

Порівняльна таблиця: популярні генеративні підходи штучного інтелекту, що використовуються у розробці ліків 📊

Трохи недосконала таблиця, бо реальне життя трохи недосконале.

Інструмент / Підхід	Найкраще для (аудиторії)	Ціна приблизно	Чому це працює (і коли ні)
Генератори молекул de novo (SMILES, графіки)	Мед. хімія + комп. хімія	$$-$$$	Чудово швидко досліджує нові аналоги 😎 - але може виявляти нестабільні невідповідності REINVENT 4 GENTRL (Nature Biotech 2019)
Генератори білків / структур	Біологічні команди, структурна біологія	$$$	Допомагає пропонувати послідовності + структури, але «виглядає правдоподібно» не те саме, що «працює» AlphaFold (Nature 2021) RFdiffusion (Nature 2023)
Молекулярний дизайн у дифузійному стилі	Розширені команди машинного навчання	$$-$$$$	Сильний у обумовленні обмежень та різноманітності – налаштування може бути… цілим процесом JCIM 2024 (моделі дифузії) Огляд дифузії PMC 2025
Копілоти прогнозування властивостей (комбінація QSAR + GenAI)	DMPK, проектні команди	$$	Добре для сортування та ранжування — погано, якщо сприймати як євангеліє 😬 ОЕСР (домен застосовності) ADMETlab 2.0
Планувальники ретросинтезу	Хімічний процес, КМЦ	$$-$$$	Прискорює розробку маршрутів — для забезпечення доцільності та безпеки все ще потрібна залученість людей. AiZynthFinder 2020 Coley 2018 (CASP)
Мультимодальні лабораторні копілоти (текст + дані аналізу)	Перекладацькі команди	$$$	Корисно для отримання сигналів з різних наборів даних — схильний до надмірної впевненості, якщо дані неоднозначні Nature 2024 (пакетні ефекти в клітинній візуалізації) npj Digital Medicine 2025 (мультимодальний аналіз у біотехнологіях)
Асистенти з літератури та гіпотез	Усі, на практиці	$	Значно скорочує час читання, але галюцинації можуть бути слизькими, як зникаючі шкарпетки. Шаблони 2025 (LLM у розробці ліків). Посібник клініциста (галюцинації).
Моделі фундаментів власного виробництва	Великі фармацевтичні компанії, добре фінансовані біотехнології	$$$$	Найкращий контроль + інтеграція - також дороге та повільне у створенні (вибачте, це правда) Огляд Frontiers in Drug Discovery 2024

Примітки: ціни сильно варіюються залежно від масштабу, обчислювальних ресурсів, ліцензування та того, чи хоче ваша команда «підключи та працюй» чи «давайте побудуємо космічний корабель»

Більш детальний погляд: Генеративний ШІ для пошуку хітів та de novo дизайну 🧩

Це головний варіант використання: генерувати молекули-кандидати з нуля (або з каркасу), які відповідають цільовому профілю. Nature Biotechnology 2019 (GENTRL) REINVENT 4

Як це зазвичай працює на практиці:

Визначити обмеження
- клас-мішень, форма кишені зв'язування, відомі ліганди
- діапазони властивостей (розчинність, logP, PSA тощо) Ліпінський (контекст правила 5)
- обмеження новизни (уникайте відомих IP-зон) 🧠 Vogt 2023 (оцінка новизни)
Генерувати кандидатів
- стрибки з риштувань
- ріст фрагментів
- пропозиції щодо «прикраси цього ядра»
- багатоцільова генерація (зв'язування + проникність + нетоксичність) REINVENT 4 Elsevier 2024 (генеративні моделі)
Агресивно фільтруйте
- правила медичної хімії
- PAINS та реактивні групові фільтри Baell & Holloway 2010 (PAINS)
- перевірки синтезованості AiZynthFinder 2020
- докінг / оцінювання (недосконало, але корисно) Nature 2023 (огляд відкриття лігандів)
Виберіть невеликий набір для синтезу
- люди все ще вибирають, бо іноді можуть відчувати нісенітницю

Незручна правда: цінність полягає не лише в «нових молекулах». Це нові молекули, які мають сенс для обмежень вашої програми. Остання частина — це все. Nature 2023 (огляд відкриття лігандів)

Також, деяке перебільшення: коли все зроблено добре, може здаватися, що ви найняли команду невтомних молодших хіміків, які ніколи не сплять і ніколи не скаржаться. З іншого боку, вони також не розуміють, чому певна стратегія захисту є кошмаром, тому… баланс 😅.

Детальніше: Оптимізація лідів за допомогою генеративного штучного інтелекту (багатопараметричне налаштування) 🎛️

Оптимізація лідів – це те, де мрії ускладнюються.

Ви хочете:

підвищення потенції
вибірковість вгору
метаболічна стабільність
розчинність вгору
сигнали безпеки опущені
проникність «якраз»
І все ще бути синтезованим

Це класична багатоцільова оптимізація. Генеративний ШІ надзвичайно добре пропонує набір компромісних рішень, а не вдає, що існує одне ідеальне поєднання. REINVENT 4 Elsevier 2024 (генеративні моделі)

Практичні способи використання командами:

Аналогова пропозиція: «Створіть 30 варіантів, які зменшать кліренс, але збережуть ефективність»
Сканування замісників: кероване дослідження замість перерахування методом грубої сили
Стрибки по каркасу: коли ядро вдаряється об стіну (токсичність, IP або стабільність)
Пояснювальні пропозиції: «Ця полярна група може покращити розчинність, але може погіршити проникність» (не завжди правильно, але корисно)

Одне застереження: предиктори властивостей можуть бути крихкими. Якщо ваші навчальні дані не відповідають вашому хімічному ряду, модель може бути впевнено помилковою. Наприклад, дуже помилковою. І вона не буде червоніти. Принципи валідації QSAR ОЕСР (область застосування) Weaver 2008 (область застосування QSAR)

Більш детальний огляд: ADMET, токсичність та скринінг «будь ласка, не вбивайте програму» 🧯

ADMET – це те, де багато кандидатів тихо зазнають невдачі. Генеративний ШІ не вирішує проблеми біології, але може зменшити кількість помилок, яких можна уникнути. ADMETlab 2.0 Waring 2015 (відтік)

Поширені ролі:

прогнозування метаболічних зобов'язань (місця метаболізму, тенденції кліренсу)
позначання ймовірних мотивів токсичності (сповіщення, проксі-реактивні проміжні продукти)
оцінка діапазонів розчинності та проникності
пропонуючи модифікації для зменшення ризику hERG або покращення стабільності 🧪 FDA (ICH E14/S7B Q&A) EMA (огляд ICH E14/S7B)

Найефективніша схема виглядає так: використовувати GenAI для пропозиції варіантів, але використовувати спеціалізовані моделі та експерименти для перевірки.

Генеративний ШІ – це двигун генерування ідей. Валідація все ще існує в аналізах.

Більш детальний погляд: Генеративний ШІ для біологічних препаратів та білкової інженерії 🧬✨

Розробка ліків – це не лише малі молекули. Генеративний штучний інтелект також використовується для:

генерація послідовності антитіл
пропозиції щодо дозрівання спорідненості
покращення стабільності білка
ферментна інженерія
дослідження пептидної терапії ProteinMPNN (Наука 2022) Rives 2021 (моделі білкової мови)

Генерація білків та послідовностей може бути потужною, оскільки «мова» послідовностей напрочуд добре відповідає методам машинного навчання. Але ось випадковий зворотний шлях: вона добре відповідає… доки не перестане. Тому що імуногенність, експресія, патерни глікозилювання та обмеження розробки можуть бути жорстокими. AlphaFold (Nature 2021) ProteinGenerator (Nat Biotech 2024)

Отже, найкращі налаштування включають:

фільтри розроблюваності
оцінка ризику імуногенності
обмеження технологічності
цикли мокрої лабораторії для швидкої ітерації 🧫

Якщо ви їх пропустите, то отримаєте чудову послідовність, яка поводиться як діва у виробництві.

Детальніше: Планування синтезу та пропозиції щодо ретросинтезу 🧰

Генеративний штучний інтелект також проникає в хімічні операції, а не лише в генерування ідей молекул.

Планувальники ретросинтезу можуть:

запропонувати шляхи до цільової сполуки
запропонуйте комерційно доступні вихідні матеріали
ранжувати маршрути за кількістю кроків або сприйнятою доцільністю
допомогти хімікам швидко виключити «милі, але неможливі» ідеї AiZynthFinder 2020 Coley 2018 (CASP)

Це може заощадити реальний час, особливо коли ви досліджуєте багато структур-кандидатів. Тим не менш, люди тут мають велике значення, тому що:

зміни доступності реагентів
проблеми безпеки та масштабу є реальними
деякі кроки виглядають добре на папері, але постійно зазнають невдачі

Не зовсім ідеальна метафора, але я все одно її використаю: ретросинтетичний ШІ схожий на GPS, який здебільшого правильний, за винятком того, що іноді він прокладає маршрут через озеро та наполягає, що це короткий шлях. 🚗🌊 Колі 2017 (комп'ютерний ретросинтез)

Дані, мультимодальні моделі та сувора реальність лабораторій 🧾🧪

Генеративний ШІ любить дані. Лабораторії створюють дані. На папері це звучить просто.

Ха. Ні.

Реальні лабораторні дані:

неповний
шумний
повний пакетних ефектів Leek et al. 2010 (пакетні ефекти) Nature 2024 (пакетні ефекти у візуалізації клітин)
розкидані по різних форматах
благословенний «креативними» правилами іменування

Мультимодальні генеративні системи можуть поєднувати:

результати аналізу
хімічні структури
зображення (мікроскопія, гістологія)
оміки (транскриптоміки, протеоміки)
текст (протоколи, ELN, звіти) npj Цифрова медицина 2025 (мультимодальний у біотехнологіях) Аналіз медичних зображень 2025 (мультимодальний ШІ в медицині)

Коли це працює, це чудово. Ви можете виявити неочевидні закономірності та запропонувати експерименти, які окремий спеціаліст міг би пропустити.

Коли щось зазнає невдачі, то це відбувається тихо. Воно не грюкає дверима. Воно просто підштовхує вас до впевненого неправильного висновку. Ось чому управління, валідація та перевірка предметної області не є необов'язковими. Посібник клініциста (галюцинації) npj Digital Medicine 2025 (галюцинації + система безпеки)

Ризики, обмеження та розділ «не дайте себе обдурити вільним виводом» ⚠️

Якщо ви пам'ятаєте лише одне, пам'ятайте ось це: генеративний ШІ переконливий. Він може звучати правильно, водночас хибно. Посібник клініциста (галюцинації)

Ключові ризики:

Галюцинаційні механізми: правдоподібна біологія, яка не є реальною. Посібник для клініцистів (галюцинації).
Витік даних: створення чогось занадто схожого на відомі сполуки USENIX 2021 (вилучення навчальних даних) Vogt 2023 (проблеми новизни/унікальності)
Надмірна оптимізація: гонитва за передбачуваними результатами, які не підтверджуються in vitro Nature 2023 (огляд відкриття лігандів)
Зміщення: навчальні дані зміщені в бік певних хемотипів або мішеней Vogt 2023 (оцінка моделі + зміщення/новизна)
Хибна новизна: «нові» молекули, які насправді є тривіальними варіантами Фогт 2023
Прогалини в поясненні: важко обґрунтувати рішення для зацікавлених сторін Принципи валідації QSAR ОЕСР
Проблеми безпеки та IP: конфіденційні деталі програми в підказках 😬 USENIX 2021 (вилучення навчальних даних)

Пом'якшувальні заходи, які допомагають на практиці:

тримати людей у процесі прийняття рішень
підказки та виводи журналів для відстеження
валідувати за допомогою ортогональних методів (аналізи, альтернативні моделі)
автоматично застосовувати обмеження та фільтри
розглядати результати як гіпотези, а не як таблетки істини, рекомендації ОЕСР щодо QSAR

Генеративний ШІ — це потужний інструмент. Електроінструменти не роблять вас теслею… вони просто швидше роблять помилки, якщо ви не знаєте, що робите.

Як команди впроваджують генеративний ШІ без хаосу 🧩🛠️

Команди часто хочуть використовувати це, не перетворюючи організацію на науковий ярмарок. Практичний шлях впровадження виглядає так:

Почніть з одного вузького місця (розширення хітів, генерація аналогів, сортування літератури) Nature 2023 (огляд виявлення лігандів)
Побудуйте щільний цикл оцінювання (фільтри + стикування + перевірки властивостей + хімічний огляд) REINVENT 4 AiZynthFinder 2020
Вимірювання результатів (економія часу, коефіцієнт успішності, зменшення відтоку) Waring 2015 (відтік)
Інтеграція з існуючими інструментами (ELN, реєстр сполук, бази даних аналізів) Единбурзький ресурс ELN
Створення правил використання (що можна запитувати, що залишається офлайн, кроки перевірки) USENIX 2021 (ризик вилучення даних)
Навчайте людей обережно (серйозно, більшість помилок виникають через неправильне використання, а не через модель). Посібник для клініцистів (галюцинації)

Також не варто недооцінювати культуру. Якщо хіміки відчуватимуть, що їм нав'язують штучний інтелект, вони його проігнорують. Якщо це заощадить їхній час і поважатиме їхню експертизу, вони швидко його приймуть. Люди такі кумедні 🙂.

Яка роль генеративного штучного інтелекту у виявленні ліків, якщо зменшити масштаб? 🔭

Якщо зменшити масштаб, то роль полягає не в тому, щоб «замінити вчених». Це «розширити наукову пропускну здатність». Nature 2023 (огляд відкриття лігандів)

Це допомагає командам:

досліджуйте більше гіпотез щотижня
пропонувати більше структур-кандидатів за цикл
розумніше пріоритезувати експерименти
стиснення циклів ітерацій між проектуванням та тестуванням
обмін знаннями між ізольованими структурами Patterns 2025 (LLM у розробці ліків)

І, можливо, найбільш недооцінений аспект: це допомагає не витрачати дорогу людську творчість на повторювані завдання. Люди повинні думати про механізм, стратегію та інтерпретацію, а не витрачати дні на створення списків варіантів вручну. Nature 2023 (огляд відкриття лігандів)

Отже, так, роль генеративного ШІ у відкритті ліків — це прискорювач, генератор, фільтр, а іноді й джерело проблем. Але цінна роль.

Заключний підсумок 🧾✅

Генеративний штучний інтелект стає ключовою можливістю у сучасному відкритті ліків, оскільки він може генерувати молекули, гіпотези, послідовності та маршрути швидше, ніж люди, і може допомогти командам вибирати кращі експерименти. Огляд Frontiers in Drug Discovery 2024 Nature 2023 (огляд відкриттів лігандів)

Підсумкові пункти:

Найкраще підходить для раннього виявлення та циклів оптимізації лідів ⚙️ REINVENT 4
Підтримує малі молекули та біологічні препарати GENTRL (Nature Biotech 2019) ProteinMPNN (Science 2022)
Це підвищує продуктивність, розширюючи воронку ідей Nature 2023 (огляд відкриття лігандів)
Потрібні обмеження, валідація та люди, щоб уникнути впевненої нісенітниці. Принципи OECD QSAR. Посібник для клініцистів (галюцинації).
Найбільші перемоги походять від інтеграції робочих процесів, а не від маркетингової піни. Nature 2023 (огляд лігандів).

Якщо ви ставитеся до нього як до співробітника, а не як до оракула, він може справді просувати програми вперед. А якщо ви ставитеся до нього як до оракула… ну, ви можете знову піти за тим GPS в озеро.

Приклад з реального світу: Побудова робочого процесу генерації молекул, що враховує обмеження 🧪

Сценарій

Вигадана, але реалістична невелика біотехнологічна команда працює над мішенню для лікування запальних захворювань. У них вже є 42 підтверджених слабких відповідей за результатами скринінгу, але більшість із них мають погану розчинність, а деякі знаходяться занадто близько до патентного простору конкурентів.

Замість того, щоб просити генеративну модель «знайти кращі молекули» – що по суті є запрошенням отримати елегантну нісенітницю – команда створює чіткий робочий процес для розширення хітів.

Мета проста: створити ширший набір аналогів, ретельно їх відфільтрувати та відправити лише найбільш обґрунтованих кандидатів на розгляд у медичній хімії.

Що потрібно помічнику

Команда надає системі:

профіль мішені та інформація про відомі ліганди

42 підтверджені об'єкти, що потрапляють під удар

межі властивостей для молекулярної маси, logP, TPSA, розчинності та передбачуваного кліренсу

заблоковані каркаси та пороги подібності для уникнення IP-адрес

PAINS та реактивні групові фільтри Baell & Holloway 2010

Прогноз ADMET перевіряє ADMETlab 2.0

перевірки можливості ретросинтезу AiZynthFinder 2020

правила перевірки людиною для остаточного вибору

Важливий момент: моделі не дозволено оптимізувати ефективність самостійно. Вона повинна збалансувати ефективність, новизну, можливість розробки та синтезованість.

Приклад інструкції

Згенеруйте 150 аналогових ідей на основі цих підтверджених структурних відповідей. Підтримуйте молекулярну масу між 300 та 480, прогнозований logP між 1,5 та 4,0, TPSA нижче 110 та уникайте заблокованих каркасів, перелічених у файлі IP. Надайте пріоритет структурам без сповіщень PAINS, без очевидних реакційних груп та з правдоподібним шляхом синтезу з п'яти або менше кроків. Для кожної молекули поясніть основну модифікацію, передбачуване покращення властивостей, ключовий ризик та те, чи слід сполуку відхилити, переглянути чи надати їй пріоритет.

Як це перевірити

Команда не довіряє першому виводу. Вони запускають невеликий цикл оцінювання:

Перевірте, чи згенеровані молекули відповідають обмеженням властивостей

Видалити майже дублікати та структури, що знаходяться занадто близько до відомих сполук

Запустіть фільтри PAINS, реактивної групи та базової медичної хімії

Запустіть другу модель властивості для порівняння прогнозів ADMET

Попросіть двох хіміків незалежно один від одного оцінити 30 найкращих кандидатів

Надсилайте на обговорення синтезу лише короткий список із найвищим балом

Цінним тестовим питанням є: «Чи розглядали б ми цю молекулу, якби штучний інтелект її не запропонував?»

Коли відповідь негативна, команда запитує чому. Іноді це виявляє гарну нову ідею. Іноді це виявляє прийняття бажаного за дійсне, кероване моделлю.

Результат

Лише ілюстративний результат – не реальне дослідження компанії.

Виходячи з хронометражу трьох зразків завдань розширення результатів, ручний робочий процес зайняв близько 5 годин для створення та сортування 60 аналогових ідей. Робочий процес GenAI, що враховував обмеження, створив 150 початкових кандидатів приблизно за 55 хвилин.

Після фільтрації лише 27 кандидатів пережили повний скринінг. З них хіміки позначили 9 як такі, що варті детальнішого розгляду, 12 як «цікаві, але ризиковані» та 6 як такі, що відхилено під час розгляду.

Це означає, що цінним результатом було не «150 нових молекул». Цінним результатом було 9 кандидатів, придатних для перевірки, менш ніж за 1 годину, з чітким журналом аудиту, який показує, які обмеження кожен кандидат пройшов, а які ні.

Команда може перевірити це, відстежуючи:

час, витрачений на цикл проектування

кількість згенерованих структур

відсоток, видалений фільтрами

рівень прийняття хіміків

кількість кандидатів, відібраних для синтезу

кількість пізніше підтверджена як активна в аналізі

Що може піти не так

Модель може оптимізуватися навколо фільтрів, замість того, щоб пропонувати справді надійну хімію.

Кандидат може мати чудовий вигляд у прогнозованому ADMET, але одразу не пройде у реальному аналізі. Принципи валідації QSAR ОЕСР

Пропозиції щодо ретросинтезу можуть здаватися правдоподібними, якщо вони покладаються на недоступні реагенти, незручні умови або небезпечну хімію.

Фільтр новизни може занадто агресивно видаляти корисні сполуки або пропускати молекули, які все ще знаходяться занадто близько до відомого IP.

Найбільша помилка — сприймати ранжований список як істину. Це лише список гіпотез із пріоритетом.

Практичний висновок

Найкраще застосування генеративного штучного інтелекту у розробці ліків — це не «натисни кнопку — отримай ліки». Це контрольована фабрика ідей: генеруй широко, ретельно фільтруй, документуй кожне рішення та дозволяй вченим приймати остаточне рішення.

Найчастіші запитання

Яка роль генеративного штучного інтелекту у розробці ліків?

Генеративний ШІ, в першу чергу, розширює воронку ідей на ранніх етапах виявлення та оптимізації потенційних клієнтів, пропонуючи молекули-кандидати, послідовності білків, шляхи синтезу та біологічні гіпотези. Цінність полягає не стільки в «замінюванні експериментів», скільки в «виборі кращих експериментів» шляхом генерування багатьох варіантів, а потім ретельної фільтрації. Він найкраще працює як прискорювач у дисциплінованому робочому процесі, скільки як окремий інструмент прийняття рішень.

Де генеративний ШІ найкраще працює в процесі розробки ліків?

Він, як правило, забезпечує найбільшу цінність там, де простір для гіпотез великий, а ітерація є дорогою, наприклад, для ідентифікації згод, de novo проектування та оптимізації лідів. Команди також використовують його для сортування ADMET, пропозицій ретросинтезу та підтримки літератури чи гіпотез. Найбільші переваги зазвичай виникають завдяки інтеграції генерації з фільтрами, оцінюванням та рецензуванням людиною, а не очікуванню, що одна модель буде «розумною»

Як встановити обмеження, щоб генеративні моделі не створювали непотрібних молекул?

Практичний підхід полягає у визначенні обмежень перед генерацією: діапазони властивостей (наприклад, розчинність або logP-мішені), правила каркасу або підструктури, особливості сайтів зв'язування та межі новизни. Потім застосуйте фільтри медичної хімії (включаючи PAINS/реактивні групи) та перевірки синтезованості. Генерація з урахуванням обмежень особливо корисна для молекулярного дизайну в стилі дифузії та фреймворків, таких як REINVENT 4, де можна закодувати багатоцільові цілі.

Як команди повинні перевіряти результати GenAI, щоб уникнути галюцинацій та надмірної впевненості?

Розглядайте кожен вихідний результат як гіпотезу, а не висновок, і перевіряйте його за допомогою аналізів та ортогональних моделей. Генеруйте пари з агресивною фільтрацією, стикуванням або оцінюванням, де це доречно, та перевірками області застосовності для предикторів у стилі QSAR. Зробіть невизначеність видимою, коли це можливо, оскільки моделі можуть бути впевнено помилковими щодо хімії поза розповсюдженням або ненадійних біологічних заяв. Перевірка «людиною в циклі» залишається основною функцією безпеки.

Як можна запобігти витоку даних, ризику для IP-адреси та «запам’ятовуваним» виходам?

Використовуйте засоби управління та контролю доступу, щоб конфіденційні деталі програми не потрапляли випадково в підказки, а також реєструйте підказки/виходи для перевірки. Забезпечте перевірку новизни та схожості, щоб згенеровані кандидати не розташовувалися надто близько до відомих сполук або захищених областей. Дотримуйтесь чітких правил щодо того, які дані дозволені в зовнішніх системах, і віддавайте перевагу контрольованим середовищам для роботи з високим рівнем конфіденційності. Перевірка людиною допомагає виявляти «занадто знайомі» пропозиції на ранній стадії.

Як генеративний штучний інтелект використовується для оптимізації лідів та багатопараметричного налаштування?

В оптимізації лідів генеративний штучний інтелект цінний, оскільки він може пропонувати кілька компромісних рішень, замість того, щоб гонитву за однією «ідеальною» сполукою. Звичайні робочі процеси включають підказування аналогів, кероване сканування замісників та перехід між сценаріями, коли обмеження потенції, токсичності або IP блокують прогрес. Предиктори властивостей можуть бути крихкими, тому команди зазвичай ранжують кандидатів за допомогою кількох моделей, а потім експериментально підтверджують найкращі варіанти.

Чи може генеративний ШІ допомогти також у біологічних препаратах та білковій інженерії?

Так, команди використовують його для генерації послідовностей антитіл, ідей дозрівання афінності, покращення стабільності та дослідження ферментів або пептидів. Генерація білків/послідовностей може виглядати правдоподібною, але не є розроблюваною, тому важливо застосовувати фільтри розроблюваності, імуногенності та технологічності. Структурні інструменти, такі як AlphaFold, можуть підтримувати міркування, але «правдоподібна структура» все ще не є доказом експресії, функції чи безпеки. Петлі вологої лабораторії залишаються важливими.

Як генеративний ШІ підтримує планування синтезу та ретросинтезу?

Планувальники ретросинтезу можуть пропонувати маршрути, вихідні матеріали та рейтинги маршрутів, щоб пришвидшити генерування ідей та швидко виключити нездійсненні шляхи. Інструменти та підходи, такі як планування в стилі AiZynthFinder, є найефективнішими в поєднанні з перевірками реальної доцільності, що проводяться хіміками. Доступність, безпека, обмеження масштабування та «паперові реакції», які не працюють на практиці, все ще вимагають людського судження. Використаний таким чином, він економить час, не вдаючи, що хімія вирішена.

Посилання

Nature - Огляд відкриття лігандів (2023) - nature.com
Природна біотехнологія - GENTRL (2019) - nature.com
Природа - AlphaFold (2021) - nature.com
Природа - РФ-дифузія (2023) - nature.com
Nature Biotechnology - Генератор білків (2024) - nature.com
Nature Communications - Пакетні ефекти в клітинній візуалізації (2024) - nature.com
npj Цифрова медицина - Галюцинації + система безпеки (2025) - nature.com
npj Цифрова медицина - Мультимодальний напрямок у біотехнологіях (2025) - nature.com
Наука - ProteinMPNN (2022) - science.org
Клітинні патерни - ступінь магістра права з розробки ліків (2025) - cell.com
ScienceDirect (Elsevier) - Генеративні моделі в розробці нових лікарських засобів (2024) - sciencedirect.com
ScienceDirect (Elsevier) - Vogt (2023): проблеми новизни/унікальності - sciencedirect.com
Аналіз медичних зображень (ScienceDirect) - Мультимодальний штучний інтелект у медицині (2025) - sciencedirect.com
PubMed Central - Посібник для клініцистів (ризик галюцинацій) - nih.gov
Звіти про хімічні дослідження (публікації ACS) - Хімічний простір (2015) - acs.org
PubMed Central - Ірвін та Шойчет (2009): хімічна просторова шкала - nih.gov
Рубежі у відкритті ліків (PubMed Central) - Огляд (2024) - nih.gov
Журнал хімічної інформації та моделювання (публікації ACS) - Дифузійні моделі в розробці ліків de novo (2024) - acs.org
PubMed Central - REINVENT 4 (відкритий фреймворк) - nih.gov
PubMed Central - ADMETlab 2.0 (важливі ранні версії ADMET) - nih.gov
ОЕСР - Принципи валідації моделей (Q)SAR для регуляторних цілей - oecd.org
ОЕСР - Керівний документ щодо валідації моделей (Q)SAR - oecd.org
Звіти про хімічні дослідження (публікації ACS) - Комп'ютерне планування синтезу / CASP (Колі, 2018) - acs.org
Центральна наука ACS (публікації ACS) - Комп'ютерний ретросинтез (Колі, 2017) - acs.org
PubMed Central - AiZynthFinder (2020) - nih.gov
PubMed - Ліпінський: контекст правила 5 - nih.gov
Журнал медичної хімії (публікації ACS) - Baell & Holloway (2010): PAINS - acs.org
PubMed - Waring (2015): відтік - nih.gov
PubMed - Rives (2021): моделі білкової мови - nih.gov
PubMed Central - Leek et al. (2010): ефекти партій - nih.gov
PubMed Central - Огляд Diffusion (2025) - nih.gov
FDA - E14 та S7B: клінічна та доклінічна оцінка подовження інтервалу QT/QTc та проаритмічного потенціалу (Q&A) - fda.gov
Європейське агентство з лікарських засобів - огляд рекомендацій ICH E14/S7B - europa.eu
USENIX - Карліні та ін. (2021): вилучення навчальних даних з мовних моделей - usenix.org
Единбурзький університет – Цифрові дослідницькі служби – Ресурс електронного лабораторного зошита (ELN) – ed.ac.uk
ScienceDirect (Elsevier) - Weaver (2008): Область застосування QSAR - sciencedirect.com

Знайдіть найновіший штучний інтелект в офіційному магазині помічників зі штучним інтелектом

Про нас

Повернутися до блогу

Додаткові поширені запитання

Як генеративний штучний інтелект сприяє розробці ліків?

Генеративний штучний інтелект сприяє відкриттю ліків, генеруючи молекули-кандидати, прогнозуючи їхні властивості та ефективніше досліджуючи біологічні гіпотези. Він дозволяє командам розширити можливості генерування ідей, надаючи більше можливостей для експериментального тестування.
Чи може генеративний штучний інтелект зменшити кількість експериментів, необхідних для розробки ліків?

Так, генеруючи широкий спектр молекул-кандидатів та гіпотез перед тестуванням, генеративний штучний інтелект дозволяє командам проводити менше «сліпих» експериментів, що зрештою максимізує ефективність процесу розробки ліків.
Які ключові переваги використання генеративного штучного інтелекту у розробці ліків?

Ключові переваги використання генеративного штучного інтелекту у розробці ліків включають швидші цикли ітерацій, покращене генерування гіпотез, розширені спільні обговорення між дисциплінами та можливість визначення пріоритетів експериментів на основі обґрунтованих прогнозів.
Яких запобіжних заходів слід вживати під час використання генеративного штучного інтелекту для розробки ліків?

Вкрай важливо забезпечувати жорсткі обмеження, перевіряти результати як гіпотези та підтримувати всебічну відстежуваність підказок та рішень, щоб запобігти потенційному неправильному використанню або неправильній інтерпретації результатів.
Як команди забезпечують надійність результатів генеративного штучного інтелекту?

Команди повинні розглядати результати генеративного штучного інтелекту як гіпотези, що потребують перевірки, підтверджувати їх за допомогою аналізів та ортогональних моделей, а також застосовувати фільтри для усунення безглуздих результатів, перш ніж продовжувати будь-які експериментальні плани.
Які типи молекул може допомогти виявити генеративний ШІ?

Генеративний штучний інтелект може допомогти у відкритті як малих молекул, так і біологічних препаратів, генеруючи послідовності-кандидати, пропонуючи модифікації та маршрути синтезу на основі заздалегідь визначених обмежень.
Чи потрібен людський нагляд під час використання генеративного штучного інтелекту для розробки ліків?

Так, людський нагляд є важливим для керівництва процесом, перевірки отриманих результатів та забезпечення відповідності висновків біологічним та хімічним знанням, що робить процес прийняття рішень більш надійним.
Які обмеження повинні бути враховані командами під час використання генеративного штучного інтелекту?

Команди повинні знати, що генеративний штучний інтелект іноді може видавати правдоподібні результати, які є неправильними. Технологія також може мати упередження, засновані на навчальних даних, що призводить до потенційних ризиків для якості результату.