Регистрация лекарств — ИИ сокращает сроки подготовки досье на 60-80%
Регистрационное досье инновационного препарата может насчитывать от 100 до 500 тысяч страниц. Человеку физически невозможно проверить каждую цифру на противоречия, сверить дозировки между разделами, убедиться в согласованности формулировок.
Именно здесь в 2026 году алгоритмы берут на себя рутину, а специалисты сосредотачиваются на стратегических решениях.
Январь 2026 года стал точкой пересечения двух процессов: завершения переходного периода по техническим регламентам ЕАЭС и начала глобального перехода на формат eCTD 4.0.
EMA в декабре 2025 года открыла возможность опционального использования версии 4.0 для централизованных процедур, Япония сделала этот формат обязательным для новых заявок с 2026 года.
В таких условиях вопрос «заменит ли ИИ регуляторного менеджера» уступает место практическому: как использовать нейросети для ускорения работы без потери качества?
Было-ручная сборка досье и недели на проверку
До массового внедрения специализированных платформ подготовка регистрационного досье в формате ОТД (общего технического документа) выглядела так:
1. Группа медицинских писателей собирала данные из разрозненных источников.
2. Специалисты по качеству вручную сверяли спецификации.
3. Переводчики готовили документы на языки стран ЕАЭС. Каждый этап занимал дни или недели.
Модуль 1 (административная информация) требовал извлечения данных из сертификатов GMP, доверенностей, лицензий разных стран.
Модуль 2 (резюме) предполагал анализ тысяч страниц отчетов о доклинических и клинических исследованиях из Модулей 4 и 5, чтобы сформулировать выводы для экспертов регулятора.
Типичные сроки выглядели так:
Таблица 1. Типичные сроки подготовки регистрационного досье без использования ИИ
| Этап | Время (без ИИ) |
|---|---|
| Сборка Модуля 1 | 5-7 рабочих дней |
| Подготовка клинического резюме | 15-20 рабочих дней |
| Техническая проверка досье на противоречия | 3-5 рабочих дней |
| Перевод на 3 языка ЕАЭС | 30 рабочих дней |
При этом вероятность ошибки оставалась высокой.
Если на странице 1 500 указано «5 мг», а на странице 45 200 написано «5,0 мг», эксперт регулятора может вернуть досье на доработку. Один такой возврат способен задержать регистрацию на месяцы.
Стало — автоматизация рутины и проверка за минуты
В 2024-2025 годах крупнейшие поставщики регуляторных систем (Veeva, IQVIA, ArisGlobal, Ennov) интегрировали возможности искусственного интеллекта в свои платформы.
К 2026 году эти инструменты перешли из категории «экспериментальных» в разряд «обязательных» для компаний, работающих в нескольких юрисдикциях.
Автоматизация Модулей 1 и 2
Специализированные языковые модели, обученные на медицинских и регуляторных данных, теперь выполняют задачи, которые раньше требовали команды из пяти-семи человек.
Для Модуля 1 ИИ автоматически извлекает данные из сертификатов, доверенностей и лицензий. Система распознает структуру документов разных стран ЕАЭС и ЕС, учитывает национальные требования к языку и формату.
Для Модуля 2 применяется архитектура RAG (Retrieval-Augmented Generation). Система загружает исходные отчеты о клинических исследованиях из Модуля 5 в векторную базу данных.
При генерации раздела об эффективности модель извлекает подходящие фрагменты из CSR (Clinical Study Reports), касающиеся первичных и вторичных конечных точек.
LLM генерирует связный текст, следуя структуре руководства ICH E3, и автоматически расставляет гиперссылки на источники в Модуле 5.
Раньше расстановка ссылок была отдельной трудоемкой задачей.
Подготовка резюме экспертного качества теперь занимает 1-2 дня вместо 3-4 недель.
Контроль качества и поиск несоответствий
Главная проблема при подаче досье в любой регулятор мира, будь то Росздравнадзор, EMA или FDA, состоит в технических ошибках и противоречиях между разделами.
ИИ-валидаторы сверяют дозировку в инструкции по медицинскому применению (ОХЛП, общая характеристика лекарственного препарата) с данными в спецификациях (Модуль 3) и отчетами о клинических исследованиях (Модуль 5). Если система обнаруживает расхождение между «5 мг» в одном разделе и «5,0 мг» в другом, она помечает это как потенциальную причину отказа.
Традиционные валидаторы проверяли только техническое соответствие XML-схеме. Новые ИИ-валидаторы выполняют семантическую проверку, обученную на базах данных отказов от шлюзов FDA и EMA. Система может предсказать отказ не из-за ошибки в коде, а из-за аномалии в контенте: например, если в разделе 3.2.S.2 «Производство» отсутствует описание синтеза, хотя тип заявки подразумевает его наличие.
Такой глубокий анализ до подачи существенно снижает риск получения запросов на дополнительную информацию.
По данным отраслевых экспертов, внедрение ИИ-валидации снижает количество дефектов в досье на 20-40% и сокращает время до готовности к подаче.
Концепция Active Dossier
В 2026 году подход «сборки досье» как разового события уходит в прошлое.
Ее заменяет концепция Active Dossier (активное досье). Вместо статичного снимка документов система поддерживает живое состояние досье. ИИ-агенты отслеживают статус документов в системе управления качеством (QMS).
Как только обновленная спецификация утверждается в QMS, агент автоматически инициирует создание новой последовательности (sequence) в системе управления регуляторной информацией (RIM) и уведомляет ответственного сотрудника.
Мониторинг регуляторной среды
Регуляторная среда меняется постоянно. В 2025 году вступили в силу обновленные технические схемы структур документов в электронном виде (Решение Коллегии ЕЭК от 19.04.2022 №67).
С апреля 2026 года Япония переходит на eCTD 4.0, EMA планирует обязательный переход для централизованно зарегистрированных препаратов к 2027 году.
ИИ-агенты следят за обновлениями на порталах ЕЭК, Минздрава России, EMA, FDA и других регуляторов. Система формирует практические рекомендации с привязкой к портфелю компании: «Вышло Решение ЕЭК №ХХХ. Необходимо обновить разделы стабильности в течение 90 дней для препаратов из группы Y».
Специфика ЕАЭС и задачи Gap-анализа
А что происходит на нашем рынке?
Для стран ЕАЭС 2026 год стал точкой перелома из-за окончания переходного периода. Фармацевтические компании столкнулись с необходимостью массового пересмотра регистрационных досье на соответствие требованиям Союза. Вручную проанализировать тысячи досье на предмет соответствия новым фармакопейным статьям физически невозможно.
Здесь применяются специализированные ИИ-инструменты для Gap-анализа. Алгоритм сканирует существующее национальное досье, семантически сравнивает его содержимое с актуальными требованиями ЕАЭС и автоматически формирует отчет о недостающих документах или несоответствиях. Система может выявить отсутствие отчета о биоэквивалентности, выполненного по новым правилам Союза, или несоответствие спецификации на примеси гармонизированной фармакопее.
Дополнительный вызов в ЕАЭС составляет мультилингвальность. Нейросетевой машинный перевод, специализированный на медико-биологической лексике, автоматизирует перевод административных данных и инструкций по применению с русского на государственные языки стран-членов (казахский, армянский, белорусский, кыргызский). Современные системы интегрируют память переводов (Translation Memory), что обеспечивает терминологическое единство по всему портфелю продуктов компании.
Таблица 2. Сравнение сроков подготовки досье: традиционный подход и автоматизация с ИИ
| Этап | Время (без ИИ) | Время (с ИИ, 2026) |
|---|---|---|
| Сборка Модуля 1 | 5-7 рабочих дней | 2-4 часа |
| Подготовка клинического резюме | 15-20 рабочих дней | 2-3 рабочих дня |
| Техническая проверка досье | 3-5 рабочих дней | 15-30 минут |
| Перевод на 3 языка ЕАЭС | 30 рабочих дней | 2 рабочих дня (с вычиткой человеком) |
Инструментарий регуляторного специалиста в 2026 году
Какие инструменты доступны сегодня?
Специализированные платформы RIM
Системы управления регуляторной информацией (Regulatory Information Management, RIM) стали стандартом для средних и крупных фармкомпаний.
Лидеры рынка, такие как Veeva Vault RIM, IQVIA RIM Smart, ArisGlobal LifeSphere, предлагают встроенные инструменты ИИ для:
- планирования и составления заявок;
- генерации и валидации eCTD-пакетов;
- отслеживания статуса регистраций по всему миру;
- управления изменениями в досье.
Эти системы поддерживают форматы eCTD 3.2.2 (действующий стандарт) и готовятся к переходу на eCTD 4.0, который предполагает переход от документоориентированного к датаориентированному подходу.
Важный аспект eCTD 4.0 заключается в использовании контролируемых словарей (Controlled Vocabularies).
В отличие от версии 3.2.2, где многие поля допускали текстовый ввод, версия 4.0 требует использования точных кодов (например, код C42998 вместо слова «Таблетка»). Генеративные модели ИИ часто испытывают трудности с точным воспроизведением кодов, поэтому стандартом стали нейро-символические системы. Генеративный компонент (LLM) интерпретирует намерение пользователя («мы регистрируем таблетку, покрытую оболочкой»), а символический компонент (Rules Engine) обращается к базе данных NCI или EUTCT для извлечения валидного кода. Это снижает риск валидационных ошибок практически до нуля.
Языковые модели для регуляторных задач
Общедоступные модели (ChatGPT, Claude, Gemini) не подходят для работы с конфиденциальными досье. Использование публичных нейросетей для обработки данных о новых молекулах представляет собой грубое нарушение требований конфиденциальности и потенциальный риск утечки коммерческой тайны.
Крупные фармкомпании используют закрытые (локальные) контуры ИИ или специализированные модели, обученные на медицинских данных. Такие модели соблюдают терминологию MedDRA (Медицинский словарь для регуляторной деятельности), не «галлюцинируют» по медицинским вопросам и настроены на требования конкретных регуляторов.
Перевод регистрационной документации на языки стран ЕАЭС (казахский, армянский, кыргызский) требует языковой точности и сохранения жесткой структуры eCTD одновременно. Специализированные переводческие системы адаптированы под эту задачу и сокращают время перевода в 10-15 раз по сравнению с ручной работой.
Этические и юридические барьеры
При всех возможностях алгоритмов в 2026 году сохраняется базовый принцип: за ошибку в досье, подготовленном с помощью ИИ, отвечает уполномоченное лицо компании. Разработчик нейросети ответственности не несет.
Регуляторы не принимают ссылки на «ошибку алгоритма» в качестве оправдания. Это означает, что любые результаты работы ИИ должны проходить верификацию квалифицированным специалистом. ИИ ускоряет рутину, но не снимает ответственность.
Конфиденциальность данных
Работа с регистрационным досье предполагает обращение с информацией, которая составляет коммерческую тайну: данные о новых молекулах, результаты клинических исследований, производственные процессы.
Использование публичных версий языковых моделей для таких задач недопустимо.
Компании обязаны:
- использовать только закрытые (on-premise) решения или облачные сервисы с гарантиями изоляции данных;
- заключать соглашения о неразглашении с поставщиками ИИ-решений;
- проводить аудит систем на соответствие требованиям GxP.
Регуляторные требования к ИИ
В январе 2026 года FDA и EMA опубликовали совместные принципы надлежащей практики использования ИИ в разработке лекарств (Guiding Principles of Good AI Practice in Drug Development).
Три из них напрямую касаются подготовки досье:
Человекоцентричность. ИИ не может быть финальным арбитром. Архитектура любой системы должна предусматривать обязательное участие человека в принятии решений. Кнопка «Submit» всегда нажимается человеком.
Управление данными. Требуется полная прослеживаемость обучающих данных. Если ИИ генерирует резюме, спонсор должен быть способен доказать, на каких именно клинических данных был обучен этот вывод.
Риск-ориентированный подход. Уровень валидации ИИ-инструмента должен соответствовать уровню риска процесса. Генерация этикетки, влияющей на безопасность пациента, требует более строгой валидации модели, чем сортировка входящей почты.
Проблема галлюцинаций
Здесь стоит остановиться подробнее. Одна из главных проблем генеративных моделей, так называемые «галлюцинации», когда система создает правдоподобную, но ложную информацию.
В 2025 году юристы в США были оштрафованы за использование несуществующих судебных прецедентов, сгенерированных ChatGPT. В регуляторной сфере последствия могут быть еще серьезнее: выдуманный профиль безопасности способен стоить жизней.
Современные системы включают механизмы Confidence Scoring (оценка уверенности). Если ИИ генерирует утверждение с низкой степенью корреляции с исходным текстом, фрагмент подсвечивается для обязательной ручной проверки. Юридически ответственность за содержание eCTD полностью лежит на держателе регистрационного удостоверения независимо от того, был ли текст написан человеком или машиной.
eCTD 4.0 и новые возможности для ИИ
Принципиальное отличие eCTD 4.0 от версии 3.2 состоит в переходе от жесткой структуры папок к динамической структуре сообщений на основе XML/JSON. Вместо «листьев» (leaf elements) используются метаданные. Версия 4.0 базируется на стандарте HL7 Regulated Product Submission (RPS), где первичной единицей становятся данные и контекст их использования. Документ отходит на второй план.
Одно из важных нововведений, Object Reuse (повторное использование объектов). Каждому документу присваивается уникальный идентификатор UUID, позволяющий ссылаться на него в разных процедурах без повторной загрузки. Отслеживание тысяч UUID на протяжении десятилетий жизненного цикла продукта представляет непосильную когнитивную нагрузку для человека. Для алгоритмов эта задача тривиальна, что делает их незаменимыми для поддержания целостности досье.
Еще одна особенность eCTD 4.0: встроенная двусторонняя коммуникация между заявителем и регулятором. Это создает потребность в интеллектуальных агентах, способных в реальном времени классифицировать входящие запросы от регуляторов, определять срочность и маршрутизировать на профильных экспертов.
Новый формат открывает возможности для:
- повторного использования контента между разными заявками;
- автоматической агрегации данных;
- машинной обработки без парсинга PDF-документов.
ИИ-системы лучше всего работают со структурированными данными. Переход на eCTD 4.0 означает, что возможности автоматизации вырастут многократно. Компании, которые готовятся к этому переходу сейчас (внедряют единые RIM-системы, структурируют мастер-данные), получат конкурентное преимущество.
Что делать
1. Оцените текущие процессы. Проведите аудит времени, которое команда тратит на сборку досье, проверку противоречий, переводы. Определите, где автоматизация даст максимальный эффект.
2. Выберите подходящую платформу. Для крупных компаний с глобальным портфелем лучше всего подойдут комплексные RIM-системы (Veeva, IQVIA). Для локальных производителей могут подойти более простые решения с базовой ИИ-функциональностью.
3. Обеспечьте конфиденциальность. Не используйте публичные нейросети для работы с регистрационной документацией. Требуйте от поставщиков гарантий изоляции данных и соответствия GxP.
4. Готовьтесь к eCTD 4.0. Даже если ваши рынки пока не требуют нового формата, начните структурировать мастер-данные и настраивать процессы управления данными. Это инвестиция в будущую эффективность.
5. Обучайте команду. Регуляторному специалисту уже недостаточно знать только нормативную базу. Нужны цифровые навыки: понимание принципов работы алгоритмов, критическое мышление для оценки результатов ИИ, умение формулировать запросы к системе. Знание синтаксиса XML становится менее важным, чем навыки промпт-инжиниринга и алгоритмического аудита.
Таблица 3. Сводная таблица изменений в регуляторных процессах с применением ИИ
| Процесс | Традиционный подход | С применением ИИ (2026) | Экономия |
|---|---|---|---|
| Регуляторная разведка | Ручной мониторинг сайтов агентств | ИИ-агенты сканируют базы 24/7, маппируют изменения на портфель | Реальное время |
| Сборка Модуля 1 | Ручной ввод данных в формы, риск ошибок | Автозаполнение из RIM/LIMS, автовыбор контролируемых словарей | ~70% времени |
| Написание Модуля 2 | Писатели создают черновики с нуля (недели) | GenAI (RAG) генерирует черновик, писатель редактирует | ~50% времени |
| QC и валидация | Ручная проверка, только техническая валидация | QC-боты, семантическая валидация, предиктивный анализ | ~80% времени |
| Перевод (ЕАЭС) | Аутсорсинг агентствам, терминологический разнобой | Специализированный NMT с памятью переводов | ~60% затрат |
Искусственный интеллект в 2026 году не заменяет мозг специалиста, но убирает рутину из его работы. Концепция «самопишущегося досье» пока остается в стадии развития: кнопка «Submit» всегда нажимается человеком, принцип Human-in-the-Loop гарантирует это. Однако подготовка досье, включая категоризацию, суммаризацию, форматирование и валидацию, теперь на 60-80% выполняется с помощью алгоритмов.
Специалист решает, что подавать, в то время как ИИ берет на себя задачу, как это оформить. Компании, которые освоят эти инструменты раньше конкурентов, получат преимущество в скорости вывода препаратов на рынок.
Нормативная база:
1. Guiding Principles of Good AI Practice in Drug Development (FDA/EMA, январь 2026)
2. Решение Совета ЕЭК от 03.11.2016 №78 «О Правилах регистрации и экспертизы лекарственных средств для медицинского применения»
3. Решение Коллегии ЕЭК от 19.04.2022 №67 «Об обновлении технических схем структур документов в электронном виде»
4. Решение Коллегии ЕЭК от 30.06.2017 №79 «О требованиях к электронному виду заявлений и документов регистрационного досье»