Генеративный ИИ в инженерии: доктор Пиюш Лахават об автоматизации на базе LLM

Llm Rag ии Ml инженерия данных промпт-инжиниринг techtimes.com

Доктор Пиюш Лахават, старший сотрудник техперсонала, работающий над инфраструктурой LLM в ведущей компании, делится опытом автоматизации цепочек поставок, RAG и агентного ИИ. — techtimes.com

Доктор Пиюш Лахават — старший сотрудник технического отдела, работающий над инфраструктурой больших языковых моделей в ведущей мировой компании-разработчике корпоративного программного обеспечения. Его научный и отраслевой опыт охватывает автоматизацию цепочек поставок, системы RAG и инструментарий агентного ИИ. Он применял генеративный ИИ для решения сложных инженерных задач в таких компаниях, как Western Digital, Salesforce и TuneIn, а его глубокие корни лежат в классическом машинном обучении со времен аспирантуры. Здесь он делится тем, как изменилась сфера под его ногами, и как он превратил это в преимущество.

«Я заметил постоянный сдвиг в области машинного обучения (ML) и ИИ с 2015 года в сторону унифицированных глобальных моделей», — говорит доктор Лахават. Во время учебы в аспирантуре он создавал классические модели машинного обучения, когда ансамблевые методы уже набирали обороты, а затем наблюдал, как архитектуры глубокого обучения стремительно распространяются, начиная обобщаться на различные задачи ML. Но именно генеративный ИИ и LLM ознаменовали настоящий прорыв. «Эта технология устранила саму концепцию обучения отдельных моделей для изолированных задач», — отмечает он.

Последствия оказались глубже, чем просто архитектура. В ML существовала классическая концепция компромисса между дисперсией и смещением (variance-bias tradeoff) — генеративный ИИ фактически разрушил ее. Доктор Лахават рано понял, что это определит следующую эпоху в данной области.

«Я начал применять это в своих исследовательских прототипах по автоматизации цепочек поставок», — объясняет он. «Я увидел немедленные прорывы в нескольких сложных проблемах, над которыми мы долгое время бились, и с тех пор пути назад не было».

Эта ранняя убежденность дала ему фору. В то время как другие все еще оценивали, готовы ли LLM к промышленному использованию, доктор Лахават уже демонстрировал результаты и продвигал решение проблем.

LLM мощны в ответах на вопросы, основанные на общедоступных знаниях, но корпоративные инженерные задачи требуют проприетарного контекста — и именно в этом зазоре RAG становится незаменимым. «Этот подход дополняет контекст, предоставляемый LLM, выходя за рамки простого промпта, за счет извлечения отобранных артефактов знаний на основе их релевантности запросу», — объясняет доктор Лахават. Успех RAG сводится к двум вещам: что вы помещаете в базу знаний и как вы извлекаете из нее информацию.

Что касается курирования, доктор Лахават прямолинеен: «Курирование базы знаний по своей сути является задачей инженерии данных, где вы очень хорошо понимаете схемы данных и словари и работаете с заинтересованными сторонами, чтобы сгруппировать их по областям применения». Эти группы не всегда четко разделены — они, как правило, представляют функциональные домены, которые на практике пересекаются.

Что касается извлечения, его подход столь же прагматичен: он ничем не отличается от настройки любой традиционной поисковой системы. У вас есть параметры, и вы настраиваете их для достижения нужной глубины и широты результатов.

То, что выглядит как проблема ИИ, часто является замаскированной проблемой данных. Команды, которые пропускают этап курирования и сразу переходят к настройке извлечения, обычно обнаруживают, что гонятся за симптомами, а не устраняют коренные причины.

«По моему мнению, настройка промптов (prompt tuning) не может осуществляться так же, как традиционная настройка параметров для моделей или предиктивных систем», — откровенно заявляет доктор Лахават. Возникает соблазн рассматривать промпты как гиперпараметры — создать набор данных для оценки, настроить производительность, итерировать. Но такой подход приводит к переобучению под конкретную модель и полностью теряет объяснимость.

Вместо этого доктор Лахават основывает свой дизайн промптов на лингвистике. «Это языковые модели, как следует из названия», — указывает он. Последующие правила обманчиво просты: будьте конкретны и однозначны, устраняйте противоречия и всегда предоставляйте примеры, охватывающие ключевые крайние случаи.

«Это общие правила, и они дополнительно развиваются в зависимости от конкретной задачи», — добавляет он. Цель состоит в том, чтобы создавать промпты, которые обобщаются на разные модели, а не те, которые хрупки по отношению к одной версии.

Это различие становится более важным по мере того, как команды масштабируют системы ИИ на несколько моделей и сред развертывания. Архитектура промптов, построенная на лингвистических принципах, переживает обновления моделей; та, что построена исключительно на эталонной производительности, часто нет.

«Самыми большими техническими препятствиями на ранних этапах были принуждение к детерминизму и поддержание строгого формата вывода там, где это необходимо», — вспоминает доктор Лахават. Сценарии использования чат-ботов и исследовательского анализа допускали некоторую гибкость, но автоматизированное выполнение задач и последовательный вызов функций — нет. «Иногда простые задачи, такие как генерация ответа в формате JSON, давали сбой, особенно в ранние дни генеративного ИИ».

Реакция была многоуровневой. Промпт-инжиниринг был первым шагом, за которым следовали детерминированные защитные механизмы (guardrails) и фреймворки LLM-as-judge для обнаружения и исправления сбоев на последующих этапах. Это требовало терпения и значительной защитной архитектуры.

«С ранних дней технология развивалась, и сейчас эти проблемы гораздо более управляемы с помощью MCP-серверов и других агентных инструментов», — отмечает он, — это значительный сдвиг, который превратил то, что когда-то было тяжелым кастомным каркасом, в более стандартизированные инструменты.

Эволюция отражает, как быстро созрела экосистема. Проблемы, которые два года назад требовали значительных инженерных обходных путей, теперь в значительной степени решаются на уровне платформы.

Повышение эффективности за счет автоматизации с помощью ИИ в командах доктора Лахавата было конкретным и измеримым. «Было несколько электронных таблиц и отчетов, которые регулярно создавались для обзора и согласования между различными командами и бизнес-процессами», — объясняет он. Многие из них курировались вручную, поглощая значительное время технических специалистов, у которых были более важные задачи.

«Нам удалось автоматизировать около 40% этих отчетов и таблиц с помощью автоматизации на базе ИИ», — заявляет доктор Лахават. Измерение было простым — подсчет отчетов, отслеживание того, какие из них теперь обрабатываются автономно, и мониторинг качества по сравнению с ручным эталоном.

Не требовалось сложной инструментации; влияние было четко отражено в сэкономленных часах и улучшенной согласованности.

Эта цифра — это нижний предел, а не потолок. По мере созревания баз знаний и документирования большего числа процессов охват автоматизации продолжает расширяться.

Внедрение ИИ в существующие инженерные рабочие процессы — это не чисто техническая проблема. «Это та часть, которая требует сильных навыков управления заинтересованными сторонами и хорошей коммуникации», — говорит доктор Лахават. Его стандартный подход заключается в том, чтобы сначала создать ИИ-двойника существующего процесса в паре с надежным конвейером мониторинга. Этот этап параллельной работы позволяет командам сравнивать результаты бок о бок перед любым переключением.

Ключевым фактором является возможность аудита. «Предоставление командам возможности проверять любой этап процесса по требованию было ключом к успеху», — объясняет он. Инженеры, которые могут проверить, что сделал ИИ и почему, гораздо охотнее ему доверяют — и гораздо быстрее выявляют проблемы на ранних стадиях.

Его наиболее эффективные стратегии управления изменениями включают «модуляризацию, конвейеры мониторинга и оповещения, а также навыки прозрачного аудита».

Доверие не возникает в одночасье, и доктор Лахават это четко понимает. Важно, чтобы команды были готовы внедрять ИИ вдумчиво и структурированно — не как черный ящик, вброшенный в их рабочий процесс, а как систему, которую они понимают и могут подвергать допросу.

«Бизнес-критическая задача, над которой я работал в Western Digital, заключалась в количественной оценке рисков в цепочке поставок для основных компонентов, таких как конденсаторы, транзисторы и микросхемы», — объясняет доктор Лахават. Мировой рынок этих компонентов крайне волатилен — сроки закупки могут резко меняться, а непредвиденные задержки влекут за собой огромные экономические последствия, включая упущенные заказы, сборы за ускоренную доставку и сбои в производстве на последующих этапах.

Традиционный ИИ здесь уперся в стену. «Эту проблему было чрезвычайно трудно решить с помощью традиционного ИИ, потому что данные были беспорядочными и не имели фиксированного формата», — отмечает он. Он определил ключевые сигналы, предсказывающие риск закупок, наряду с проприетарными внутренними данными, но классические модели не могли обрабатывать неструктурированные входные данные переменного формата.

«Но с помощью фреймворка генеративного ИИ на базе LLM я смог получить надежную оценку этого риска, основанную на прошлой истории рынка».

Детали дизайна остаются зарегистрированной коммерческой тайной компании. Но в отношении результатов доктор Лахават лаконичен: влияние на бизнес было значительным, что привело к экономии нескольких миллионов долларов на сборах за ускоренную доставку и позволило выполнить обещанные заказы.

«Следующим рубежом для генеративного ИИ являются мультимодальные модели», — говорит доктор Лахават. LLM уже извлекли огромную ценность из текстовых данных, доступных в интернете и внутри предприятий, — но углубленное обучение на аудио, видео и записях реальных рабочих сессий представляет собой следующий прорыв. Настоящая инженерная работа является визуальной и контекстуальной, и один только текст упускает многое из этого.

Его долгосрочное видение амбициозно, но обоснованно. «Я предвижу, что передовые модели будущего смогут рассуждать и проектировать реальные системы с нуля без явного человеческого руководства масштабируемым и надежным образом».

Когда это произойдет, ограничение технологического прогресса сместится полностью. «Человеческое творчество станет единственным барьером для технологического прогресса», — говорит он, — это взгляд, который больше связан с тем, что ИИ наконец-то догоняет то, что люди всегда воображали, а не с заменой людей ИИ.

Отказ от ответственности: Мнения, выраженные доктором Пиюшем Лахаватом, являются его собственными и никоим образом не отражают взгляды его работодателя.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: