ИИ-агент – что это такое и какие бывают
ИИ-агент — это программное обеспечение, использующее искусственный интеллект для автономного выполнения задач без постоянного участия человека. Это может быть принятие решений, устранение каких-то неполадок, взаимодействие с внешней средой или выполнение конкретных действий.
По большому счету, речь идет об автономной интеллектуальной системе, которая может предпринимать что-то без участия человека. От традиционных ИИ-систем они отличаются тем, что способны самообучаться на потоке поступающих задач.
Есть разные классификации типов ИИ-агентов, и одна из них, по сути, отражает эволюционное развитие таких инструментов.
- Реактивные. Действуют исключительно в настоящую минуту, не хранят воспоминания и не учитывают предыдущий опыт. Действуют согласно предопределенным правилам.
- Специализированные. Обучаются на узкопрофильных данных, помогают экспертам и часто опережают их по скорости “мышления”.
- Зависимые от контекста. Способные работать с динамическими сценариями, опираясь на существующий контекст, сводят друг с другом сложные и разнотипные данные.
- “Социальные”. Системы понимают эмоции человека, могут делать выводы о его убеждениях и намерениях – это своего рода ИИ-агенты с эмпатией.
- Саморефлексивные. Способны обучаться на предыдущем опыте, стремятся к развитию, постоянно анализируют собственные процессы принятия решения и могут улучшать их автономно.
- Агенты AGI, общего искусственного интеллекта, которые умеют мыслить на человеческом уровне. Разумеется, пока ни одной системе достичь этого не удалось.
- Сверхразумные. Первым идею о возникновении суперинтеллекта высказал философ Ник Бостром – он предполагал, что она превзойдет разум человека во многих областях, что приведет к новой научно-технической революции. Произойдет ли это в обозримым будущем? Вряд ли.
Делят ИИ-агентов и по уровням автономности — от простых уровня L1 до полностью автономного уровня L5. К примеру, ChatGPT от OpenAI и Gemini от Google пока можно отнести лишь к уровню L1, однако недавно представленный общественности OpenAI ИИ-агент Operator может уже претендовать на L2, ведь он не только выполняет задачи, но умеет действовать и принимать решения самостоятельно.
Где можно встретить ИИ-агентов
Функциональность ИИ-агентов невероятно разнообразна, и их применение постоянно расширяется. Рассмотрим, например, сферу финансовых услуг.
Чат-бот на странице банка, предлагающий оформить кредитную карту, – это типичный пример ИИ-агента. Он не просто отвечает на запросы пользователей, а ведет диалог, уточняя детали и собирая необходимую информацию. Он анализирует данные клиента, его историю платежей, кредитный лимит и другие параметры, задавая цепочку вопросов, логически связанных друг с другом.
Например, если клиент запрашивает информацию об оплате счета, бот может затем уточнить дату платежа или сумму, а если клиент интересуется увеличением кредитного лимита, бот запросит информацию о доходах и расходах.
В случае, если бот сталкивается со сложной ситуацией или недостатком информации, он может передать запрос оператору-человеку, обеспечивая бесшовное обслуживание клиента.
Более того, такие агенты способны выявлять подозрительную активность, анализируя транзакции на предмет мошенничества, что значительно снижает финансовые риски для банка и его клиентов. Они также могут помогать в принятии решений по кредитованию, оценивая кредитный риск заемщиков и мониторя изменения в их финансовом положении в режиме реального времени, что позволяет своевременно реагировать на потенциальные проблемы. Все эти задачи выполняются автономно, без постоянного вмешательства человека.
В здравоохранении ИИ-агенты также демонстрируют огромный потенциал. Представьте себе систему, анализирующую медицинские изображения – рентгеновские снимки, УЗИ, КТ или МРТ. Обученная на огромных массивах данных модель способна обнаруживать признаки различных заболеваний с высокой точностью.
ИИ-агент, интегрированный в такую систему, может обрабатывать изображения нового пациента, выделяя ключевые особенности и предоставляя врачу краткое, но информативное заключение, включающее вероятные диагнозы и рекомендации по дальнейшему обследованию и лечению.
Агенты также могут анализировать историю болезни пациента, учитывая генетические факторы и симптомы, чтобы предложить врачу варианты диагностики и составить предварительный план лечения. Это значительно ускоряет процесс диагностики и позволяет принимать более обоснованные решения, особенно в сложных случаях.
Разработка автономных ИИ-агентов активно ведется многими крупными компаниями. Antropic, например, представила модель Claude 3.5 Sonnet, способную взаимодействовать с компьютерным интерфейсом, имитируя действия человека: нажатия клавиш, перемещения курсора и клики мышью. Эта модель используется в таких платформах, как Replit, для автоматизации разработки программного обеспечения.
Google представила семейство ИИ-агентов, включая Project Mariner (для работы в браузере), Jules (для разработчиков на GitHub) и Project Astra (универсальный помощник для поиска, Lens и Maps).
OpenAI также внесла свой вклад, представив Operator – автономного агента, способного выполнять многошаговые задачи на компьютере по текстовым инструкциям пользователя. Он анализирует веб-страницы, выполняет действия на сайтах и отчитывается о результатах.
Из чего они состоят
Создаются ИИ-агенты с помощью специальных конструкторов на базе технологий машинного обучения и обработки естественного языка (NLP). Разберемся, что у таких систем “под капотом”.
- Агентно-ориентированные интерфейсы, которые помогают агенту воспринимать человеческую речь, работать с базами данных, подключаться к различным датчикам, если это необходимо (картинка с камеры, показатели оборудования и пр.).
- Модуль памяти. Кратковременная память ИИ-агента способна запомнить, что вы только что у него спросили. Долговременная – сохранить предпочтения заказчика и пожелания по тем или иным задачам.
- Модуль профиля. Это своего рода анкета агента, в которой прописывается, какая у него роль (аналитик или консультант), цели (развлекать или быстро отвечать), поведение (официальное или неформальное).
- Модуль планирования. Он помогает ИИ-агенту проанализировать задачу и разбить ее на этапы – иными словами, сформулировать план работы. К примеру, если человек хочет приобрести авиабилет, алгоритм предложит уточнить дату и направление, только затем покажет рейсы, и в самом конце откроет форму для оплаты.
- Модуль действий. Он состоит из инструментов агента (системные интеграции), которые определяют его возможности.
Как работают ИИ-агенты
Мозг ИИ-агента – это большие языковые модели, его руки – это инструменты, которые можно запускать с использованием кода. Вот основные этапы работы ИИ-агента.
Этап 1. Восприятие. Перед тем, как взять задачу в работу, агент воспринимает ее через текст, визуал, голосовую команду или набор данных.
Этап 2. Рассуждение. После этого с помощью алгоритмов информация анализируется – идет поиск закономерностей и причинно-следственных связей. Используя большие языковые модели, агенты оценивают имеющиеся сведения, расставляют приоритеты, дробят крупные задачи на мелкие, учитывают контекст и другие параметры.
Этап 3. Действие. На основе этих размышлений система принимает решение – предлагает вам наилучший ответ, решение или совершает действие. Происходит это с помощью интерфейсов, интегрированных с корпоративными системами и различными инструментами. К примеру, агент получает доступ к CRM-системе или системе управления заказами, а затем может делегировать действия другим пользователям. Если информации недостаточно, ИИ-агент может дозапросить разъяснения. Такие агенты в том числе опираются на поисковую дополненную генерацию (RAG) – она позволяет обратиться к внешним источникам за данными, если это разрешено.
Как создать ИИ-агента
Первое, что необходимо сделать, если вы решили внедрить ИИ-агента в бизнес-процессы – определить его цель. Что именно от него требуется – возможно, рассчитать кредитный рейтинг или сформировать список локаций, подходящих для открытия новой точки магазина?
Второе – требуется понять, какую информацию для этих целей ИИ-агент будет использовать, и откуда ее можно брать. Часто входные данные можно черпать из множества источников, они могут быть разного типа – картинки, отсканированная документация, аудио, карты и пр. Также определитесь, как именно агент получит доступ к этой информации.
Третье – определите правила, по которым агент должен анализировать предоставленные сведения, чтобы получить тот или иной результат. Этот этап может предполагать предоставление доступа к правилам или моделям машинного обучения.
Затем нужно выбрать действия, которые требуются для получения результата (например, обновление какой-то переменной процесса, обновление данных и др.)
Наконец, стоит разрешить ИИ-агенту предоставлять обратную связь, а не только выполнять конкретные действия. Это поможет ему обучаться и адаптироваться к меняющимся запросам.
Если разбить создание собственного ИИ-агента на этапы, то получится следующая инструкция.
- Определиться с назначением агента и целевой аудиторией – кому инструмент будет полезен.
- Подобрать инструменты – программы, в которых нужно написать код, фреймворки типа PyTorch или TensorFlow, языковая модель (например, GPT-4).
- Создать базу с данными, на которых будет работать агент (например, журналы чатов, тикетов поддержки или электронных писем), журналы взаимодействия (данные о работе схожих ручных систем). Не забудьте составить примеры для обучения на этих данных.
- Обучить модель – загрузить в нее подготовленные данные, настроить все параметры, протестировать полученные результаты.
- Ввести в эксплуатацию - нужно выбрать платформу для размещения (веб-сайт, приложение или голосовой интерфейс) и интегрировать ее через API. Кстати, есть платформы, где можно создавать автономные интеллектуальные системы даже без навыков программирования. Например, GPT Builder.
В то же время отметим, что создание полноценного ИИ-агента – не такая уж простая задача, и зачастую куда легче обратиться за этим к специализированным разработчикам таких решений. Кроме того, есть no-code и low-code решения: Make, n8n, CrewAI, LangGraph, LangFlow.
А вам точно нужен ИИ-агент? Барьеры при внедрении
Самое главное, что нужно осознавать – ИИ-агент не заберет на себя всю работу, он может лишь точечно снять с сотрудников нагрузку. Строить завышенных ожиданий не стоит.
В целом, при создании приложений с LLM лучше всего искать максимально простое решение – работать будет лучше. А еще – хорошо подумайте, нужны ли вам вообще ИИ-агенты. Для многих приложений вполне достаточно оптимизировать единичные вызовы LLM с использованием поиска и контекстных примеров.
Среди других барьеров можно назвать низкое качество и доступность корпоративных данных, которые используются в работе ИИ-агента, проблемы с их интеграцией в ИТ-инфраструктуру (предоставление доступа к чувствительным данным, протоколы информационной безопасности) и их последующей поддержкой.
Сложно также обеспечивать предсказуемость и контролируемость действий ИИ-агентов – иногда они могут принимать неожиданные решения. Важно также понять, как будут распределяться роли между сотрудниками и ИИ-агентами – ведь, по сути, сейчас формируется новая управленческая парадигма, в которой каждый сотрудник начинает “менеджерить” ИИ-подопечного – четко формулировать для него цели и задачи и верифицировать результаты его работы.





