Статьи

Технологии ИИ: чего сегодня еще не умеют «умные» машины

Мировой ВВП к 2030 году вырастет на 14 % из-за ускоренного внедрения ИИ-технологий в самые разные сферы экономики – потенциально они добавят минимум $15,7 трлн, уверены аналитики PwC. Но на какой уровень к тому времени выйдет искусственный интеллект? Разбираемся, какие технологии сейчас на пике, а о чем разработчикам умных машин пока остается лишь мечтать.

Начать с азов

Перед тем, как рассуждать об уровне развития технологий искусственного интеллекта, разберемся, что мы понимаем под классическим интеллектом.

Базовое определение звучит так: интеллект – это качество психики, которое заключается в способности осознавать новые ситуации и приспосабливаться к ним, обучаться и запоминать информацию на основе опыта, понимать и применять абстрактные концепции, использовать теоретические знания для решения прикладных задач в повседневной жизни.

Определение искусственному интеллекту впервые дали американские ученые Джон Маккарти, Марвин Ли Минский, Натаниэль Рочестер и Клод Шеннон в 1956 году. Под ним понимается способность компьютерных систем выполнять интеллектуальные и творческие функции, которые традиционно считаются присущими исключительно человеку. То есть – обучаемость, способности рассуждать логически, применять абстрактные знания в конкретных ситуациях.

Но что необходимо для того, чтобы создать систему, которая будет решать сложные задачи без участия человека? Считается, что тут требуются четыре составляющие.

Большие данные. Это своего рода учебники и энциклопедии для машины, которые она должна проштудировать. Разнообразные дата-сеты, которыми «подкармливают» алгоритмы – это база для глубокого обучения. Кстати, сейчас на повестке дня у крупных компаний организация свободного обмена обезличенными данными, что должно ускорить развитие технологий.

Анализ больших данных. Здесь имеется в виду алгоритм, который позволяет обработать все загруженные данные и научиться делать на их основании выводы – находить решения в самых разных сферах деятельности. Новые возможности для извлечения полезных знаний сегодня дают мобильные устройства, облачные вычисления, интернет вещей и суперкомпьютеры.

Искусственная нейронная сеть. Речь идет о системе, состоящей из простых блоков математических операций, которые моделируют искусственные нейроны. По сути, модель имитирует сеть нервных клеток человеческого мозга. Такая нейросеть не программируется в классическом смысле, а обучается. Это полезно для работы с картинками, аудиодорожками и текстами. Современные архитектуры и топологии ИНС довольно сложные и состоят из бесчисленного количества слоев ассоциативных элементов, которые способны упорядочить и классифицировать информацию. Из примитивных данных они создают усложненные композиции, благодаря чему можно моделировать непростые отношения.

Методы машинного обучения. Они позволяют научить систему решать задачи после обработки множества примеров – по аналогии. Чем больше итераций происходит, чем чаще сеть выдает правильные нейронные соединения, тем больше вероятность того, что она справится с новой задачей и выдаст верный ответ.

На каком уровне ИИ-технологии сегодня

Эксперты призывают пока не ждать от искусственного интеллекта слишком много: сейчас ИИ – это лишь огромное количество умных систем и их комбинаций, которые умеют решать точечные задачи: генерируют изображения, водят автомобиль, тестируют программу или пишут код. О появлении так называемого общего искусственного интеллекта, который действительно разумен и способен осознать самого себя, речи пока не идет.

Технически современные разработчики способны создать модель искусственной нейронной сети, которая по количеству нейронов может быть сравнима с кошачьим головным мозгом. В то же время нужно понимать, что мозг живого существа – это не просто массив отдельных нейронов. Между ними происходят различные процессы, многие из которых до сих пор не изучены.

Строго говоря, и принципы работы человеческого сознания науке все еще понятны не до конца – так что говорить о возможности воспроизведения их внутри машины более чем преждевременно. Впрочем, даже до воссоздания полноценной «кошки» разработчикам ИИ еще далеко.

Для простоты понимания можно рассмотреть этапы работы человеческого интеллекта, чтобы осознать, насколько ИИ до него далеко.

  1. Получение информации и первичная обработка данных.
  2. Распределение информации по блокам и обобщение.
  3. Формулировка выводов и прогнозирование будущих событий.
  4. Построение целостной картины мира.
  5. Осознание мотивов принятия решений.

А теперь возьмем, к примеру, систему ИИ для троллейбуса-беспилотника и смоделируем аналогичные этапы ее работы.

  1. Первичная обработка видео и лидар-сигналов, определение расстояния до объектов, которые расположены ближе или дальше.
  2. Выделение и распознание объектов: это могут быть пешеходы, велосипедисты, машины, дорожные знаки, светофоры.
  3. Предсказание поведения участников дорожного движения, которые находятся в поле зрения.
  4. Моделирование нестандартных сценариев: что делать, если рядом с постоянным знаком висит временный, или знак покосился и его невозможно распознать? А что если светофор неисправен?
  5. Осознание цели своего передвижения, расставить приоритеты в случае нештатной ситуации: «Для чего мне добираться до места назначения?» «Я еду из пункта А в пункт Б?», «Что хуже – поцарапать машину или наехать на ребенка»?

Нужно признать, что ИИ сегодня вполне состоятелен в том, что касается 1 и 2 пунктов, частично – 3. Однако с последними двумя все значительно сложнее, так как речь идет об осознании себя (чего машина сделать не может), интерпретации жизненного опыта, смеси бессознательного, эмоций, гормонов – в общем, всего того, что делает нас людьми. Неудивительно, что без всего этого у машин бывают огромные проблемы с эмпатией, распознаванием чувств людей и реакцией на них.

Поэтому, к примеру, нейросеть, общаясь с девушкой, может пригласить ее на свидание в Битцевский лесопарк (справедливо оценив эту локацию как не требующую денежных затрат, живописную, располагающую к долгим прогулкам). А если предложить боту решить проблему глобального потепления, рассмотрев сотни вариантов, он придет к логичному выводу: нужно уничтожить человечество. И нет, он вовсе не кровожаден – просто нашел самый быстрый и эффективный способ достижения цели.

Какие технологии будут развиваться к 2030 году в России

В России на развитие отечественных технологий искусственного интеллекта к 2030 г. планируется потратить 145,9 млрд рублей – об этом говорится в дорожной карте, которую подготовил Сбер и которую утвердила Правительственная комиссия по цифровому развитию использованию ИТ для улучшения качества жизни и условий ведения предпринимательской деятельности.

В документе технологии ИИ разделены на четыре поднаправления: перспективные методы ИИ; обработка естественного языка, распознавание и синтез речи; компьютерное зрение; интеллектуальная поддержка принятия решений. По каждому планируется разработка программно-аппаратных комплексов, библиотек и алгоритмов, создание образовательных программ для школьников, студентов и их преподавателей и хакатоны.

Развитием ИИ-решений в нашей стране активно занимаются и исследовательские центры. Так, в 2021 году в рамках федерального проекта «Искусственный интеллект» национальной программы «Цифровая экономика» были отобраны первые шесть научно-образовательных организаций, которые получили господдержку на создание таких центров: Сколтех, Университет «Иннополис», Университет ИТМО, НИУ ВШЭ, МФТИ и ИСП РАН им. В. П. Иванникова. Победителями второй волны в 2023-м стали НМИЦ онкологии им. Н. Н. Блохина, Самарский университет им. академика С. П. Королева, Новосибирский государственный университет, НИЯУ МИФИ, ННГУ им. Н. И. Лобачевского, СПбГУ.

Разберем подробнее несколько перспективных ИИ-технологий

Распознавание и синтез речи

Здесь речь идет о решениях, которые помогают переводить устную речь в текстовый формат, распознавать эмоции, делать резюме и т. д. Системы автоматического распознавания речи сейчас активно внедряются в колл-центрах крупных банков и телеком-операторов. Распознавание позволяет быстро обрабатывать простые запросы клиентов.

Вероятнее всего, к 2030 году системы, хорошо распознающие живую человеческую речь на разных языках, выйдут на новый уровень – их можно будет без ограничений применять для формирования контента для людей с ограничениями слуха, на судебных заседаниях и совещаниях, для расшифровки интервью в журналистике и даже в медицинской диагностике. Сейчас зачастую даже самые совершенные системы допускают досадные ошибки и трактуют человеческую речь слишком формально.

Возможно, в обозримом будущем синтез речи начнут применять для создания новостных роликов, озвучки фильмов и сериалов, игр и образовательных курсов и других решений. Скорее всего, голосовые интерфейсы в «умном доме» будут применяться чаще.

Ожидается, что рынок распознавания речи продолжит свой рост в среднем на 16,3 % в год вплоть до 2030 года – такие прогнозы делают аналитики Statista.

Компьютерное зрение

Технологии получения изображений объектов реального мира, их обработки, использования полученных данных для разных задач, по всей видимости, также будут развиваться. Так, по данным Statista, в 2023 году объем рынка компьютерного зрения вырос почти на 22 %.

Уже сегодня машины способны распознать и идентифицировать текст, восстановить 3D-формы по 2D-изображениям, оценить движение, выделить на картинках определенные структуры. Эти функции позволяют, к примеру, проводить глубокие маркетинговые исследования, бороться с нежелательным контентом, спамом и т. д.

К примеру, Google для проверки писем в Gmail использует OCR для улучшения категоризации своих писем, в частности писем-скидок. В Mail.ru Group также уже несколько лет используют технологии распознавания логотипов и визуального оформления письма для борьбы с рассылками мошенников.

Активно используется машинное зрение также на системах видеоаналитики – ими пользуются компании из самых разных отраслей: от финсектора до промышленности.

Интеллектуальная поддержка принятия решений

Будущее, очевидно, за предиктивной аналитикой – уже сегодня умные системы помогают руководителям компаний моделировать события, которые могут произойти в будущем. Система обрабатывает огромные массивы данных, анализирует их и делает предположения на их основе, которые помогают принимать решения.

К примеру, банки используют антифрод-системы для обнаружения мошенников. Поведенческая аналитика помогает зафиксировать нетипичное поведение и аномальные действия и сообщить о том, что необходимо принять меры. Предиктивные модели банки применяют и для оценки вероятности дефолта покупателя или потребителя, которым присваивается кредитный рейтинг.

А в нефтегазовом секторе такие системы, например, помогают вовремя заметить неполадку оборудования или сбой в процессах, предупредить о возможном возникновении чрезвычайной ситуации.