Статьи

Как происходит обучение AI: задачи и виды machine learning

По прогнозам Statista, в 2024 году мировой рынок машинного обучения достигнет 204 млрд долларов. Неудивительно: сегодня 48 % всех компаний на планете так или иначе задействуют в своих бизнес-процессах алгоритмы машинного обучения искусственного интеллекта, и 80 % организаций, инвестировавших в них, заявили, что их доходы увеличились. Разбираемся, как сегодня устроено машинное обучение и какую пользу оно может принести компании.

Отличаем AI от ML

Первое, что необходимо понять: машинное обучение – это область развития искусственного интеллекта, а не тождественное ему понятие. Классическое определение звучит так: ML – это совокупность методов искусственного интеллекта, позволяющих проектировать самообучающиеся компьютерные системы (модели машинного обучения, нейросети). Для этих систем не нужно прописывать конкретные алгоритмы решения задач, достаточно загрузить в них подготовленные датасеты и сформулировать критерии успешного решения задачи, на которой учатся нейронные сети.

Иными словами, в ML не используются явные инструкции на языке программирования для решения конкретной задачи. Алгоритмы машинного обучения учатся «сделать что-то похожее» на предоставленном датасете.

Технологии ML сегодня широко применяются во всех областях, начиная со здравоохранения и заканчивая автопромом. И с каждым годом они развиваются, ведь в них активно инвестируют ведущие мировые компании, такие как Google, Apple, Facebook, Amazon, Microsoft – задавая тренды для игроков поменьше.

Зачем нам машинное обучение

Глобальная задача машинного обучения на далекую перспективу ― создать искусственный интеллект, равный человеческому или даже превосходящий его. Считается, что ученым это под силу в ближайшей перспективе 5-10 лет. Кстати, такой AI, который может составить конкуренцию человеку и решать самые разнообразные задачи, называют сильным или общим (artificial general intelligence).

Также можно выделить 4 группы основных задач машинного обучения, которые компании решают прямо сейчас, эффективно применяя ИИ в своих процессах.

  1. Классификация Речь идет о задаче, в рамках которой нужно проанализировать ключевые и второстепенные признаки каких-либо объектов и распределить их по нужным категориям. Эта функция успешно используется компаниями в работе «умных» складов, а также на производствах. К примеру, в металлургии может потребоваться отделить продукцию с браком от качественной с помощью технологий компьютерного зрения. А на мусороперерабатывающем заводе – отделить пластик от бумаги.

  2. Регрессия Задачи типа регрессии отличаются от классификации тем, что необходимо выполнять предсказание не класса, а некоторого числа. Например, можно предсказывать курсы валют, температуру воздуха, вероятность наступления какого-либо события и многое другое.

  3. Кластеризация Эта задача похожа на первую, однако отличается тем, что категории заранее машине неизвестны. Машине задают определенные критерии, по которым она должна проанализировать объекты – а распределяет их она уже самостоятельно. Часто такую функцию используют для классификации клиентов, когда необходимо проанализировать их покупательское поведение, уровень доходов, возраст, пол, семейное положение и другие факторы, важные для маркетинговой кампании.

  4. Уменьшение размерности В рамках этой задачи машина может уменьшить количество признаков в данных без потери информации. Такая функция способна значительно упростить обработку данных и убыстрить алгоритмы ML, так как объем информации, которую необходимо обработать, сокращается.

К примеру, когда компьютер распознает картинку, снижение размерности позволяет ему не фиксировать все пиксели, а обращать внимание лишь на ключевые признаки.

Из чего состоит машинное обучение

Выделяются три ключевые составляющие этого процесса: данные, признаки и алгоритмы.

Под данными имеется в виду самая разнообразная информация: примеры решений, статистические данные, расчеты, картинки, аудио– и видеозаписи. Объемные наборы данных или образцов называются датасетами. Их требуется тщательно готовить, так как от этого зачастую зависит успех обучения.

Признаки – это те вещи, на которых компьютер должен сконцентрироваться. На этом этапе важно понять, на что именно нужно обращать внимание, чтобы сделать тот или иной вывод. Чем признаки конкретнее, и чем их меньше, тем оперативнее машина пройдет обучение. Однако в сложных моделях могут быть задействованы тысячи и даже миллионы разных параметров.

Под алгоритмами подразумеваются варианты решения задач – ведь у одной и той же задачи может быть несколько способов, с помощью которых можно прийти к верному ответу. Машине требуется выбрать лучший из них – самый быстрый и эффективный. Иногда, чтобы добиться лучшей производительности, комбинируют разные алгоритмы – эти конструкции называют ансамблями (ensemble learning).

Каким бывает машинное обучение

Сегодня выделяют несколько основных типов обучения компьютеров – понятно, что каждый из них продолжает развиваться, вплоть до выделения подтипов и стилей, однако мы разберем базовые.

  1. С учителем (supervised learning) При таком типе обучения машине сразу говорят, какой ответ будет считаться верным. Учитель в этой системе – выборка с размеченными данными, на которой обучается машина или тот, кто указывает верные ответы во время процесса обучения – дата-сайентист или аналитик данных. На основе предоставленной информации компьютер учится сам находить и фиксировать признаки, которые, к примеру, позволяет ему отличить ребенка от взрослого на картинке.

Иными словами, чтобы добиться нужного результата, специалист должен какое-то время демонстрировать машине самые разные примеры и показывать, как они решаются. Далее она пытается сделать то же самое по тому же принципу. В случае ошибок учитель ее корректирует – это происходит до тех пор, пока компьютер не перестанет ошибаться.

Такой тип обучения удобен, когда нужно решать задачи классификации и регрессии – например, фильтровать спам на почте, подключать компьютерное зрение, распределять по категориям документы.

  1. Без учителя (unsupervised learning) Большинство компаний жалуются на то, что количество данных у них зашкаливает, однако они никак не размечены и выглядят хаотично. В таком случае можно использовать этот ML-подход – машина сама проанализирует данные, найдет между ними общее, выявит тенденции и связи, а затем рассортирует их.

Именно так, к примеру, учатся рекомендательные системы онлайн-ритейлеров, банковские антифрод-системы для обнаружения аномалий в транзакциях. Никаких подсказок компьютер от человека уже не получает. В общем-то, никаких подсказок дата-сайентист дать и не в состоянии – в силу того, что проанализировать такой объем информации человеку физически невозможно. Однако специалист в то же время может предполагать, что какие-то паттерны в этом огромном массиве данных все же есть – а выявит их уже машина.

  1. С частичным участием учителя (semi-supervised learning) В этом случае дата-сайентист может разметить лишь небольшую часть информации, чтобы модель делала предсказания точнее. Делается это, как правило, на старте обучения, и применяется, когда данных очень много, они однотипные по форме, но разные по содержанию. Допустим, если требуется распознавать картинки и аудиозаписи.

  2. С подкреплением (reinforcement learning) Здесь имеется в виду обучение, основанное на усилении желательного поведения путем взаимодействия с окружающей средой. Подход применяется в робототехнике, игровой индустрии, финансах, управлении и множестве других сфер. Смысл в том, что нейросеть, которую называют агентом, работает в определенной динамичной среде, чтобы получить какую-то обратную связь. Она может быть как позитивной (награда), так и негативной (штраф).

Агент выполняет какие-то действия и анализирует, как среда на них реагирует. Чтобы получить максимально возможную награду, машина сама корректирует свои действия. Модель учится сама путем проб и ошибок, запоминая самые быстрые пути решения и сокращая количество промахов.

К примеру, беспилотные автомобили обучаются именно таким способом.

  1. Глубинное обучение (deep learning) На данный момент это самый сложный тип машинного обучения, так как алгоритмы создаются по аналогии со структурой мозга человека и работают благодаря многослойным нейронным сетям.

Кстати, машинное и глубокое обучение часто путают, считая, что это разные направления развития искусственного интеллекта. Однако Deep Learning — это подвид машинного обучения, а нейронные сети — разновидность алгоритмов машинного обучения.

Deep Learning позволяет машине проанализировать огромное количество признаков – и именно этот параметр «огромное» отличает этот вид обучения машины от остальных. Кстати, иногда дата-сайентисты даже не подозревают, что происходит «под капотом» компьютера перед тем, как он дает ответ.

Именно благодаря моделям нейросетей с глубоким обучением появились биометрические системы, чат-боты и голосовые ассистенты. Однако для их обучение необходимы огромные датасеты и ресурсы для обучения.

Где используют Machine learning

Примеров применения технологий машинного обучения множество. Среди них, например, распознавание речи, которое достигается с помощью обработки естественного языка (NLP) для конвертации устной речь в текст.

Эту технологию, в частности, использует билайн – в задачах автоматического распознавания фродов и спамеров при звонках абонентам.

Еще один пример – компьютерное зрение, позволяющее анализировать картинки и видео, которые применяются, например, в здравоохранении, системах безопасности с видеоаналитикой и контроле качества продукции на производстве.

К примеру, билайн предоставляет большой спектр продуктов по видеоаналитике на рынке B2B. Среди функций, которые они выполняют – контроль качества обслуживания, определение дефектов на производстве, аналитика по безопасности на производстве и многое другое.

Рекомендательные системы. Алгоритмы умеют анализировать данные в ретроспективе – например, о поведении покупателей и выявлять корреляции. Это помогает порекомендовать человеку продукт, который ему, скорее всего, подойдет.

Например, в мобильном приложении билайн можно найти полоску с полезными историями. Их порядок подобран в соответствии с индивидуальными особенностями клиентов.

Подбор комбинаций. В здравоохранении машинное обучение позволяет подбирать нужные сочетания активных веществ для создания лекарственных препаратов и вакцин. Так, Google DeepMind использовал AlphaFold – систему, которая предсказывала структуру белка с применением огромных наборов геномных данных – это в итоге помогло ученым лучше понять вирус Covid-19. В Великобритании во время пандемии тоже с помощью алгоритмов определяли высокопотенциальное соединение для лечения инфекции и прогнозировали, какие комбинации препаратов дадут лучшую иммунную реакцию.

Позволяет машинное обучение также сегментировать клиентскую базу, чтобы выстроить грамотную маркетинговую стратегию. К примеру, ML-инструмент разработали в компании Tom Tailor Russia – в корпоративном хранилище данных были объединены сведения из различных источников, в частности из ERP и CRM. Затем их разбили на RFM-кластеры, но не стандартным методом, а с использованием алгоритма k-means. В итоге компании за более короткий срок удалось получить сопоставимое количество конверсий, выручка от которых оказалась в 1,3 раза выше, а расходы на рекламу в 2 раза ниже.

Подведем итог: технологии машинного обучения уже давно стали частью нашей жизни, растет также число стартапов и инновационных продуктов со сложными ML-алгоритмами. Чем раньше компания, к какой бы отрасли она ни относилась, интегрирует эту технологию в свои процессы, тем больше у нее шансов не потерять конкурентоспособность на рынке.