Отличаем AI от ML
Первое, что необходимо понять: машинное обучение – это область развития искусственного интеллекта, а не тождественное ему понятие. Классическое определение звучит так: ML – это совокупность методов искусственного интеллекта, позволяющих проектировать самообучающиеся компьютерные системы (модели машинного обучения, нейросети). Для этих систем не нужно прописывать конкретные алгоритмы решения задач, достаточно загрузить в них подготовленные датасеты и сформулировать критерии успешного решения задачи, на которой учатся нейронные сети.
Иными словами, в ML не используются явные инструкции на языке программирования для решения конкретной задачи. Алгоритмы машинного обучения учатся «сделать что-то похожее» на предоставленном датасете.
Технологии ML сегодня широко применяются во всех областях, начиная со здравоохранения и заканчивая автопромом. И с каждым годом они развиваются, ведь в них активно инвестируют ведущие мировые компании, такие как Google, Apple, Facebook, Amazon, Microsoft – задавая тренды для игроков поменьше.
Зачем нам машинное обучение
Глобальная задача машинного обучения на далекую перспективу ― создать искусственный интеллект, равный человеческому или даже превосходящий его. Считается, что ученым это под силу в ближайшей перспективе 5-10 лет. Кстати, такой AI, который может составить конкуренцию человеку и решать самые разнообразные задачи, называют сильным или общим (artificial general intelligence).
Также можно выделить 4 группы основных задач машинного обучения, которые компании решают прямо сейчас, эффективно применяя ИИ в своих процессах.
-
Классификация Речь идет о задаче, в рамках которой нужно проанализировать ключевые и второстепенные признаки каких-либо объектов и распределить их по нужным категориям. Эта функция успешно используется компаниями в работе «умных» складов, а также на производствах. К примеру, в металлургии может потребоваться отделить продукцию с браком от качественной с помощью технологий компьютерного зрения. А на мусороперерабатывающем заводе – отделить пластик от бумаги.
-
Регрессия Задачи типа регрессии отличаются от классификации тем, что необходимо выполнять предсказание не класса, а некоторого числа. Например, можно предсказывать курсы валют, температуру воздуха, вероятность наступления какого-либо события и многое другое.
-
Кластеризация Эта задача похожа на первую, однако отличается тем, что категории заранее машине неизвестны. Машине задают определенные критерии, по которым она должна проанализировать объекты – а распределяет их она уже самостоятельно. Часто такую функцию используют для классификации клиентов, когда необходимо проанализировать их покупательское поведение, уровень доходов, возраст, пол, семейное положение и другие факторы, важные для маркетинговой кампании.
-
Уменьшение размерности В рамках этой задачи машина может уменьшить количество признаков в данных без потери информации. Такая функция способна значительно упростить обработку данных и убыстрить алгоритмы ML, так как объем информации, которую необходимо обработать, сокращается.
К примеру, когда компьютер распознает картинку, снижение размерности позволяет ему не фиксировать все пиксели, а обращать внимание лишь на ключевые признаки.
Из чего состоит машинное обучение
Выделяются три ключевые составляющие этого процесса: данные, признаки и алгоритмы.
Под данными имеется в виду самая разнообразная информация: примеры решений, статистические данные, расчеты, картинки, аудио– и видеозаписи. Объемные наборы данных или образцов называются датасетами. Их требуется тщательно готовить, так как от этого зачастую зависит успех обучения.
Признаки – это те вещи, на которых компьютер должен сконцентрироваться. На этом этапе важно понять, на что именно нужно обращать внимание, чтобы сделать тот или иной вывод. Чем признаки конкретнее, и чем их меньше, тем оперативнее машина пройдет обучение. Однако в сложных моделях могут быть задействованы тысячи и даже миллионы разных параметров.
Под алгоритмами подразумеваются варианты решения задач – ведь у одной и той же задачи может быть несколько способов, с помощью которых можно прийти к верному ответу. Машине требуется выбрать лучший из них – самый быстрый и эффективный. Иногда, чтобы добиться лучшей производительности, комбинируют разные алгоритмы – эти конструкции называют ансамблями (ensemble learning).
Каким бывает машинное обучение
Сегодня выделяют несколько основных типов обучения компьютеров – понятно, что каждый из них продолжает развиваться, вплоть до выделения подтипов и стилей, однако мы разберем базовые.
- С учителем (supervised learning) При таком типе обучения машине сразу говорят, какой ответ будет считаться верным. Учитель в этой системе – выборка с размеченными данными, на которой обучается машина или тот, кто указывает верные ответы во время процесса обучения – дата-сайентист или аналитик данных. На основе предоставленной информации компьютер учится сам находить и фиксировать признаки, которые, к примеру, позволяет ему отличить ребенка от взрослого на картинке.
Иными словами, чтобы добиться нужного результата, специалист должен какое-то время демонстрировать машине самые разные примеры и показывать, как они решаются. Далее она пытается сделать то же самое по тому же принципу. В случае ошибок учитель ее корректирует – это происходит до тех пор, пока компьютер не перестанет ошибаться.
Такой тип обучения удобен, когда нужно решать задачи классификации и регрессии – например, фильтровать спам на почте, подключать компьютерное зрение, распределять по категориям документы.
- Без учителя (unsupervised learning) Большинство компаний жалуются на то, что количество данных у них зашкаливает, однако они никак не размечены и выглядят хаотично. В таком случае можно использовать этот ML-подход – машина сама проанализирует данные, найдет между ними общее, выявит тенденции и связи, а затем рассортирует их.
Именно так, к примеру, учатся рекомендательные системы онлайн-ритейлеров, банковские антифрод-системы для обнаружения аномалий в транзакциях. Никаких подсказок компьютер от человека уже не получает. В общем-то, никаких подсказок дата-сайентист дать и не в состоянии – в силу того, что проанализировать такой объем информации человеку физически невозможно. Однако специалист в то же время может предполагать, что какие-то паттерны в этом огромном массиве данных все же есть – а выявит их уже машина.
-
С частичным участием учителя (semi-supervised learning) В этом случае дата-сайентист может разметить лишь небольшую часть информации, чтобы модель делала предсказания точнее. Делается это, как правило, на старте обучения, и применяется, когда данных очень много, они однотипные по форме, но разные по содержанию. Допустим, если требуется распознавать картинки и аудиозаписи.
-
С подкреплением (reinforcement learning) Здесь имеется в виду обучение, основанное на усилении желательного поведения путем взаимодействия с окружающей средой. Подход применяется в робототехнике, игровой индустрии, финансах, управлении и множестве других сфер. Смысл в том, что нейросеть, которую называют агентом, работает в определенной динамичной среде, чтобы получить какую-то обратную связь. Она может быть как позитивной (награда), так и негативной (штраф).
Агент выполняет какие-то действия и анализирует, как среда на них реагирует. Чтобы получить максимально возможную награду, машина сама корректирует свои действия. Модель учится сама путем проб и ошибок, запоминая самые быстрые пути решения и сокращая количество промахов.
К примеру, беспилотные автомобили обучаются именно таким способом.
- Глубинное обучение (deep learning) На данный момент это самый сложный тип машинного обучения, так как алгоритмы создаются по аналогии со структурой мозга человека и работают благодаря многослойным нейронным сетям.
Кстати, машинное и глубокое обучение часто путают, считая, что это разные направления развития искусственного интеллекта. Однако Deep Learning — это подвид машинного обучения, а нейронные сети — разновидность алгоритмов машинного обучения.
Deep Learning позволяет машине проанализировать огромное количество признаков – и именно этот параметр «огромное» отличает этот вид обучения машины от остальных. Кстати, иногда дата-сайентисты даже не подозревают, что происходит «под капотом» компьютера перед тем, как он дает ответ.
Именно благодаря моделям нейросетей с глубоким обучением появились биометрические системы, чат-боты и голосовые ассистенты. Однако для их обучение необходимы огромные датасеты и ресурсы для обучения.
Где используют Machine learning
Примеров применения технологий машинного обучения множество. Среди них, например, распознавание речи, которое достигается с помощью обработки естественного языка (NLP) для конвертации устной речь в текст.
Эту технологию, в частности, использует билайн – в задачах автоматического распознавания фродов и спамеров при звонках абонентам.
Еще один пример – компьютерное зрение, позволяющее анализировать картинки и видео, которые применяются, например, в здравоохранении, системах безопасности с видеоаналитикой и контроле качества продукции на производстве.
К примеру, билайн предоставляет большой спектр продуктов по видеоаналитике на рынке B2B. Среди функций, которые они выполняют – контроль качества обслуживания, определение дефектов на производстве, аналитика по безопасности на производстве и многое другое.
Рекомендательные системы. Алгоритмы умеют анализировать данные в ретроспективе – например, о поведении покупателей и выявлять корреляции. Это помогает порекомендовать человеку продукт, который ему, скорее всего, подойдет.
Например, в мобильном приложении билайн можно найти полоску с полезными историями. Их порядок подобран в соответствии с индивидуальными особенностями клиентов.
Подбор комбинаций. В здравоохранении машинное обучение позволяет подбирать нужные сочетания активных веществ для создания лекарственных препаратов и вакцин. Так, Google DeepMind использовал AlphaFold – систему, которая предсказывала структуру белка с применением огромных наборов геномных данных – это в итоге помогло ученым лучше понять вирус Covid-19. В Великобритании во время пандемии тоже с помощью алгоритмов определяли высокопотенциальное соединение для лечения инфекции и прогнозировали, какие комбинации препаратов дадут лучшую иммунную реакцию.
Позволяет машинное обучение также сегментировать клиентскую базу, чтобы выстроить грамотную маркетинговую стратегию. К примеру, ML-инструмент разработали в компании Tom Tailor Russia – в корпоративном хранилище данных были объединены сведения из различных источников, в частности из ERP и CRM. Затем их разбили на RFM-кластеры, но не стандартным методом, а с использованием алгоритма k-means. В итоге компании за более короткий срок удалось получить сопоставимое количество конверсий, выручка от которых оказалась в 1,3 раза выше, а расходы на рекламу в 2 раза ниже.
Подведем итог: технологии машинного обучения уже давно стали частью нашей жизни, растет также число стартапов и инновационных продуктов со сложными ML-алгоритмами. Чем раньше компания, к какой бы отрасли она ни относилась, интегрирует эту технологию в свои процессы, тем больше у нее шансов не потерять конкурентоспособность на рынке.