Новости
2023-03-14

Data science. Что это такое и зачем это нужно?

Чем занимается команда дата-сайентистов и как в нее попасть — рассказывает лидер команды машинного обучения и искусственного интеллекта билайна Дмитрий Ермилов

Посмотрите подробнее, какие еще решения мы создали

Машинное обучение, искусственный интеллект, Big Data — за этими словами стоит сложная наука — Data science. Что это такое и чем занимаются дата-сайентисты в билайне, в проекте «Как это работает?» рассказывает руководитель департамента машинного обучения и искусственного интеллекта дирекции по искусственному интеллекту и цифровым продуктам Дмитрий Ермилов.

Что такое Data science?

В мире ежедневно появляется огромное количество неструктурированной и сырой информации, которая может быть полезна людям, в частности бизнесу. Data science — это набор инструментов и алгоритмов, которые позволяют эти знания доставать и использовать.

Это молодая наука. Сам термин «Data science» появился в 70-х годах, но тот вид, который эта наука приобрела сейчас, начал формироваться не так давно. Это можно связать с огромным ростом трафика, который случился в 2010-х годах. Те алгоритмы, которые были раньше, просто перестали справляться с объемом информации. Так случился технологический прорыв как в области обработки данных, так и в области их анализа. Например, в области нейронных сетей появились новые архитектуры, которые позволяли очень быстро и эффективно обрабатывать входной поток изображений. Это позволило автоматизировать многие задачи.

Если подвести итог, то в широком смысле Data science — это совокупность методов и инструментов по получению знаний из данных.

Зачем Data science нужна людям?

Благодаря обработке огромного количества информации мы можем создавать продукты. Практически любые сайты и приложения так или иначе используют рекомендательные системы. Это тоже Data science. Мы можем использовать видеоаналитику практически везде — на производствах, фабриках, в офисах. Аудиоинформация также содержит полезные знания. Обработка аудиосигналов сейчас сильно развивается. Она позволяет выявлять мошенников и фродов.

Зачем Data science в телеком-компании?

Телеком-операторы — лидеры рынка по объему информации, который через них проходит ежедневно. В билайне около 50 млн абонентов — это большая база. Ежедневно мы получаем огромное количество обезличенной информации: биллинги, звонки, смс, интернет-трафик, действия в приложении. Это ценнейшая информация, которую телеком-операторы стараются монетизировать.

Например, в билайне мы фокусируемся на следующих продуктах — антифрод, сегментация клиентов и скоринговые продукты. Кроме того, в билайне есть продукты на основе компьютерного зрения и анализа аудиосигнала с помощью нейронных сетей. Поэтому Data science и билайн — это уже фактически одно целое.