Статьи

Скоринг и верификация данных на основе Big Data: о чем нужно знать

Важнейший этап кредитного процесса в банке — это оценка способности клиента вовремя выплачивать по займу и выполнять условия договора. И банкам в этом сегодня серьезно помогает верификация данных о человеке с помощью технологий работы с Big Data.

Скоринг и верификация

Под кредитным скорингом банки, МФО и страховые организации понимают метод анализа для оценки рисков при выдаче кредитов. Скоринговая оценка базируется на сведениях о кредитной истории человека, уровне его доходов и расходов, а также множестве других факторов — наличии высшего образования, официального трудоустройства, детей и т. д.

Чем точнее оценка, тем ниже вероятность ошибки при выдаче кредита и убытков для финансовых организаций. Неудивительно, что они все время совершенствуют систему оценки кредитоспособности заемщиков, улучшая методы верификации информации о них — в том числе с помощью технологий работы с большими данными. Российские банки, оценивая платежеспособность юрлиц, используют метод коэффициентов, который позволяет получить представление о ликвидности компании, финансовом леверидже, оборачиваемости капитала, объеме чистой прибыли компании и возможности обеспечивать долг.

Что касается физлиц, их проверяют с помощью скоринговых моделей — они представляют собой математические методы оценки благонадежности. Обычно такие модели используют при быстром кредитовании и выдаче кредитных карт, когда анализируются базовые характеристики — финансовые возможности, обеспеченность кредита, условия предоставления займа.

Среди минусов подхода — возможность недостоверных сведений, которые клиент указывает в анкете, если он, например, студент или начинающий предприниматель. Некоторые считают, что банки при этом упускают до 80 % важной информации о человеке, которая могла бы повлиять на итоговое решение.

Зачем здесь нужны большие данные

Системы, работающие с большими данными, сегодня способны вычислить уловки, к которым прибегают заемщики, и провести более качественный и детальный анализ платежеспособности человека. Такие системы способны оценивать, например, направленность платежей и переводов, а в некоторых случаях — и активность в соцсетях, чтобы предвидеть все риски.

Технологии Big Data дают возможность аналитикам строить более сложные и точные модели кредитоспособности и вместо простых алгоритмов, которые опирались на ограниченное количество данных, использовать машинное обучение. Если резюмировать, некоторые сервисы Big Data для скоринга наделены следующими функциями:

  1. Анализ соцсетей. К 2024 году социальные сети превратились в ценный источник данных о заемщике — кто-то скажет, что это вторжение в частную жизнь человека, но профиль действительно может рассказать о его интересах, увлечениях, путешествиях, о его личных качествах. Иногда даже выводы о социальном статусе, образовании и квалификации заемщика делаются на основе словарного запаса после анализа его постов. Кстати, некоторые финтех-стартапы даже подтверждают кредитоспособность у друзей потенциального заемщика, которых находят в соцсетях. Что касается оценки юрлиц, можно проанализировать частоту упоминаний компании в СМИ и общую тональность материалов.
  2. Использование мобильных данных. Какие-то выводы о клиенте помогут сделать периодичность и время его звонков, история запросов в поисковике, онлайн-покупки — в общем, «цифровой» след.
  3. Агрегация различных источников информации. Такой подход позволяет вести перекрестную проверку одних и тех же сведений — например, данные в соцсетях могут противоречить сведениям об образовании и карьере, которыми человек поделился, заполняя заявление на кредит.
  4. Применение технологии ИИ и адаптивного обучения. Это помогает банкам дать комплексную оценку заемщику, так как анализируется огромное количество фрагментов неструктурированных данных. Далее они позволяют организовать непрерывный мониторинг клиента даже после того, как ему выдали заем — например, чтобы понять, что он не использовал его для выплаты другого кредита.
  5. Глубокое машинное обучение. Скоринговые модели базируются на ML-алгоритмах, в том числе на нейронных сетях, которые умеют обрабатывать неструктурированные данные и выявлять сложные зависимости.
  6. Использование блокчейн. Блокчейн-технологии могут обеспечить безопасность и прозрачность хранения данных о клиентах и их кредитной истории. Эта технология позволяет отслеживать транзакции и другие действия клиентов с использованием смарт-контрактов, что может повысить точность оценки рисков. Пример 1: британский финтех-стартап Aire помогает присваивать кредитный рейтинг тем, кого традиционный скоринг считает некредитоспособным. Заемщики сами могут следить за своим уровнем платежеспособности. Сейчас решение использует Управление по финансовому регулированию и надзору Великобритании.

Пример 2: Решение билайн «Скоринг и верификация для банков, МФО и страховых включает в себя как классический рисковый скоринг, скоринг с настройками под специализацию компании (например, под кредиты наличными, выдачу кредитных карт, POS-кредитование, ипотеку, автокредиты, займы МФО, розничное страхование ОСАГО и КАСКО), так и индивидуальные скоринговые модели. Также разработчик продукта предлагает верификацию отдельных данных и проверку дополнительных параметров.

Верификация Big Data

Верификация с помощью технологий Big Data - это процесс проверки и подтверждения точности, достоверности и целостности больших объемов данных. В условиях, когда объемы информации стремительно растут, а источники становятся разнообразнее, верификация становится критически важной для обеспечения надежности аналитических выводов и принятия решений.

Так, современные платформы позволяют фильтровать данные на наличие ошибок и шумов. Это включает в себя проверку на дубликаты, пропуски и несоответствия, что позволяет выявить реальные тренды и исключить неверные данные.

Что получают аналитики и банк

Аналитикам платформы для анализа больших данных помогают очищать и подготавливать информацию, визуализировать ее с помощью графиков и диаграмм, строить модели машинного обучения и обучать их, чтобы в дальнейшем использовать для предсказаний. Затем — тестировать, оптимизировать и развертывать в производство.

Банки же видят в использовании технологий Big Data следующие преимущества:

  • снижение кредитного риска, а значит, и количество невозвращенных кредитов.
  • рост прибыли. С меньшими рисками финансовые организации способны выдавать кредиты большему количеству клиентов.
  • улучшение качества сервиса. Технологии Big Data в итоге позволяют формулировать персонализированные предложения для клиента.
  • автоматизация и ускорение процессов. Развитие технологий обработки данных позволяет автоматизировать многие этапы скоринга, включая сбор данных, анализ и принятие решений. Это не только ускоряет процесс обработки заявок, но и снижает затраты на управление рисками. Искусственный интеллект в последнее время также начинает играть все большую роль в автоматизации скоринга.
  • возможность интеграции новых источников информации без значительных затрат.
  • борьба с мошенничеством: Системы анализа больших данных помогают выявлять аномальные транзакции и поведение клиентов, что позволяет банкам быстро реагировать на потенциальные угрозы и предотвращать финансовые потери

Вызовы

Тут можно выделить правовой аспект: это например, вопрос соблюдения законодательства о защите данных, который становится все более актуальным при использовании персонализированных данных для скоринга.

Есть также трудность с интерпретируемостью моделей: сложные модели машинного обучения тяжело интерпретировать, что создает проблемы с прозрачностью принятия решений.

Скоринг и верификация на основе Big Data - это важный шаг вперед в области оценки рисков, он позволяет компаниям более эффективно управлять своими портфелями и снижать риски связанные с невозвратом кредитов, мошенничеством и другими нежелательными событиями.