Машинное обучение: что нужно знать разработчикам и бизнес-аналитикам

1149
Екатерина Резникова Член Правления, Вице-президент, руководитель блока розничных рисков, ПАО «МТС-Банк»

Применение машинного обучения можно найти во многих отраслях, и практически везде оно позволяет существенно улучшить процессы. Однако внедрение инноваций – это не простой путь: нужно не только найти опытных аналитиков-математиков, обладающих навыками внедрения новых методов, но и объединить их компетенции с бизнес-лидерами, способными произвести необходимые организационные изменения. Успешное внедрение машинного обучения требует целостной стратегии, которая позволит вовлечь в этот процесс все бизнес-функции на всех уровнях управления. Необходимо сфокусироваться на следующих моментах:

 

• анализ бизнес-кейсов;

 

• определение приоритетных направлений, по которым машинное обучение может принести максимальную пользу;

 

• анализ управления рисками в процессе изменений. 

 

Обучение математическому анализу занимает годы, но важно, чтобы бизнес-лидеры, аналитики и разработчики понимали, где и как можно применять технологии, и имели общее представление о машинном обучении. 

 

Использование машинного обучения требует иного подхода к решению бизнес-задач: вы просто позволяете машинному алгоритму решить проблему за вас

 

Это своего рода переворот в головах людей, которые привыкли мыслить функциональными шагами. Требуется доверие, что машинное обучение может дать лучший результат.

 

Машинное обучение зародилось в 1950-х годах, когда программисты смогли научить компьютер игре в шашки. С тех пор по мере расширения возможностей вычислительных мощностей увеличивалась сложность задач, по которым перед компьютером ставилась задача по поиску взаимозависимостей, закономерностей и построению прогнозов на будущее. 2006 год можно считать началом применения машинного обучения в жизни для решения бизнес-задач.

 

Существует множество процессов и методов машинного обучения, но ведущую роль играют нейросети, которые имеют структуру, схожую с человеческим мозгом. Нейросети, имеющие множество сложных уровней, называются глубокими нейросетями.

 

До тех пор, пока ученые не научились использовать видеокарты для обучения нейросетей, глубокие нейронные сети не были распространены. Глубокое обучение получило развитие в 2012 году, когда команда аналитиков из Канады представила первую обученную нейросеть на конкурс по распознаванию рисунков и выиграла его с большим отрывом от конкурентов. Уже в следующем году 60% конкурсантов использовало в своих работах алгоритмы глубокого обучения, а в 2014-м оно было использовано практически во всех работах.

 

С этого момента из Силиконовой долины стали появляться разнообразные истории успеха. Google, Amazon, PayPal и Microsoft получили новые возможности для обслуживания клиентов и понимания своего рынка. Так, использование машинного обучения позволило Google сократить мощности для охлаждения своих дата-центров на 40%. PayPal стала использовать глубокое обучение для обнаружения мошенничества и попыток отмывания денег. Одна медицинская школа, используя глубокое обучение, научилась на основе анализа медицинских карт пациентов предсказывать около 80 различных заболеваний за год до их появления. Японская страховая компания AXA смогла улучшить прогнозирование автомобильных аварий до 78 с 40% благодаря применению глубокого обучения.

 

На базовом уровне выделяют два вида машинного обучения: 

 

1. Обучение с учителем. Вы обучаете модель при помощи выборки с указанием правильных ответов. На основе этих данных требуется восстановить зависимость, то есть построить алгоритм, способный выдавать достаточно точный ответ для новых объектов. Например, если вы хотите построить модель, которая будет определять вероятность, что у пациента разовьется определенное заболевание, вам понадобятся данные по случайно выбранным людям, которые будут содержать риск-факторы и факт наступления заболевания.

 

2. Обучение без учителя. Необходимо, чтобы алгоритм нашел зависимости между объектами, при этом правильный ответ не задан. Таким примером служит кластерный анализ – многомерная статистическая процедура, собирающая данные, которые содержат информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Например, если вы проводите маркетинговые кампании, кластерный анализ поможет найти группы клиентов, которым могут потребоваться разные маркетинговые сообщения. В случае применения взаимосвязей нужно, чтобы алгоритм нашел правила, которые описывают данные. Например, алгоритм обнаружил, что люди, которые покупают пиво по понедельникам, также часто покупают подгузники. Зная это, вы можете напомнить покупателям пива по понедельникам про покупку подгузников.

 

Иногда эти два вида дополнительно разделяют на обучение с частичным привлечением учителя и обучение с подкреплением. Как видно из примеров, применение машинного обучения требует видения за рамками знаний математики и алгоритмов. Необходимы совместные усилия сотрудников, которые понимают, что нужно бизнесу, сотрудников, которые знают математические алгоритмы, и руководителей, которые могут обеспечить необходимый фокус на задаче. 

 

В МТС Банке машинное обучение впервые применили в 2016 году, чтобы спрогнозировать оптимальный лимит для нецелевых потребительских кредитов. Для этих целей была построена новая скоринговая модель с использованием высокоуровневого языка Python, которая пилотировалась на части онлайн-потока. Благодаря использованию данного подхода на кредитном портфеле, сформированном по новому подходу, удалось снизить стоимость риска на 30% без потери в объеме выдач.

 

Далеко не все современные системы принятия решений способны использовать такие математические модели. Поэтому для применения новых скорингов, построенных на принципах машинного обучения в инфраструктуру комплекса систем, участвующих в принятии решений, был внесен ряд изменений. В первую очередь изменения коснулись системы принятия решений, из которой были вынесены все скоринговые модели в отдельную систему, содержащую в себе интерпретатор языка Python. Система принятия решений стала обращаться к скоринговому модулю таким же образом, как и к прочим внешним сервисам, например бюро кредитных историй. Реализация подобного подхода позволила нам получить ряд преимуществ, ключевыми из которых являются: 

 

• возможность использовать скоринговые модели, написанные на языке Python, без их последующей перекодировки в синтаксис, понятный системе принятия решений;

 

• оперативно мониторить качество моделей и вносить в них изменения без сложных доработок системы принятия решений.

 

Однако использование подобной схемы имеет ряд недостатков:

 

• усложнение инфраструктуры систем, используемых в процессах принятия решений, требующих дополнительной поддержки;

 

• незначительное увеличение времени обработки (~1,5 сек) за счет дополнительного вызова внешнего сервиса.

 

Тем не менее положительный эффект от применения моделей компенсирует недостатки. Начиная с 2017 года МТС Банк успешно разработал и внедрил модели, основанные на машинном обучении, во всех процессах управления розничными рисками и взыскания, а именно: 

 

• прогнозирование вероятности образования просроченной задолженности в процессах кредитного конвейера;

 

• прогнозирование стоимости риска при подготовке предодобренных предложений по существующей клиентской базе;

 

• прогнозирование уровня мошенничества для новых клиентов в процессах онлайн-принятия кредитного решения;

 

• оценка качества и прогноз поведения сформированного кредитного портфеля для целей резервирования.

 

Отдельный блок моделей был разработан для оптимизации и увеличения эффективности работы с проблемной задолженностью:

 

• модель, определяющая наиболее эффективный инструмент коммуникации с каждым сегментом клиентов для предотвращения образования просроченной задолженности;

 

• модель выбора оптимального процесса взаимодействия с клиентом на раннем и позднем этапах работы с просроченной задолженностью; 

 

• модель, определяющая сегмент, по которому наиболее эффективным процессом является исковое и приказное производство.

 

Наиболее значимые изменения машинное обучение привнесло в процесс онлайн-принятия решения. Процессы, работавшие до машинного обучения, развивались эволюционно: подключались новые источники данных, появлялись новые кредитные продукты. Такое постепенное развитие приводило к усложнению процесса онлайн-принятия решения, появлялось большое количество веток конвейера, что существенно затрудняло внесение дальнейших изменений, проведение качественного тестирования и дальнейшего мониторинга и аналитики новых выдач. Так, например, запуск новых продуктов и подключение новых источников данных основывались на следующих принципах:

 

• каждый продукт уникальный: нужны отдельные модели по каждому продукту;

 

• каждый сервис уникальный: нужны отдельные модели по анкетным данным, поведенческим данным, антифрод-сервисам и иным внешним сервисам (БКИ, данные телеком-операторов, данные социальных сетей);

 

• каждая стратегия уникальна: нужно учитывать изменения в стратегиях принятия решений и тщательно очищать данные под новую архитектуру.

 

Все эти заповеди сводились к тому, что на каждый продукт строились 3–5 моделей по разным признакам, а после – отдельная модель, принимающая результаты всех этих прогнозных моделей и объединяющая их в финальный скоринговый балл. Для оптимизации затрат антифрод-модели были выделены в отдельный контур, который применялся на последнем этапе работы конвейера по заявкам, по которым на более ранних этапах не было найдено негативной информации. В итоге мы получили более 40 моделей, которые используются в конвейере на всех кредитных продуктах.

 

Минусы такого подхода: 

 

1. Мониторинг моделей в такой архитектуре настроить крайне тяжело, а некоторые тонкости с применением антифрод-моделей невозможно оценить.

 

Слишком сложная архитектура принятия решения усложняла понимание: при построении моделей приходилось разбираться в тонкостях каждой стратегии, чтобы правильно очистить данные и собрать необходимые витрины данных.

 

2. Такое количество моделей требует отвлечения значительных ресурсов на мониторинг. Необходимо было для каждого продукта строить отдельный отчет по мониторингу с рекомендациями по дальнейшему использованию или изменению моделей. 

 

3. Поддержка большого количества моделей требует значительных ресурсов.

 

Столкнулись с ситуацией, когда все ресурсы уходили на экстренное обновление деградировавших моделей, что мешало плановому развитию.

 

4. Большое количество моделей могло приводить к операционным рискам появления ошибок на всех этапах разработки и внедрения: ошибки в сборе данных, ошибки при построении моделей, ошибки внедрения, ошибки в мониторинге.

 

Опыт применения машинного обучения позволил МТС Банку решить все эти проблему сразу. Мы разработали концепцию «единой» стратегии, в основу которой были положены следующие принципы:

 

1. Стратегия должна быть основана на одной «единой» модели.

 

2. Модель едина для всех продуктов.

 

3. На вход принимаются все данные: анкетные, поведенческие, транзакционные, БКИ и другие. 

 

4. В модели учитываются все выдачи без анализа изменений стратегии.

 

«Единая» модель была построена на популярной библиотеке LightGBM, в которой выполнена реализация градиентного бустинга. В результате качество модели (Gini) увеличилось на 15% пунктов, что дало значимый эффект на бизнес. 

 

Градиентный бустинг деревьев решений. Термин «бустинг» означает улучшение и представляет собой процедуру последовательного построения композиции алгоритмов машинного обучения, когда каждый следующий алгоритм стремится компенсировать недостатки композиции всех предыдущих алгоритмов. Это специфическое отличие является преимуществом, так как позволяет рассматривать различные функции потерь и решать как задачи классификации, так и задачи регрессии. С точки зрения классификации бустинг деревьев решений считается одним из наиболее эффективных методов. Данный алгоритм строит модель в виде суммы деревьев. Новые слагаемые деревья добавляются в сумму путем минимизации эмпирического риска, заданного некоторой функцией потерь.

 

В отличие от логистических регрессий, где требуется довольно много времени для выверки всех признаков прежде, чем строить «финальную» модель, с новыми методами можно итерироваться и тестировать новые гипотезы по нескольку раз в день. Это позволяет Исследователю больше не концентрироваться на алгоритме и методах обработки, а заняться тем, что от него ожидают, – улучшить качество модели. То время, которое безвозвратно терялось на «группировки» и ручную выверку «неправильных» признаков, теперь можно тратить на улучшение доменных знаний и специфики, придумывать новые признаки и самое главное – видеть прирост в результате. В классическом подходе построения логистических регрессий, по сути, строилась одна модель, и качество такой модели преподносилось как «наилучшее».

 

Тем не менее мы столкнулись с рядом проблем, для которых машинное обучение не является панацеей:

 

1. В банке ранее существовал процесс, в котором на первом этапе запрашивается «короткая» анкета, и только по сегменту с высокой вероятностью просроченной задолженности требовалось заполнить дополнительные поля «длинной» анкеты. В результате заполненные признаки из «длинной» анкеты автоматом трактовались как высокорисковые. Такие признаки машинное обучение всегда выделяло в топовые признаки по важности. 

 

2. В банке существуют внутренние базы данных, по которым определяются различные антифрод признаки. Некоторые из таких баз обновлялись последний раз около пары лет назад. То есть складывалась ситуация, что на обучающей выборке признак был значим, но на бою уводил бы предсказания не в том направлении.

 

Обнаружить эти ошибки помогли знания процессов и более детальная работа с данными. При классическом подходе обнаружение таких проблем заняло бы больше времени, а применение машинного обучения позволило достаточно быстро обнаружить нестабильные переменные. 

 

Используя градиентный бустинг на деревьях при построении скоринговых карт, мы смогли значительно оптимизировать процессы принятия решений и работы с просроченной задолженностью и получить значимый эффект на бизнес: 

 

• увеличение уровня одобрения в среднем на 30% при неизменном уровне риска; 

 

• сокращение числа клиентов, входящих в просрочку, на 20%;

 

• рост эффективности взыскания на ранней стадии на 6%.

 

Использование машинного обучения показало свою эффективность в вышеперечисленных областях, поэтому мы планируем совершенствовать модели и наполнять их новыми источниками информации, например, кликстрим (данные из интернета), пользовательское поведение, а также пробовать различные методики для обработки транзакционных данных и внутренней кредитной истории. Следующий этап, который МТС Банк планирует, – внедрение uplift-моделей, позволяющих своевременно и эффективно принимать решение о каком-либо взаимодействии с клиентом: увеличении кредитного лимита, проведении коммуникации с клиентом, методе взыскания просроченной задолженности и т.д. 

ПОДЕЛИСЬ С ДРУЗЬЯМИ: