«Новая аналитика», или Доступно о Watson для банков

1458
Александр Дмитриев Бизнес-консультант по индустриальным решениям, ведущий системный архитектор, Клиентский центр IBM в России и СНГ
Гаяне Арутюнян архитектор Клиентского центра, IBM Россия и СНГ
Мария Степанова специалист Клиентского центра, IBM Россия и СНГ

В этой статье мы расскажем, как действительно современный аналитический инструментарий может помочь банку. В первой части статьи рассмотрим ситуацию с аналитикой на рынке, во второй – дадим практические рекомендации, исходя из успешных проектов. И, наконец, в третьей части – представим иллюстративный материал, тоже по результатам реальных проектов. 

Какова сегодня ситуация в отрасли? Если не говорить о топ-десяти банках, а говорить о следующем за ними множестве крупных и средних, то можно с большой долей уверенности утверждать, что продвинутая (когнитивная) аналитика в банковской сфере используется довольно редко. Почему? 

Попытка ответить на этот вопрос рисует такую картину: человек, находящийся под артиллерийским огнем, мало заботится о прическе и не обращает внимания на расстегнутый воротничок. «Cтепень сужения участников банковской системы в РФ не идет в сравнение с другими странами», – говорится в докладе АРБ за 2017 год. В Австрии – около семи банков на 100 тысяч населения, в России – примерно один банк на 300 тысяч, и это соотношение продолжает ухудшаться. 

Кроме того, «непонятность сложившейся ситуации провоцирует некоторых участников рынка идти на нарушение закона, что в итоге негативно отражается на репутации всей банковской системы и снижает доверие к некрупным кредитным организациям»1.

Попросту говоря, некоторые участники банковского сектора начинают мошенничать. Как говорят психологи, «ненормальная реакция есть нормальная реакция на ненормальную обстановку». 

Но в сложившейся ситуации скрыты и новые возможности: банки, которые смогут за счет новых технологий и с соблюдением нормативных требований улучшить свою ситуацию, существенно повышают шансы на свое выживание и дальнейшее развитие. О каких технологиях идет речь? О действительно современном аналитическом инструментарии. 

Понятно, что в каждом банке существует более-менее стандартная аналитика. В нашей статье мы говорим об аналитике нового типа, затрагивающей такие области, которые еще вчера были совершенно белыми пятнами на картах. 

Давайте посмотрим, какие задачи решает аналитика в зарубежных банках. McKinsey приводит примеры нескольких банков, которые обнаружили серьезное отставание от конкурентов и применили аналитику для выравнивания ситуации2

Для этого им пришлось совместно анализировать такие данные, как:

• демография клиентов,

• ключевые характеристики клиентов,

• ситуация с кредитными картами,

• транзакционные данные,

• данные с банкоматов,

• онлайн и мобильные платежи,

• данные по кредитам и т.д. 

Что это дало? Уменьшение оттока клиентов на 15% в одном случае, повышение отдачи от кредитов на 8% – в другом, обнаружение 15 тысяч микросегментов в клиентской базе – в третьем. 

Здесь надо обязательно остановиться на важном моменте. Из личного общения с представителями банков авторы обнаружили, что многие, даже весьма продвинутые, специалисты не очень понимают, как сегментирование клиентской базы монетизируется. 

А считается это вот как: среднее sms-сообщение при массовой рассылке стоит сегодня примерно рубль, а реальная отдача (клиент, принявший предложение, сделавший покупку или воспользовавшийся сервисом как результат рассылки) колеблется в районе 1–3%. Получается, 97–99% денег на «достучаться» до клиента уходят «дымом в небеса». 

Если мы сегментируем (разделим) всю базу клиентов, скажем, на пять частей и будем рассылать по одной пятой, то затраты снизятся сразу в пять раз. При этом отклик в среднем повышается до 4–6% (поскольку содержание заинтересованных клиентов в этом сегменте базы выше). То есть отдача уже примерно в 10 раз выше (в два раза возрос процент отклика и в пять раз уменьшились расходы). 

Если учесть, что в среднем число клиентов банков, находящихся в первой сотне, измеряется миллионами и сотнями тысяч, экономия получается немаленькая. 

Итак: 

• экономические плюсы не складываются, а перемножаются;

• не снижается лояльность в базе, потому что мы не «раздражаем» четыре пятых нашей базы ненужной информацией;

• лояльность повышается в нашем выбранном сегменте, потому что люди получают информацию, в которой с большей вероятностью заинтересованы. 

Важный вывод: суммарный положительный эффект от деления (сегментации) базы на пять частей существенно больше, чем в пять раз! Деньги экономятся, а отдача увеличивается. 

Но как это сделать на практике? Попытки бизнесмена или управленца из банковской отрасли без специального образования натолкнется на абзацы наподобие (цитирую по одной из статей-рекомендаций): «Набор данных в рассматриваемой задаче D представляет собой таблицу из N элементов (записей), описываемых l отдельными атрибутами h1, h2, …, hl. Атрибут может быть как числовой, так и категориальной переменной. Запись (строка) Xi = (h1i, h2i, …,hli) представляет собой поведенческую историю клиента Xi на момент расчета таблицы D…» – и так далее. Вопросы «что делать-то?» И «для чего это нужно-то?» остаются повисшими в воздухе. 

Теперь посмотрим, как обстоит дело с инструментарием и подходами к анализу. Вот, например, система анализа региональной экономики Банка России была создана достаточно давно (с 1995 года используется практически). Используется ли там прогнозная аналитика с проработкой информации, извлеченной из открытых интернет-источников или социальных сетей? Мне не удалось найти этому подтверждения. В основном это информация из опросников или отчетов… 

А вот совсем свежий журнал «Информационно-аналитические материалы», третий номер за 2017 год, рекомендует корреляционный анализ «в наиболее доступной для понимания форме» проводить в Excel. 

Между тем АРБ рекомендует: «Банкам необходимо четко определиться со своими стратегиями развития, а не плыть по течению». В этом плавании при неопределенной ситуации на первый план выходит стратегический риск. Это означает, по мнению АРБ, что необходимо выявить свои нaиболее сильные стороны и предлагать клиентам соответствующие продукты. 

Но как это сделать для конкретного банка? Если вчитываться в обширный материал, который предоставляют различные компании в популярной форме, то они говорят про необходимость создания команды, определения стратегии, выработки метрик – но еще раз – КАК это сделать в конкретном случае? 

Еще непонятнее для бизнеса, когда идут рекомендации наподобие: «…Набор данных в рассматриваемой задаче D представляет собой таблицу из N элементов (записей), описываемых l отдельными атрибутами h1, h2, …, hl. Атрибут может быть как числовой, так и категориальной переменной. Запись (строка) Xi = (h1i, h2i, …,hli) представляет собой поведенческую историю

клиента Xi на момент расчета таблицы D»3.

При этом методики базируются на литературе конца 90-х – начала 2000-х. 

Между тем Рита Саллам, вице-президент компании «Гартнер» по бизнес-аналитике, еще год назад4 говорила о сдвиге от базирующейся на IT-аналитике, использующей систему записей о клиентах, к аналитике:

• основанной на задачах бизнеса;

• легко понятной бизнесу (режим «самообслуживания»);

• быстро адаптирующейся к изменениям на рынке;

• дающей глубинное понимание процессов в нужной области;

• объединяющей анализ множественных источников.

И здесь мы переходим ко второй части статьи – как и что делается в успешных проектах на современной аналитике. 

Итак, мы поняли, что основной смысл сегментации клиентской базы – это снижение расходов и повышение эффективности работы с клиентами (включая повышение финансовой отдачи и лояльности). 

Первым шагом является построение профиля клиента. Что это такое? В аналитический инструментарий нового поколения (авторы имеют в виду решение Watson Explorer, WEX) загружаются данные со всевозможными параметрами клиентов. Стандартными являются пол, возраст, место жительства, доход, история финансовых операций и т.д. Но современные банки стремятся максимально обогатить собственную базу данных, мы расскажем дальше, как это делается с соблюдением требований ФЗ о персональных данных. 

Таким образом можно обрабатывать истории покупок в магазинах, факты посещения ресторанов или развлекательных центров, сведения об отдыхе и стиле проведения свободного времени и так далее. 

И здесь первое отличие аналитики нового поколения (WEX) от прежних инструментов. Если для использования аналитики ранее требовалось выдвижение гипотез, очистка данных, построение математической модели, нахождение возможных корреляций, выбор метода проверки и собственно проверка их опытным аналитиком, то современная сама выделяет возможные гипотезы и практически мгновенно их проверяет. Это раз. Механизм очень прост: система сама проверяет данные на чистоту, определяет наилучшие математические механизмы для выявления «паттернов» (устойчивых статистических зависимостей) и корреляций, отбирает наиболее значимые и выдает гипотезы для окончательного отбора аналитику. Что означает «сама проверяет, выбирает, выявляет» и т.д.? Именно то, что имела в виду эксперт компании «Гартнер» – встроенные мощные математические механизмы в Watson Explorer действительно сами проделывают всю эту работу. Для описания работы этих механизмов потребуется не статья, а целый журнал, поэтому заинтересованным клиентам это демонстрируют на семинарах в Клиентском центре IBM в Москве, где развернута система. 

Что дает WEX? Требования к уровню технической экспертизы аналитика существенно снижаются, что означает определенную экономию денег. Рутинные работы берет на себя система – это значительно сокращает время получения результата. Проверка гипотез занимает несколько минут. Добавим к этому мощный аппарат визуализации данных (опять-таки система сама выбирает наиболее подходящий вид представления данных), и мы получаем очень мощные конкурентные преимущества. 

 

Что представляет собой профиль клиента? Это ряд связанных между собой статистически параметров, которые объединяют группу клиентов внутри нашей базы. Важно, чтобы один из параметров был нам интересен с точки зрения получения финансового результата. Приведу пример. Скажем, мы выясняем, что параметр «склонны брать кредит от 10 до 50 тысяч рублей на один год» связан статистически с группой таких параметров, как:

• возраст – от 30 до 45 лет;

• мужчины;

• имеющие постоянную работу;

• имеющие одного или двух детей;

• недавно отдыхавшие за границей.

Мы сможем проделать две важные вещи. Первое – выделить из имеющейся базы персон с такими характеристиками и предлагать только им подобный кредит. И второе: во внешнем мире искать потенциальных клиентов с такими характеристиками и предлагать им этот же продукт, кредит от 10 до 50 тысяч, делая их своими клиентами. 

Таким образом, как ни парадоксально это звучит, сегментация (то есть сужение) клиентской базы приводит к ее увеличению. Мы теперь охотимся не за любыми клиентами, а только за клиентами с определенными характеристиками, с выделенным нами профилем клиента. 

Собственно – все! С точки зрения повышения эффективности аналитической службы и всех перечисленных выше плюсов это все, что нужно понимать. Достаточно, чтобы сам механизм работы системы понимало ограниченное количество аналитиков с соответствующей квалификацией. Они готовят и отлаживают алгоритм загрузки данных в аналитический модуль – а использовать его в штатном режиме могут и обычные пользователи. Важно обеспечить механизм обновления данных из выбранных источников (Watson Explorer это позволяет), и система уже работает практически без вмешательства, постоянно перерабатывая новые данные о клиентах. 

Конечно, найденные модели и зависимости надо время от времени пересматривать, мониторить. Но это уже не поиск каждый раз новых гипотез или сложная процедура построения математических моделей. За нас это уже все придумали и вложили в продукт. 

Теперь о подходах к расширению баз данных и обогащению их новыми параметрами. Современные банки делают следующее: собирают данные из открытых источников, социальных сетей, например «Твиттера». Это вполне законно, и банки создают специальные отделы, которые работают с определенными группами в социальных сетях. Например, это могут быть любители дельтапланеризма или экстремального туризма, любители мотоциклов или группы молодых мам, обсуждающих проблемы воспитания детей. Эксперты вполне открыто могут войти в эти группы, участвовать в обсуждениях, набирать опыт и постигать интересы данной группы, а также анализировать открытые данные об их участниках. Анализируются события (отпуск, свадьба, покупка машины или квартиры и т.д.) и сопутствующие факторы. Такими факторами могут быть возраст, пол, место проживания, интересы и т.д. Если удается в результате анализа выделить связанные между собой характеристики, то возникает еще одно и, может быть, главное преимущество аналитики нового поколения.

А заключается это преимущество в том, что мы начинаем работать с клиентами не по реакции на уже свершившиеся действия, а в упреждающем режиме. 

Простой пример: свадьба обычно (из житейского опыта) связана с целым рядом финансовых вопросов – это и деньги собственно на свадьбу, и путешествие жениха и невесты, и вопрос о жилье, возможно, покупка новой машины и т.д. Если кто-то в «Твиттере», в группе, которую отслеживает аналитика банка, упоминает о предстоящей свадьбе (и зачастую со сроками, которые тоже можно определить), это крайне интересный потенциальный клиент. 

Есть еще один важный момент. У внимательного читателя может возникнуть вопрос: а как мы из «Твиттера» выделим информацию о свадьбе?

В этом и заключается одно из главных достоинств WEX, в состав которого входит модуль работы с текстами (Watson Explorer Content Analytics): возможность выделять из неструктурированных текстовых данных определенные взаимозависимости, структуры, работая с различными языками, в том числе с русским языком. 

И тут мы сталкиваемся с одной из основных проблем, которая всплывает в разговорах с представителями банков, когда обсуждаешь вопрос использования социальных сетей. А как мы «достучимся» до непонятно кого, если они скрываются в социальных сетях за псевдонимом, например, «Розовая пантера»? 

Авторы задали этот вопрос Монтсеррат Рока, главе отдела по модернизации банковских систем в Клиентском центре IBM в Барселоне. Данный центр имеет колоссальный опыт работы с ведущими банками Европы. Он, в частности, помогал кардинальной модернизации La Caixa, крупнейшего сберегательного банка Испании. 

Ответ, который мы получили, удивил своей простотой:

«Пусть в социальных сетях он или она представлены ником «Розовая пантера» – можно совершенно законно, уже пользуясь тем же каналом интернета, сделать этому потенциальному клиенту предложение от лица эксперта или банка. 

Например, написать электронное сообщение, что-то наподобие: «Дорогая «Розовая пантера»! Вы меня, возможно, узнаете как (эксперта такого-то банка), и я как раз работаю с продуктами и сервисами для молодоженов. Вы написали в своем блоге, что в июне у вас свадьба, и посетовали на проблемы с жильем. Если интересно, могу посоветовать очень хороший вариант кредита, условия которого можно обсудить со мной или обратившись по такому-то адресу». 

«Розовая пантера» может и не согласиться, не заинтересоваться. Но если заинтересуется, то уже обратится официально как гражданин или гражданка».

Этот подход используют пока только самые продвинутые банки, ведь это требует не только перестройки аналитического инструментария, но и создания новых отделов, воспитания новых сотрудников, вообще серьезных изменений в подходе к работе с клиентами. Но никто не призывает ломать старые методы и системы – можно понемножку, сначала в опытном режиме, просто добавлять новые. 

Итак, на самом острие использования аналитического инструментария – извлечение информации потенциально из всех социальных информационных источников. Банк от работы с собственной базой клиентов и тем ручейком новых, что поставляют кампании маркетингового отдела, переходит к просеиванию и отбору всех потенциальных клиентов города, страны, мира. 

В заключение приведем пример из проекта, выполненного для крупного российского банка. Здесь в роли «клиентов» выступали собственные работники, управленцы. 

Сразу оговоримся, что данные и должности в таблице и на графиках вымышленные, чтобы не разглашать данные заказчика, но таблица и суть графиков отражают реальный проект. Мы хотим проиллюстрировать подход к сегментации базы клиентов за счет построения профиля персоны и методику извлечения информации из кучи данных. 

В чем заключалась задача? В крупном банке с большим количеством распределенных по территории отделений и, соответственно, огромным количеством персонала и различных должностей существует большая база различных данных об этом персонале. Там есть большое количество самых разных параметров – результаты их работы за определенный период, личностные характеристики, результаты экзаменов, сведения о заработной плате, количество лет в должности и так далее. 

Отдел кадров банка должен решать целый ряд задач: 

• выбирать из нескольких потенциальных кандидатов претендентов на одну должность;

• повышать зарплату успешным работникам с определенной периодичностью;

• менять в должности, переводить на другую работу, рекомендовать смену типа работы по результатам;

• поощрять успешных работников различными способами;

• проводить обучение и переподготовку кадров.

Как воспользоваться всеми этими данными? Какой из нескольких кандидатов больше подходит на ту или иную должность? Что должно помочь сделать такой выбор? Кого направить на обучение или тренинги и в каком направлении подтягивать персонал в каждом конкретном случае? Для ответа на все эти вопросы эта огромная куча данных была практически бесполезна. Максимум, что можно было сделать, – отследить средние показатели или поощрить за конкретные успехи в последнем квартале/полугодии/по итогам года.

В банке тратятся достаточно большие ресурсы на проведение психологических тестов, обучение персонала и т.д. – но все это, как и в рассылках по всей базе клиентов, – неадресные затраты. И нам была поставлена задача – извлечь из базы ценную информацию и рекомендовать, как ей воспользоваться. 

Первым шагом была очистка данных – умная аналитика позволила это сделать за пару дней (объемы данных были очень большими, а у самого заказчика не хватало ресурсов очистить эти данные и упорядочить их). 

Затем мы выделили основную линейку параметров, которые нас интересовали, – это были должности согласно штатному расписанию. Мы загрузили все остальные параметры в систему и задали ей найти корреляции между различными параметрами и типами должностей. И получили весьма занятные закономерности. Оказалось, что для каждой должности можно было выделить значительные группы, у которых оценки по целому ряду параметров были весьма близкими. Мы задали привязку к результатам деятельности людей на этих должностях и получили группы персонала, в которых результаты были хорошие и результаты были не очень хорошие. 

Важный момент – мы не знаем (и не ставили себе задачу понять), почему позитивные результаты связаны именно с такой группой оценок по тем или иным параметрам. Самое важное, что мы нашли связь. Например, если на должности начальника отделения результаты по параметру «общительность» находятся около «пяти», целеустремленность – «пяти», а «делегирование полномочий» – «единица», то результаты работы будут выше среднего («четверка»). 

Успешный главный инженер (результаты работы – «пятерка», высший балл), имеет низкую общительность («два»), высокую способность к делегированию полномочий («пять») и низкую целеустремленность. Почему? Не знаем, но можем выделить потенциальных «хороших» главных инженеров по их личностным характеристикам. То есть из двух потенциальных кандидатов на должность главного инженера мы рекомендуем отделу кадров выбирать того, чей профиль будет «два-пять-один». И статистически надеемся, что результаты его работы будут очень хорошие. 

То есть у нас получилась примерно такая таблица:

И мы знаем, что неуспешные финансовые управляющие общительны, целеустремленны, но не умеют делегировать полномочия. (Напомним, это условный пример, в реальности неуспешные финансовые управляющие, возможно, обладают другими характеристиками.)

 

Фактически мы с помощью аналитики Watson построили профили должностей, выявили наиболее «интересных» клиентов (представителей персонала) и сформировали политику работы с ними на основании их профилей. Продвигать надо тех «клиентов», профили которых совпадают с «успешными» профилями. А что касается обучения – если профиль того или иного человека близок к «идеальному», но не совпадает по одному или двум параметрам – надо эти параметры подтянуть к нужным. То есть если у человека маловато общительности, а она в его случае «должна» быть высокой – направляем его на тренинг по выработке этого качества. 

Мы специально выбрали пример анализа внутренней базы данных крупного банка, чтобы показать: практически неважно, в какой индустрии и с каким типом клиентов мы работаем. Сегментация – это процесс, проходящий по определенной и описанной нами методике, и результаты будут помогать выделять нужные группы людей из всей базы и формировать осмысленную политику работы с ними.

ПОДЕЛИСЬ С ДРУЗЬЯМИ: