В последнее время все больше внимания стало уделяться теме управления данными. Актуальность выстраивания процесса организации жизненного цикла данных, систематизации и унификации имеющихся данных, управления изменениями в преломлении к понятию «данные» очевидна. О том, каким образом в настоящее время в Росбанке выстраивается процесс управления данными, рассказывает Светлана Бова, директор Департамента аналитических систем.
В 2015 году, подойдя к понятию «данные» с точки зрения его определения как ценного актива, банк выделил три уровня процессов, которые оперируют данными (рис. 1).
Во главе угла безусловно стоит способность измерять ценность информации, которая используется в непосредственной деятельности банка, которой оперируют сотрудники, выполняя свои ежедневные функциональные обязанности, на основе которой составляется управленческая отчетность для принятия управленческих решений и регуляторная отчетность.
Оказывается, очень сложно ответить на такие вопросы, как, например, «насколько критично наличие в информационных системах банка, заполненного на 100%, поля «мобильный телефон клиента»? Представитель розничного банкинга сразу же даст ответ: «Да, это очень важно! Нужно обязательно обеспечить 100%-ное заполнение по всем клиентам». Но рассчитать стоимость в денежном эквиваленте ценности наличия этих данных – в моменте времени – не сможет. Для этого необходимо выявить все процессы, в которых участвуют эти данные, а затем отсеять только те процессы, которые участвуют в доходных операциях банка. При этом не следует забывать очень важную составляющую – расчет расходной части. Последняя включает в себя стоимость инфраструктуры, затраты на содержание программного обеспечения, в котором эти данные учитываются, и аллокацию расходов на персонал, участвующий в процессе заполнения и актуализации данных в информационных системах. И это только в расчете на всего лишь одно поле, один атрибут. А сколько таких бизнес-атрибутов используется в банковской деятельности? – тысячи, и для каждого нужно выявить и формализовать правила расчета стоимости/ценности для банка. Вот здесь мы уже переходим на следующий уровень.
Анализ данных: в реалиях огромного объема данных, как структурированных, так и неструктурированных, анализировать информацию без использования специализированных технологий достаточно затруднительно. Именно поэтому в последние несколько лет стали наиболее востребованы аналитические приложения. Такие функциональные возможности, как оперативная обработка массивов данных, создание ad-hock-отчетности, палитра визуальных средств отображения показателей, являются основными драйверами в вопросах построения современного ИТ-ландшафта. Но прежде чем приступать к анализу данных, надо обеспечить их сбор, консолидацию, выверку, очистку, нормализацию, и главное – определить правила управления данными в процессе внедрения изменений, которые под давлением скорости развития рынка становятся все более динамичными.
Это как раз тот базовый фундаментальный уровень, который обеспечивает работоспособность всей системы – Управление данными. Рассмотрим основные факторы, которые были выделены нами как необходимые для успеха внедрения процесса управления данными на горизонте трех лет:
• создана политика управления
данными;
• определены и четко зафиксированы роли и зоны ответственности в процессе управления данными;
• определен и зафиксирован перечень данных, наиболее значимых для бизнеса;
• определены категории ценности данных и глубина полезного хранения;
• для категории наиболее ценных данных формализован сквозной жизненный цикл обработки данных;
• определены критерии качества данных для перечня значимой для бизнеса информации;
• ценные данные полностью эксплуатируются, путем совместного использования (data sharing) в пределах банка;
• всем пользователям обеспечен доступ к информации, необходимой для выполнения их работы через различные каналы с учетом четких правил разграничения прав доступа;
• качество данных сохраняется на приемлемом уровне, и информация, используемая в бизнесе, является точной, надежной и достоверной;
• юридические требования к защите неприкосновенности частной информации, безопасности, конфиденциальности и целостности данных соблюдаются;
• модель данных банка определяет наиболее важные сущности и их связи, что помогает избежать избыточности и ухудшения архитектуры, которая меняется в процессе динамичных изменений бизнеса.
Первым практическим шагом в реализации этих целей в Росбанке стало внедрение в декабре 2015 года промышленного решения Бизнес-глоссария (Business-Glossary) – среды разработки, согласования и утверждения терминологии и взаимосвязей терминов с другими информационными активами (таблицами, полями, элементами моделей данных). На данном этапе связь бизнес-терминов с бизнес-моделью и физической моделью осуществляется с одной из информационных систем банка – Корпоративным хранилищем данных (КХД) как системой, содержащей наибольшее количество критичных для бизнеса и отчетности данных.
В Бизнес-глоссарии для каждого термина содержатся:
• его детальное описание;
• описание методологии его расчета в случае, если данный бизнес-термин/показатель является расчетным;
• описание и методология проверок качества данных содержания показателя;
• его владелец – подразделение, отвечающее за правила определения термина, правила контроля качества его содержания (рис. 2).
Функциональность данного инструмента также позволяет проводить связи от уровня бизнес-термина до указания конкретного поля физической таблицы базы данных информационной системы, а затем до конкретного поля пользовательского отчета.
Сейчас уже более 2700 терминов определено и зафиксировано в Business-Glossary. Его использование упрощает и ускоряет обработку поступающих запросов на изменение в информационных системах банка, поскольку при подаче заявки на отчет пользователь указывает конкретный, необходимый ему, перечень показателей из Business-Glossary. В этом случае уже не требуется большого количества времени на анализ и уточняющие вопросы: «Как считается, каждый показатель? В какой системе хранится? Какие значения может принимать? Какой формат данных?». Вся эта информация присутствует в Business-Glossary. Более того, если данный показатель уже реализован в каком-либо отчете, то пользователь сразу увидит набор готовых отчетов, где использован данный показатель, и может принять решение об эффективном повторном использовании имеющего функционала или его минимальной доработке, не инициируя новых запросов на якобы новый отчет. Трудно переоценить, насколько подобный подход может снизить затраты на внедрение изменений в информационные системы, тем самым высвобождая ресурсы на решение более масштабных для развития бизнеса задач. В процессе жизни, безусловно, данные меняются, так же как и методологические подходы к определению термина, поэтому функциональность инструмента предполагает версионность его ведения и историзацию всех изменений.
Вторым практическим шагом стала для нас имплементация специализированного решения по автоматизации проверок качества данных Корпоративного хранилища данных с репозиторием реализованных проверок, средствами мониторинга результатов отработки проверок. Теперь администратор качества данных КХД с помощью данного инструментария осуществляет мониторинг и контроль качества поступающих в КХД данных, оперативно информируя владельцев и пользователей данных об их состоянии, в случае некорректных данных инициирует инциденты для последующего разбора и исправления с привлечением аналитиков ИТ-систем, в которых данные порождаются и обрабатываются по цепочке. Отчеты о проверках качества данных также имели положительный эффект с точки зрения бизнес-пользователей. Например, базируясь на отчете о полноте заполнения клиентских данных, руководство розничного банкинга установило клиентским менеджерам розничной сети банка KPI по заполнению ключевых полей клиентской анкеты, тем самым сделав шаг к монетизации данных.
Следующим практическим шагом реализации наших планов в 2016 – начале 2017 года станет решение задачи обеспечения централизованного качественного управления мастер-данными, такими как нормативно-справочная информация. В рамках данного направления была проделана подготовительная работа по регламентации обработки справочной информации и разработаны соответствующие регламенты, для каждого справочника зафиксирован владелец (подразделение, осуществляющее ведение данного справочника). Запланированы работы по разворачиванию специализированного промышленного решения класса RDM (Referential Data Management).
Безусловно, это первые шаги в выстраивании полноценного процесса управления данными. Но мы уверены, что, только целенаправленно занимаясь этой работой, можно со временем приобрести способность оперативно встраиваться в динамично изменяющиеся условия рынка, более эффективно и быстро реализовывать изменения как бизнес-процессов банка, так и функционала информационных систем, обеспечивая высокий уровень сервиса для наших клиентов.