1.3 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ УПРАВЛЕНИЯ
ДАННЫМИ С ПОЗИЦИИ DAMA-DMBOK

1.3.1 НАЗНАЧЕНИЕ СВОДА ЗНАНИЙ

Ряд концептуальных понятий в области управления данными мы приводим на основании наиболее известного, полного и всеобъемлющего свода знаний в области управления данными — DAMA-DMBOK. Этот документ создан Международной ассоциацией управления данными (Data Management Association International, DAMA), которая объединяет профессионалов в области управления данными.
Сегодня существует только два полноценных комплекта справочных материалов по управлению данными, которые не зависят от поставщика соответствующих решений: DAMA-DMBOK и CMMI DMM (модель зрелости управления данными Института CMMI), см.: Aiken P., Harbour T. Data Strategy and the Enterprise Data Executive: Ensuring that Business and IT are in Synch in the Post-Big Data Era. Technics Publications, 2017.
Первое издание «Руководства DAMA к своду знаний по управлению данными» (Data Management Body of Knowledge, DMBOK) вышло в 2009 году. Эта книга заложила фундамент развития профессий, относящихся к управлению данными. В 2017 году опубликовано второе издание — DAMA-DMBOK2, а в 2020 году — его русский перевод.
Задачи DAMA — собирать, систематизировать и пропагандировать лучший опыт, вырабатывать единую терминологию и фреймворки для знаний и подходов. Основное назначение DMBOK — предоставление полного, точного и актуального введения в дисциплину управления данными,
в частности:
  • выработка общепринятого согласованного представления об областях знаний по управлению данными;

  • определение руководящих принципов управления данными;

  • предоставление стандартных определений для наиболее часто используемых понятий (общих и по областям знаний);
  • обзор лучших практик, методов и методик, а также альтернативных подходов;

  • краткий обзор общих организационных и культурных вопросов;

  • уточнение границ сферы управления данными;

  • предоставление полезных общеупотребительных фреймворков управления данными (см. разделы 4.2, 4.3).
В DMBOK области знаний по управлению данными иногда также называются функциями управления данными.
Зачем DMBOK нужен «простому управленцу» или «простому госслужащему»? Подобные своды знаний есть и для других областей — от управления проектами (PMBOK) до бизнес-анализа и программной инженерии (BABOK и SWEBOK соответственно). Они полезны тем, что в концентрированной форме излагают основные идеи и принципы конкретной области, позволяя погрузиться в нее быстро и довольно глубоко. Конечно, максимум пользы из таких сводов знаний могут извлечь специалисты, имеющие опыт практической работы, но и начинающим они дают ясную картину предметной области. Мы не только рекомендуем ознакомиться с DAMA-DMBOK, но и даем в навигаторе ряд понятий в соответствии с этой методологией.


Зачем DMBOK нужен «простому управленцу» или «простому госслужащему»? Подобные своды знаний есть и для других областей — от управления проектами (PMBOK) до бизнес-анализа и программной инженерии (BABOK и SWEBOK соответственно). Они полезны тем, что в концентрированной форме излагают основные идеи и принципы конкретной области, позволяя погрузиться в нее быстро и довольно глубоко. Конечно, максимум пользы из таких сводов знаний могут извлечь специалисты, имеющие опыт практической работы, но и начинающим они дают ясную картину предметной области. Мы не только рекомендуем ознакомиться с DAMA-DMBOK, но и даем в навигаторе ряд понятий в соответствии с этой методологией.

Project Management Body of Knowledge («Свод знаний по управлению проектами»).
Business Analysis Body of Knowledge («Свод знаний по бизнес-аналитике»).
Software Engineering Body of Knowledge («Свод знаний по программной инженерии»).

1.3.2 ОДИННАДЦАТЬ ОБЛАСТЕЙ ЗНАНИЙ

Управление данными согласно DAMA-DMBOK строится вокруг основного фреймворка DAMA, включающего колесо DAMA, шестиугольник факторов среды и контекстные диаграммы. На рис. 6 представлено колесо DAMA — диаграмма областей знаний по управлению данными.
В русском переводе DAMA-DMBOK термину framework соответствует термин «рамочная структура»; в этой книге ради согласованности с другими главами (в частности, с главой 7) был выбран термин «фреймворк».

Рисунок 6
Колесо DAMA: области знаний по управлению данными

В DMBOK выделено 11 областей знаний по управлению данными.

1. Руководство данными (Data Governance) обеспечивает стратегическое управление информационными активами организации. Это одна из функций управления данными, главная по отношению ко всем другим его функциям. Руководство данными необходимо, чтобы обеспечить такие процессы принятия решений по поводу данных, которые отвечают интересам организации.
2. Архитектура данных задает схему управления информационными активами в соответствии со стратегией организации, формулируя стратегические требования к данным и способы удовлетворения этих требований.
3. Моделирование и проектирование данных — это процесс выявления, анализа, фиксации и распространения требований к данным в точно определенной форме, называемой моделью данных. Процесс происходит итеративно и может включать разработку концептуальной, логической и физической моделей.
4. Хранение данных и операции с ними. Проектирование и внедрение решений для хранения данных с целью максимального увеличения их ценности. Операции обеспечивают сопровождение данных на протяжении всего их жизненного цикла от планирования до удаления.
5. Безопасность данных обеспечивает приватность и конфиденциальность данных, защиту от взлома, надлежащий доступ к ним.
6. Интеграция и интероперабельность данных включают процессы, связанные с перемещением и консолидацией данных как внутри хранилищ, приложений и организаций, так и между ними.
7. Управление документами и контентом включает планирование, внедрение и мониторинг процессов, которые связаны с управлением ЖЦ данных (подробнее см. главу 2), полученных из разнообразных неструктурированных источников, особенно документов, которые необходимы для обеспечения выполнения нормативных требований.
8. Справочные данные и основные данные (мастер-данные) включают непрерывную сверку и согласование основных совместно используемых данных с целью обеспечить последовательное использование во всех системах наиболее точных, актуальных и релевантных сведений о ключевых бизнес-единицах.
9. Ведение хранилищ данных и бизнес-аналитика предполагают планирование, внедрение и контроль процессов управления теми данными, на основе которых принимаются решения, и создание условий, в которых информационные работники (knowledge workers) смогут извлекать ценность из данных с помощью их анализа и формирования отчетности.
10. Метаданные предполагают планирование, проведение и контроль работ по обеспечению доступа к интегрированным метаданным высокого качества, в том числе к определениям, моделям, потокам данных и другой информации, критически важной для понимания самих данных и систем, где они создаются, содержатся и где к ним обеспечивается доступ.
11. Качество данных предполагает разработку и внедрение методов управления качеством с целью измерять, оценивать и повышать пригодность данных к использованию внутри организации.
Руководству данными отведено центральное место в деятельности по управлению данными; именно оно обеспечивает согласованность и сбалансированность всех функций. Другие области (архитектура, моделирование и проектирование данных и т. д.) равномерно распределены вокруг центра колеса DAMA. Все области необходимы, чтобы управление данными можно было назвать зрелым, но реализовывать их можно постепенно и в том порядке, который отвечает нуждам организации. Проработка всех сегментов колеса позволяет построить полноценную систему управления данными — в этом состоит практический смысл этого инструмента.
Для каждой из областей знаний в DMBOK подробно описаны основные факторы, влияющие на эту область (см. рис. 7): это люди (их роли и ответственность), процессы и технологии.

Рисунок 7
Шестиугольник факторов среды

Наконец, контекстные диаграммы описывают для каждой области знаний цели, входные материалы (и их поставщиков), работы (и их участников), результаты (и их потребителей), а также методы, инструменты и метрики.
Колесо DAMA отражает набор областей знаний на верхнем уровне; шестиугольник факторов среды показывает общие структурные элементы этих областей на более низком уровне; контекстные диаграммы детально представляют устройство каждой области.

Колесо DAMA отражает набор областей знаний на верхнем уровне; шестиугольник факторов среды показывает общие структурные элементы этих областей на более низком уровне; контекстные диаграммы детально представляют устройство каждой области.
Изучение методологии DAMA-DMBOK и основных областей управления данными, составляющих колесо DAMA, может стать первым шагом на пути к полноценному управлению данными.

1.3.3 ВИДЫ УПРАВЛЕНИЯ В ОБЛАСТИ ДАННЫХ

Изучение методологии DAMA-DMBOK и основных областей управления данными, составляющих колесо DAMA, может стать первым шагом на пути к полноценному управлению данными.
Рассмотрим термины, применяемые к деятельности по управлению данными:
  • управление данными (Data Management, DM);
  • управление информацией (Information Management, IM);
  • управление корпоративной информацией (Enterprise Information Management, EIM);
  • управление информационными активами (Information Asset Management, IAM).
Согласно определению DMBOK, управление данными — это разработка, выполнение и контроль выполнения политик, программ и практик предоставления, проверки, защиты и повышения ценности данных на протяжении всего их жизненного цикла. Поскольку в DMBOK термины «информация» и «данные» в применении к управлению данными с известными оговорками взаимозаменяемы (соотношение этих терминов будет подробно обсуждаться в главе 2), «управление данными» и «управление информацией» также описывают одну и ту же реальность. Джон Лэдли отмечает, что рекомендации DMBOK для управления данными применимы как на локальном уровне (на уровне отдельных подразделений), так и на корпоративном (уровне организации в целом).
В этой главе мы берем за основу определения из DAMA-DMBOK.
Ladley J. Data Governance: How to Design, Deploy, and Sustain an Effective Data Governance Program: 2nd Edition. Academic Press, 2020.
Управление корпоративной информацией подразумевает управление на уровне всей организации, причем под это определение подпадают не только коммерческие структуры, но и министерства, ведомства, любые большие организации.
Управление информацией и управление корпоративной информацией обычно рассматриваются как программы в смысле подхода Program Management, под программой понимается «совокупность взаимосвязанных проектов и другой деятельности, направленных на достижение общей цели и реализуемых в условиях общих ограничений».

Управление информацией и управление корпоративной информацией обычно рассматриваются как программы в смысле подхода Program Management, под программой понимается «совокупность взаимосвязанных проектов и другой деятельности, направленных на достижение общей цели и реализуемых в условиях общих ограничений».
Smith P., Edge J., Parry S., Wilkinson D. Crossing the Data Delta: Turn the data you have into the information you need // Entity Group Limited. 2−16. 2016.
См. ГОСТ Р 54 871−2011. Проектный менеджмент. Требования к управлению программой.
Важное отличие управления корпоративной информацией от управления данными вообще — подход к данным как к активу (см. раздел 1.2). В этой связи четвертый ключевой термин в области управления данными — управление информационными активами. Это набор принципов и концепций, в котором данные рассматриваются как стратегически важный актив организации. Управление информационными активами можно воспринимать как новый, датацентричный образ мышления.
Основные аспекты IAM отражены в книге: Лейни Д. Инфономика. Информация как актив: монетизация, оценка, управление. М.: Точка, 2020.
Между управлением информационными активами и управлением корпоративной информацией существует неразрывная связь: первое поставляет концепции, а второе, будучи программой (см. выше), реализует эти концепции. Далее управление данными мы будем обсуждать именно в контексте управления корпоративной информацией.
Там же.