БЛОК II
начинаем работать

4. СИСТЕМА УПРАВЛЕНИЯ ДАННЫМИ

Авторы: А. С. Константинов, Н. В. Скворцов, Р. С. Стрекаловский
Время чтения: 27 мин.

Ключевые идеи

Жизненный цикл данных начинается с планирования и заканчивается ликвидацией данных, он включает, к примеру, обеспечение доступности данных; хранение, обслуживание данных и предоставление совместного доступа к ним; повышение ценности данных.
Управление на основе данных невозможно без управления данными, включающего в себя, прежде всего, отлаженные процессы, сформированную архитектуру данных, инструменты обеспечения их данных.
Корпоративная модель данных включает наименования элементов данных, подробные определения данных и метаданных, концептуальные и логические сущности и связи между ними, а также бизнес-правила.
Работе с данными может помешать недостаток дата-центричного мышления, отсутствие квалифицированного руководства в области данных, несогласованность между планами в области данных и ИТ-проектами.
При разработке и внедрении системы управления данными приоритетными будут такие вопросы, как оценка зрелости существующей системы управления данными; разработка стратегии работы с данными и стратегии управления данными, тесно увязанных со стратегией организации; внедрение в организации функции руководства данными.

4.1 ЖИЗНЕННЫЙ ЦИКЛ ДАННЫХ В DAMA-DMBOK

Все управленческие решения и практические действия, имеющие отношение к данным, так или иначе привязаны к их жизненному циклу (ЖЦ). Он начинается с планирования и заканчивается ликвидацией данных. На рис. 19 представлены следующие процессы ЖЦ данных:
1) планирование;
2) проектирование и обеспечение доступности данных;
3) создание или получение данных;
4) перемещение, преобразование, хранение, а также обслуживание данных и предоставление совместного доступа к ним;
5) расширение возможностей использования данных;
6) улучшение (повышение ценности) данных.
Завершает цикл ликвидация данных. Кроме того, на протяжении всего ЖЦ данные можно очищать, преобразовывать, подвергать слиянию или агрегировать (см. раздел 6.2).
Требования к организации отдельных фаз ЖЦ зависят от вида данных (их классификацию см. в главе 2). ЖЦ данных в отдельно взятой организации может оказаться весьма запутанным. Наряду с ЖЦ данные имеют еще и путь (lineage), по которому они движутся от места возникновения до места использования; этот путь иногда называют также цепочкой данных.

Рисунок 19
Жизненный цикл данных

Следует иметь в виду, что перед госсектором стоит отдельная методологическая задача — адаптировать общие подходы DMBOK с учетом особенностей государственных организаций.
Схема на рис. 20 соотносит ЖЦ данных с основным фреймворком DAMA (см. раздел 1.3) и исходит из цели управления данными — дать организации возможность извлекать выгоду из информационных активов. Для этого требуется управлять жизненным циклом данных, поэтому функции, относящиеся к его конкретным фазам, помещены в центр диаграммы.

Рисунок 20
Фреймворк функций управления данными (в привязке к жизненному циклу)

Начинается все с планирования и проектирования надежных и качественных данных. К этому этапу относятся процедуры создания архитектуры и модели данных, разработка системы метаданных.
Архитектура данных образует фундамент управления данными. Цель архитектуры данных — служить мостом между бизнес-стратегией и ее технологической реализацией. Поскольку весь объем данных в организации не может быть осмыслен отдельными сотрудниками, возникает потребность в представлении этих данных на разных уровнях абстракции так, чтобы их можно было понять и чтобы руководство организации могло принимать относительно них соответствующие решения.

Как стратегия данных не существует в вакууме без стратегических документов организации в целом (см. раздел 4.3), так и архитектура данных входит в целостную архитектуру предприятия (Enterprise Architecture). Она описывается с помощью комплекса проектных документов разной степени абстракции, включая стандарты, политики и прочие документы, определяющие порядок сбора, хранения, упорядочения, использования и удаления данных. Наиболее детализированным архитектурным документом в области данных является оформленная надлежащим образом корпоративная модель данных, включающая наименования элементов данных, подробные определения данных и метаданных, концептуальные и логические сущности и связи между ними, а также бизнес-правила. Наряду с другими документами в состав документации входят физические модели данных, но только в качестве продуктов области моделирования и проектирования, а не области архитектуры данных.

Архитектура данных образует фундамент управления данными. Цель архитектуры данных — служить мостом между бизнес-стратегией и ее технологической реализацией. Поскольку весь объем данных в организации не может быть осмыслен отдельными сотрудниками, возникает потребность в представлении этих данных на разных уровнях абстракции так, чтобы их можно было понять и чтобы руководство организации могло принимать относительно них соответствующие решения.

Как стратегия данных не существует в вакууме без стратегических документов организации в целом (см. раздел 4.3), так и архитектура данных входит в целостную архитектуру предприятия (Enterprise Architecture). Она описывается с помощью комплекса проектных документов разной степени абстракции, включая стандарты, политики и прочие документы, определяющие порядок сбора, хранения, упорядочения, использования и удаления данных. Наиболее детализированным архитектурным документом в области данных является оформленная надлежащим образом корпоративная модель данных, включающая наименования элементов данных, подробные определения данных и метаданных, концептуальные и логические сущности и связи между ними, а также бизнес-правила. Наряду с другими документами в состав документации входят физические модели данных, но только в качестве продуктов области моделирования и проектирования, а не области архитектуры данных.
DAMA-DMBOK: свод знаний по управлению данными. 2-е изд. М.: Олимп-Бизнес, 2020.
Потееев П., Рудь В. Что такое архитектура организации // Стратегия цифровой трансформации: написать, чтобы выполнить. М.: РАНХиГС, 2021.
DAMA-DMBOK: свод знаний по управлению данными. 2-е изд. М.: Олимп-Бизнес, 2020.
Далее наступает черед внедрения процессов и функций, обеспечивающих доступность данных для использования и их обслуживание. Наконец, данные используют в аналитике, за счет чего их ценность повышается (см. главу 9). Для успешной поддержки производства и использования данных, а также повышения уровня исполнительской дисциплины, организации должны осуществлять руководство данными (Data Governance; см. об этом раздел 4.4). А все названные функции в совокупности составляют систему управления данными, описанную ниже.