9.2 УРОВНИ И РЕЗУЛЬТАТЫ АНАЛИТИКИ

Типичные проекты в области анализа данных делятся на несколько этапов: данные оцениваются и отбираются, очищаются и фильтруются, визуализируются и анализируются, а результаты анализа в итоге интерпретируются и оцениваются. Трудоемкость этапов неодинакова. Львиная доля рабочего времени (принято считать, что 80−90%) уходит на поиск, извлечение, очистку данных (см. разделы 6.2 и 4.1) и подготовку их к анализу. Для удобства можно выделить ключевые этапы аналитического проекта, показанные на рис. 31.
Межотраслевой стандартный процесс интеллектуального анализа данных (Cross-Industry Standard Process for Data Mining, CRISP-DM) включает шесть этапов: понимание целей, начальное изучение данных, подготовка данных, моделирование, оценка, внедрение
Перед этапом анализа выделяется также процесс самостоятельной подготовки данных (Self-Service Data Preparation), цель которого — привести данные разной периодичности, форматов и качества в единый вид силами бизнес-пользователей. Отличие от стандартного сбора (интеграции данных) заключается в том, что подготовку делает не инженер данных, а сам бизнес-пользователь.
Аналитика помогает принимать обоснованные управленческие решения на четырех уровнях (табл. 6), каждому из которых соответствует определенный результат.
Big data, big outcomes: how analytics can transform public services and improve citizens' lives // EY.
Первый уровень — дескриптивный (описательный), когда мы можем описать прошлое и ответить на вопрос «Что произошло?». Это, например, элементы бухгалтерского учета или количество тех или иных записей в ИС, число жителей в разных районах области, количество автодорог на душу населения. По оценкам авторов, на этом уровне находится около 70% организаций, как государственных, так и негосударственных. Для большинства повседневных задач описательного уровня достаточно.
Второй уровень — диагностический; он отвечает на вопрос «Почему что-либо произошло?». На нем появляется собственно анализ, например ключевые показатели, рентабельность и аналитический финансовый показатель EBITDA в бухгалтерской отчетности; динамика изменения фактического населения региона по сезонам года, изменение удовлетворенности населения после введения каких-либо новых услуг. На этом уровне находится 15−20% организаций госсектора.

Рисунок 31
Этапы аналитического проекта

Предиктивная (прогностическая, предсказывающая) аналитика — это уже не просто анализ, но и построение различных моделей на основе данных, которыми располагает организация, — от простых регрессионных до более сложных на базе нейронных сетей. Предиктивная аналитика отвечает на вопрос «Что произойдет?».
О том, как работают предиктивные аналитические модели в современных организациях мира, см.: Сигель Э. Просчитать будущее. Кто кликнет, купит, соврет или умрет. М.: Альпина Бизнес Букс, 2014.
Центр ЦТ ФАУ «Главгосэкспертиза России» разрабатывает цифровые решения на основе дата-ориентированного подхода для отрасли строительной экспертизы. В ходе реализации нацпроекта «Цифровая экономика» создается Единая цифровая платформа экспертизы. В нее загружается в машиночитаемом виде вся предоставляемая на экспертизу документация, производится разметка данных, что позволяет применять аналитические методы и получать ответы на вопросы «Почему?», «Кто?» и «Какие действия предпринять?». Возможности цифровой платформы экономят время и средства при проведении экспертизы.

Центр ЦТ ФАУ «Главгосэкспертиза России» разрабатывает цифровые решения на основе дата-ориентированного подхода для отрасли строительной экспертизы. В ходе реализации нацпроекта «Цифровая экономика» создается Единая цифровая платформа экспертизы. В нее загружается в машиночитаемом виде вся предоставляемая на экспертизу документация, производится разметка данных, что позволяет применять аналитические методы и получать ответы на вопросы «Почему?», «Кто?» и «Какие действия предпринять?». Возможности цифровой платформы экономят время и средства при проведении экспертизы.
BIG DATA 2020: Главгосэкспертиза на единой цифровой платформе // Вестник цифровой трансформации CIO.RU.
Наконец, на прескриптивном (предписывающем) уровне руководители получают варианты решений анализируемой проблемы. Реализована такая аналитика может быть как в виде расчетов вероятности тех или иных событий при принятии определенного решения или поиска оптимума «затраты — доходы», так и в виде полноценных систем поддержки принятия решений. Лишь считаные проценты организаций в мире строят свою деятельность на предиктивной или прескриптивной аналитике.
«Издалека аналитические информационные панели могут выглядеть внушительно: какие-то цифры, графики. Но представьте, что это панель управления автомобиля — куча мелких цифр и диаграмм. Как вы будете им управлять? Хорошая аналитическая система должна включать прогноз, а не одни мертвые данные, показывающие, что произошло. Если у вас нет прогноза, вы не понимаете, как будет развиваться ситуация».
Илия Димитров, омбудсмен по вопросам развития цифровой экономики
Следует учесть, что системы предиктивной или прескриптивной аналитики нуждаются в больших массивах данных, создание которых требует отдельных усилий и специальной инфраструктуры. Такого уровня аналитики легче достичь, если организации удается преодолеть «феодализм данных» (см. также раздел 4.5), когда данные хранятся изолированно в локальных базах отделов и департаментов, а их интеграция в единые наборы затруднена по административным или техническим причинам.
Развитию высокоуровневой аналитики способствует свободный обмен данными, накопление их в специальных хранилищах, постоянное обогащение данных. Кроме того, важно наличие метаданных (сведений об имеющихся данных), регламентов сбора, обработки и хранения данных.

Таблица 6
Уровни аналитики данных