Б. ОПЫТ УПРАВЛЕНИЯ ДАННЫМИ В РОССИИ

Время чтения: 40 мин.
Осваивая современные методы управления данными, руководители и команды цифровой трансформации получают инструменты для поддержки управленческих решений, надежную аналитику, оптимизируют процессы в своих организациях. Собранные в этом приложении успешные кейсы семи российских ведомств и регионов показывают, что налаженная работа с данными может изменить органы госуправления и выступить драйвером изменений в социальной сфере.

Б1 Анализ эффективности единой государственной системы отчетности в Республике Татарстан

Авторы: Р. И. Абдрахманов А. А. Орлова Д. О. Теплякова
Название проекта
Анализ эффективности единой государственной системы отчетности «Отчеты ведомств» информационного портала «Открытый Татарстан»
Год
2020
Название организации
Центр цифровой трансформации Республики Татарстан (далее — ЦЦТ РТ); комитет по социально-экономическому мониторингу Республики Татарстан (далее — КСЭМ РТ); центр информационных технологий Республики Татарстан (далее — ЦИТ РТ)
Цель проекта
Увеличить эффективность при составлении отчетов, уменьшить трудозатраты.
Команда
  • Исполнительный директор ЦЦТ РТ
  • Начальник отдела управления данными ЦЦТ РТ
  • Руководитель проектов ЦЦТ РТ
  • Аналитик данных ЦЦТ РТ
  • Департамент информационной безопасности ЦИТ РТ
  • Начальник отдела информационных ресурсов и технологий КСЭМ РТ
  • Ведущий специалист отдела информационных ресурсов и технологий КСЭМ РТ
К началу проекта команда была сформирована. Основной ее состав (роли 1−5) участвует в большинстве прикладных проектов отдела управления данными ЦЦТ РТ.
Результат
По итогам проекта был выработан ряд рекомендаций, в частности: автоматизировать заполнение показателей, используемых в наиболее популярных отчетах; переводить непопулярные отчеты в архив, чтобы избежать затрат на их сопровождение.
Интересный факт
В единой государственной системе отчетности «Отчеты ведомств» информационного портала «Открытый Татарстан» (далее — ЕГСО ОВ) накапливается и обрабатывается более 4000 показателей по различным направлениям деятельности Республики Татарстан, таким как образование, здравоохранение, экономика, промышленность, строительство, транспорт и дороги, общественная безопасность, статистика, финансы и бюджет, экология, потребительский рынок и др. Показатели используются при построении отчетных форм, которых в ЕГСО ОВ около 500. Более 1300 сотрудников органов исполнительной власти и местного самоуправления занимаются актуализацией, проверкой и публикацией отчетов.

Предпосылки

ЕГСО ОВ информационного портала «Открытый Татарстан» была создана в 2013 году. Проект анализа ее эффективности родился из гипотезы о том, что не все отчеты и показатели в системе одинаково эффективны и полезны. Есть показатели, которые используются в востребованных отчетах с большим количеством просмотров. А у некоторых отчетов просмотров так мало, что затраты на сопровождение этих отчетов не окупаются.
Постановление кабинета министров Республики Татарстан от 27.08.2013 № 603 «О создании единой государственной системы отчетности „Отчеты ведомств" информационного портала „Открытый Татарстан"» // Электронный фонд правовых и нормативно-технических документов.

Рисунок 36
Пример главной страницы дашборда

Особенности проекта

Для анализа ситуации на основе данных было выбрано BI-решение Qlik Sense Enterprise. Решение имеет широкие функциональные возможности, как в части ETL (см. раздел 6.2), так и в части работы с моделью данных и визуализацией (см. рис. 36). Это решение можно было развернуть в том же центре обработки данных (далее — ЦОД), где развернута ЕГСО ОВ.
Команда проанализировала ряд метрик: трудозатраты сотрудников на отчет в часах, общее количество просмотров отчета с учетом его периодичности, еще некоторые другие (вспомогательные) метрики. Отношение количества просмотров к величине трудозатрат было названо индексом эффективности отчета. Отчеты с индексом ниже среднего были отнесены к красной зоне, остальные — к зеленой. Отчеты красной зоны были проанализированы более детально; среди отчетов со сравнительно высокими показателями просмотров были выявлены наиболее трудозатратные.

Безопасность

Qlik Sense был развернут в контролируемой зоне ЦОД — той же, где развернута ЕГСО ОВ, — что позволило сэкономить на приобретении средств криптографической защиты информации. Также затраты на информационную безопасность были снижены благодаря исключению из обработки персональных данных пользователей.
Подключение пользователей к BI было реализовано через виртуальную частную сеть, а подключение к веб-серверу Qlik Sense защищено шифрованием SSL. Дополнительно были настроены межсетевые экраны, препятствующие несанкционированному доступу на уровне локальновычислительной сети ЦОД.

Б2 Система управления данными в Счетной палате РФ

Авторы: М. В. Петров
Название проекта
Внедрение системы управления данными
Год
2021
Название организации
Счетная палата Российской Федерации
Цель проекта
Существенно повысить качество данных и удобство их использования, автоматизировать их обработку, изменить культуру работы с данными в организации.
Команда
Департамент цифровой трансформации Счетной палаты осуществляет общее руководство проектом; институт специалистов по описанию данных (дата-стюардов) в составе службы управления данными формирует ландшафт данных Счетной палаты.
Результаты
  1. Создана система управления данными как модуль цифровой платформы Счетной палаты. В нем ведется описание данных, а также настраиваются правила, которым должны соответствовать данные.
  2. Создана служба управления данными; ей поручено обеспечивать инспекторский состав качественными данными. В состав службы входят дата-стюарды (см. о них разделы 4.4 и 5.1), дата-инженеры.
Интересный факт
Дата-стюарды составляют карты данных, описывая по специальной методике ИС — источники данных, готовят описания наборов данных и витрин данных (см. рис. 37). Чтобы создать и успешно интегрировать правила управления качеством в систему, дата-стюард должен быть экспертом в предметной области и уметь преобразовывать описание правил в алгоритмы. Рассматривались два варианта создания службы — централизованный и децентрализованный, при котором датастюарды рассредоточены по отдельным департаментам. Был выбран второй вариант.

О проекте

В Счетной палате РФ создана цифровая платформа, объединяющая все основные бизнес-процессы организации. Ее составная часть и основа — система управления данными (СУД).

Предпосылки

Ранее данные накапливались в том виде, в котором они поступали в Счетную палату (в том числе разноформатные, неполные, некорректные, устаревшие). На проверку и очистку уходило много времени, приходилось дорабатывать системы сбора данных. Нужно было создать принципиально новую систему управления данными, которая позволяла бы описывать весь ландшафт данных, доступных для работы, быстро подключать новые источники, настраивать правила проверки качества данных.

Технология

Цифровая платформа в целом имеет трехслойную архитектуру.

  • Верхний слой непосредственно связан с бизнес-процессами: он обеспечивает проведение проверок, работу инспекторов, взаимодействие с экспертами.
  • Средний слой — озеро данных, хранящее данные, которые поступают из внутренних и внешних источников.
  • Глубинный слой — источники, из которых данные попадают в озеро данных.
Система управления данными Счетной палаты РФ (рис. 38) — основной элемент цифровой платформы Счетной палаты, позволяющий обеспечить централизованный учет, инвентаризацию информационных ресурсов, а также нормализацию, обогащение и качество данных.

К ключевым процессам в СУД можно отнести:

  • формирование карт данных;
  • описание подключения к источникам данных;
  • описание статуса первичной загрузки наборов данных;
  • мониторинг загрузки и обновления наборов данных;
  • создание правил качества данных и контроль качества данных;
  • мониторинг результатов контроля качества данных.
Все процессы реализованы в едином удобном интерфейсе, что позволяет быстрее находить уже загруженные и обработанные данные, понимать, какие источники данных имеются в распоряжении, по каким ведется работа.

Рисунок 37.
Модели компетенций дата-стюардов, разработанные в Счетной палате РФ

Рисунок 38.
Система управления данными Счетной палаты Российской Федерации

Особенности проекта

В СУД используются карты данных и инструменты проверки качества данных, контроль качества данных стандартизирован. Особое внимание уделяется таким метрикам данных, как своевременность и волатильность, точность, валидность, согласованность (см. раздел 7.3). Взаимодействие подразделений является в СУД сквозным процессом: нет необходимости направлять служебные записки, письма между подразделениями.
Cистема постоянно действующей проверки качества эффективна при большом и относительно неизменном потоке данных. Если данные имеют разный формат, разные цели, поступают спорадически, система обработки данных вряд ли будет эффективна. В этом случае проще проверять качество данных вручную.
Прежде чем загрузить в озеро данные загранпаспорта, их проверяют на валидность (дата окончания действия паспорта должна быть в будущем, а не в прошлом) и корректность (разность между датой окончания срока действия паспорта и датой его выдачи должна быть ровно 10 лет). Если эти условия не соблюдаются, значит, у паспорта закончился срок действия, он недействителен или имеются ошибки ввода данных.

Прежде чем загрузить в озеро данные загранпаспорта, их проверяют на валидность (дата окончания действия паспорта должна быть в будущем, а не в прошлом) и корректность (разность между датой окончания срока действия паспорта и датой его выдачи должна быть ровно 10 лет). Если эти условия не соблюдаются, значит, у паспорта закончился срок действия, он недействителен или имеются ошибки ввода данных.
При обнаружении ошибки дата-стюард во взаимодействии с инспекторским составом принимает решение повторно запросить данные у источника или, если позволяет ситуация, оперативно исправить данные. В СУД создаются инструменты, поддерживающие такие действия.

Результаты

Определены источники знания и инструментарий для работы с данными. Созданы отдельные профили компетенций для дата-стюардов (см. раздел 5.1) и остальных сотрудников, работающих с данными. Чтобы ускорить работу и тратить меньше ресурсов, выстраивается взаимодействие с Минцифры России в части гармонизации методологических подходов к управлению данными, в целях объединения описания данных в НСУД (см. раздел 3.1.2) с описаниями в СУД Счетной палаты РФ и создания единого информационного поля. СУД находится в промышленной эксплуатации, проведена работа по формированию структуры и укомплектованию службы управления данными, обучены ключевые сотрудники департаментов и инспекций Счетной палаты РФ. К концу 2021 года СУД оперировала 908 источниками данных, 634 наборами данных и 80 картами данных.

Б3 Использование результатов хакатона в практике Роструда

Авторы: И. А. Анисимова А. В. Архипов А. А. Орлова
Название проекта
Хакатон PandemicDataHack
Год
2020
Цель проекта
Создание моделей и проверка гипотез для развития сервисов единой цифровой платформы (ЕЦП) «Работа в России»; исследования в сфере рынка труда в период пандемии.
Команда
Руководитель и заместитель руководителя проекта, постановщики задач, аналитики данных, дата-инженеры, координаторы треков, отраслевые эксперты, медиакоманда, специалисты технической поддержки.
Результаты
Созданы прототипы и модели сервисов ЕЦП «Работа в России» (для служб занятости, граждан и работодателей). Результаты исследований используются для трудоустройства безработных граждан.
Интересный факт
Более 2500 центров занятости используют в своей деятельности сервисы ЕЦП.

О проекте

В декабре 2020 года Роструд совместно с АНО «Центр перспективных управленческих решений» (ЦПУР) провел онлайн-хакатон по решению задач в сфере труда и занятости во время коронавируса PandemicDataHack. Его участникам были предложены четыре направления работы (трека). Участники исследовательского трека на основе административных данных портала «Работа в России» должны были определить:

  • как изменился профиль безработного в службе занятости;
  • какие группы населения больше всего рискуют потерять работу в кризис;
  • в каких отраслях рынки труда более устойчивы в кризис;
  • какие факторы влияют на трудоустройство граждан во время пандемии.
Cм. официальный сайт хакатона PandemicDataHack
Участники трека машинного обучения на основе массивов вакансий и резюме создавали модели определения релевантной зарплаты для соискателя. Роструд планировал использовать результаты хакатона для создания новых сервисов в ЕЦП «Работа в России», а также для процессов модернизации служб занятости (проект «Служба занятости 2.0»).
К данным, подготовленным для хакатона, были применены процедуры снижения детализации и анонимизации, чтобы исключить риск раскрытия чувствительных данных, но не потерять их ценность для исследований.

Предпосылки

В последние годы в службах занятости многих стран, в том числе в России, появился запрос на кастомизацию услуг — формирование предложений, которые в наибольшей степени подходят конкретному гражданину, той или иной категории (например, молодежи или людям с инвалидностью). Для развития сервисов специалистам Роструда важно анализировать не только общие тренды, но и более частные закономерности: по отдельным группам граждан, территориям, социальному статусу, возрасту и т. д. Потребность в таких подходах еще более усилилась с 2020 года, когда уровень регистрируемой безработицы впервые в российской истории существенно приблизился к уровню общей безработицы, рассчитываемой по методологии Международной организации труда.
Весной 2020 года на портале «Работа в России» появилась возможность онлайн-обращения за услугами. В результате за содействием в поиске работы обратились несколько миллионов граждан, объем данных значительно возрос. На рынке труда и занятости произошли существенные перемены, ситуация потребовала оперативных решений, создания новых сервисов для граждан на ресурсах Роструда, выработки новых подходов, основанных на анализе данных. Для создания моделей будущих сервисов и проверки гипотез в декабре 2020 года был инициирован хакатон с привлечением молодых исследовательских команд.

Особенности

По данным о вакансиях и резюме участники трека машинного обучения строили модели, предсказывающие уровень зарплаты, на которую может рассчитывать соискатель. Хакатон проводился на платформе Kaggle.
Kaggle (kaggle.com) — система организации конкурсов и социальная сеть специалистов по обработке данных и машинному обучению. На этой платформе исследователи разных уровней могут опробовать свои модели анализа данных на реальных задачах. Ресурс дает возможность получить профессиональный опыт, авторов лучших моделей награждают денежными призами.

Kaggle (kaggle.com) — система организации конкурсов и социальная сеть специалистов по обработке данных и машинному обучению. На этой платформе исследователи разных уровней могут опробовать свои модели анализа данных на реальных задачах. Ресурс дает возможность получить профессиональный опыт, авторов лучших моделей награждают денежными призами.
Для более точного соответствия между вакансиями и резюме исследователи и аналитики данных предложили включить в число собираемых данных сведения о поведении пользователей на портале: какие вакансии просматривает автор резюме, как меняется интенсивность его поиска. На портале появился блок, позволяющий собирать такие сведения.

Результаты

1
Алгоритмы, опробованные на хакатоне, стали отправной точкой внедрения технологий машинного обучения для работы с вакансиями и резюме. В 2021 году в ЕЦП «Работа в России» был запущен инновационный сервис СV-matching, позволяющий центрам занятости оперативно подбирать как максимально релевантные вакансии для соискателей, так и резюме кандидатов на открытые позиции в компании. Этим сервисом, созданным с использованием компонентов ИИ, уже могут пользоваться граждане и работодатели.
2
Исследования участников хакатона использовались в работе центров занятости с различными категориями граждан, в том числе с молодежью.
3
Проведение хакатона на детальных данных, ранее недоступных широкому сообществу исследователей и дата-аналитиков, позволило:



  • по-новому взглянуть на услуги и сервисы Роструда, собрать гипотезы и предложения, которые легли в основу концепции по совершенствованию действующих сервисов;

  • активно внедрять методы доказательной политики на рынке труда;

  • строить сообщество пользователей, анализирующих данные ведомства, которых в дальнейшем можно привлекать в качестве внешних экспертов.

Б4 Геоаналитическая платформа ВТБ

Авторы: Д. А. Суржко М. В. Туманова Ю. А. Шамаев
Название проекта
Геоаналитическая платформа
Год
2020–2021
Название организации
Банк ВТБ
Цель проекта
Создание инструмента поддержки принятия решений
Команда
  • Инфраструктурная группа разрабатывает интерфейс, осуществляет поддержку серверов, ведет договорную базу.

  • Команда исследователей данных разрабатывает дизайн продукта и модели ИИ.

  • Платформа больших данных (совместное предприятие ВТБ и «Ростелекома») взаимодействует с заказчиками.
Результат
Геоплатформа представляет собой универсальный геоаналитический инструмент, способный решать широкий спектр задач: от размещения точек продаж до управления рисками.
Интересный факт
Геоплатформа стала базой для принципиально нового продукта на рынке — сервисов Geo-embedding, основанных на применении нейронных сетей. Они позволяют DataScience-команде платформы объединять усилия с DS-командами клиентов, вместо того чтобы конкурировать с ними или заменять их.

О проекте

В банке ВТБ создана геоаналитическая платформа, которая объединяет как собственные данные банка, полученные в результате геотегирования использования банковской карты, так и данные других организаций: сотовых операторов, интернет-провайдеров, портала сделок с недвижимостью. Геоплатформа — инструмент, способный решать широкий спектр задач: от прогнозирования спроса, размещения точек продаж, рекламы и оптимизации клиентопотока до управления рисками. Решение может применяться и в сфере госуправления, например для аналитики туристических потоков, оценки инвестиционной привлекательности, а также для решения локальных задач: выбора места для нового отделения МФЦ или оптимизации его загрузки, прогнозирования востребованности отдельных госуслуг.
По сравнению с экспертной оценкой и моделью на основе открытых данных платформа обладает большей точностью. Она вызвала интерес сторонних организаций; оставалось выбрать способ сотрудничества (см. табл. 8). Требовалось найти решение, позволяющее достичь синергии на уровне данных и при этом сохранить комфортное распределение компетенций и первичной информации между партнерами. Подход Data Fusion (сквозное объединение данных) стал очередным шагом в предиктивной аналитике, который помогает бизнесу создавать персонифицированные предложения и прогнозировать потребности клиентов. В 2021 году в ВТБ этот подход был реализован в технологии Geo-embedding (геоэмбеддинга, или векторного представления клиентов), позволяющей решать проблемы, которые возникают при объединении данных.
Модели на основе машинного обучения невозможно построить независимо, объединив только прогнозы; максимальная эффективность достигается при объединении данных, что позволяет учесть все нелинейные закономерности внутри данных.

Таблица 8.
Варианты сотрудничества в сфере обработки данных

Особенности платформы

  • Уникальный набор данных, которые удалось собрать в банке и с помощью партнеров. Более 200 первичных геослоев и около 1000 производных позволяют делать прогнозы на качественно новом уровне детализации и точности. На геоплатформе можно решать задачи эффективного размещения точек продаж, рекламы, оптимизировать поток клиентов.

  • Заказчику передается информация по любому участку в удобной для него форме (набор цифр, который заказчик вставляет в свою модель, не обладая при этом специфическими компетенциями в геоаналитике).

  • Используются специализированные нейросети, которые решают определенный класс задач; они относительно недороги и при этом дают заказчику определенную свободу действий.
По сравнению с универсальной сетью.

Безопасность

Платформа позволяет безопасно объединять данные о клиентах, полностью их обезличивая, но сохраняя ценность для задач моделирования. Она не работает с чувствительными данными. Платформа не делает разовые срезы данных, идет постоянный мониторинг, модели постоянно обновляются. За соблюдение требований информационной безопасности отвечает специальное подразделение банка.

Б5 Использование данных мобильного оператора Tele2

Авторы: В. В. Малыгин М. В. Туманова А. А. Орлова
Название проекта
Геоаналитика сотового оператора для госслужбы
Год
2019–2021
Название организации
BigData Office Tele2
Цель проекта
Оптимизация транспортных потоков, решение градостроительных задач, обеспечение безопасности на массовых мероприятиях, уточнение демографических данных.
Команда
Дата-аналитики, дата-инженеры, исследователи данных.
Результаты
Созданы аналитические инструменты для принятия управленческих решений. Получена новая оценка данных для улучшения качества процессов.
Интересный факт
В 2014 году на основе геоданных аналитики Tele2 было установлено, что на одном из московских кладбищ постоянно проживают около 2500 человек. Проверка выявила общежитие нелегальных мигрантов.

О проекте

Технология обработки данных мобильного оператора, разработанная в подразделении больших данных компании Tele2, использовалась для решения задач в сфере туризма, транспорта, обеспечения безопасности на массовых мероприятиях, муниципального управления; определения количества и качества населения, изучения пропускной способности дорог. Сотрудники Tele2 изучали запросы РОИВ и помогали решать им демографические, транспортные и другие проблемы (см. табл. 9).

Таблица 9
Что дает использование мобильных данных

1. Туризм

Комитет по развитию туризма Волгоградской области попросил сотрудников Tele2 проанализировать состав туристов, посещающих регион. Госслужащие считали, что к ним едут преимущественно родственники волгоградцев, а также рыбаки или туристы. Анализ турпотока с помощью мобильных данных показал, что через регион перемещается много транзитных туристов. Среди них выделяется особый сегмент — байкеры, которые выбирают вместо федеральных трасс дороги с более спокойным трафиком и останавливаются в популярных в их среде местах по дороге на байк-фестивали. Региональные власти оборудовали в этих местах стоянки, сделали кемпинги, поставили туалеты, там стала развиваться коммерческая инфраструктура.
Один из курортов регулярно отчитывался о росте туристического потока. Однако при анализе данных пользователей сотовой сети (см. рис. 39) специалисты Tele2 выяснили, что 95% приезжих раньше уже бывали на этом курорте, новых туристов практически нет. Эта проблема ставила под сомнение перспективы курорта, и ее невозможно было выявить традиционными методами, при которых считали количество посещений, но не учитывали уникальность персон.

Рисунок 39
Использование данных оператора связи для анализа турпотоков

Для учета туристов, прибывающих в район популярного природного парка Сортавала, администрация Республики Карелия традиционно запрашивала сведения у гостиниц, РЖД и Росавтодора, а также у ФСБ (о приехавших иностранцах). На основе этих данных госслужащие делали выводы об объеме турпотока и необходимой инфраструктуре. Когда специалисты Tele2 показали администрации региона свои данные, основанные на геолокации сотовых телефонов, оказалось, что количество туристов почти в 10 раз превышает цифры, полученные в результате обычного подсчета: на обсуждаемой территории находилось более 1 млн гостей; гостиницы были переполнены.
Каким образом были получены эти данные? Требовалось определить домашнюю локацию абонента (место, где он в основном находится в ночное время). Система устанавливает домашнюю локацию на основе динамических изменений, после этого можно выделить туристов. Оператор мобильной связи обрабатывает петабайты информации, но вся она обезличена, результаты формируются в агрегированном виде.
Специалисты Tele2 взаимодействовали с исследовательским агентством, которое разрабатывало стратегию развития туризма в регионе. В проекте был проанализирован турпоток за два предыдущих года.

2. Демография

Для развития населенного пункта важно знать, сколько человек проживают там постоянно, сколько — временно, сколько человек посещают город в определенные часы. Раньше использовались два способа: регистрация по месту жительства (данные МВД) и перепись населения (Росстат), — но перепись дает устаревшие и неточные данные, а регистрация не учитывает суточную мобильность (рис. 40).

Рисунок 40
Расчет суточной мобильности

Тепловые карты, построенные на основе мобильных данных, позволяют увидеть городские проблемы, от скопления мусора до неудобного маршрута транспорта и недостатка социальной инфраструктуры, а также наблюдать за активностью населения, например подсчитать, сколько человек регулярно совершают пробежки.
В деревне под Ижевском рассматривался вопрос о необходимости фельдшерского пункта. Команда Tele2 провела анализ годовой динамики населения, и стало понятно, что это скорее дачный поселок: летом туда приезжают отдыхать, а зимой там почти никто не живет. График работы фельдшерского пункта был изменен, и теперь он работает с мая по октябрь, во время дачного сезона.

3. Безопасность на массовых мероприятиях

Специалисты Tele2 сотрудничали с администрацией Санкт-Петербурга, помогая составить социально-демографический портрет участников массовых мероприятий. На одном из фестивалей организаторы неожиданно для себя обнаружили большое количество детей. Анализ данных сотовых операторов показал, что дети приехали из Челябинской области, где каникулы начались на две недели раньше. В точной характеристике посетителей мероприятий был заинтересован не только городской комитет по развитию туризма, но и комитет по культуре: если первый отвечал за приезжих, то второму было важно понять, сколько петербуржцев посещает такие фестивали.
Анализ данных помогает планировать мероприятия с учетом потребностей их участников. В итоге было изменено время работы рамок безопасности, оптимизированы маршруты подвоза туристов, скорректирована маркетинговая активность (исходя из портрета посетителя).

4. Городской транспорт

При строительстве объездной дороги вокруг Сочи необходимо было рассчитать ее пропускную способность. Проектная организация, агентство «Стройпроект», собиралась применить традиционные методы, чтобы рассчитать усредненный транспортный поток за день, неделю или месяц. Такой способ не позволял точно прогнозировать пиковые нагрузки и не давал возможности избежать пробок в часы пик. Для анализа транспортной нагрузки команда Tele2 использовала матрицы корреспонденций (перемещений из одного места в другое) за получасовые интервалы, при этом учитывался план строительства новых жилых районов на пути трассы. В результате пропускная способность дороги была рассчитана на несколько лет вперед и с учетом повышенной нагрузки в часы пик.
В Иркутске городские власти закрывали для ремонта дороги одну из улиц и попросили команду Tele2 рассчитать, насколько труднее будет людям передвигаться по городу. По результатам аналитики время перемещения человека из дома на работу должно было увеличиться в полтора-два раза. Такие точные подсчеты помогают выбрать правильное решение при планировании работ.
Раньше количество пассажиров вручную фиксировали специальные сотрудники в течение нескольких дней. Сейчас аналитик за несколько часов может построить матрицы пассажиропотока в общественном транспорте с помощью данных мобильных операторов. Специалисты Tele2 делят город на транспортные районы исходя из доступности рабочих мест, социальных объектов по отношению к местам проживания, составляют матрицы корреспонденций между районами, которые показывают миграционную потребность населения — транспортный спрос, затем на матрицу корреспонденций накладывается существующая маршрутная сеть и генерируются передвижения населения, на основе которых можно сделать вывод о загруженности маршрута и востребованности направления и о подвижности населения в целом.
В частности, можно рассчитать для каждого жителя города расстояние до парка (в проектах по развитию городского хозяйства есть показатель — пешая доступность парка для каждого горожанина); по итогам анализа можно спроектировать зеленые зоны.

Технологии

Инструменты работы с данными показаны в табл. 10.

Таблица 10
Инструменты работы с данными

Результаты

Работа с данными позволила, в частности:

  • уточнить объем туристического потока, который оказался в 10 раз больше предполагаемого;
  • обнаружить поток транзитных туристов на автотрассе и оборудовать для них стоянки;
  • установить регионы, откуда прибыли участники массовых мероприятий, оптимизировать туристические маршруты;
  • повысить точность долгосрочного планирования и избежать транспортных проблем в перспективе;
  • проанализировать причины ДТП, чтобы обеспечить безопасность движения.
На основе проделанной работы был сделан вывод, что для обоснованного прогноза нет необходимости получать данные от всех сотовых операторов: экстраполяция данных одного-двух операторов дает прогноз необходимой точности. Но получить нужные данные недостаточно, нужна готовность их использовать: вносить изменения в проекты строительства, в планы ремонта, в обеспеченность социальной инфраструктурой.

Б6 Система раннего предупреждения онкозаболеваний в Якутии

Авторы: Л. Н. Афанасьева А. А. Орлова
Название проекта
Создание веб-приложения «Онкопоиск» Год 2020
Год
2020
Название организации
Министерство здравоохранения Республики Саха (Якутия), Якутский республиканский онкологический диспансер
Цели проекта
Ранняя диагностика злокачественных новообразований и предопухолевой патологии, выявление шести видов рака, наиболее распространенных в Якутии. Формирование групп повышенного онкологического риска и отбор нуждающихся в дополнительном обследовании. Выявление людей с высоким риском возникновения онкозаболеваний.
Команда
  • Авторы программы: главврач и врачи Якутского республиканского онкодиспансера.
  • Разработчики программы: ИТ-специалисты.
  • Для разработки сервиса был назначен CDO.
Результат
Программа находится в стадии внедрения, планируется подключение медицинских организаций первичного звена. В дальнейшем веб-приложение сможет использовать любой житель республики.
Интересный факт
Кроме онлайн-диагностики проект «Онкопоиск» предполагает также открытие кабинетов онкоскрининга в поликлиниках и выезд в отдаленные районы мультидисциплинарных медицинских бригад «Онкодесант».

О проекте

«Онкопоиск» нацелен на выявление шести наиболее распространенных в регионе видов рака. Представляет собой автономный сайт-платформу для автоматизированного расчета рисков развития злокачественных новообразований (ЗНО) и предраковых состояний.

Возможности программы «Онкопоиск» (см. табл. 11):

  • Анкетирование и диагностика. Алгоритм анализирует результаты заполнения опросника и выбирает пациентов, которым нужно дополнительное обследование в онкодиспансере. Все пользователи системы фиксируются в республиканском регистре скрининга рака.
  • Аналитика. С помощью программы можно вести онлайн-мониторинг, а также составить карту заболеваемости по республике.

Таблица 11
Архитектура проекта «Онкопоиск»

Предпосылки

Необходимость в скрининговом сервисе назрела давно; ранее подобные анкеты были размещены на сайте республиканского онкодиспансера, но граждане редко заполняли их. При подготовке проекта по данным формы № 7 федерального статистического наблюдения были изучены региональные особенности заболеваемости и смертности в Якутии от злокачественных новообразований за последние 10 лет. Оказалось, что шесть заболеваний в сумме давали более 50% всей смертности от ЗНО. Команда проекта выбрала именно эти заболевания. По ним имелись скрининговые технологии с доказанной эффективностью. В качестве основы были взяты анкеты, разработанные ВОЗ, и адаптированы с учетом региональной специфики (заболеваемости и смертности), добавлены вопросы по выявлению малых симптомов рака по шести нозологиям.

Технологии

Команда разработки изучила технологии, позволяющие быстро создавать безопасные и поддерживаемые веб-сайты, и создала на основе сочетания фреймворков (Django, FastAPI, Vue, React. js) программно-аналитический комплекс. Обработка и визуализация данных происходят в системе Yandex Datalens. Основной технической сложностью стала интеграция с существующими медицинскими системами.
Пилотный проект (скрининг рака легких) реализован в 2020 году в Якутске, в 2021 году добавлен скрининг остальных видов рака. Когда количество анкет пациентов, имеющих повышенный риск развития онкозаболеваний, достигнет 25 000, будет оценена эффективность тестирования.

Пилотный проект (скрининг рака легких) реализован в 2020 году в Якутске, в 2021 году добавлен скрининг остальных видов рака. Когда количество анкет пациентов, имеющих повышенный риск развития онкозаболеваний, достигнет 25 000, будет оценена эффективность тестирования.
Чтобы вовлечь в анкетирование больше участников, скрининг-платформу активно продвигали на популярных в регионе информационных каналах (на официальных ресурсах, в социальных сетях). Использовалось сотрудничество с руководством разного уровня — от республиканского до муниципального, анонс сервиса перевели на якутский язык, учли возможность распространения информации от пользователя к пользователю по WhatsApp.

Безопасность

Были подписаны договоры о сотрудничестве с Якутским региональным онкодиспансером и Минздравом, использовались https-протоколы шифрования. Компания, которая обеспечивает кибербезопасность Якутского республиканского онкодиспансера, протестировала сервер и устройства, на которых они обрабатывались. Сервер аккредитован в соответствии с федеральным законом «О персональных данных».

Б7 Повышение эффективности управления филиалами МФЦ в Новосибирской области

Авторы: О. С. Жданова, А. А. Орлова
Название проекта
Разработка и внедрение ИС МФЦ
Год
2018
Название организации
Министерство цифрового развития и связи Новосибирской области
Цель проекта
Повышение эффективности и качества предоставления услуг многофункциональных центров Новосибирской области.
Команда
Представители министерства цифрового развития и связи Новосибирской области, руководители МФЦ и разработчики основного платформенного решения для МФЦ, на базе которого реализован модуль бизнес-аналитики.
Результат
Среднее время ожидания в очереди сократилось на 23%. Время сбора квартальной отчетности сократилось по всей сети МФЦ с пяти дней до одной минуты.
Интересный факт
В результате внедрения системы повысилась скорость работы операторов; суммарное время приема граждан по всей сети МФЦ сократилось на 870 часов в месяц.

О проекте

Система бизнес-аналитики МФЦ позволяет наблюдать работу МФЦ в реальном времени и автоматически определяет отклонения от средних значений, например:

  • срок ожидания свыше 15 минут;
  • сроки часто нарушаются;
  • недостаточное количество операторов;
  • неравномерность загрузки окон в филиале;
  • неравномерность загрузки филиалов;
  • увеличение среднего времени обслуживания в филиале.
Информация об отклонениях передается всем заинтересованным лицам: директорам филиалов, руководству сети, контролирующим органам.

В интерфейсе системы бизнес-аналитики доступен просмотр и анализ всех важных параметров работы МФЦ:

  • количества заявлений;
  • количества консультаций;
  • количества выданных документов;
  • среднего времени ожидания;
  • среднего времени обслуживания оператора по различным услугам;
  • количества ошибок операторов;
  • оценок системы «Ваш контроль»;
  • статистики работы контакт-центра и др.

Особенности проекта

Для каждого оператора по каждой услуге и виду приема (первичный прием документов, выдача готовых результатов) рассчитывается среднее время обслуживания. Это время сравнивается со средним временем обслуживания по этой услуге и виду приема по всей сети. Если показатель оператора более чем на 50% превышает средний показатель по сети, оператору выставляется «отклонение» по этой услуге и виду приема.
Затем руководитель оператора изучает статистику системы аналитики и помогает оператору повысить показатели. Если непосредственный руководитель в течение трех месяцев не смог помочь оператору устранить отклонение, проблема переадресуется вышестоящему руководству.
Для повышения эффективности в МФЦ используют систему мотивации. За каждое принятое заявление оператору начисляют баллы (с учетом скорости обслуживания, количества ошибок, универсальности оператора и оценок, выставленных заявителями в системе «Ваш контроль»). Используется как нематериальная (соревнование сотрудников, доска почета, грамоты), так и материальная мотивация (премиальный фонд распределяется между операторами в соответствии с набранным количеством баллов).
Способы решения ряда проблем, выявленных в ходе проекта, представлены в таблице 12.

Таблица 12
Проблемы в работе МФЦ Новосибирской области и их решения, основанные на системе бизнес-аналитики

Нормативные документы

Разработка и внедрение информационной системы шли в соответствии с требованиями законодательства о размещении госзаказов. Техническое задание на разработку системы формировалось совместно специалистами министерства цифрового развития и связи Новосибирской области и сотрудниками МФЦ Новосибирской области.

Технологии

Источники данных: автоматизированная информационная система (АИС) МФЦ, электронная очередь, контакт-центр, 1С. Данные обрабатываются и помещаются в хранилище. На основании анализа данных система формирует набор показателей, интерактивных панелей, отчетов.

Безопасность

Анализируемые данные не являются персональными или конфиденциальными, не составляют государственной тайны. Используются стандартные методы обеспечения ИБ.