3. КАК УСТРОЕНА РАБОТА С ДАННЫМИ В ГОССЕКТОРЕ

Ключевые идеи

К госданным относятся данные, которыми распоряжаются и за которые отвечают органы власти и организации госсектора: создают, собирают, хранят, защищают, изменяют, удаляют.
Отдельно стоит выделить юридически значимые сведения в реестрах. Они нужны для оказания госуслуг, в том числе проактивных, и адресной помощи.
К качеству госданных предъявляются жесткие требования, поскольку это фундамент управления на основе данных. Их роль в принятии решений на всех уровнях власти будет только расти.
Разобщенность государственных данных выражается в ряде проблем с качеством, получением доступа, форматами на внутриведомственном и межведомственном уровнях, а также между федеральными властями, субъектами федерации и муниципалитетами.
В части межведомственного обмена данными активную роль будет играть Национальная система управления данными (НСУД), которая должна собрать сведения обо всех госданных и обеспечить их единообразие, транзакционную и аналитическую доступность.
Чем чаще данные используются в разных сферах, тем больше на них обращают внимание, тем они лучше, качественнее и удобнее.

3.1 ОСОБЕННОСТИ ГОСУДАРСТВЕННЫХ ДАННЫХ

Авторы: О. А. Виниченко, А. А. Малахов, О. Б. Саваровская
Время чтения: 27 мин.

3.1.1 КАКУЮ РОЛЬ ИГРАЮТ ДАННЫЕ В ГОСУДАРСТВЕ

Государство опирается в своей работе на данные, и в этом отношении оно ничем принципиально не отличается от любой крупной организации. Для государства характерны все операции с данными, составляющие их жизненный цикл: создание, сбор, обработка, публикация, хранение, удаление, обеспечение защиты и т. п. Во всех сферах, где работают с данными, к ним применимы одни и те же принципы, инструменты, методы оценки их значимости.
К ГОСУДАРСТВЕННЫМ ДАННЫМ относятся все данные, которыми распоряжаются органы власти и организации государственного сектора, — которые они создают, собирают, хранят, защищают, изменяют, удаляют и за которые отвечают на всем жизненном цикле работы с данными.
Говоря о государственных данных, мы имеем в виду обращение данных внутри государства, так как вопросы трансграничной передачи данных и их использования, например, международными организациями или другими странами требуют отдельного рассмотрения.
Концепция создания и функционирования национальной системы управления данными (утверждена распоряжением Правительства Российской Федерации от 03.06.2019 № 1189-р, с изм. на 14.05.2021) дает следующее определение: «Государственные данные — информация, содержащаяся в информационных ресурсах органов и организаций государственного сектора, а также в информационных ресурсах, созданных в целях реализации полномочий органов и организаций государственного сектора».
Государство использует данные при анализе, подготовке, принятии управленческих решений (см. также раздел 1.1). Для поддержки принятия решений нужна как совокупность первичных данных, так и результаты их анализа — разного рода отчетность, статистические и аналитические выкладки, причем при отсутствии одного из слагаемых качество управленческих решений резко снижается.
Отдельно стоит выделить такие важные госданные, как юридически значимые сведения в реестрах. Они способны подтверждать юридические факты о людях и их документах, о движимом и недвижимом имуществе, организациях, начиная с самых привычных, таких как фамилия, имя, отчество и дата рождения конкретного человека. Данные в реестрах очень нужны для оказания разнообразных государственных услуг и мер поддержки, а в будущем потребуются для проактивного оказания услуг и адресной помощи.
Проактивное (упреждающее) оказание госуслуг означает, что ведомство или цифровой госсервис предлагают человеку доступную ему услугу, не дожидаясь его обращения. При этом ведомство само запрашивает и получает необходимые документы и справки благодаря налаженному межведомственному обмену. Гражданину остается лишь согласиться на предложенную услугу (хотя он может и отказаться), и она будет оказана.
Единый государственный реестр недвижимости (ЕГРН) Росреестра — первый в России электронный информационный ресурс, электронные записи в котором (в реестрах ресурса) имеют юридическую значимость.

Единый государственный реестр недвижимости (ЕГРН) Росреестра — первый в России электронный информационный ресурс, электронные записи в котором (в реестрах ресурса) имеют юридическую значимость.
Потребителей госданных можно разделить на большие группы. Каждая включает несколько подгрупп, использует госданные с разными целями для решения разных задач (см. табл. 1). Депутатам законодательных собраний данные нужны для обоснования законопроектов, руководителям — для подкрепления цифрами документов стратегического планирования, правительству РФ и органам власти субъектов РФ — для принятия решений, затрагивающих миллионы граждан. Автоматизация государственного надзора и контроля, использование ИИ при принятии и верификации решений — перспективы госуправления в ближайшем будущем. Поскольку в результате деятельности государства возникают значимые для общества решения, к госданным предъявляются жесткие требования. Ошибки в данных бизнеса опасны для бизнеса и для его клиентов, но их масштаб, как правило, меньше, чем в госданных. Кроме того, от ошибок в госданных страдает значительно больше людей и государство в целом.
Группы соответствуют разным целевым аудиториям внутри государства. Мы рассматриваем группы исходя из распределения целевых аудиторий внутри государства, как было сказано ранее. Список групп разработан на основании описаний, созданных в Минэкономразвития при участии АНО «ЦПУР». См.: Минэкономразвития провело стратегическую сессию по качеству российских открытых данных // Минэкономразвития.

Таблица 1
Цели использования госданных разными группами потребителей

Госданные необходимы государству еще и для того, чтобы оценивать качество госуправления, достижение стратегических и тактических целей, эффективность деятельности госслужащих, в первую очередь руководителей министерств и высших должностных лиц регионов. Их работа может быть признана неэффективной при недостижении поставленных показателей, а выполнение задач оценивается на основе анализа все большего количества данных.
Постановление Правительства РФ от 03.04.2021 № 542 «Об утверждении методик расчета показателей для оценки эффективности деятельности высших должностных лиц <…> субъектов Российской Федерации и деятельности органов исполнительной власти субъектов Российской Федерации <…>» предполагает работу с данными для достижения заданных показателей.
В приказ Минцифры № 600 включены методики расчета пяти целевых показателей, в том числе «достижение „цифровой зрелости“ ключевых отраслей экономики и социальной сферы» и «увеличение доли массовых социально значимых услуг, доступных в электронном виде, до 95 процентов». Источниками информации для расчета уровня цифровой зрелости названы административные данные заинтересованных ФОИВ и государственных внебюджетных фондов РФ, формируемые в рамках автоматизированных ИС.

В приказ Минцифры № 600 включены методики расчета пяти целевых показателей, в том числе «достижение „цифровой зрелости“ ключевых отраслей экономики и социальной сферы» и «увеличение доли массовых социально значимых услуг, доступных в электронном виде, до 95 процентов». Источниками информации для расчета уровня цифровой зрелости названы административные данные заинтересованных ФОИВ и государственных внебюджетных фондов РФ, формируемые в рамках автоматизированных ИС.
Государство работает с данными всех типов (см. подробнее в главе 2). Госорганизации в качестве дополнительного источника аналитики используют в том числе данные, приобретенные у банков, мобильных операторов связи, телеком-провайдеров, бюро кредитных историй. В них, как правило, не содержатся персональные данные (ПДн) отдельных граждан. Они используются при принятии локальных решений, например для мониторинга качества жизни населения и миграционных потоков, оценки транспортных потоков и фактической численности жителей конкретной территории, определения реального уровня доходов жителей региона, уровня социального неравенства в регионе, уровня кредитной нагрузки и т. п.
Например, в 2016 году Сбербанк запустил проект «Открытые данные» на основе больших данных, который с тех пор развился в отдельное направление «СберИндекс».
Одна из главных задач управления данными на уровне государства — обеспечение межведомственного взаимодействия, которое требует доступности данных онлайн на высокой скорости для всех исполнителей и получателей государственных услуг и сервисов: для ведомств, граждан, представителей бизнеса, других организаций. Всем клиентам государства хотелось бы получать его услуги так же легко, как это происходит сейчас, например, в банковской сфере: быстро, онлайн, без многократного ввода информации, уже имеющейся у поставщика услуг (банка или государства). Хранение бумажных документов постепенно перестает быть актуальным, и необходима альтернатива.
«Как гражданин видит целевое состояние межведомственного взаимодействия при оказании госуслуг? Гражданин обращается за услугой по любому удобному для него каналу (МФЦ, ЕПГУ, через региональные порталы, личные кабинеты ведомств) и проходит идентификацию привычным для него способом (паспорт, биометрия, логин/пароль ЕСИА или цифровая подпись). Он ожидает, что информация о нем, имеющаяся в государственных реестрах и системах, будет получена автоматически и ему не придется
собирать „багаж“ документов, а затем приносить их в бумажном виде или загружать сканы на портал „Госуслуги“. Для достижения такого целевого состояния потребуются значительные изменения в процессах управления данными в ИС ведомств и процессах межведомственного обмена данными».

Олег Виниченко, исполнительный директор дирекции «Цифровые решения для государственного сектора» ПАО «Сбербанк»
Последние годы развивается ряд инициатив в сфере работы с госданными. В 2020—2021 годах в большинстве федеральных и региональных органов власти появились руководители ЦТ (Chief Digital Transformation Offi cers, CDTO), ответственные за проведение ЦТ в своих ведомствах, и в некоторых из органов власти уже есть ответственные за работу с данными (CDO). (Подробнее об основных функциях CDTO и CDO в государственной организации см. раздел 5.1.) В сфере оказания госуслуг акцент сместился с МФЦ на развитие ЕПГУ (портала «Госуслуги», gosuslugi.ru), проактивное оказание услуг, создание инструментов для сбора обратной связи по госуслугам. Во всех регионах создаются платформы обратной связи и центры управления регионом (ЦУР).
Система межведомственного электронного взаимодействия (СМЭВ) создавалась 10 лет назад для поддержки оказания госуслуг и до сих пор развивается, чтобы соответствовать современным запросам к скорости и функциональности работы. СМЭВ развивается в сторону межведомственного обмена теми блоками данных, которые нужны ведомствам для выполнения их функций, оказания госуслуг и реализации полномочий.
В 2010 году в законе «Об организации предоставления государственных и муниципальных услуг» от 27.07.2010 № 210-ФЗ было введено положение, которое должно было коренным образом изменить ситуацию: «Органы, предоставляющие государственные услуги, <…> не вправе требовать от заявителя представления документов и информации, которые находятся в распоряжении органов, предоставляющих государственные и муниципальные услуги, либо подведомственных организаций».
В числе приоритетных направлений деятельности Минцифры — перевод востребованных госуслуг в электронный формат и развитие национальной системы управления данными (НСУД).

3.1.2 НАЦИОНАЛЬНАЯ СИСТЕМА УПРАВЛЕНИЯ ДАННЫМИ

Авторы: Д. А. Кашко, С. В. Сергиенко
НСУД разрабатывалась для систематизации работы с данными на государственном уровне и в основном регулирует сферу межведомственного взаимодействия. Задача НСУД —обеспечить согласованность госданных, удобную работу с ними, их доступность для участников взаимодействия.
Система включает четыре основных компонента (рис. 16).

Рисунок 16
Основные компоненты ФГИС «ЕИП НСУД»

  1. Управляющий компонент — федеральная государственная информационная система «Единая информационная платформа НСУД» (ФГИС «ЕИП НСУД», nsud.info.gov.ru), где ведомства формируют и ведут модели своих данных, а оператор на этой основе ведет единую модель госданных («карту данных»).

  2. Ведомственные витрины данных — компоненты ведомственных систем, на которых ведомства публикуют данные в соответствии с моделью, настроенной в ЕИП НСУД.

  3. Обработчик и маршрутизатор запросов к данным — компонент СМЭВ («СМЭВ 4»), который обеспечивает прямой доступ к данным ведомственных витрин.

  4. Аналитическое хранилище — подсистема информационно-аналитического обеспечения ЕИП НСУД, отвечающая за сбор и аналитическую обработку данных, получаемых из витрин и других источников по поручениям органов, уполномоченных правительством РФ.
В отличие от ориентированного на обмен электронными сообщениями «СМЭВ 3».
НСУД позволяет решать актуальные задачи управления госданными в современной дата-ориентированной экономике:
  • предоставление данных в режиме реального времени: обеспечение быстрого доступа к данным на витринах для онлайн-взаимодействия при оказании госуслуг и выполнении государственных функций;

  • возможность получать данные в режиме запроса либо в режиме подписки;

  • обеспечение доступности данных: возможность опубликовать новые наборы данных, найти опубликованные наборы и получить право доступа к ним в минимальный срок;

  • контроль качества данных, включая их полноту, актуальность, непротиворечивость и связность (в том числе с эталонными данными);

  • построение единой модели данных (понимание, где какие данные находятся и в каком виде);

  • обеспечение возможности оперативной передачи данных в аналитическое хранилище и получения аналитических показателей.
Сейчас под режимом реального времени понимается такой режим взаимодействия ведомств, при котором с момента отправления межведомственного запроса до момента получения ответа на этот запрос проходит не более двух секунд.
Для представления данных с использованием НСУД обладателю данных (поставщику) необходимо:
  • описать свои информационные ресурсы и ИС в ЕИП НСУД, как минимум в части, подлежащей передаче (межведомственному обмену), создать и согласовать модель государственных данных;

  • создать витрину данных и обеспечить регулярное размещение в ней актуальных данных, соответствующих согласованной модели госданных;

  • сформировать и зарегистрировать регламентированные запросы к данным, размещенным на витрине, по которым допускается получение данных с витрины;

  • зарегистрировать витрину данных и регламентированные запросы в СМЭВ.
Для получения доступа к данным с использованием НСУД пользователю данных (получателю) необходимо:
  • найти нужные данные, пользуясь навигацией и поиском ЕИП НСУД;

  • получить доступ к соответствующим регламентированным запросам в личном кабинете СМЭВ;

  • настроить обработку получаемых из агента СМЭВ данных в своей ИС либо в витрине данных;

  • после получения разрешения на доступ к данным — выполнять необходимые запросы к данным либо получать данные по подписке.
Технологии НСУД позволяют максимально сократить процессы запроса и публикации необходимых данных. Создание нового регламентированного запроса состоит в написании и проверке SQL-запроса и занимает несколько часов. Публикация новых данных на витрине занимает не более нескольких дней и состоит из создания структуры данных, настройки ETL-инструментария (см. раздел 6.2) и реализации правил проверки качества.
Типовое ПО витрины данных реализовано как свободное ПО и доступно в Национальном фонде алгоритмов и программ (portal.eskigov.ru/nfap). Для публикации небольших наборов данных, не предъявляющих высоких требований к производительности, есть облегченный вариант витрины данных; он содержит только реляционную систему управления базами данных (СУБД см. раздел 6.2) и доступен в виде исполняемых файлов.
Витрины данных реализуют подход мультимодельности (он же Polyglot Persistence, многовариантное хранение), при котором данные хранятся одновременно в нескольких базах данных и ответ возвращается из той базы данных, которая способна быстрее других отработать запрос.

3.1.3 ОТКУДА ПОЯВЛЯЮТСЯ И ГДЕ ХРАНЯТСЯ ГОСДАННЫЕ

Авторы: О. А. Виниченко, А. А. Малахов, О. Б. Саваровская
Источниками госданных выступают буквально все граждане и организации, чьи данные тем или иным образом попадают в организации госсектора. Организации, граждане и должностные лица собирают и сдают всевозможную отчетность, а также создают данные в результате своей хозяйственной или управленческой деятельности; госорганизации ведут различные реестры и ИС для выполнения своих основных функций (обычно возникновение нового полномочия у госорганизации влечет за собой обязанность вести очередной реестр или ИС). Государство ведет себя так же, как любая крупная компания, — стремится собрать максимум данных, которые могут пригодиться для его задач.
Госданные хранятся не только в государственных, муниципальных и ведомственных ИС (ГИС — наиболее важные ресурсы), но также в отдельных электронных таблицах и базах (например, Excel) и даже на бумаге — и всеми ими необходимо правильно управлять. Свои ИС имеют не только ФОИВ, но и государственные и муниципальные организации, подведомственные организации, казенные учреждения, унитарные предприятия и т. д. О многих ИС знают только те, кто непосредственно работает с ними, например об ИС в отдельных бюджетных учреждениях, созданных для нужд этих учреждений.
В России огромный объем информации хранится в многочисленных архивах в бумажном виде или в устаревших электронных форматах. Здания архивов территориально распределены по всей стране, что дополнительно затрудняет доступ к данным в них. Содержащиеся в этих документах «ретроспективные» данные (данные прошлых лет) еще предстоит оцифровать (или перевести в современные форматы) и включить в реестры ИС.
В России пока нет единого каталога госданных (он создается в ЕИП НСУД), зато есть около 600 различных реестров ИС, содержащих госданные. В этих реестрах — десятки тысяч ИС различных органов, ведомств, учреждений (о проблемах работы с данными в госсекторе см. раздел 3.2.1). В одной только ФГИС Координации информатизации (ФГИС КИ, portal.eskigov.ru), которая задумана и реализована как основной реестр ИС госорганизаций, зарегистрировано более 800 федеральных и 3300 региональных ИС.
Заместитель председателя Правительства РФ Д. Н. Чернышенко привел следующие данные: в России 826 федеральных и 3303 региональных информационных систем. См.: Конференция «Использование единой платформы „ГосТех“» 23.10.2021 // Гостех.
Разобщенность госданных, существующих во множестве ИС, обусловлена сложностью федеративного устройства России и большим количеством ведомств и организаций разного уровня (государственных, муниципальных, бюджетных, подведомственных), финансируемых из бюджета. В госсекторе действуют сотни тысяч юридических лиц, и все они вовлечены в оборот данных: создают их, собирают, обрабатывают, хранят, передают и т. д.
В России имеется около 20 000 органов местного самоуправления (по одному на каждое муниципальное образование), а также 90 ФОИВ и около 2500 РОИВ. По данным за 2014 год только государственных и муниципальных учреждений в стране насчитывалось 178 875. В совокупности с организациями, финансируемыми из бюджета, это дает оценку в сотни тысяч юрлиц, приведенную выше.

В России имеется около 20 000 органов местного самоуправления (по одному на каждое муниципальное образование), а также 90 ФОИВ и около 2500 РОИВ. По данным за 2014 год только государственных и муниципальных учреждений в стране насчитывалось 178 875. В совокупности с организациями, финансируемыми из бюджета, это дает оценку в сотни тысяч юрлиц, приведенную выше.
Есть и другие факторы, затрудняющие управление государственными данными и их использование:
  • особенность госданных в реестрах — юридическая значимость записей, необходимых для выполнения государством его функций;
  • огромное количество данных разной значимости и детализации, собранных в разное время и с разными целями;
  • закрепление в многочисленных НПА конкретных практик и особенностей работы с госданными, создающее правовые барьеры;
  • уровень цифровой зрелости государства в работе с данными.
Исследовательская и консалтинговая компания Gartner еще в 1995 году разработала модель «цикл хайпа» для оценки уровня зрелости технологий. Ситуацию с госданными в России сейчас можно отнести ко второму этапу, тогда как первым была хаотичная и рассогласованная автоматизация многочисленных государственных функций. См.: Understanding Gartner’s Hype Cycles // Gartner.
На практике в любой сфере первыми улучшаются наиболее востребованные данные и процессы. Так, с 2010 года после принятия ФЗ-210 активно развивается сфера оказания госуслуг в электронном виде. Достигнуты существенные результаты, которые стали особенно заметны во время пандемии. Процессы типизации и сквозного обмена постепенно налаживаются, получить госуслуги стало проще, их оказывают быстрее.
Федеральный закон от 27.07.2010 № 210-ФЗ «Об организации предоставления государственных и муниципальных услуг».
Сейчас на «вершине айсберга» находятся около 20 наиболее развитых ключевых информационных ресурсов, постоянно задействованных в межведомственном обмене. Они содержат информацию о юридических, физических лицах, имуществе, земельных ресурсах, финансово-бюджетной сфере (СНИЛС, ЕГРЮЛ, ЕГРИП, данные ПФР, ФНС и т. д.).

Сейчас на «вершине айсберга» находятся около 20 наиболее развитых ключевых информационных ресурсов, постоянно задействованных в межведомственном обмене. Они содержат информацию о юридических, физических лицах, имуществе, земельных ресурсах, финансово-бюджетной сфере (СНИЛС, ЕГРЮЛ, ЕГРИП, данные ПФР, ФНС и т. д.).
Однако вне действия ФЗ-210 по-прежнему заметно отсутствие последовательной, ясной стратегии управления госданными на уровне государства, а у ведомств нет полномочий для изменения ситуации вне их компетенции.
Попытки развивать проактивное оказание госуслуг вскрывают проблемы с текущим состоянием данных в разных органах власти, на разных уровнях. Распространенная в госсекторе ситуация выглядит так:
  • для решения конкретной задачи ведомству нужны данные, которые находятся в разных источниках и управляются разными операторами;

  • многие необходимые данные, скорее всего, хранятся в неудобном формате или находятся на бумажном носителе, доступ к ним ограничен нормативно или организационно, а в некоторых случаях и вовсе отсутствует (подробнее см. раздел 3.2);

  • бывает сложно выяснить, где найти необходимые данные, кто ими управляет, как получить к ним доступ, на каких условиях ими можно распоряжаться.
Открытые государственные данные образуют отдельную категорию. Они должны быть доступны общественным (некоммерческим), коммерческим, исследовательским и образовательным организациям, СМИ. Открытые данные размещаются в интернете в виде систематизированных данных, организованных в формате, допускающем автоматическую обработку (без предварительного изменения человеком), в целях неоднократного, свободного и бесплатного использования. В конечном счете они касаются всех граждан, хотя при раскрытии данных важно соблюдать баланс между открытостью и приватностью.
Тему открытости данных в России много лет разрабатывает АНО «Инфокультура»; см., в частности, проект «Каталог данных». Рекомендуем экспертные доклады об открытости данных в ФОИВ: «Открытость государства в России» — 2021 // Счетная палата РФ, АНО «ЦПУР», АНО «Информационная культура», 2021. Акиров О. И., Соловьев Д. Б. Открытые данные в дипломатии: Россия в контексте международного опыта / под ред. М. О. Комина. М.: ЦПУР, 2021.
См.: Методические рекомендации по публикации открытых данных государственными органами и органами местного самоуправления, а также технические требования к публикации открытых данных. Версия 3.0 (утв. протоколом заседания Правительственной комиссии по координации деятельности Открытого Правительства от 29.05.2014 № 4).
Удачный пример государственного сервиса открытых данных — портал госзакупок zakupki.gov.ru (см. кейс ЕАЭС в разделе 3.2.2). В любой момент из ИС с помощью API можно скачать для анализа фрагмент базы данных, относящийся к определенной территории или тематике. Немаловажный фактор развития сервиса — спрос на раскрытие этих данных и последовательная политика государства по их раскрытию.

Удачный пример государственного сервиса открытых данных — портал госзакупок zakupki.gov.ru (см. кейс ЕАЭС в разделе 3.2.2). В любой момент из ИС с помощью API можно скачать для анализа фрагмент базы данных, относящийся к определенной территории или тематике. Немаловажный фактор развития сервиса — спрос на раскрытие этих данных и последовательная политика государства по их раскрытию.
Государственные организации и ведомства — тоже потребители открытых данных; благодаря открытым данным они могут выяснять последствия тех или иных решений, находить взаимосвязи между ними, анализировать текущее положение дел и решать, что делать дальше. Нередко для самих госорганизаций пользоваться открытыми данными проще, чем получать данные по межведомственным каналам.