3.2 ТРУДНОСТИ В РАБОТЕ С ГОСУДАРСТВЕННЫМИ ДАННЫМИ

Авторы: О. А. Виниченко, С. В. Коршунова, А. А. Малахов, О. Б. Саваровская
Время чтения: 40 мин.

3.2.1 ОСНОВНЫЕ ТИПЫ ПРОБЛЕМ

Ниже описан в общем виде ряд проблем, которые по мнению экспертов, участвовавших в подготовке настоящего навигатора, оказывают критическое влияние на развитие управления данными в России.
Не претендуя на исчерпывающее описание проблем, их причин и сложных взаимосвязей, отметим, что эти проблемы проявляются и требуют решения одновременно на разных уровнях: внутри- и межведомственном, внешнем (предоставление госданных получателям не из госсектора). Минцифры сейчас предпринимает существенные действия, чтобы добиться системных изменений.

1. Низкое качество данных

Качественные данные (см. главу 7) — это фундамент использования данных в любых целях. У проблемы низкого качества госданных есть много проявлений:
  • нет общесистемных механизмов обеспечения качества госданных, в каждом конкретном случае вопрос качества решается исходя из локальных приоритетов;

  • отсутствуют требования к работе с госданными, направленные на исключение возникновения ошибок;

  • нет общих стандартов, единых справочников, общих метаданных;

  • отсутствует мониторинг качества госданных и управление инцидентами, связанными с их качеством;

  • отсутствуют общесистемные механизмы совместимости госданных при обмене, разрешения противоречий между госданными разных информационных ресурсов, приведения госданных в соответствие друг с другом;

  • госданные в «цифре» могут противоречить сведениям на бумаге; если приоритет отдается «бумажным» сведениям, снижается эффективность использования данных в электронном виде;

  • из-за низкого качества данных невозможно использовать их для оценки текущей ситуации.
Отсутствие единого подхода к исправлению ошибок в госданных критично при переходе на реестровую модель предоставления госуслуг (например, при выдаче разрешений). Особенность реестровой модели в том, что юридически значимыми данными в них являются данные реестров (записи в реестрах), а не исходные документы. До сих пор при обнаружении ошибки следовало удалить запись и создать новую запись (или новый документ). В реестровой модели этот принцип не работает, так как в момент появления записи в реестре возникает юридически значимый факт. Необходимо разрабатывать новые правила и порядки, предлагать решения для исправления как технических ошибок, так и ошибок в сути, в частности описывать ситуации, когда к исправлению записи необходимо привлекать субъекта данных или поставщика данных.
См. исследование Аналитического центра при Правительстве РФ: Основные результаты анализа законодательства зарубежных государств и Российской Федерации в области управления данными, описания моделей правового регулирования управления данными. М., 2019.
Нельзя обеспечить взаимодействие между системами разных ведомств без потери смысла, не имея системы классификации и кодирования, единых справочников. В законодательстве описаны полномочия и функции ведомств: косвенным образом это описание предопределяет, кто какие системы ведет. Необходимы мастер-данные, эталонные источники и все, что поможет использовать достоверные качественные источники информации для автоматизации внутри ведомств или организаций, работающих с госданными, и межведомственного обмена.
Специфика каждого ведомства, прежде всего отраслевая, предполагает разную трактовку одних и тех же терминов. Возможен и противоположный вариант — разные названия в разных ведомствах для одних и тех же сущностей. Например, разный понятийный аппарат Минфина и Федеральной налоговой службы обусловлен Бюджетным кодексом (для Минфина) и Налоговым кодексом (для ФНС).

Специфика каждого ведомства, прежде всего отраслевая, предполагает разную трактовку одних и тех же терминов. Возможен и противоположный вариант — разные названия в разных ведомствах для одних и тех же сущностей. Например, разный понятийный аппарат Минфина и Федеральной налоговой службы обусловлен Бюджетным кодексом (для Минфина) и Налоговым кодексом (для ФНС).
Единство нормативной справочной информации особенно важно при работе с массивами неструктурированных данных. Справочники могут быть национальными и отраслевыми и, соответственно, в обязательном порядке использоваться всеми участниками или на национальном уровне, или на отраслевом. В примере ниже справочники полов — отраслевые.
Что такое «пол»? В справочниках правоохранительной системы — пять полов, они определены исходя из того, что можно использовать при дознании (вторичные половые признаки, базовые и с отклонениями). В авиации «полов» тоже пять, но уже других: мужчина, женщина, «большой мужчина», «большая
женщина» и «ребенок». В системе здравоохранения полов шесть — те, которые имеют медицинское значение, в том числе скрытые факторы пола.

Что такое «пол»? В справочниках правоохранительной системы — пять полов, они определены исходя из того, что можно использовать при дознании (вторичные половые признаки, базовые и с отклонениями). В авиации «полов» тоже пять, но уже других: мужчина, женщина, «большой мужчина», «большая женщина» и «ребенок». В системе здравоохранения полов шесть — те, которые имеют медицинское значение, в том числе скрытые факторы пола.
Для обеспечения интероперабельности (см. раздел 7.1) необходимы единые требования к управлению госданными. Без таких требований не только нет ответственных за организацию и управление данными, но и отсутствует системный подход к обеспечению качества данных.
Сейчас в этом направлении предпринимаются некоторые шаги, но пока каждой организации приходится придерживаться собственных правил.
В инфраструктуре электронного правительства действует Единая информационная система нормативной справочной информации (ГИС ЕИС НСИ). У этой системы есть методические и организационные недостатки. Например, непонятно, какой из десятка справочников ОКАТО/ОКТМО эталонный, какие из них можно использовать, а какие нельзя. ФОИВ, регионы, другие участники системы госуправления самостоятельно решают эту проблему, находя и встраивая в свои ИС подходящие справочники. Однако такой подход не обеспечивает интероперабельность: в разных справочниках содержание одного и того же термина может различаться.

В инфраструктуре электронного правительства действует Единая информационная система нормативной справочной информации (ГИС ЕИС НСИ). У этой системы есть методические и организационные недостатки. Например, непонятно, какой из десятка справочников ОКАТО/ОКТМО эталонный, какие из них можно использовать, а какие нельзя. ФОИВ, регионы, другие участники системы госуправления самостоятельно решают эту проблему, находя и встраивая в свои ИС подходящие справочники. Однако такой подход не обеспечивает интероперабельность: в разных справочниках содержание одного и того же термина может различаться.
На качество данных в ИС влияет еще и отсутствие форматно-логического контроля — проверки данных по критериям полноты, качества, формата и безопасности при вводе их пользователем. Там, где данные при вводе не проверяются по эталонным справочникам, можно быть уверенным в наличии «мусора» в данных.

На качество данных в ИС влияет еще и отсутствие форматно-логического контроля — проверки данных по критериям полноты, качества, формата и безопасности при вводе их пользователем. Там, где данные при вводе не проверяются по эталонным справочникам, можно быть уверенным в наличии «мусора» в данных.

  • Городской округ г. Петрозаводск
  • Петрозаводский городской округ
  • город Петрозаводский
  • г. Петрозаводск
  • ГО Петрозаводск

На качество данных в ИС влияет еще и отсутствие форматно-логического контроля — проверки данных по критериям полноты, качества, формата и безопасности при вводе их пользователем. Там, где данные при вводе не проверяются по эталонным справочникам, можно быть уверенным в наличии «мусора» в данных.

  • Городской округ г. Петрозаводск
  • Петрозаводский городской округ
  • город Петрозаводский
  • г. Петрозаводск
  • ГО Петрозаводск

2. Госорганизации вынуждены многократно собирать данные вместо получения их из эталонных источников

Десятки госорганизаций и ведомств могут собирать одни и те же данные для реализации своих функций, не синхронизируя их между собой или с эталонным источником (если он есть). Часто при этом неясно, какие данные эталонные, на записи какой системы стоит ориентироваться.
В качестве примера можно взять знакомую каждому ситуацию: ведомства, собирая наши данные, нередко дублируют их, многократно запрашивают одни и те же данные. На рис. 17 приведены примеры данных, которые собирают несколько крупнейших ведомств.

Рисунок 17
Данные о гражданах, которые собирают и присваивают крупнейшие госорганы

Дублирование ведет к увеличению расходов на госуправление и к сложности управления. В числе других проблем:
  • составы данных не описаны полностью в одном документе (в ходе разработки ИС требования многократно уточняются, исправляются, обновляются в соответствии с новыми поручениями, изменения утверждаются разными актами);

  • иногда дублировать сбор данных приходится из-за правовой недоступности уже собранных данных;

  • без единого каталога госданных и организаций, ответственных за их ведение (создание), о некоторых данных, полученных в ходе информационного обмена, знают только стороны такого обмена;

  • организациям приходится многократно сдавать одни и те же данные в виде отчетности в разных форматах, в разные сроки и в разные ведомства, что создает излишнюю нагрузку на всех участников процесса.
Сейчас получателям данных — как государственным структурам, так и бизнесу — приходится самостоятельно (и под свою ответственность) решать, какая информация верна и актуальна.

3. Сложно получить госданные

Любая госструктура, как правило, выступает как монополист, когда речь идет о сборе и обработке тех уникальных данных, которые находятся в ее ведении, или о распоряжении ими. В понятие «информационная система» входят содержащиеся в ней данные; эксплуатацией ИС и данных в ней занимается оператор ИС. На практике наполнением ИС и распоряжением данными в ней занимаются разные функциональные структуры оператора ИС, а соответствующие полномочия нередко оформлены локальными актами. В отсутствие четкого разграничения предмета управления и функций возникают «белые пятна» в управлении и размываются границы ответственности; в результате госорганизации часто действуют по принципу «запрещено все, что не разрешено».
Отраслевые и ведомственные «колодцы» затрудняют обмен данными. Одни ведомства в соответствии со своими полномочиями создают и собирают уникальные данные (МВД, ЗАГС, ФНС и другие), другие ведомства дублируют эти данные, когда собирают их для осуществления собственных функций.
Информационная система — совокупность содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств. Оператор ИС — гражданин или юридическое лицо, осуществляющие деятельность по эксплуатации ИС, в том числе по обработке информации, содержащейся в ее базах данных. См. Федеральный закон от 27.07.2006 № 149-ФЗ «Об информации, информационных технологиях и о защите информации».
Например, госорганизация — оператор ИС отказывается предоставить коммерческим организациям данные из этой ИС. Оператор не имеет права предоставлять первичные данные (документы) третьим лицам (это в том числе обеспечивает защиту данных), а чтобы делиться агрегированными данными, следовало предусмотреть такую возможность на этапе разработки ИС.

Например, госорганизация — оператор ИС отказывается предоставить коммерческим организациям данные из этой ИС. Оператор не имеет права предоставлять первичные данные (документы) третьим лицам (это в том числе обеспечивает защиту данных), а чтобы делиться агрегированными данными, следовало предусмотреть такую возможность на этапе разработки ИС.
Из-за разобщенности и наличия тысяч ИС потребителям госданных (о потребителях госданных и их целях см. раздел 3.1.1) сложно найти данные, определить права и ответственность по отношению к данным, выяснить, где и как происходит работа с данными.
«Многие исследователи, уже работающие с государственными данными, отмечают сложность получения доступа к необходимой информации, неудобный формат, отсутствие системы и методологии в подаче».
Мария Шклярук, академический директор Центра подготовки РКЦТ
Сапрыкина А., Мельникова Ю. Ученым облегчат работу с госданными // ComNews.
Получить доступ к госданным может быть сложно по разным причинам:
  • не определены или нечетко определены права доступа к госданным (что связано, в частности, с данными ограниченного распространения);

  • некоторые данные невозможно получить быстро и онлайн, хотя формально они доступны без ограничений;

  • нет единого подхода к платному/бесплатному предоставлению госданных; без единого каталога госданных и организаций, ответственных за их ведение (создание), о некоторых данных, полученных в ходе информационного обмена, знают только стороны такого обмена;

  • данные в ИС существуют в неудобных форматах (например, сканы в формате pdf могут называться машиночитаемыми данными);

  • необходимые данные вообще не существуют или не собираются;

  • не решен вопрос о допустимом использовании некоторых данных (в частности, ПДн или больших данных, необходимых для обучения ИИ) с соблюдением баланса интересов всех сторон.
Неконсистентность способов взаимодействия между госструктурами существенно осложняет регулирование доступа госорганов к данным. Во многих случаях неизвестно:
  • какие государственные структуры какими данными управляют (кто владелец данных);
  • на каком основании они это делают;
  • какие права есть у ведомств на использование данных других ведомств.
Госорганизации на всех уровнях власти сталкиваются с тем, что предоставление данных из ГИС регламентировано, и поставщики данных определенного реестра не всегда могут выступать получателями данных из этого же реестра. Это ведет к повторному сбору информации (см. проблему 2).
Например, в ГАС «Управление» есть более 50 ролей с разным уровнем доступа. См.: Регламент подключения и интеграции с ГАС «Управление».
В России более 50 «тайн» — видов информации ограниченного доступа (государственная тайна, служебная, врачебная, налоговая, ПДн и др.). Ограничения доступа к этим данным в ГИС и других ИС для третьих лиц регулируются рядом НПА. При этом требования по обезличиванию данных в соответствии с видами тайн не определены однозначно и полностью (подробнее о правовых аспектах работы с данными см. приложение В).
Несовершенство НПА называют в качестве трудности при работе с данными 44% всех опрошенных и 67% руководителей высшего звена (из числа опрошенных).

Несовершенство НПА называют в качестве трудности при работе с данными 44% всех опрошенных и 67% руководителей высшего звена (из числа опрошенных).
По результатам опроса, проведенного Центром подготовки РКЦТ летом 2021 года. См. также введение.
Проблема «лоскутного» законодательства в сфере данных существует не только в России. В странах ЕС континентальной правовой семьи (Франции, Германии, Эстонии) правовое регулирование управления данными разделяет законодательство в сфере обеспечения доступа к информации публичного сектора и регулирование в сфере защиты ПДн. Действуют также отдельные законы о разных видах информации ограниченного доступа (о государственной тайне, о коммерческой тайне и др.).
Подробнее о законодательстве разных стран в сфере работы с данными см. исследование Аналитического центра при Правительстве РФ: Основные результаты анализа законодательства зарубежных государств и Российской Федерации в области управления данными, описания моделей правового регулирования управления данными. М., 2019.
В ФЗ-143 о Едином госреестре записей актов гражданского состояния (ЕГР ЗАГС) был указан закрытый перечень лиц, имеющих право получать справки о смерти, и Минцифры в этот перечень не входило. В результате Минцифры не имело юридических оснований, чтобы удалять аккаунты умерших людей из базы ЕСИА. Внесение изменений на уровне федерального закона заняло полтора года.

В ФЗ-143 о Едином госреестре записей актов гражданского состояния (ЕГР ЗАГС) был указан закрытый перечень лиц, имеющих право получать справки о смерти, и Минцифры в этот перечень не входило. В результате Минцифры не имело юридических оснований, чтобы удалять аккаунты умерших людей из базы ЕСИА. Внесение изменений на уровне федерального закона заняло полтора года.
Федеральный закон от 15.11.1997 № 143-ФЗ «Об актах гражданского состояния».
Ситуация с данными, обладающими юридической значимостью, медленно улучшается. Ситуация с открытыми данными в России скорее ухудшается: публикуется мало новых наборов данных, отменяются обязательства по публикации некоторых данных в открытом формате (данные «закрывают»), а уже опубликованные наборы не актуализируются и постепенно теряют ценность, поскольку содержат неверные или устаревшие сведения. У потребителей открытых данных мало или нет средств для обратной связи и диалога с разработчиками, а у разработчиков не хватает мотивации для повышения качества невостребованных данных.

4. Не проработаны вопросы обращения с ПДн и доступа граждан к данным о себе

Пока не разрешено противоречие, касающееся предоставления данных. С одной стороны, государство обязано защищать ПДн граждан и ряд других видов данных, и этому помогают строгое регулирование и сложный доступ. С другой стороны, для развития цифровой экономики как можно больше госданных должны быть доступны всем заинтересованным сторонам. Кроме того, гражданам полезно иметь доступ ко всем юридически значимым записям о себе, иметь возможность исправить ошибку, удалить (обновить) устаревшие данные, что сейчас практически невозможно.
В области этичного обращения с данными (см. также заключение) в государстве до сих пор существует ряд проблем и противоречий:
  • данные собираются избыточно;
  • данные собираются на чрезмерно длительный срок (срок хранения данных на «Госуслугах» — 50 лет);
  • данные, собранные для конкретной цели, иногда имеют необоснованно длительный срок хранения и не удаляются вовремя;
  • не до конца проработаны юридические механизмы, связанные с анонимизацией и деперсонификацией данных;
  • нет точного определения данных ограниченного распространения, неясно, как и кто может их обрабатывать.
Соглашаясь на обработку персональных данных при оформлении цифрового пропуска весной 2020 года, москвичи передавали не только персональные данные, но и информацию о месте работы, данные документов о гражданстве, образовании, контактные данные, технические данные устройств и другие. В соглашении говорилось, что данные собирают сроком на 10 лет с правом на обработку третьими лицами, в том числе с такими целями, как получение материалов «информационного и (или) рекламного характера».

Соглашаясь на обработку персональных данных при оформлении цифрового пропуска весной 2020 года, москвичи передавали не только персональные данные, но и информацию о месте работы, данные документов о гражданстве, образовании, контактные данные, технические данные устройств и другие. В соглашении говорилось, что данные собирают сроком на 10 лет с правом на обработку третьими лицами, в том числе с такими целями, как получение материалов «информационного и (или) рекламного характера».
Доступ госструктур к данным может быть существенно затруднен из-за закрытого списка получателей данных, особого назначения сбора данных и по другим причинам. Однако если удалось найти правовые основания для доступа к данным и согласовать такой доступ, появляется большой риск бесконтрольного неограниченного доступа к данным и их распространения без необходимого участия первоисточника.
Во многих случаях не существует порядка использования данных, полученных от другого ведомства. Если порядки защиты данных и обеспечения их безопасности подробно описаны для первичного сбора, то при передаче данных непонятно, как получатель может ими распоряжаться, например, может ли далее их передавать и в каком объеме (возможные методы защиты чувствительных данных, опробованные в Роструде, показаны на рис. 18).
Из выступления Д. А. Васильева, заместителя руководителя Федеральной службы по труду и занятости, на секции «Лучшие практики доказательного подхода в органах власти в России» конференции АСОПП-2021 19 октября 2021 года.

Рисунок 18
Методы защиты чувствительных данных в Роструде (план)

Обычно назначение собираемых данных прямо указывается в НПА или в согласии на обработку ПДн, и тогда такие данные (в том числе предобработанные, например обезличенные/деперсонифицированные) сложно или невозможно использовать повторно с другими целями. Исключение было сделано для оказания госуслуг, и это решение работает довольно успешно. Время от времени меняются требования Роскомнадзора к работе с обезличенными и необезличенными ПДн, критерии признания данных персональными, в том числе как следствие развития и доработки законодательства о защите ПДн.
Государство обладает уникальным составом данных, но далеко не в полной мере использует их потенциал как реального инструмента госуправления. Нынешний период можно назвать переходным, когда органы власти знают о проблемах и их причинах. В следующем разделе описаны причины и те шаги, которые госорганы (в первую очередь, Минцифры) предпринимают для решения этих проблем.

3.2.2 ПРИЧИНЫ ПРОБЛЕМ С ДАННЫМИ И ПУТИ ИХ РЕШЕНИЯ

Анализируя ниже наиболее значимые причины проблем с данными, авторы сознательно не стали соотносить конкретные проблемы с теми или иными причинами, чтобы не усложнять описание: у каждой проблемы могут быть несколько причин, в разной степени «ответственных» за нее.

1. Разрозненность ИС («зоопарк информационных систем», «лоскутная информатизация»)

При автоматизации госфункций и процессов на основе разных подходов к управлению данными были реализованы разные архитектурные решения. В результате для обеспечения межведомственного взаимодействия ведомства вынуждены заключать между собой соглашения об обмене данными, оговаривая в них конкретные технологии, унификацию обмена, технологическую поддержку обмена и контроля, защиту данных от утечек, предоставление данных при условии наличия полномочий.
Основным препятствием для внедрения СМЭВ был разнобой нормативных требований к виду и содержанию информации в разных органах. Данные, на основе которых выписывали справки, хранились в бумажных архивах и ИС, часто они были избыточными или недостаточными, неверифицированными, требовали длительных ручных операций для их извлечения и подготовки и т. п., а неправильно составленная справка была проблемой заявителя. С внедрением СМЭВ органы должны решать подобные проблемы между собой и в предельно сжатые сроки, так как по закону ответ на межведомственный запрос должен быть направлен в течение пяти рабочих дней. С 1 января 2022 года этот срок должен будет составлять не более 48 часов, а в отдельных случаях — две секунды (взаимодействие в режиме реального времени).

Основным препятствием для внедрения СМЭВ был разнобой нормативных требований к виду и содержанию информации в разных органах. Данные, на основе которых выписывали справки, хранились в бумажных архивах и ИС, часто они были избыточными или недостаточными, неверифицированными, требовали длительных ручных операций для их извлечения и подготовки и т. п., а неправильно составленная справка была проблемой заявителя. С внедрением СМЭВ органы должны решать подобные проблемы между собой и в предельно сжатые сроки, так как по закону ответ на межведомственный запрос должен быть направлен в течение пяти рабочих дней. С 1 января 2022 года этот срок должен будет составлять не более 48 часов, а в отдельных случаях — две секунды (взаимодействие в режиме реального времени).
Ст. 7.2 ч. 3 Федерального закона от 27.07.2010 № 210-ФЗ «Об организации предоставления государственных и муниципальных услуг»
Как следствие объемного и довольно жесткого законодательного регулирования ГИС появляются ведомственные ИС (ВИС), требования к которым проще и легче выполнять. Это усугубляет разрозненность вместо ее преодоления. Множество не согласованных между собой ИС («лоскутное одеяло») затрудняет не только межведомственное взаимодействие, но и использование данных самим ведомством — оператором данных, и анализ данных, и качество решений, принятых на анализе таких данных.
Историю ГИС и ключевые проблемы регулирования ГИС в России подробнее см. в аналитическом докладе «Оценка открытости государственных информационных систем в России». АНО «ЦПУР», АНО «Информационная культура», 2020.
Подходы и возможные решения. Как уже упоминалось выше, такая ситуация с разрозненностью данных закономерна, но понятны и способы ее преодоления. Российскому госсектору еще предстоит обеспечить связность разных данных в многочисленных ИС и стандартизировать работу с данными в госорганизациях. Проблему выбора эталонов можно решить, определив эталонные источники данных (что планируется сделать в НСУД), назначив ведомства, ответственные за каждый такой источник, и приняв дополнительные НПА.
Одно из главных направлений системной работы с данными на уровне государства и в нормативной, и в технологической плоскости — создание общегосударственной модели (карты) данных с единым понятийным аппаратом. Созданием модели данных и ведением реестра информационных ресурсов сейчас занимается Минцифры. Необходима инвентаризация всех ИС с госданными (от ведомственных до ГИС), кросс-валидация систем и проверка связности собираемых в них данных. Отдельно нужно провести аудит данных внутри ведомств и аудит межведомственных данных, начиная с пилотных проектов для отработки технологии.
По результатам такого глобального аудита можно будет сформировать общий каталог государственных данных (о каталоге как инструменте управления данными см. раздел 7.2) и их владельцев, выяснить существующие ограничения в НПА на уровне ведомств и подготовить предложения об изменениях в НПА в своей отрасли.

2. Внесение данных вручную

Сбор отчетности в архаичной форме (в «бумажной» форме, в таблицах и с ручным вводом) неудобен для организаций и граждан, при этом создает избыточную нагрузку на субъектов, предоставляющих отчетность, и оставляет массу возможностей для появления ошибок и искажений. Из-за длительного процесса сбора отчетности к моменту принятия решений результаты анализа могут быть уже устаревшими и ненужными.
Пандемия COVID-19 в 2020 году показала недоступность оперативных данных, в первую очередь из системы здравоохранения. Для принятия оперативных решений данные, поступающие с месячной задержкой, не годились. В качестве временной меры медработникам пришлось заполнять отчеты ежедневно вручную.

Пандемия COVID-19 в 2020 году показала недоступность оперативных данных, в первую очередь из системы здравоохранения. Для принятия оперативных решений данные, поступающие с месячной задержкой, не годились. В качестве временной меры медработникам пришлось заполнять отчеты ежедневно вручную.
Качество решений, принимаемых на основе данных, напрямую зависит от качества и актуальности самих данных. В России, как и во всем мире, возник запрос на перестройку системы сбора статистики и аналитики в режим ежедневного получения актуальных данных (вместо привычной периодически собираемой отчетности с агрегированными данными).
Сильная агрегация понижает ценность данных. Например, из данных, агрегированных на уровне региона или федерации, невозможно получить детальную информацию о текущей ситуации на уровне муниципалитета или района города. С учетом уровня развития инструментов и методов анализа данных сейчас востребованы именно первичные данные с максимальной детализацией и возможностью обогащать их другими данными для получения новой информации.
Подходы и возможные решения. Агрегированные данные должны существовать не вместо первичных данных, а наряду с ними. Нужны оперативные данные, поступающие в онлайн-режиме, в том числе с ретроспективой.
Проблема «грязных» данных активно обсуждалась в начале внедрения СМЭВ. Директор департамента информационных технологий и связи Правительства РФ Алексей Попов в 2011 году говорил о том, что большой объем данных пришлось срочно вводить в ИС руками, что привело к росту числа ошибок. Эксперты предполагали, что проблема частично решится либо в процессе активного взаимодействия органов, либо при естественном устаревании «грязных» данных и выходе их из оборота.

Проблема «грязных» данных активно обсуждалась в начале внедрения СМЭВ. Директор департамента информационных технологий и связи Правительства РФ Алексей Попов в 2011 году говорил о том, что большой объем данных пришлось срочно вводить в ИС руками, что привело к росту числа ошибок. Эксперты предполагали, что проблема частично решится либо в процессе активного взаимодействия органов, либо при естественном устаревании «грязных» данных и выходе их из оборота.
Мальцев С. Ведущий эксперт по управлению документацией ЭОС Наталья Храмцовская: «Даже если завтра СМЭВ будет закрыта и заменена чем-то иным, определенное положительное влияние она уже оказала» // ICT Online.
Вместо медленного по современным меркам ручного сбора необходимо наладить процессы непрерывного автоматизированного сбора данных с использованием эталонных справочников, а также модернизировать (или создать) инфраструктуру для сбора данных и предоставления доступа к ним. В положения о ФОИВ придется внести положения о роли поставщика данных и необходимых полномочиях. Внутри ФОИВ необходимо сформировать рабочие процессы по созданию новых наборов данных как продуктов, постепенно увеличивая их (наборов) количество.

3. Ведомственные барьеры

Ведомства долгое время решали проблемы с данными своими силами, по собственным планам, без коммуникации и кооперации, что объясняется в том числе уже упомянутой разрозненностью ведомственных ИС.
Ведомственные и внутриорганизационные барьеры называют проблемой в работе с данными 44% респондентов, а среди руководителей проектов и руководителей высшего звена — более 70% респондентов.

Ведомственные и внутриорганизационные барьеры называют проблемой в работе с данными 44% респондентов, а среди руководителей проектов и руководителей высшего звена — более 70% респондентов.
По результатам опроса, проведенного Центром подготовки РКЦТ летом 2021 года. См. также введение.
Большинство органов власти работает с госданными внутри своих полузамкнутых «отраслевых колодцев» (что создает риск «феодализма данных», см. раздел 8.2), а Минцифры не хватает полномочий для организации единой системы работы с данными для всех органов власти.
Сейчас даже на ЕПГУ гражданин иногда вынужден самостоятельно запрашивать и передавать из одной государственной организации в другую информацию (справки, выписки и т. п.), которую при налаженном межведомственном взаимодействии организации быстрее и проще передали бы напрямую.

Сейчас даже на ЕПГУ гражданин иногда вынужден самостоятельно запрашивать и передавать из одной государственной организации в другую информацию (справки, выписки и т. п.), которую при налаженном межведомственном взаимодействии организации быстрее и проще передали бы напрямую.
Подходы и возможные решения. Необходимо наладить обмен данными между ФОИВ, а ведомствам — сотрудничать друг с другом, чтобы обеспечивать связность, полноту и историчность данных (шаги к такой кооперации сейчас делаются на уровне отдельных ФОИВ). Предстоит выработать единую методологию сбора данных, с тем чтобы:
  • установить прозрачные правила предоставления доступа к данным (для этого, например, собрать набор практик или кодекс для работы с данными в федеральных органах власти);
  • определить универсальные подходы к сбору данных внутри госорганов, в частности к методикам сбора данных и их типам;
  • облегчить коммуникацию между ведомствами.
Публикация данных в формате открытых данных упрощает доступ к ним не только внешним потребителям (например, бизнесу), но и государственным организациям. Для этого необходимо провести инвентаризацию и анализ нормативных документов, затрагивающих открытые данные, актуализировать НПА, предусмотреть добавление в ГИС возможностей API и обновить «Методические рекомендации»: отказаться от устаревших практик формирования и передачи данных и добавить требования к архивам данных.
В первую очередь речь идет о таких документах, как 1) распоряжение от 10.07.2013 № 1187-р «О перечнях общедоступной информации, размещаемой в сети Интернет в форме открытых данных»; 2) Федеральный закон от 29.11.2007 № 282-ФЗ «Об официальном статистическом учете и системе государственной статистики в Российской Федерации»; 3) Федеральный закон от 06.10.2003 № 131-ФЗ (ред. от 01.07.2021) «Об общих принципах организации местного самоуправления в Российской Федерации».
Методические рекомендации по публикации открытых данных государственными органами и органами местного самоуправления, а также технические требования к публикации открытых данных. Версия 3.0 (утв. протоколом заседания Правительственной комиссии по координации деятельности Открытого Правительства от 29.05.2014 № 4).

4. Низкий уровень компетенций и нехватка кадров

У госзаказчика часто не хватает кадров, обладающих компетенциями в области управления данными и проектами с использованием данных. Низкий уровень оплаты труда и высокая зарегулированность — серьезные препятствия для привлечения в госсектор квалифицированных специалистов и топ-менеджеров сферы ИТ.
Нельзя нанять аналитика, CDO, целую команду и принимать результаты их труда некритично, на веру. Руководителю нужно быть компетентным заказчиком, чтобы опираться на данные при принятии решений: уметь задавать корректные вопросы к данным и результатам их анализа; понимать, стоит ли доверять ответам; отличать достоверную аналитику от искажений и последствий влияния человеческого фактора; иметь представление о возможных логических ошибках. Хорошо известна «настраиваемость» социологических опросов: можно получать разные результаты, если по-разному сформулировать вопросы и предлагать разные наборы вариантов ответов.
См. например: Аверьянов Л. Я. Социология: искусство задавать вопросы. М., 1998.
Подходы и возможные решения. Следует выделить ресурсы на создание инфраструктуры для «производства» качественных данных внутри ведомства, на обучение сотрудников ведомств работе с данными, на привлечение в штат квалифицированных специалистов по работе с данными. Каждому ведомству нужна своя внутренняя команда по работе с данными — от CDO до стюардов данных (см. раздел 5.1). Предстоит определить ответственных за все аспекты качества и стадии обработки госданных с соответствующими полномочиями.

5. Собираемые данные не используются

Часть госданных не используется для поиска лучших решений, а лежит «мертвым грузом». Иногда организационная культура не позволяет госорганизации открыто демонстрировать результаты своей работы и раскрывать данные, показывающие реальную ситуацию, за которую отвечает эта организация. При этом чем чаще и активнее используются данные, чем больше потребителей в них заинтересовано, тем больше внимания уделяется качеству данных и управлению данными.
Подходы и возможные решения. Госорганам, в частности Минцифры, предстоит провести масштабные исследования для изучения спроса на госданные среди целевых групп (см. раздел 3.1.1), причем результаты исследований должны стать публичными. Нужно расширять обмен лучшими практиками как между ведомствами, так и между целевыми группами потребителей госданных. Возможным решением станут советы (или рабочие группы) по данным (см. раздел 5.1) на уровне ведомств для непосредственного взаимодействия с практикующими специалистами.
ПРОБЛЕМЫ ОТКРЫТОСТИ ДАННЫХ В СТРАНАХ ЕАЭС

Для эффективного использования возможностей единого экономического пространства ЕАЭС важно обеспечить равный доступ к информации, необходимой для принятия решений и выполнения требований национального законодательства. Так, ФНС России требует от компаний осмотрительности при выборе контрагентов, правительство РФ обязывает госкорпорации проверять конечных собственников компаний-поставщиков, законодательство РФ ограничивает работу с офшорными компаниями. При этом если Россия обеспечивает высокую прозрачность бизнеса, в том числе за счет открытости и бесплатности федеральных реестров юридических лиц, то в других государствах ЕАЭС складывается иная ситуация (см. табл. 2).
Сейчас в ЕАЭС отсутствует единый стандарт раскрытия информации, необходимой компаниям для принятия бизнес-решений и уменьшения рисков.

В частности, в Казахстане из всего массива сведений о юрлицах, хранящихся в государственной базе данных «Юридические лица», в машиночитаемом формате возможно получить только пять категорий данных (для сравнения: из российского реестра предоставляется более тридцати категорий). Причем среди этих категорий нет информации о владельцах компаний — ее можно получить, только заказав выписку из указанного реестра. В Белоруссии в машиночитаемом формате можно получить только сведения о факте регистрации компании.

В России прозрачность госзакупок обеспечена многочисленными информационно-аналитическими системами, обслуживающими участников рынка госзаказа. Функционирование этих систем возможно благодаря предоставлению данных с официального сайта zakupki.gov.ru в машиночитаемом формате (формате открытых данных).

Необходимо унифицировать условия предоставления информации из реестров юридических лиц ЕАЭС, в том числе в формате открытых данных, а также определить единый набор сведений, которые должны раскрываться о юридических лицах.

ПРОБЛЕМЫ ОТКРЫТОСТИ ДАННЫХ В СТРАНАХ ЕАЭС

Для эффективного использования возможностей единого экономического пространства ЕАЭС важно обеспечить равный доступ к информации, необходимой для принятия решений и выполнения требований национального законодательства. Так, ФНС России требует от компаний осмотрительности при выборе контрагентов, правительство РФ обязывает госкорпорации проверять конечных собственников компаний-поставщиков, законодательство РФ ограничивает работу с офшорными компаниями. При этом если Россия обеспечивает высокую прозрачность бизнеса, в том числе за счет открытости и бесплатности федеральных реестров юридических лиц, то в других государствах ЕАЭС складывается иная ситуация (см. табл. 2).
Сейчас в ЕАЭС отсутствует единый стандарт раскрытия информации, необходимой компаниям для принятия бизнес-решений и уменьшения рисков.

В частности, в Казахстане из всего массива сведений о юрлицах, хранящихся в государственной базе данных «Юридические лица», в машиночитаемом формате возможно получить только пять категорий данных (для сравнения: из российского реестра предоставляется более тридцати категорий). Причем среди этих категорий нет информации о владельцах компаний — ее можно получить, только заказав выписку из указанного реестра. В Белоруссии в машиночитаемом формате можно получить только сведения о факте регистрации компании.

В России прозрачность госзакупок обеспечена многочисленными информационно-аналитическими системами, обслуживающими участников рынка госзаказа. Функционирование этих систем возможно благодаря предоставлению данных с официального сайта zakupki.gov.ru в машиночитаемом формате (формате открытых данных).

Необходимо унифицировать условия предоставления информации из реестров юридических лиц ЕАЭС, в том числе в формате открытых данных, а также определить единый набор сведений, которые должны раскрываться о юридических лицах.
Кейс предоставлен О. В. Полетаевым, директором по развитию цифрового бизнеса группы «Интерфакс». Впервые кейс публично обсуждался на круглом столе «Экономика данных. Цифровое ускорение глобального сотрудничества» на конференции «Цифровая индустрия промышленной России» (ЦИПР) 29 июня 2021 года.

Таблица 2
Ситуация с открытостью данных о юридических лицах в странах ЕАЭС