7.4 ПАМЯТКА ДЛЯ ОТВЕТСТВЕННОГО ЗА КАЧЕСТВО ДАННЫХ

Некачественные данные подрывают веру в ценность данных. К снижению качества данных приводят неумелое планирование, неполнота документации, архитектурная обособленность систем, рассогласованность проектов. Работа с качеством данных должна быть встроена во все процессы организации.
1. Данные должны работать. Чем чаще данные используют, тем больше вероятность выявить ошибку (например, что в записи о гражданине правильная фамилия не «Фет», а «Фёт»).
2. Обеспечивать качество данных нужно на всех этапах процесса сбора или создания этих данных. Не должно быть таких ситуаций, в которых вся работа при сборе/получении данных ориентирована на их качество, но остается дополнительное «окно» для получения данных. К примеру, предоставить данные можно через электронную форму с масками ввода или в бумажном виде, где такой маски ввода нет. Другой пример: правила контроля качества запускаются автоматически, но на одном из этапов эта функция отдана оператору. При таком «слабом звене» все остальные усилия по обеспечению качества сильно обесцениваются.
3. Жизненный цикл данных должен быть встроен во все ключевые
процессы организации, чтобы качество данных реально повышалось.
4. Человеческий фактор при сборе и вводе данных должен быть минимизирован. По всем метрикам должны быть внедрены форматнологические контроли (см. раздел 3.2.1), различные маски ввода.
4. Ответственных за предоставление данных нужно мотивировать к тому, чтобы они вводили качественные данные. Например, если сотруднику при вводе информации выпадает только сообщение о том, что данные неполны, то он может не заполнить нужное поле или заполнить его некачественной информацией. А если показать ему сообщение, что отсутствие данных в конкретном поле приведет к неправильному начислению налога, шансы, что сотрудник заполнит поле правильно, возрастут.
5. Неправильная интерпретация данных может привести к социально значимым последствиям. Чтобы исключить неправильное понимание, данные должны быть описаны.
6. Необходимо всегда опираться на первоисточник. При передаче данных возможны ошибки, которые будут иметь критическое значение для получателя. Поэтому необходимо, чтобы всегда был указан первоисточник: данные должны максимально сохранять вид из первоисточника, а посредники должны их обогащать, а не заменять.
Маска ввода — строка символов, указывающая формат допустимых значений входных данных. Ее используют для обеспечения единого формата данных, например для полей с телефонными номерами из девяти цифр.