Типичные проекты в области анализа данных делятся на
несколько этапов: данные оцениваются и отбираются, очищаются и фильтруются, визуализируются и анализируются, а результаты анализа в итоге интерпретируются и оцениваются. Трудоемкость этапов неодинакова. Львиная доля рабочего времени (принято считать, что 80−90%) уходит на поиск, извлечение, очистку данных (см. разделы
6.2 и
4.1) и подготовку их к
анализу. Для удобства можно выделить ключевые этапы аналитического проекта, показанные на
рис. 31.