Построение дашборда в Yandex DataLens на примере прогнозирования спроса в ритейле
Николай Курбатов, аналитик данных, Beltel Datanomics
Применение алгоритмов машинного обучения и технологий Data Science позволяет бизнесу оптимизировать расходы и увеличить прибыль. Отправной точкой принятия решений является анализ данных. Есть множество способов представления данных, включая объемные отчёты и презентации, однако самым наглядным и интерактивным инструментом является дашборд с визуализацией данных, позволяющий следить за продуктом, вовремя обнаруживать проблемы и проверять различные гипотезы.
Расскажем об опыте построения дашбордов в сервисе Yandex DataLens на примере кейса прогнозирования спроса в ритейле.
О сервисе DataLens
DataLens – это облачный BI сервис от компании Yandex.
DataLens находится в экосистеме Яндекса и интегрирован с другими сервисами: Яндекс.Погода, AppMetrica, Яндекс.Метрика, Яндекс.Карты, Yandex Cloud Billing. Существует возможность подключения сторонних источников данных: ClickHouse, MySQL, PostgreSQL, MS SQL Server, Oracle Database, Greenplum, Google Sheets и других, которые есть в маркетплейсе.
В сервисе есть возможность настройки правил доступа, причем не только к отдельным объектам, но и к данным.
Рисунок 1. Доступ к дашборду в DataLens
Этапы построения дашборда
1. Постановка задачи
При построении дашборда необходимо понять, на какие вопросы он должен отвечать. Для нашего кейса интерес представляет:
- мониторинг прогнозирования спроса (метрики качества, сводные таблицы);
- мониторинг динамики продаж;
- анализ продаж в различных магазинах.
Исходя из требований визуализацию можно разделить на две части: мониторинг прогнозов и анализ спроса. Это позволит отслеживать качество работы алгоритма прогнозирования и проводить переобучение модели на новых данных для поддержания точности, а также исследовать спрос в различных точках, анализировать динамику продаж во время промоакций и при их отсутствии.
Следующий шаг – это определение показателей, удовлетворяющих поставленным задачам. Для блока мониторинга прогнозирования спроса может понадобиться график динамики фактических и прогнозируемых продаж, а также информация о метриках качества прогнозной модели (в виде таблицы или столбчатых графиков); для блока анализа продаж потребуются несколько KPI с разными фильтрами, такие как средняя выручка, прибыль.
Далее стоит подумать о конфигурации этих показателей и графиков на дашборде. Это сэкономит время на его создание и позволит получить простое и понятное визуальное представление. Лучше ранжировать информацию по высоте – уменьшать важность информации сверху вниз.
2. Сбор данных
Если набор данных небольшой, можно загрузить в DataLens несколько файлов в формате .csv.
В нашем случае для визуализации нужны данные о реальных и прогнозируемых продажах, данные о промоакциях, остатках, спецификации товаров, информация о магазинах.
В DataLens реализованы коннекторы не только к локальным БД, но и к облачным, развернутым в YandexCloud. Мы для этих целей выделили кластер ClickHouse в YandexCloud. (Рис.2).
Рисунок 2. Схема поставки данных для визуализации
3. Построение визуализации
Процесс создания дашборда в DataLens состоит из нескольких этапов (Рис.3):
- Настройка соединения с источником данных, таких источников может быть несколько;
- Создание датасета: выбрав подключение, нужно создать модель данных и определить типы полей (показатели, измерители). Причем для БД, поддерживающих sql-синтаксис, существует возможность написания собственных сложных запросов;
- Создание графиков, показателей: выбрав датасет с нужными полями, можно создавать визуализации и варьировать настройки графиков (подписи, фильтры, цвета и др.)
- Создание дашборда: расположение созданных графиков и показателей на одной или нескольких страницах; добавление подписи, текста (есть поддержка markdown), слайдеров; настройка зависимостей, обновления виджетов.
Рисунок 3. Структура дашборда
В DataLens есть возможность создания геоаналитики. Располагая данными о продажах, можно построить на карте торговые точки, а цвет и размер этих точек будет соответствовать суммарной выручке в определенный период времени (Рис.4).
Рисунок 4. Торговые точки на карте
4. Публикация отчета
Прежде чем приступить к публикации отчета, необходимо продумать правила доступа пользователей. Это можно сделать на уровне облачных аккаунтов либо в настройках доступа внутри DataLens при публикации отчета.
В рамках нашего кейса был сделан дашборд, состоящий из двух страниц (Рис.5-6).
На страницах есть возможность выбора торговой точки, а также различных фильтров для создания нужного среза данных.
Рисунок 5. Страница мониторинга прогнозов
Линейный график позволяет визуально отслеживать корректность прогноза, а таблица с метриками – получить полную информацию о качестве работы модели. Цветовая гамма таблицы метрик настроена на возрастание ошибки, это помогает быстро найти и ликвидировать проблему в прогнозном сервисе.
Информация по определенному товару собрана в виде сводной таблицы, которую при необходимости можно использовать в других отчетах.
Рисунок 6. Страница анализа продаж
Торговые точки на карте позволят следить за тем, как меняется динамика выручки или любой другой метрики от магазина к магазину. С помощью инструмента геоаналитики можно выявлять закономерности, связанные с различными геофакторами, например, открытия новых магазинов около торговой точки, за счет чего произошло снижение выручки.
Распределения суммарного объема продаж и выручки в группах товаров позволяют отслеживать успешность промоакций.
Заключение
Визуализация с помощью дашбордов облегчает работу с информацией, ускоряет принятие решений, является удобным способом контроля и анализа. Чтобы система BI приносила максимальную пользу, необходимо каждый отдельный дашборд рассматривать как продукт, который нужно улучшать и совершенствовать, добавлять новую информацию или исключать неактуальную, вовлекать пользователей в предоставление обратной связи.
Дополнительно:
Построение аналитической платформы в облаке Yandex Cloud (datanomics.ru)
Облачная аналитика для промышленности. Как внедрять ИИ уже сегодня (datanomics.ru)
Преимущества алгоритмов машинного обучения для прогнозирования спроса (datanomics.ru)