25.05.2022

Построение дашборда в Yandex DataLens на примере прогнозирования спроса в ритейле

Николай Курбатов, аналитик данных, Beltel Datanomics

Применение алгоритмов машинного обучения и технологий Data Science позволяет бизнесу оптимизировать расходы и увеличить прибыль. Отправной точкой принятия решений является анализ данных. Есть множество способов представления данных, включая объемные отчёты и презентации, однако самым наглядным и интерактивным инструментом является дашборд с визуализацией данных, позволяющий следить за продуктом, вовремя обнаруживать проблемы и проверять различные гипотезы.

Расскажем об опыте построения дашбордов в сервисе Yandex DataLens на примере кейса прогнозирования спроса в ритейле.

О сервисе DataLens

DataLens – это облачный BI сервис от компании Yandex.

DataLens находится в экосистеме Яндекса и интегрирован с другими сервисами: Яндекс.Погода, AppMetrica, Яндекс.Метрика, Яндекс.Карты, Yandex Cloud Billing. Существует возможность подключения сторонних источников данных: ClickHouse, MySQL, PostgreSQL, MS SQL Server, Oracle Database, Greenplum, Google Sheets и других, которые есть в маркетплейсе.

В сервисе есть возможность настройки правил доступа, причем не только к отдельным объектам, но и к данным.

Рисунок 1. Доступ к дашборду в DataLens

Этапы построения дашборда

1.   Постановка задачи

При построении дашборда необходимо понять, на какие вопросы он должен отвечать. Для нашего кейса интерес представляет:

  • мониторинг прогнозирования спроса (метрики качества, сводные таблицы);
  • мониторинг динамики продаж;
  • анализ продаж в различных магазинах.

Исходя из требований визуализацию можно разделить на две части: мониторинг прогнозов и анализ спроса. Это позволит отслеживать качество работы алгоритма прогнозирования и проводить переобучение модели на новых данных для поддержания точности, а также исследовать спрос в различных точках, анализировать динамику продаж во время промоакций и при их отсутствии.

Следующий шаг – это определение показателей, удовлетворяющих поставленным задачам. Для блока мониторинга прогнозирования спроса может понадобиться график динамики фактических и прогнозируемых продаж, а также информация о метриках качества прогнозной модели (в виде таблицы или столбчатых графиков); для блока анализа продаж потребуются несколько KPI с разными фильтрами, такие как средняя выручка, прибыль.

Далее стоит подумать о конфигурации этих показателей и графиков на дашборде. Это сэкономит время на его создание и позволит получить простое и понятное визуальное представление. Лучше ранжировать информацию по высоте – уменьшать важность информации сверху вниз.

2.   Сбор данных

Если набор данных небольшой, можно загрузить в DataLens несколько файлов в формате .csv.

В нашем случае для визуализации нужны данные о реальных и прогнозируемых продажах, данные о промоакциях, остатках, спецификации товаров, информация о магазинах.

В DataLens реализованы коннекторы не только к локальным БД, но и к облачным, развернутым в YandexCloud. Мы для этих целей выделили кластер ClickHouse в YandexCloud. (Рис.2).

Рисунок 2. Схема поставки данных для визуализации

3.   Построение визуализации

Процесс создания дашборда в DataLens состоит из нескольких этапов (Рис.3):

  1. Настройка соединения с источником данных, таких источников может быть несколько;
  2. Создание датасета: выбрав подключение, нужно создать модель данных и определить типы полей (показатели, измерители). Причем для БД, поддерживающих sql-синтаксис, существует возможность написания собственных сложных запросов;
  3. Создание графиков, показателей: выбрав датасет с нужными полями, можно создавать визуализации и варьировать настройки графиков (подписи, фильтры, цвета и др.)
  4. Создание дашборда: расположение созданных графиков и показателей на одной или нескольких страницах; добавление подписи, текста (есть поддержка markdown), слайдеров; настройка зависимостей, обновления виджетов.

Рисунок 3. Структура дашборда

В DataLens есть возможность создания геоаналитики. Располагая данными о продажах, можно построить на карте торговые точки, а цвет и размер этих точек будет соответствовать суммарной выручке в определенный период времени (Рис.4).

Рисунок 4. Торговые точки на карте

4.   Публикация отчета

Прежде чем приступить к публикации отчета, необходимо продумать правила доступа пользователей. Это можно сделать на уровне облачных аккаунтов либо в настройках доступа внутри DataLens при публикации отчета.

В рамках нашего кейса был сделан дашборд, состоящий из двух страниц (Рис.5-6).

На страницах есть возможность выбора торговой точки, а также различных фильтров для создания нужного среза данных.

Рисунок 5. Страница мониторинга прогнозов

Линейный график позволяет визуально отслеживать корректность прогноза, а таблица с метриками – получить полную информацию о качестве работы модели. Цветовая гамма таблицы метрик настроена на возрастание ошибки, это помогает быстро найти и ликвидировать проблему в прогнозном сервисе.

Информация по определенному товару собрана в виде сводной таблицы, которую при необходимости можно использовать в других отчетах.

Рисунок 6. Страница анализа продаж          

Торговые точки на карте позволят следить за тем, как меняется динамика выручки или любой другой метрики от магазина к магазину. С помощью инструмента геоаналитики можно выявлять закономерности, связанные с различными геофакторами, например, открытия новых магазинов около торговой точки, за счет чего произошло снижение выручки.

Распределения суммарного объема продаж и выручки в группах товаров позволяют отслеживать успешность промоакций.

Заключение

Визуализация с помощью дашбордов облегчает работу с информацией, ускоряет принятие решений, является удобным способом контроля и анализа.  Чтобы система BI приносила максимальную пользу, необходимо каждый отдельный дашборд рассматривать как продукт, который нужно улучшать и совершенствовать, добавлять новую информацию или исключать неактуальную, вовлекать пользователей в предоставление обратной связи.

Дополнительно:

Построение аналитической платформы в облаке Yandex Cloud (datanomics.ru)

Облачная аналитика для промышленности. Как внедрять ИИ уже сегодня (datanomics.ru)

Преимущества алгоритмов машинного обучения для прогнозирования спроса (datanomics.ru)

Оставьте заявку и получите бюджет и план внедрения наших решений в ваш бизнес

    Заполняя форму, Вы соглашаетесь с правилами обработки персональных данных.

    Мы используем файлы cookies, чтобы получать статистику и делать наш сайт и другие сервисы удобными для вас. Продолжая дальнейшее использование сайта и/или его сервисов, вы соглашаетесь с этим. Более подробную информацию можно прочитать в «Политика обработки персональных данных» и в «Политика Cookies»