Как улучшить прогнозирование на всех уровнях иерархии товаров
Сергей Кравченко, Старший аналитик данных, Beltel Datanomics
Прогнозирование продаж товаров для ритейла или производителей должно быть согласованным на каждом уровне планирования, такими как товар-контрагент, товар-регион или товар-группа. Данное согласование может быть описано иерархией аналитических признаков товаров. Очевидно, что при прогнозировании на уровне точка-товар мы бы хотели, чтобы прогнозы при агрегации в пару товар-регион или товар-распределительный центр (РЦ) совпадали с фактом продаж данного товара в регионе или РЦ. Согласование прогнозов позволяет улучшить их на всей цепочке иерархии.
В этой статье мы кратко опишем проблематику прогнозирования товаров с иерархическими признаками и расскажем об общих подходах к решению этой проблемы.
Примеры данных с иерархическими признаками
Предположим, мы прогнозируем продажи мясоперерабатывающего предприятия. Общее количество продукции, проданное производителем, может быть разложено по категориям, таким как: говядина, свинина, курица. Категоризация продуктов может не ограничиться этим, в качестве групп верхнего уровня могут быть такие классы товаров как: свежее мясо, колбасы, деликатесы, полуфабрикаты. При этом каждая группа, например, «колбасы» может содержать подгруппы, такие как: вареные, сыровяленые, сырокопченые и т. д. Каждые из приведенных выше подгрупп могут быть разбиты на более специфические категории-признаки.
Иерархия продаж может также определяться географическими признаками. Например, общее количество проданных товаров может быть разбито по странам, регионам, городам, вплоть до каналов сбыта или точек продаж. Предпочтения регионов могут существенно менять торговую линейку, для некоторых регионов производители используют специфический признак «халяль», который указывает на соответствие производств товара традиционным нормам существенной группы населения региона. Так или иначе все эти признаки являются категориальными и должны учитываться при прогнозировании.
Ниже представлен абстрактный пример двухуровневой иерархической структуры данных.
Рисунок 1. Двухуровневая иерархическая структура данных
Предположим, мы производим расчет для компании, которая из прогнозов продаж товаров в регионах A и B, рассчитывает бюджет на следующий год. У нас есть всего два региона, в одном продается два товара, в другом — три. В этом небольшом примере для расчета прогнозов необходимо произвести прогнозы на всех трех уровнях для планирования логистики, итого будет 1 + 2 + 5 = 8 прогнозов. На самом нижнем уровне всего 5 прогнозов, на среднем – 2, плюс еще один, самый верхний уровень.
Прогнозы на разных уровнях в данном примере должны быть согласованы следующим условием:
Total = AA + AB + AC + BA + BB
A = AA + AB + AC
B = BA + BB
Такое условие, на первый взгляд, должно выполняться само собой, если произвести прогнозирование пяти рядов самого низкого уровня, а остальные прогнозы будут получены агрегированием сумм. Однако на практике не всегда такое получается. Агрегирование может привести к завышению или занижению прогнозов на более высоких уровнях иерархии.
Подходы к иерархическому прогнозированию
Существует два классических подхода согласования прогнозов при иерархическом прогнозировании: метод сверху-вниз и снизу-вверх. Первый метод предполагает прогнозирование полностью агрегированного ряда, а затем разложение прогнозов на основе исторических пропорций. Метод снизу-вверх включает прогнозирование каждого временного ряда на самом низком уровне иерархии, а затем использование простой агрегации для получения прогнозов на более высоких уровнях иерархии.
На практике некоторые компании сочетают эти методы путем получения прогнозов на промежуточном уровне иерархии, а затем агрегированием получают прогноз на более высоких, а разложением на составляющие для получения прогнозов на более низких уровнях. Ни один из этих методов не учитывает внутреннюю корреляционную структуру иерархии, и получить предсказательные интервалы для прогнозов от этих методов не так просто.
Существует также оптимальный подход, который реализуется в два этапа: сначала выполняется прогнозирование всех временных рядов на каждом уровне иерархии независимо друг от друга, затем эти прогнозы собираются путем согласования в соответствии с каждым уровнем иерархии. Согласование прогнозов реализуется путем минимизации ошибок прогнозирования для всех уровнях иерархии. Этот подход обладает рядов преимуществ перед описанными выше методами согласования.
Заключение
Иерархическое прогнозирование — это мощный инструмент для управления и анализа данных, который позволяет эффективно моделировать и прогнозировать продажи на разных уровнях иерархии. Вот несколько ключевых причин, почему такой подход важен:
- Согласование прогнозов на разных уровнях. Например, продажи товаров могут быть организованы по странам, регионам, категориям товаров и конкретным продуктам. Для планирования логистики, прогнозы должны быть согласованы между всеми аналитическими разрезами.
- Улучшенное прогнозирование. Иерархическое прогнозирование позволяет учитывать зависимости между данными на разных уровнях. Например, прогноз продаж на уровне категории может зависеть от прогноза продаж на уровне продукта. Это помогает улучшить точность прогнозов и снизить ошибку.
- Оптимальное использование информации. При иерархическом прогнозировании можно использовать информацию с более низких уровней для уточнения прогнозов на более высоких уровнях. Например, если у нас есть точные данные о продажах конкретного продукта, мы можем использовать эту информацию для уточнения прогноза продаж на уровне категории.
- Управление ресурсами. Иерархическое прогнозирование позволяет оптимизировать распределение ресурсов. Например, при планировании производства можно учитывать прогнозы на разных уровнях, чтобы избежать перепроизводства или дефицита товаров.
Иерархическое прогнозирование помогает улучшить точность прогнозов, оптимизировать ресурсы и обеспечивает структурированное представление данных.