«Потому, потому что мы пилоты…» или почему проекты распознавания товаров на полке не доходят до промышленной эксплуатации
Анна Племяшова, Руководитель Департамента аналитики больших данных и искусственного интеллекта Beltel Datanomics.
Технологии компьютерного зрения (CV) с развитием облачных вычислений и алгоритмов глубокого машинного обучения активно шагнули в ритейл начиная с 2015 года. Пилотные проекты по освоению возможностей распознавания товаров на полках начали запускаться в России в 2016-2017 годах. Прошло пять лет, но в розничных магазинах пока не наблюдается дополнительного контура камер для распознавания товаров, да и мерчандайзеров, снимающих полку на телефон, как это показано в рекламных роликах разработчиков решений, нечасто встретишь – я, например, ни разу не видела.
В чем причины, что такая, казалось бы, передовая технология и ИТ продукты, которые обещают решить массу проблем ритейлеров и производителей – от out-of-stock до оптимизации персонала – пока не получили признания и не используются повсеместно?
Причина 1. Подготовка датасета
Как мы уже писали в предыдущих статьях на тему цифрового мерчандайзинга (ЦМ), на сегодняшний день не существует готового набора данных, на котором было бы возможно обучить нейронную сеть, подходящую для любого магазина. Отчасти этим объясняется тот факт, что производители из FMCG отрасли идут в пилоты проектов цифрового мерчандайзинга охотнее, чем ритейл. Разметить товары для сотен номенклатур – такая задача легче укладывается в голове, чем разметка тысяч позиций товарной матрицы ритейлера.
Подготовка датасета – самый сложный и длительный этап проекта и часто обсуждение потенциального внедрения заканчивается из-за осознания заказчиком трудоемкости этого этапа.
Подробнее о подготовке датасета читайте в нашем материале Принципы создания датасета для систем компьютерного зрения в ритейле (datanomics.ru)
Причина 2. Наличие инфраструктуры
Одна из целей цифрового мерчандайзинга – исключить человека из процесса контроля полок и заменить его на систему сбора и распознавания объектов на изображении.
Такая система может выглядеть, например, вот так:
Камеры должны смотреть на полки фронтально, поэтому существующие системы видеонаблюдения в ритейле, как правило, не подходят: такие системы монтировались для служб безопасности и наблюдение у них направлено в проходы, а не на товары. Возникает необходимость дополнительного видео-контура, что требует затрат и изменений существующей инфраструктуры. И если на пилотных проектах можно попробовать работоспособность решения на нескольких камерах, то при масштабировании придется модернизировать всю существующую ИТ инфраструктуру.
Некоторые российские ритейлеры решили попробовать роботов для целей мониторинга полок, и их не останавливает опыт Walmart, который в конце прошлого года решил разорвать контракт с Bossa Nova Robotics и вернуться к простым и экономичным способам контроля полок – с помощью людей. На наш взгляд, подобные пилоты – это имиджевые проекты, безусловно, вызывающие интерес у покупателей, но в дальнейшее масштабирование верится слабо.
Причина 3. Выкладка и упаковка
Технология компьютерного зрения – это не волшебное решение и то, что не может на изображении различить человеческий глаз, скорее всего не сможет и машина.
Например, машина будет ошибаться при распознавании бликующих упаковок косметики. Еще одна сложность – отличать литраж при идентичных этикетках. Ошибки распознавания будут возникать в случае мелких товаров или выкладки россыпью, когда даже человек по фото не может определить товар и его количество.
Например, заказчик рассматривал возможность распознавания такой выкладки, как на фото.
В этом случае, даже если система сможет прочитать названия на коробках, перекрытия другими упаковками, блики света приведут к ошибкам, и количество посчитанного товара будет неверным, поэтому смысл такого распознавания крайне сомнительный.
Причина 4. Наличие интернета
Как правило, текущие ИТ продукты для мониторинга полок используют облачные технологии и для устойчивой работы приложения требуется наличие Интернета.
С проблемой, в основном, сталкиваются мерчандайзеры FMCG производителей, использующие мобильные приложения для контроля полок в торговых точках. Отсутствие или слабый сигнал Интернета приводит к тому, что мерчандайзер не может завершить работу или тратит неоправданно много времени на контроль, получает штрафы и нарекания от руководства.
На рынке существуют мобильные приложения, которые могут работать автономно, но они, как правило, быстро разряжают батарею на устройствах и их возможности распознавания слабее, чем у облачных решений.
Причина 5. Точность
Системы распознавания товаров на полке целесообразно внедрять, когда точность распознавания составляет не менее 95%. Система, которая часто ошибается, которую надо перепроверять – бессмысленна, к ней отсутствует доверие, зато присутствует раздражение.
Как уже было отмечено, на точность влияет выкладка, упаковка, освещение, используемые устройства и алгоритмы. И даже если точность на пилоте удовлетворительная, масштабирование повлечет затраты, которые заказчик может посчитать необоснованными. Поэтому часто успешно завершенный пилот так и остается только красивым пресс-релизом для истории.
Изменится ли ситуация в ближайшем будущем, появятся ли приложения, которые легко будут работать не с единичной этикеткой, как например популярное приложение Vivino, а с целой полкой, причем любых товаров – это крайне сомнительно.
Решения распознавания товаров начинаются с датасета. Пока не создана платформа, на которой накапливаются и обновляются размеченные датасеты производителей товаров для обучения нейросети, вход в проекты будет трудоемким, а масштабирование иметь крайне туманную перспективу.
Статья подготовлена для журнала New Retail