Снижение рисков инновационных проектов или как помочь проекту взлететь

Анна Племяшова, Руководитель Департамента аналитики больших данных и искусственного интеллекта Beltel Datanomics.
В предыдущих материалах мы уже писали о приемах снижения рисков инновационных проектов, в частности проектов предиктивной и предписывающей аналитики. Один из способов – это этапность и детализация. На сколько этапов разбивать проекты, например, прогнозирования протекания технологических процессов и их оптимизации, и какие рамки должны быть у пилотных проектов?
Обычная практика реализации проектов это:
- Постановка цели и формализация задачи, написание технического задания
- Построение моделей и тестирование
- Прототипирование системы и создание макетов пользовательского интерфейса
- Составление технико-рабочего проекта на внедрение в промышленную эксплуатацию
- Внедрение, опытная эксплуатация и поддержка
- Масштабирование
Успех зависит от качества и количества данных, поэтому выделяйте доказательство осуществимости идеи в отдельный подпроект
В случае построения интеллектуальных систем с применением продвинутой аналитики успех реализации зависит не только от используемых технологий и экспертизы исполнителей, а прежде всего от качества и количества данных. Действие принципа GIGO (мусор на входе – мусор на выходе) очевиден для построения подобных систем, поэтому мы рекомендуем своим заказчиком после постановки цели и формализации задачи выделять в отдельный подпроект этап Proof of Concept (PoC) или доказательство осуществимости идеи на исторических данных. Техническое задание в этом случае можно ограничить формализацией задачи в цель машинного обучения, например, какие величины прогнозируем или какую целевую переменную выбираем для оптимизации; метриками качества прогнозной модели, т. е. по каким критериям считаем проект успешным и возможным для дальнейшей разработки.
Задачи, сроки и результаты
Проекты PoC можно выполнить за 2-3 месяца, их стоимость не превышает 1 млн. рублей, поэтому риски по срокам и бюджету минимальные.
Задача проекта – это создать датасет из существующих данных заказчика, провести описательную (дескриптивную) аналитику, построить на основании существующих исторических данных предиктивные или оптимизационные модели и оценить их качество.
Результатом проекта PoC является собранный датасет и отчет, в котором должны быть отражены все этапы исследовательской деятельности, а именно:
- Цели и задачи бизнеса, для которых запускается проект PoC
- Структура и источники данных
- Описание подготовки датасета и результат сбора данных
- Результаты описательной аналитики и статистические выводы
- Описание подготовки данных для моделирования и выбора алгоритмов
- Результаты моделирования и оценка качества
- Выводы по проекту
- Предложения по дальнейшему развитию проекта
При успешном завершении проекта Proof of Concept согласно утвержденным в техническом задании критериям можно переходить к составлению детального технического задания с описанием функциональности системы, требованиям к пользовательскому интерфейсу, архитектуре, надежности и пр. с указанием этапов и сроков, и после прототипирования запускать систему в промышленную эксплуатацию.
Сложности, которые не позволяют запустить систему в промышленную эксплуатацию
Иногда мы сталкивались со следующими сложностями, которые не позволяют достигать требуемого качества моделирования или запустить систему в промышленную эксплуатацию:
- Отсутствие данных
При построении модели может выяснится, что точности не хватает за счет отсутствия данных с каких-то узлов оборудования, лабораторных проб и пр. На текущей момент потребности в их сборе и хранении не было, но для задач прогнозирования и оптимизации они необходимы.
- Данные не оцифрованы или хранятся разрозненно
Бумажные журналы, Excel таблицы со сложной организацией записей, файлы с данными, которые ведет сотрудник по собственной инициативе – все это примеры, когда данные как бы есть, но для промышленного запуска – это равно «данных нет».
- Датчики неисправны, сломаны, не откалиброваны
Подобные проблемы, если они существуют, выявляются на стадии описательной аналитики. Иногда неисправность датчика неочевидна, с помощью аналитики такие проблемы можно отследить и устранить.
- Нерегулярность записи данных
Некоторые показатели могут записываться ежесекундно, но такая частота не увеличит датасет, если по другим критичным параметрам данные снимаются раз в сутки, например.
Перечень замечаний к сбору и хранению данных на стадии PoC формирует необходимый объем работ, без реализации которых невозможно перейти к промышленному внедрению.
Для проектов построения интеллектуальных систем на производстве мы настоятельно рекомендуем не пренебрегать исследовательским этапом и выделять его в отдельный проект, иначе техническое задание с подробным описанием требуемого функционала так и останется на бумаге, так как качество данных не позволит осуществить все задуманные идеи.
Получив результаты исследований и анализа существующих данных, наши заказчики вносят изменения в систему сбора и хранения данных согласно полученной дорожной карте и через какое-то время возвращаются для продолжения проекта.
Дополнительно:
10 вопросов при запуске проектов по оптимизации процессов на производстве (datanomics.ru)
Data Governance. 5 основных задач управления данными (datanomics.ru)