© ComNews
08.12.2020

Сбер и исследовательское подразделение Microsoft Research разработали ИИ-систему управления роботами для взаимодействия с физическим миром. Она может применяться в различных сферах – от логистики до проведения спасательных операций. Испытания показали, что в реальных условиях система может работать с точностью до 95%. Исследовательский проект не имеет аналогов в России.

Разработанная уникальная ИИ-система дает возможность обучить роботов манипулировать физическими объектами непостоянной формы практически так, как это делает человек. Ключевой целью исследовательского проекта была разработка решения, способного взаимодействовать с людьми, освобождая их от механически сложной рутинной работы и обеспечивая высокий уровень безопасности. Кроме того, это один из первых примеров переноса подобной технологии из симуляции в реальный мир – обученная система была внедрена и протестирована в Лаборатории робототехники Сбера.

"Совместно с Microsoft нам удалось добиться результатов, очень важных для развития искусственного интеллекта и робототехники. Система может быть востребована во множестве отраслей отечественной экономики. Мы намерены продолжать исследования, чтобы способствовать развитию цифровых технологий и обеспечивать российские компании современными высокопроизводительными роботами", – отметил заместитель председателя правления Сбербанка Станислав Кузнецов.

Работа над проектом осуществлялась в Лаборатории робототехники Сбера в Москве, Россия, и в Microsoft в Беркли и Редмонде, США, и в совокупности длилась больше года, с мая 2019 года по май 2020. Исследовательская группа состояла из 8 человек. Их практической задачей было разработать технологию выгрузки с помощью робота-манипулятора инкассаторских мешков с монетами весом до 6 килограмм из мобильных тележек для их последующей обработки в счетных машинах. В отличие от захвата твердотельных объектов, манипуляции объектами непостоянной формы из-за подвижного центра тяжести требуют постоянного вычисления положения и ориентации захватного устройства в каждом отдельном случае. Для расчета и предсказания этих параметров были применены методы глубокого обучения и обучения с подкреплением. Испытания продемонстрировали успешность выгрузки мешков с первого раза в более 95% в реальных условиях.

Процесс работы над проектом проходил в три этапа. Первый – разработка реалистичной симуляции робототехнической установки и объектов манипуляции – деформируемых мешков с монетами с учетом их физических характеристик. Вторым этапом была интеграция симуляторов с фреймворком машинного обучения с подкреплением и проведение экспериментов в симуляционной среде с обучением интеллектуального агента управлению виртуальным роботом. Для этого исследователями был применен подход machine teaching (англ. "обучение машин"). Методика предполагает не только обучение посредством взаимодействия алгоритма со средой, как в классическом обучении с подкреплением, но и использование "подсказок" от человека. На этом этапе необходимо было прописать правильные опорные точки для алгоритма, на основе которых он сможет обучаться. Это позволяет значительно ускорить процесс и сделать его более эффективным. На завершающем третьем этапе обученного в симуляторах интеллектуального агента перенесли непосредственно на физического робота. В результате в Лаборатории робототехники Сбера были успешно протестированы реальные манипуляции по разгрузке тележки с мешками монет роботом.

Создатели системы уверены, что подобная технология может быть востребована в широком ряде сфер. Особенно целесообразно ее применение для решения тех задач, где человек подвергается опасности или должен прилагать чрезвычайные физические усилия, например, в спасательных операциях, нефтедобыче, логистике и т.д. – везде, где необходимо совершать действия с объектами непостоянной формы.

Компании продолжат сотрудничество в исследовательской сфере, чтобы способствовать развитию и более широкому распространению своих разработок на стыке робототехники и искусственного интеллекта.