Сбер и Microsoft разработали ИИ-систему управления роботами

Сбер и исследовательское подразделение Microsoft Research подвели итоги совместного проекта, анонсированного в октябре 2019 года. Разработанная ИИ-система дает возможность обучить роботов манипулировать физическими объектами непостоянной формы практически так, как это делает человек. Ключевой целью проекта была разработка решения, способного взаимодействовать с людьми, освобождая их от механически сложной рутинной работы и обеспечивая высокий уровень безопасности. Кроме того, это один из первых примеров переноса подобной технологии из симуляции в реальный мир – обученная система была внедрена и протестирована в Лаборатории робототехники Сбера.

Видео с демонстрацией функционала робота доступно здесь.

Работа над проектом осуществлялась в Лаборатории робототехники Сбера в Москве, Россия, и в Microsoft в Беркли и Редмонде, США, и в совокупности длилась больше года, с мая 2019 года по май 2020. Исследовательская группа состояла из 8 человек. Их практической задачей было разработать технологию выгрузки с помощью робота-манипулятора инкассаторских мешков с монетами весом до 6 килограмм из мобильных тележек для их последующей обработки в счетных машинах. В отличие от захвата твердотельных объектов, манипуляции объектами непостоянной формы из-за подвижного центра тяжести требуют постоянного вычисления положения и ориентации захватного устройства в каждом отдельном случае. Для расчета и предсказания этих параметров были применены методы глубокого обучения и обучения с подкреплением. Испытания продемонстрировали успешность выгрузки мешков с первого раза в более 95% в реальных условиях.

Процесс работы над проектом проходил в три этапа. Первый – разработка реалистичной симуляции робототехнической установки и объектов манипуляции – деформируемых мешков с монетами с учетом их физических характеристик. Вторым этапом была интеграция симуляторов с фреймворком машинного обучения с подкреплением и проведение экспериментов в симуляционной среде с обучением интеллектуального агента управлению виртуальным роботом. Для этого исследователями был применен подход machine teaching (англ. «обучение машин»). Методика предполагает не только обучение посредством взаимодействия алгоритма со средой, как в классическом обучении с подкреплением, но и использование «подсказок» от человека. На этом этапе необходимо было прописать правильные опорные точки для алгоритма, на основе которых он сможет обучаться. Это позволяет значительно ускорить процесс и сделать его более эффективным. На завершающем третьем этапе обученного в симуляторах интеллектуального агента перенесли непосредственно на физического робота. В результате в Лаборатории робототехники Сбера были успешно протестированы реальные манипуляции по разгрузке тележки с мешками монет роботом.

Создатели системы уверены, что подобная технология может быть востребована в широком ряде сфер. Особенно целесообразно ее применение для решения тех задач, где человек подвергается опасности или должен прилагать чрезвычайные физические усилия, например, в спасательных операциях, нефтедобыче, логистике и т.д. – везде, где необходимо совершать действия с объектами непостоянной формы.

Компании продолжат сотрудничество в исследовательской сфере, чтобы способствовать развитию и более широкому распространению своих разработок на стыке робототехники и искусственного интеллекта.