Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Андроиды на страже порядка: какие должности занимают роботы на службе у разных государств Андроиды на страже порядка: какие должности занимают роботы на службе у разных государств

Роботы по всему миру помогают людям избавиться от рутинной работы

Популярная механика
Тихие омуты Тихие омуты

Инновации в унитазах: чем подкупает вариант с инсталляцией

Идеи Вашего Дома
Разработана умная роботизированная инвалидная коляска Разработана умная роботизированная инвалидная коляска

Как умное кресло-коляска позволяет находить оптимальный путь к пункту назначения

ТехИнсайдер
А вдруг уволят?.. А вдруг уволят?..

Страх потерять работу может быть cтимулом или помехой в карьере

Лиза
Мошенники усложнили схемы Мошенники усложнили схемы

Мошенники придумали новую схему обмана с «выплатами» в евро

Ведомости
«Я попросила 16-летнюю дочь платить за содержание нашего дома» «Я попросила 16-летнюю дочь платить за содержание нашего дома»

Женщина решила обсудить семейный бюджет со своей 16-летней дочерью

Psychologies
Анализ керамики позволил выяснить рацион питания древних жителей Латвии Анализ керамики позволил выяснить рацион питания древних жителей Латвии

Основными источниками пищи выступали пресноводная рыба, моллюски и свинина

N+1
Для чего нужно обучение во взрослом возрасте Для чего нужно обучение во взрослом возрасте

Образование даёт человеку возможность достичь целей в любом возрасте

Популярная механика
Интернет, нейросети и искусственная еда: что предсказали Стругацкие Интернет, нейросети и искусственная еда: что предсказали Стругацкие

Что предсказали фантасты братья Стругацкие

Культура.РФ
7 высоковольтных фактов об электровездеходе «УАЗ-Спартан» 7 высоковольтных фактов об электровездеходе «УАЗ-Спартан»

Быстрее, круче, тяжелее!

Maxim
Увидеть первые Apple, сделать копию на ксероксе и потрогать мышку: как в Минске-88 прошла выставка «Информатика в США» Увидеть первые Apple, сделать копию на ксероксе и потрогать мышку: как в Минске-88 прошла выставка «Информатика в США»

Выставка «Информатика в США» стала потрясением для жителей Минска

VC.RU
Девушку-подростка увезли в больницу с аппендицитом, а она начала рожать Девушку-подростка увезли в больницу с аппендицитом, а она начала рожать

Аппендицит Нади Роадс из Огайо оказался беременностью

Cosmopolitan
Почему во рту появляется неприятный запах и как от него избавиться Почему во рту появляется неприятный запах и как от него избавиться

Галитоз, или запах изо рта — не приговор, избавиться от него можно

Популярная механика
“Теперь меня никто не тронет” “Теперь меня никто не тронет”

Что подтолкнуло нашу героиню пойти в монахини и о чем она жалеет?

Psychologies
Палеогенетики выяснили происхождение этрусков Палеогенетики выяснили происхождение этрусков

Этруски оказались генетически близки италикам

N+1
Остров-сад Остров-сад

Нило-Столобенская пустыня

Seasons of life
История вопроса: рекрутская повинность История вопроса: рекрутская повинность

Когда появилась рекрутская повинность и выражение «забрить в солдаты»

Культура.РФ
Жуй на здоровье: как жевательная резинка может помочь всему организму Жуй на здоровье: как жевательная резинка может помочь всему организму

Как жевательная резинка помогает организму в самых разных ситуациях

Популярная механика
Любовь побеждает всё: мужчина женился на любимой женщине после 35 лет разлуки Любовь побеждает всё: мужчина женился на любимой женщине после 35 лет разлуки

История любви, преодолевшая путь длиной почти в четыре десятилетия.

Cosmopolitan
Леонардо ДиКаприо и компания: 6 голливудских актеров со славянскими корнями Леонардо ДиКаприо и компания: 6 голливудских актеров со славянскими корнями

Какие знаменитые актеры, воплотившие американскую мечту, имеют русские корни

Cosmopolitan
Залечили своих детей до смерти: самые ужасные случаи синдрома Мюнхгаузена Залечили своих детей до смерти: самые ужасные случаи синдрома Мюнхгаузена

Резонансные случаи делегированного синдрома Мюнхгаузена.

Cosmopolitan
​​Ордер на заселение в ад: «Общага» — суровая и красивая студенческая антисоветская драма ​​Ордер на заселение в ад: «Общага» — суровая и красивая студенческая антисоветская драма

Самая ожидаемая премьера фестиваля «Общага» получила приз за лучший дебют

Esquire
Когда в России появилось мороженое? Когда в России появилось мороженое?

Именно в СССР появились всем знакомые виды мороженого

Культура.РФ
«Час за часом в прямом эфире»: трагедия 11 сентября глазами директора CBS News Эрика Шапиро «Час за часом в прямом эфире»: трагедия 11 сентября глазами директора CBS News Эрика Шапиро

Трагедия 11 сентября застала директора CBS Эрика Шапиро на столе у хирурга

Esquire
Трудоголик, зануда и ревнивец: всё о знаках зодиака стихии Земли Трудоголик, зануда и ревнивец: всё о знаках зодиака стихии Земли

О знаках стихии Земли

Cosmopolitan
Из оптически левитирующих частиц предложили сделать гироскоп Из оптически левитирующих частиц предложили сделать гироскоп

Физики изучили поведение левитирующей в оптическом пинцете микрочастицы

N+1
Семь детективных историй из практики британского нейропсихиатра. Отрывок из книги Семь детективных историй из практики британского нейропсихиатра. Отрывок из книги

Глава из книги «Глядя в бездну. Заметки нейропсихиатра о душевных расстройствах»

СНОБ
7 лучших кинотрилогий 7 лучших кинотрилогий

Франшизы, где вторая и третьи части также хороши, как и первая (а то и лучше)!

Maxim
Почему фильм «Шан-Чи и легенда десяти колец» получился совсем не в духе Marvel Почему фильм «Шан-Чи и легенда десяти колец» получился совсем не в духе Marvel

«Шан-Чи и легенда десяти колец» — кинокомикс, в котором полно романтики Азии

GQ
Триатлон и зубная паста: 6 неявных признаков измены Триатлон и зубная паста: 6 неявных признаков измены

Эти сигналы говорят о том, что, вероятно, у твоего любимого появилась другая

Cosmopolitan
Открыть в приложении