Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как воспитать кошку: она больше не будет драть ваши обои Как воспитать кошку: она больше не будет драть ваши обои

На самом деле, воспитать кошку вполне под силу любому хозяину

Популярная механика
Да, я Хофманнита Да, я Хофманнита

HOFMANNITA — о женской хип-хоп-сцене, рехабе и чувстве недооцененности

Собака.ru
Заговор «мертвого интернета»: правда ли, что ботов в сети больше, чем людей? Заговор «мертвого интернета»: правда ли, что ботов в сети больше, чем людей?

Кто доминирует в онлайн-пространстве: реальные пользователи или боты?

ТехИнсайдер
Не только «Ирония судьбы»: 10 фильмов Эльдара Рязанова, которые стоит посмотреть Не только «Ирония судьбы»: 10 фильмов Эльдара Рязанова, которые стоит посмотреть

Фильмы Эльдара Рязанова, которые ты обязательно должна посмотреть

Cosmopolitan
50 вопросов, которые помогут построить более глубокие отношения 50 вопросов, которые помогут построить более глубокие отношения

О чем спросить человека, чтобы действительно узнать его лучше?

Psychologies
«Раньше было лучше»: картина Вермеера после реставрации вызвала споры в Сети «Раньше было лучше»: картина Вермеера после реставрации вызвала споры в Сети

Почему реставрации не всегда приходятся по вкусу ценителям искусства

Psychologies
Кавказская трилогия Кавказская трилогия

За одну поездку можно осмотреть сразу три южные республики

Лиза
Страшная авария и неверный муж: две главные трагедии Фриды Кало Страшная авария и неверный муж: две главные трагедии Фриды Кало

По сути история жизни Фриды Кало — это история одной большой боли

Cosmopolitan
Вокруг гномы и карлики: психическое заболевание с очень странными галлюцинациями Вокруг гномы и карлики: психическое заболевание с очень странными галлюцинациями

Знаешь историю про Гулливера? Возможно, Джонатан Свифт её не выдумал

Cosmopolitan
Как абстрактная математика помогает конкретной физике Как абстрактная математика помогает конкретной физике

Абстрактные математические теории помогают физикам понять, как устроен наш мир

Популярная механика
Перевал Перевал

С момента гибели туристов из группы Игоря Дятлова прошло больше полувека

Популярная механика
Свободные совпадения Свободные совпадения

О русских корнях японца Рюсукэ Хамагути и его фильма «Случайность и догадка»

Weekend
В организме больных Эболой нашли вирус пятилетней давности В организме больных Эболой нашли вирус пятилетней давности

Эболавирусы способны храниться в теле человека годами и вызывать новые вспышки

N+1
Современные змеи произошли от шести переживших динозавров групп Современные змеи произошли от шести переживших динозавров групп

После вымирания нептичьих динозавров змеи пережили резкий всплеск разнообразия

N+1
Самцы живущих в суровом климате австралийских грызунов отрастили крупные семенники Самцы живущих в суровом климате австралийских грызунов отрастили крупные семенники

Как грызуны выигрывают конкуренцию во время короткого брачного сезона?

N+1
Маленький гигант большого фронта. История немецкой самоходки «Хетцер» Маленький гигант большого фронта. История немецкой самоходки «Хетцер»

«Хетцер» — одна из самых грозных немецких самоходок эпохи

Maxim
26 операций на половых губах: женщина ложится под нож снова и снова 26 операций на половых губах: женщина ложится под нож снова и снова

Девушке пришлось перенести 26 операций на половых губах из-за бартолинита

Cosmopolitan
Ешь, спи, касайся: 7 простых способов сделать брак идеальным Ешь, спи, касайся: 7 простых способов сделать брак идеальным

Что надо делать, чтобы сохранить брак на долгие годы

Cosmopolitan
Секс, класс, деньги, чувства, и снова секс: каким получился третий роман автора Секс, класс, деньги, чувства, и снова секс: каким получился третий роман автора

Салли Руни опять написала роман, где красивые люди много занимаются сексом

Esquire
Премьера! Тизер об отношениях героев Тимоти Шаламе и Зендаи в «Дюне» Премьера! Тизер об отношениях героев Тимоти Шаламе и Зендаи в «Дюне»

Дени Вильнев, Тимоти Шаламе и Зендая — о съемках «Дюны»

Cosmopolitan
Как стать привлекательным работодателем для поколения Z Как стать привлекательным работодателем для поколения Z

Что привлекает молодых специалистов в работодателе?

Inc.
Ставка на метавселенную: можно ли на ней заработать Ставка на метавселенную: можно ли на ней заработать

Метавселенная станет следующей версией интернета

Forbes
Физики увеличили время когерентности в ультрахолодных молекулах Физики увеличили время когерентности в ультрахолодных молекулах

Физики изменили поведение ультрахолодных молекул в оптических ловушках

N+1
Шарлиз Терон. Голова не в облаках Шарлиз Терон. Голова не в облаках

Ее признали самой сексуальной из ныне живущих женщин

Караван историй
3 вещи, которые всегда делает любящий мужчина 3 вещи, которые всегда делает любящий мужчина

Как понять, что твой мужчина тебя действительно полюбил?

VOICE
Рэперы против футболистов: кто зарабатывает больше Рэперы против футболистов: кто зарабатывает больше

Рэп и футбол: где кошельки толще?

GQ
Партнер не вовлечен в отношения: как быть? Партнер не вовлечен в отношения: как быть?

Откуда же берется слабая эмоциональная вовлеченность?

Psychologies
Синдром опустевшего гнезда Синдром опустевшего гнезда

Как сблизиться с мужем и вернуть отношениям смысл, когда дети выросли

Лиза
Клаудиа Кардинале: почему одна из самых красивых актрис в мире была против брака Клаудиа Кардинале: почему одна из самых красивых актрис в мире была против брака

Почему Клаудиа Кардинале не стремилась замуж

Cosmopolitan
Платье в аренду, ноутбук по подписке: кто зарабатывает на шеринг-экономике Платье в аренду, ноутбук по подписке: кто зарабатывает на шеринг-экономике

Подписка на вещи становится новым способом потребления

Inc.
Открыть в приложении