Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Наука в мире фэнтези: как Брендон Сандерсон создает магические системы Наука в мире фэнтези: как Брендон Сандерсон создает магические системы

Магия и наука – это полные противоположности? Нет!

Популярная механика
Знаки отличия Знаки отличия

Экологичная косметика: читаем этикетки

Cosmopolitan
Облачные хранилища бесплатно: где и сколько можно получить Облачные хранилища бесплатно: где и сколько можно получить

Самые популярные облачные хранилища: у каких условия самые лучшие?

CHIP
Актер. Иван Янковский Актер. Иван Янковский

Как внук Олега Янковского на глазах превращается в актера Ивана Янковского

GQ
Эмоциональный интеллект Эмоциональный интеллект

Новое представление о том, что значит быть «умным»

kiozk originals
Рука для Терминатора: как создаются манипуляторы для российских андроидов Рука для Терминатора: как создаются манипуляторы для российских андроидов

Промобот: Как происходит разработка руд для российских андроидов

Популярная механика
Таша Карлюка: Миры, в которые я улетаю Таша Карлюка: Миры, в которые я улетаю

Интервью с Ташей Карлюковой — о том, что такое литературная эмигрантская жизнь

СНОБ
Как устроен мир: 5 книг для тех, кто хочет знать больше Как устроен мир: 5 книг для тех, кто хочет знать больше

Книги о квантовая механике, генетике, устройстве микромира…

Популярная механика
Лучшие рецепты из кабачков: вкусные и простые блюда для вегетарианцев Лучшие рецепты из кабачков: вкусные и простые блюда для вегетарианцев

Подборка оригинальных рецептов с кабачками

Playboy
Смайлик Саша Смайлик Саша

СМА (спинальная мышечная атрофия) считалась неизлечимой еще несколько лет назад

Домашний Очаг
Древнейшая карта Америки оказалась подделкой Древнейшая карта Америки оказалась подделкой

Американские ученые провели исследование карты Винланда

N+1
Незнакомая знакомая Турция Незнакомая знакомая Турция

У самой границы с Сирией Турция предстает перед туристами совершенно неожиданной

Здоровье
Археологи обнаружили в Кремле редкую поливную чашу XV века Археологи обнаружили в Кремле редкую поливную чашу XV века

Археологи нашли в Большом Кремлевском сквере богатую коллекцию артефактов

N+1
Почему для кино в России времена райские, но смотрят его плохо Почему для кино в России времена райские, но смотрят его плохо

В каком направлении развивается отечественный кинематограф

РБК
Квантовое преследование Квантовое преследование

Зачем в России занялись кубитами на холодных атомах и ионах

N+1
Дэвид Келлерманн Дэвид Келлерманн

Дэвид Келлерманн превратил швейную фабрику Петербурга в крупнейшую фэшн-компанию

Собака.ru
Альтернативы Google Docs: куда перенести документы, если Гугл заблокируют Альтернативы Google Docs: куда перенести документы, если Гугл заблокируют

Куда можно перенести свои документы, если однажды Google Docs заблокируют

CHIP
Австралийцы описали «лесного древнего ястреба» возрастом 25 миллионов лет Австралийцы описали «лесного древнего ястреба» возрастом 25 миллионов лет

Палеонтологи обнаружили самую древнюю ястребиную птицу Австралии

N+1
«Обмануть крупнейший инвестбанк — это слишком»: компания Ozy дурит инвесторов, прикрываясь дружбой с YouTube и Amazon «Обмануть крупнейший инвестбанк — это слишком»: компания Ozy дурит инвесторов, прикрываясь дружбой с YouTube и Amazon

Как Ozy обманула Goldman Sachs, но продолжила привлекать инвесторов

VC.RU
Эмоциональный интеллект: как научиться распознавать гнев и работать с ним Эмоциональный интеллект: как научиться распознавать гнев и работать с ним

Замечала, что иногда тебя вдруг начинают захлёстывать эмоции?

Cosmopolitan
Все об УЗИ: 8 важных вопросов Все об УЗИ: 8 важных вопросов

Что нужно знать об УЗИ и как к нему правильно готовиться?

Лиза
Главная пряность осени: что нужно знать о корице Главная пряность осени: что нужно знать о корице

Помимо приятного аромата, в корице много питательных элементов

РБК
Девушка над городом Девушка над городом

Катя Шкуро загорает на крыше

Maxim
Родись, страдай, умри, повтори: какой получилась игра Deathloop Родись, страдай, умри, повтори: какой получилась игра Deathloop

Deathloop — игра про киллера, попавшего во временную петлю

Esquire
Худой мир Худой мир

История Алены, которая стала моделью в 15 лет и до сих пор борется с РПП

Cosmopolitan
«Он никогда не строил из себя героя». Экскурсия Льва Лурье по адресам Довлатова в Петербурге «Он никогда не строил из себя героя». Экскурсия Льва Лурье по адресам Довлатова в Петербурге

Лев Лурье провел экскурсию по адресам Довлатова в Ленинграде

СНОБ
Автор. Дмитрий Глуховский Автор. Дмитрий Глуховский

Дмитрий Глуховский – о кино, цензуре и языке ненависти

GQ
Как выглядели бы постаревшие звезды в своих фильмах сейчас? (Немного грустная галерея) Как выглядели бы постаревшие звезды в своих фильмах сейчас? (Немного грустная галерея)

Ничто так не демонстрирует быстротечность времени, как современные лица звезд

Maxim
Выпить за науку Выпить за науку

Ученые вывели важные правила получения идеальных напитков

Вокруг света
Сиа, Бен Аффлек, Майли Сайрус: кто признал алкоголизм и смог завязать Сиа, Бен Аффлек, Майли Сайрус: кто признал алкоголизм и смог завязать

Кто из знаменитостей отказался от разрушительной привычки

РБК
Открыть в приложении