Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему мы чувствуем упадок сил: 5 возможных причин постоянной усталости Почему мы чувствуем упадок сил: 5 возможных причин постоянной усталости

Вы хорошо спите, правильно питаетесь и все-таки чувствуете упадок сил?

Популярная механика
Manizha Manizha

Manizha — о творчестве, хейте, шоу-бизнесе, страхах и понятии «женщина»

ЖАРА Magazine
Воздушные винты помогли ходячему роботу сохранить равновесие во время бега Воздушные винты помогли ходячему роботу сохранить равновесие во время бега

Робот KOU-III не может летать — он использует винты для равновесия

N+1
Как вести дневник — и зачем делать это прямо сейчас Как вести дневник — и зачем делать это прямо сейчас

Зачем нужен дневник и как можно его вести

Esquire
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Экскурс в советскую моду: зачем женщины в СССР носили комбинации под платья Экскурс в советскую моду: зачем женщины в СССР носили комбинации под платья

Почему же в Советском Союзе комбинации были так популярны?

Популярная механика
«Головы профессора Уайта». История нейрохирурга, который пытался пересадить человеческую голову «Головы профессора Уайта». История нейрохирурга, который пытался пересадить человеческую голову

Отрывок из книги Брэнди Скиллаче «Головы профессора Уайта»

СНОБ
Кто проживает на дне Марианской впадины: обитатели глубин Кто проживает на дне Марианской впадины: обитатели глубин

Рассказываем все, что известно о таинственных существах, обитающих на глубине

ТехИнсайдер
Когда что-то пошло не так: 3 истории о неудачных попытках вылететь на отдых Когда что-то пошло не так: 3 истории о неудачных попытках вылететь на отдых

Самые обидные провалы в аэропорту

Playboy
Таня Рубан Таня Рубан

Как только поняла, что это позволит мне увидеть мир, я захотела стать моделью!

Grazia
Микрофоны в ботинках помогут космонавтам не споткнуться на Марсе Микрофоны в ботинках помогут космонавтам не споткнуться на Марсе

При приглушенных звуках люди хуже ощущают положение своего тела в пространстве

N+1
Вы сорвались на ребенка: что делать дальше? Вы сорвались на ребенка: что делать дальше?

Как правильно себя вести, когда страсти накаляются?

Psychologies
«Кем быть?» или просто быть «Кем быть?» или просто быть

«Худший человек на свете»: правила жизни Йоакима Триера

Weekend
Что мы знаем о новой избраннице Берлускони — ради нее он бросил красавицу-модель Что мы знаем о новой избраннице Берлускони — ради нее он бросил красавицу-модель

Попытаемся побольше узнать об избраннице любвеобильного Сильвио Берлускони

Cosmopolitan
Углеродно-азотное покрытие улучшило работу никелевого анода Углеродно-азотное покрытие улучшило работу никелевого анода

Ученые получили рекордно эффективный водородный топливный элемент

N+1
Второй раз, но навсегда: история любви Фёдора Бондарчука и Паулины Андреевой Второй раз, но навсегда: история любви Фёдора Бондарчука и Паулины Андреевой

Невероятная и полная тайн историю любви Паулины Андреевой и Фёдора Бондарчука

VOICE
План побега: как уйти из ситуации домашнего насилия План побега: как уйти из ситуации домашнего насилия

Памятка, которая поможет справиться с домашним насилием

Psychologies
WayRay Holograktor для метавселенной: первый в мире автомобиль с голографическим остеклением WayRay Holograktor для метавселенной: первый в мире автомобиль с голографическим остеклением

Первый в мире автомобиль с голографическим AR-остеклением

Популярная механика
67-летний Брюс Уиллис завершает карьеру из-за афазии: что это такое 67-летний Брюс Уиллис завершает карьеру из-за афазии: что это такое

Брюс Уиллис завершает карьеру из-за болезни. Что такое афазия?

Psychologies
Что такое привязанность и какие типы привязанности бывают Что такое привязанность и какие типы привязанности бывают

Наши взаимоотношения с людьми могут быть интерпретированы через разные теории

Cosmopolitan
Гидрогель с добавками хлорида лития поглотил воду из воздуха Гидрогель с добавками хлорида лития поглотил воду из воздуха

Американские материаловеды создали материал с самой высокой скоростью сорбции

N+1
Сибирские Афины Сибирские Афины

Поднимаемся на Воскресенскую гору. С нее открывается замечательный вид на Томск

Отдых в России
Домашний бэкап-сервер: основы Домашний бэкап-сервер: основы

Что важно знать для создания домашнего сервера для резервного копирования

CHIP
Провалиться сквозь землю: как возникает и что о нас говорит стыд? Провалиться сквозь землю: как возникает и что о нас говорит стыд?

Как понять, что стыд мешает вам жить? Возможно ли исцеление от него?

Psychologies
5 лучших фантастических сериалов по мотивам книг 5 лучших фантастических сериалов по мотивам книг

Подборка фантастических сериалов, созданных по мировым бестселлерам

Популярная механика
Как едва не ликвидировали Сталина: провальная операция агента Таврина Как едва не ликвидировали Сталина: провальная операция агента Таврина

На самом ли деле агент немецкого "Цеппелина" хотел убить вождя?

Популярная механика
5 простых способов поддержать себя в непростое время 5 простых способов поддержать себя в непростое время

Несколько простых упражнений и действий, которые позволят опереться на себя

Esquire
Вальгалла и тортики: 10 фактов о фильме Вальгалла и тортики: 10 фактов о фильме

Как из самого простого сюжета "Безумного Макса" получился эмоциональный боевик

Популярная механика
В чем сила? В чем сила?

Как не опустошить себя до конца и остаться разносторонней личностью?

Psychologies
Что означает «йиппи-ка-эй», которым Брюс Уиллис кроет злодеев в «Крепком орешке»? Что означает «йиппи-ка-эй», которым Брюс Уиллис кроет злодеев в «Крепком орешке»?

Разберемся с крепким выражением, которое мы слышали из уст Джона Макклейна

Maxim
Открыть в приложении