Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Вот о чем может рассказать цвет ваших ногтей: за ним нужно следить очень внимательно Вот о чем может рассказать цвет ваших ногтей: за ним нужно следить очень внимательно

Иногда цвет ногтей может говорить о наличии серьезных патологий

Популярная механика
Все ради искусства: 5 фильмов, для съемок в которых актеры занимались реальным сексом Все ради искусства: 5 фильмов, для съемок в которых актеры занимались реальным сексом

Эти актеры и актрисы отдались картине без остатка

Playboy
В чем разница между SDR и HDR? Это нужно знать каждому диджитал-артисту! В чем разница между SDR и HDR? Это нужно знать каждому диджитал-артисту!

Как выбрать подходящий формат для вашего проекта? Что значит SDR и HDR?

ТехИнсайдер
Автоподборщики составили черный список моторов, которые нельзя покупать Автоподборщики составили черный список моторов, которые нельзя покупать

Рейтинг надежности двигаетелей на рынке подержанных машин

РБК
Почему мозгу нужно ошибаться и можно ли этого избежать Почему мозгу нужно ошибаться и можно ли этого избежать

Почему мы попадаемся в ловушку собственного мышления

Inc.
Что же на самом деле сказал перед своей смертью Лаврентий Берия? Что же на самом деле сказал перед своей смертью Лаврентий Берия?

У Лаврентия Берии были планы после смерти вождя, но им не суждено было сбыться

Популярная механика
Отношения с мужчиной, который вырос без матери: в чем их особенность? Отношения с мужчиной, который вырос без матери: в чем их особенность?

Как отсутствие матери имеет особое значение для мужчин?

Psychologies
Система сборов Система сборов

Как зарабатывает и сколько тратит Всемирное антидопинговое агентство

Forbes
«Экономическая бойня»: как Венесуэла десятилетиями переживает кризис из-за санкций «Экономическая бойня»: как Венесуэла десятилетиями переживает кризис из-за санкций

Как на Венесуэлу повлияли разрушительные санкции США?

Forbes
Что такое привязанность и какие типы привязанности бывают Что такое привязанность и какие типы привязанности бывают

Наши взаимоотношения с людьми могут быть интерпретированы через разные теории

Cosmopolitan
Не трогай это! Что такое контактный дерматит Не трогай это! Что такое контактный дерматит

Каким бывает дерматит и почему он возникает?

РБК
Что такое депрессия, и как с ней жить: 5 главных вопросов о тяжелом психическом заболевании Что такое депрессия, и как с ней жить: 5 главных вопросов о тяжелом психическом заболевании

Из-за чего возникает депрессия и как с ней жить?

Популярная механика
Веселые и грустные фильмы о зомбирующей силе телевидения Веселые и грустные фильмы о зомбирующей силе телевидения

Фильмы о том, что человек может стать рабом телеящика

Maxim
Соломон Рабинович: «При проведении анестезии важен не только препарат, но и опыт, и знания, и руки врача» Соломон Рабинович: «При проведении анестезии важен не только препарат, но и опыт, и знания, и руки врача»

Опасно ли лечить зубы?

Здоровье
Сонник: к чему снится измена мужа Сонник: к чему снится измена мужа

Некоторые вещи не хочется видеть даже во сне

Cosmopolitan
В поиске красоты В поиске красоты

Один из тех «резных сундуков темных палаццо, полных непостижимых сокровищ»

Seasons of life
Шерстяной покров Шерстяной покров

Астхильдур Магнусдоттир рассказала, почему она выбрала жить в мире с природой

Вокруг света
Просроченное пророчество Просроченное пророчество

«Ампир V»: о бесполезности Пелевина

Weekend
Неверное прочтение: почему молитвы не помогут внедрить патриотизм в российскую школу Неверное прочтение: почему молитвы не помогут внедрить патриотизм в российскую школу

Можно ли заставить российских школьников начинать день с молитвы

Forbes
Пионер технического прогресса Пионер технического прогресса

Андрей Нартов — личный токарь Петра Великого, изобретатель, педагог и художник

Дилетант
Плохое зрение, издевки и фэтшейминг: как на самом деле живут модные редакторы Плохое зрение, издевки и фэтшейминг: как на самом деле живут модные редакторы

Действительно ли мир глянца похож на историю из «Дьявол носит Prada»?

Cosmopolitan
Белые эмигранты Белые эмигранты

Не все в жизни белых медведей складывается гладко

Вокруг света
Отважный микс Отважный микс

Брутальный интерьер с явным стремлением к минимизации деталей и форм

Идеи Вашего Дома
Родной, но чужой Родной, но чужой

Как организму женщины удается сохранить иммунную толерантность к плоду?

Здоровье
Андрей Тютюшев: «Желания кого-то обгонять нет, важнее эффективность» Андрей Тютюшев: «Желания кого-то обгонять нет, важнее эффективность»

Андрей Тютюшев — о развитии «Сибагро», возникающих сложностях и их преодолении

Агроинвестор
42 месяца, чтобы научить ребенка общаться 42 месяца, чтобы научить ребенка общаться

Родителей беспокоит, как развивается их ребенок. Попробуем в этом разобраться

Psychologies
Анна Котова-Дерябина: «Мама научила не жалеть денег на красоту» Анна Котова-Дерябина: «Мама научила не жалеть денег на красоту»

Актриса Анна Котова-Дерябина поделилась полезными бьюти-секретами

Cosmopolitan
Опубликована полная последовательность человеческого генома Опубликована полная последовательность человеческого генома

Молекулярные биологи закончили собирать последовательность ДНК человека

N+1
Важная фигура: что такое гештальт и зачем его закрывать Важная фигура: что такое гештальт и зачем его закрывать

О гештальттерапии, незавершенных гештальтах и пользе от их закрытия

Forbes
Знаки приоритета: что это и какие бывают Знаки приоритета: что это и какие бывают

Знаки приоритета являются одними из самых важных на дороге

РБК
Открыть в приложении