Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

С днем рождения, English: забавные истории о том, как английский язык пришел в Россию С днем рождения, English: забавные истории о том, как английский язык пришел в Россию

Как в СССР учили будущих разведчиков и чем славится «метод Чуковского»

Популярная механика
«Близкие контакты далеких предков: Как эволюционировал наш вид» «Близкие контакты далеких предков: Как эволюционировал наш вид»

Представьте, что ребенок лет пяти преследует в африканской саванне газелей

N+1
Как подключить и заменить праймер на бензопиле — простая инструкция Как подключить и заменить праймер на бензопиле — простая инструкция

Инструкция, как заменить праймер на бензопиле

CHIP
Made in Russia: 5 российских брендов смартфонов Made in Russia: 5 российских брендов смартфонов

Отечественные бренды смартфонов, модели которых сегодня представлены на рынке

CHIP
5 ключей к разумному оптимизму 5 ключей к разумному оптимизму

Как видеть в жизни хорошее, не вступая в противоречие со здравым смыслом

Psychologies
Как мотивировать себя в момент упадка сил Как мотивировать себя в момент упадка сил

Как найти в себе силы и мотивацию, когда кажется, что их совсем не осталось

Psychologies
На природе без смартфонов, алкоголя и разговоров о работе: как устроен детокс-лагерь для взрослых На природе без смартфонов, алкоголя и разговоров о работе: как устроен детокс-лагерь для взрослых

Офлайн лагерь для взрослых

VC.RU
Возрастные изменения у женщин: 9 проявлений, о которых вас не предупреждали Возрастные изменения у женщин: 9 проявлений, о которых вас не предупреждали

К некоторым физиологическим проявлениям возраста мы оказываемся не готовы

Популярная механика
Лиса: образ жизни, повадки и другие интересные факты Лиса: образ жизни, повадки и другие интересные факты

Действительно лисы так хитры, как их описывают в сказках?

Популярная механика
Вальгалла и тортики: 10 фактов о фильме Вальгалла и тортики: 10 фактов о фильме

Как из самого простого сюжета "Безумного Макса" получился эмоциональный боевик

Популярная механика
Найден ключ к решению проблемы ожирения? Найден ключ к решению проблемы ожирения?

В чем причина лишнего веса — в неправильном питании, генетике или влиянии среды?

Psychologies
Был ли знаменитый танк «Тигр» действительно таким великим? Был ли знаменитый танк «Тигр» действительно таким великим?

Стоил ли танк «Тигр» затраченных на него ресурсов и денег?

Популярная механика
Краткая история советского спортивного стиля, часть первая (1920–1960-е) Краткая история советского спортивного стиля, часть первая (1920–1960-е)

У СССР со спортом и физкультурой всегда были особые отношения

Esquire
Как строить планы в ситуации неопределенности? Как строить планы в ситуации неопределенности?

Планирование помогает обрести уверенность в завтрашнем дне

Psychologies
Сможет ли человечество сдвинуть планету, если все люди соберутся в одном месте и прыгнут одновременно Сможет ли человечество сдвинуть планету, если все люди соберутся в одном месте и прыгнут одновременно

На Земле проживает 7,5 миллиардов человек. Что, если мы все прыгнем сразу?

ТехИнсайдер
Зоологи впервые за сто с лишним лет услышали голос южноамериканской жабы Зоологи впервые за сто с лишним лет услышали голос южноамериканской жабы

Голос южноамериканской жабы напоминает тихий стрекот сверчка

N+1
В ваших интересах В ваших интересах

Рассматриваем тревел-мифы и разбираемся, так ли все на самом деле

Grazia
Как избавиться от ожирения: бариатрическая хирургия Как избавиться от ожирения: бариатрическая хирургия

Что такое бариатрическая хирургия и в чем её суть?

Популярная механика
Усейн Болт оказался быстрее динозавра Усейн Болт оказался быстрее динозавра

Как узнать, кто быстрее — человек или динозавр?

N+1
Разгрузить голову: 3 эффективных упражнения Разгрузить голову: 3 эффективных упражнения

Умственный детокс: простые упражнения, которые помогут выдохнуть

Psychologies
Похоже, мы уже целый век неправильно называем Мачу-Пикчу Похоже, мы уже целый век неправильно называем Мачу-Пикчу

Мачу-Пикчу мог получить свое название в честь простого недоразумения

Популярная механика
Всегда помнить про «Smize!» Всегда помнить про «Smize!»

Актриса Полина Ауг — о стиле, нужных вещах и работе в новых реалиях

OK!
Проси так, чтобы точно сбылось: 10 секретов для исполнения желаний Проси так, чтобы точно сбылось: 10 секретов для исполнения желаний

Мы узнали у эзотерика, как правильно попросить исполнения желания

VOICE
Леонид Барац: «Квартет И» не заработал столько денег, чтобы мы стали состоятельными пенсионерами» Леонид Барац: «Квартет И» не заработал столько денег, чтобы мы стали состоятельными пенсионерами»

Можем ли мы, мужчины, не повернуть голову, когда мимо идет красивая девушка?

Караван историй
«Ожившая» Диана и голая беременная Мур: 8 самых провокационных обложек в истории «Ожившая» Диана и голая беременная Мур: 8 самых провокационных обложек в истории

Порой снимки, попадающие в журналы, получаются кричащими и неоднозначными

Cosmopolitan
7 странных примет, в которые верят даже опытные дачники: реальность или миф 7 странных примет, в которые верят даже опытные дачники: реальность или миф

У вас не всегда бывает хороший урожай? Пора прислушаться к народным приметам

Популярная механика
Харуки Мураками. Отрывок из сборника рассказов «От первого лица» Харуки Мураками. Отрывок из сборника рассказов «От первого лица»

Отрывок из меланхоличного автофикшена Харуки Мураками «От первого лица»

СНОБ
Фильмы, которые пробирают до дрожи: 20 лучших триллеров XXI века (не для слабонервных!) Фильмы, которые пробирают до дрожи: 20 лучших триллеров XXI века (не для слабонервных!)

Триллеры, которые наведут бардак в голове и спутают сознание

Популярная механика
6 привычек, которые старят нас раньше времени 6 привычек, которые старят нас раньше времени

На скорость старения влияет даже то, как мы пьём сок

Популярная механика
Кит, стадо коров, офтальмологическая клиника: 10 невероятных грузов, перевезенных самолетами Кит, стадо коров, офтальмологическая клиника: 10 невероятных грузов, перевезенных самолетами

Порой встречаются примеры авиаперевозок, не поддающиеся никакой классификации

ТехИнсайдер
Открыть в приложении