Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Что случилось с дворцами Романовых после революции 1917 года? Фото «До» и «После» Что случилось с дворцами Романовых после революции 1917 года? Фото «До» и «После»

Что стало с дворцами Романовых после прихода большевиков к власти?

ТехИнсайдер
Чилийские игнимбриты объяснили поведение супервулканов перед извержениями Чилийские игнимбриты объяснили поведение супервулканов перед извержениями

Магматические очаги будущих суперизвержений росли всего пару тысяч лет

N+1
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
Абонемент или абонент? Отличие или различие? 10 сложных паронимов, в которых старшеклассники всегда ошибаются на ЕГЭ Абонемент или абонент? Отличие или различие? 10 сложных паронимов, в которых старшеклассники всегда ошибаются на ЕГЭ

Случаи, в которых ошибаются даже отличники по русскому языку

ТехИнсайдер
В чем разница между 48- и 108-Мп камерами смартфонов, если все они делают 12-Мп снимки? В чем разница между 48- и 108-Мп камерами смартфонов, если все они делают 12-Мп снимки?

Есть ли разница в разрешении камер на смартфоне?

CHIP
Ссылка в «А.Л.Ж.И.Р»: как жили узницы крупнейшего женского лагеря ГУЛАГа Ссылка в «А.Л.Ж.И.Р»: как жили узницы крупнейшего женского лагеря ГУЛАГа

«А.Л.Ж.И.Р»: крупнейшее женское трудовое поселение в СССР

Forbes
«Но учти, это в последний раз»: 4 причины дать второй шанс «Но учти, это в последний раз»: 4 причины дать второй шанс

Когда мы отказываемся от тех, кто причинил нам боль, мы сами многого себя лишаем

Psychologies
Сойти за своего: как адаптироваться к жизни в другой стране Сойти за своего: как адаптироваться к жизни в другой стране

Как интегрироваться в новое общество и преодолеть культурные барьеры?

Psychologies
Великий Горби: как страна получила свободу и не воспользовалась ей Великий Горби: как страна получила свободу и не воспользовалась ей

Михаил Горбачев вернул человеку человеческое

Forbes
Три женские ошибки, с которыми мы не будем мириться: позиция мужчин Три женские ошибки, с которыми мы не будем мириться: позиция мужчин

Что для людей становится «точкой невозврата» в отношениях

Psychologies
8 фильмов для тех, кто не готов прощаться с летом 8 фильмов для тех, кто не готов прощаться с летом

Чтобы задержаться в атмосфере лета, достаточно включить любой фильм из подборки

Psychologies
Многочасовое сидение может вызывать проблемы со здоровьем. Как минимизировать риски? Многочасовое сидение может вызывать проблемы со здоровьем. Как минимизировать риски?

Что делать, если ваша работа связана с сидячим образом жизни?

ТехИнсайдер
Больно с детства. Что с этим делать сейчас? Больно с детства. Что с этим делать сейчас?

Что делать, если эмоциональный взрыв или конфликт случились в раннем детстве?

Psychologies
В детстве вас не замечали: 7 последствий жизни в токсичной семье В детстве вас не замечали: 7 последствий жизни в токсичной семье

Какие «хвосты» из детства в токсичной семье могут отравлять взрослую жизнь?

Psychologies
6 типов психоэмоциональных вампиров 6 типов психоэмоциональных вампиров

Почему важно распознавать людей, крадущих у нас энергию?

Psychologies
Хабаровский музыкант МА ГАК ПА — о новом альбоме «V», любви к хокку и пути к успеху вдали от Москвы Хабаровский музыкант МА ГАК ПА — о новом альбоме «V», любви к хокку и пути к успеху вдали от Москвы

МА ГАК ПА — как живут дальневосточные музыканты

СНОБ
Дорогие мои: 6 вещей, которые помогут выглядеть солидно Дорогие мои: 6 вещей, которые помогут выглядеть солидно

Что такое статусный гардероб? Шкаф, набитый брендовой одеждой?

Правила жизни
Биологи построили теорию происхождения сложных клеток, из которых построены высшие организмы, в том числе человек Биологи построили теорию происхождения сложных клеток, из которых построены высшие организмы, в том числе человек

Как возникают сложные клетки — эукариоты?

ТехИнсайдер
Чистим украшения в домашних условиях: вернуть блеск драгоценностям можно средствами, которые есть в каждом доме Чистим украшения в домашних условиях: вернуть блеск драгоценностям можно средствами, которые есть в каждом доме

Избавим драгоценности от темного налета и вернем металлам былой блеск

ТехИнсайдер
Что хорошего и что плохого в сериалах по «Звездным войнам»? Обсуждаем и критикуем проекты Disney+ Что хорошего и что плохого в сериалах по «Звездным войнам»? Обсуждаем и критикуем проекты Disney+

Разбираемся, за что стоит похвалить Disney+, а за что — покритиковать

Правила жизни
От Нобелевской до Букеровской: как женщины впервые получали литературные премии От Нобелевской до Букеровской: как женщины впервые получали литературные премии

О женщинах, которые первыми получили крупнейшие в мире литературные премии

Forbes
«Неизведанное тело». Удивительные истории о том, как работает наш организм «Неизведанное тело». Удивительные истории о том, как работает наш организм

Отрывок из книги Джонатана Райсмена «Неизведанное тело» — о травмах глаз

N+1
Что опаснее для ребенка: игра Among Us, новое видео А4 или онлайн-груминг? Что опаснее для ребенка: игра Among Us, новое видео А4 или онлайн-груминг?

Многие родители сражаются не с теми врагами в интернете

Psychologies
«Вещная жизнь: материальность позднего социализма». «Вещная жизнь: материальность позднего социализма».

Отрывок из книги «Вещная жизнь» — о том, как железо в СССР было связано с силой

N+1
Библия сексуальной революции и космические мечты: что почитать у Роберта Хайнлайна Библия сексуальной революции и космические мечты: что почитать у Роберта Хайнлайна

Знаковые романы Роберта Хайнлайна

ТехИнсайдер
Удивительный паразит, который делает хозяина невероятно привлекательным и сексуальным Удивительный паразит, который делает хозяина невероятно привлекательным и сексуальным

Toxoplasma gondii потенциально манипулирует внешностью своего хозяина

ТехИнсайдер
Доисторические британцы раздробили редкий горный хрусталь и положили в погребения Доисторические британцы раздробили редкий горный хрусталь и положили в погребения

Он символизировал трансформацию мертвых и их связь с живыми

N+1
Только не голосовое: 5 золотых правил «цифрового» этикета Только не голосовое: 5 золотых правил «цифрового» этикета

Как общаться в мессенджерах, чтобы не прослыть навязчивым занудой

Psychologies
8 программ для записи видео с экрана ноутбука 8 программ для записи видео с экрана ноутбука

Самые подходящие программы для записи видео с экрана компьютера

CHIP
Этих слов нет в русском языке, но мы почему-то их произносим. А вы знали? Этих слов нет в русском языке, но мы почему-то их произносим. А вы знали?

Проверим, кто все это время говорил неправильно?

ТехИнсайдер
Открыть в приложении