Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

История одной фотографии: один, который не зиговал История одной фотографии: один, который не зиговал

Один в толпе воин! Он сражался за любовь

Maxim
Последний генеральный. Жизнь и смерть Михаила Горбачева Последний генеральный. Жизнь и смерть Михаила Горбачева

За что любили и ненавидели Михаила Сергеевича Горбачева

Правила жизни
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Репрессии, геноцид, войны: 20 фильмов о коллективной травме и катастрофах прошлого Репрессии, геноцид, войны: 20 фильмов о коллективной травме и катастрофах прошлого

Фильмы об исторических катастрофах и о попытках осмыслить природу зла

Forbes
Из-за чего судятся акционеры одной из самых популярных франшиз «Мозгобойня» Из-за чего судятся акционеры одной из самых популярных франшиз «Мозгобойня»

Почему сеть паб-квизов «Мозгобойня» раздирает корпоративный конфликт

Forbes
Григорий Распутин. Грешный старец у трона Российской империи Григорий Распутин. Грешный старец у трона Российской империи

Почему "грязный деревенский мужик" получил такую неограниченную власть

Караван историй
Мифы о месячных: отвечаем на вопросы, которые ты стеснялась задать Мифы о месячных: отвечаем на вопросы, которые ты стеснялась задать

Собрали волнующие вопросы о месячных и попросили экспертов внести ясность

VOICE
Наш мозг считает быстрее всего не слева направо, а снизу вверх Наш мозг считает быстрее всего не слева направо, а снизу вверх

Самое удобное для нашего мозга расположение чисел — в столбик снизу вверх

ТехИнсайдер
5 способов спасти себя от разрушительного стресса 5 способов спасти себя от разрушительного стресса

Комплекс мер по поддержанию нормальной работы мозга во время стресса

Psychologies
У живой клетки взяли половину цитоплазмы и секвенировали ее транскриптом У живой клетки взяли половину цитоплазмы и секвенировали ее транскриптом

Метод, позволяющий расшифровать транскриптом отдельных клеток, не убивая их

N+1
Космическая медицина на орбите и на Земле Космическая медицина на орбите и на Земле

Как медики изучают влияние космического полета на организм

ТехИнсайдер
4 причины, почему отпуск превращается в больничный 4 причины, почему отпуск превращается в больничный

Обидно, когда, не успев начаться, наш отдых прерывается болезнью

Psychologies
Магистраль роста Магистраль роста

Расширение провозных возможностей Байкало-Амурской магистрали — важный приоритет

Эксперт
Просьба о помощи — это слабость: что такое контрзависимость и как от нее избавиться Просьба о помощи — это слабость: что такое контрзависимость и как от нее избавиться

В чем причина контрзависимого поведения и как вести себя в отношениях

Forbes
«Боли больше нет»: каким показан грядущий мир в триллере «Преступления будущего» «Боли больше нет»: каким показан грядущий мир в триллере «Преступления будущего»

«Преступления будущего» — триллер о безрадостном будущем человечества

Forbes
Как выбрать TWS-наушники: 6 важных критериев Как выбрать TWS-наушники: 6 важных критериев

К выбору TWS-наушников стоит подойти максимально серьезно

CHIP
Немецкий дьявол с итальянскими корнями, привезенный из Америки: откуда взялось слово Немецкий дьявол с итальянскими корнями, привезенный из Америки: откуда взялось слово

Откуда взялось слово картофель и что оно означает?

ТехИнсайдер
Как подростки снимали фильм «Дух сейда» для проекта «Кинолаборатория» Как подростки снимали фильм «Дух сейда» для проекта «Кинолаборатория»

«Сноб» поговорил с командой фильма «Дух сейда» о том, что дал им этот проект

СНОБ
Почему дети так тяжело переносят долгие поездки? И можно ли облегчить им дальнюю дорогу? Почему дети так тяжело переносят долгие поездки? И можно ли облегчить им дальнюю дорогу?

Почему дети все время спрашивают "Когда мы приедем?"

ТехИнсайдер
Груминг и созависимость: устаревшая этика в сериале «Жена путешественника во времени» Груминг и созависимость: устаревшая этика в сериале «Жена путешественника во времени»

Этот сериал c мог бы сместить с пьедестала фильмы о созависимых отношениях

Forbes
Луна образовалась в результате столкновения Земли с неизвестной планетой: новые доказательства старой теории Луна образовалась в результате столкновения Земли с неизвестной планетой: новые доказательства старой теории

Следы газов в недрах лунной породы принадлежат только сформировавшейся Земле

ТехИнсайдер
Потому что может: как экс-президент Дональд Трамп рассчитался с огромным долгом Потому что может: как экс-президент Дональд Трамп рассчитался с огромным долгом

Как у Дональда Трампа чудесным образом оказалось полно денег

Forbes
Больше энергии и меньше тревоги: откуда брать витамин В12? Больше энергии и меньше тревоги: откуда брать витамин В12?

Важно не забывать включать в свой рацион пищу богатую витамином В12

ТехИнсайдер
Непотопляемая: история Вайолетт Джесcоп, выжившей в трех кораблекрушениях, включая Непотопляемая: история Вайолетт Джесcоп, выжившей в трех кораблекрушениях, включая

Реальная жизнь Вайолетт Джесcоп была покруче любого сценария

VOICE
Рождественское озарение: как Маргарет Штайфф придумала плюшевых мишек Тедди Рождественское озарение: как Маргарет Штайфф придумала плюшевых мишек Тедди

Мир никогда бы не узнал о медвежонке Тедди, не прояви упорство Маргарет Штайфф

Forbes
«Я люблю вас сильно-сильно»: история маньяка Вячеслава Соловьева, который убил даже жену и дочь «Я люблю вас сильно-сильно»: история маньяка Вячеслава Соловьева, который убил даже жену и дочь

Вячеслав Соловьев без малейших колебаний убивал тех, кто его раздражал

VOICE
Новый метод позволяет редактировать ДНК миллиарда клеток за один прогон Новый метод позволяет редактировать ДНК миллиарда клеток за один прогон

Как обойтись без вируса и при этом заменить в ДНК целый ген?

ТехИнсайдер
8 фильмов для тех, кто не готов прощаться с летом 8 фильмов для тех, кто не готов прощаться с летом

Чтобы задержаться в атмосфере лета, достаточно включить любой фильм из подборки

Psychologies
Реально ли выучить английский после 40? Проверим, на что способна ваша память Реально ли выучить английский после 40? Проверим, на что способна ваша память

Существует миф, что иностранные языки лучше учить в юности

ТехИнсайдер
Как сойти за умного в любой ситуации? 4 способа прикинуться интеллектуалом Как сойти за умного в любой ситуации? 4 способа прикинуться интеллектуалом

Кто не хочет, чтобы о нем думали, как об умном и образованном человеке?

ТехИнсайдер
Открыть в приложении