Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Потому что может: как экс-президент Дональд Трамп рассчитался с огромным долгом Потому что может: как экс-президент Дональд Трамп рассчитался с огромным долгом

Как у Дональда Трампа чудесным образом оказалось полно денег

Forbes
Малый ледниковый период отразился на почвах из Тульского кремля Малый ледниковый период отразился на почвах из Тульского кремля

Палеопочвоведы нашли признаки похолодания в культурных слоях XVI–XVIII веков

N+1
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
Как отпустить человека, которого любишь: 4 шага Как отпустить человека, которого любишь: 4 шага

Как отпустить любовь и сохранить себя

Psychologies
Синдром одомашнивания: отрывок из книги «Парадокс добродетели» Ричарда Рэнгема Синдром одомашнивания: отрывок из книги «Парадокс добродетели» Ричарда Рэнгема

Почему людям свойственны одновременно доброта и жестокость?

СНОБ
Как настроить велосипедный переключатель скоростей в любых условиях Как настроить велосипедный переключатель скоростей в любых условиях

Как любителю настроить переключатель на велосипеде?

ТехИнсайдер
Кто придумал знаменитые советские конструкторы: ты удивишься, когда узнаешь! Кто придумал знаменитые советские конструкторы: ты удивишься, когда узнаешь!

Все, кто родился в СССР, помнят этот популярный конструктор. Но кто его создал?

VOICE
На изящном: рабы любви, или Какой древнегреческий миф лежит в основе картины Франсуа Буше «Геркулес и Омфала» На изящном: рабы любви, или Какой древнегреческий миф лежит в основе картины Франсуа Буше «Геркулес и Омфала»

Что стоит за страстной сценой между Геркулесом и Омфалой

Правила жизни
Мама, не грусти Мама, не грусти

Мамы проходят испытание послеродовой депрессией, даже не подозревая об этом

Лиза
«За Горбачева»: как создавалась скандальная реклама пиццы Pizza Hut с Михаилом Горбачевым «За Горбачева»: как создавалась скандальная реклама пиццы Pizza Hut с Михаилом Горбачевым

Почему бывший советский лидер согласился стать лицом сети ресторанов пиццы

Правила жизни
«Но учти, это в последний раз»: 4 причины дать второй шанс «Но учти, это в последний раз»: 4 причины дать второй шанс

Когда мы отказываемся от тех, кто причинил нам боль, мы сами многого себя лишаем

Psychologies
Резинки-пружинки и другие небезопасные аксессуары, которые портят твои волосы Резинки-пружинки и другие небезопасные аксессуары, которые портят твои волосы

Сегодня мы расскажем тебе, какие аксессуары и как могут навредить твоим локонам

VOICE
Чилийские игнимбриты объяснили поведение супервулканов перед извержениями Чилийские игнимбриты объяснили поведение супервулканов перед извержениями

Магматические очаги будущих суперизвержений росли всего пару тысяч лет

N+1
Археологи раскопали в Хакасии погребение младенца окуневской культуры с кинжалом и мраморным шаром Археологи раскопали в Хакасии погребение младенца окуневской культуры с кинжалом и мраморным шаром

Археологи раскопали в Хакасии необычное погребение младенца окуневской культуры

N+1
Чем отмыть зеленку в домашних условиях: любимую одежду еще можно спасти Чем отмыть зеленку в домашних условиях: любимую одежду еще можно спасти

Попробуем вывести пятно от зеленки с цветных и белых вещей в домашних условиях

ТехИнсайдер
Земля кочевая Земля кочевая

Башкирская земля всегда рада гостям

Отдых в России
Революция в понимании депрессии: продолжать ли принимать антидепрессанты? Революция в понимании депрессии: продолжать ли принимать антидепрессанты?

Серотониновая теория депрессии умерла?

Psychologies
Что крадут наши эмоции: 7 фактов Что крадут наши эмоции: 7 фактов

Факты о негативном влиянии эмоций на нашу жизнь

Psychologies
5 вопросов про Ивана Грозного 5 вопросов про Ивана Грозного

Основанные на домыслах вопросы о жизни Ивана Грозного

Maxim
7 способов повысить интеллект ребенка 7 способов повысить интеллект ребенка

Несколько простых советов, которые помогут улучшить работу детского мозга

Лиза
16 банальных ошибок, способных испортить любую свадьбу 16 банальных ошибок, способных испортить любую свадьбу

Чего стоит избегать, планируя свадебное торжество

Psychologies
Эмили Ратаковски, Шакира и другие роскошные женщины, которым изменили мужья Эмили Ратаковски, Шакира и другие роскошные женщины, которым изменили мужья

Даже звезды порой сталкиваются с циничным обманом

VOICE
Разработано первое приложение для обмена сообщениями под водой Разработано первое приложение для обмена сообщениями под водой

Ученые разработали приложение для смартфона для передачи сообщений под водой

ТехИнсайдер
Почему «тургеневская барышня» — не комплимент: многие бездумно используют это обидное словосочетание Почему «тургеневская барышня» — не комплимент: многие бездумно используют это обидное словосочетание

«Ты такая нежная и изящная — прямо-таки тургеневская девушка!»

VOICE
Рипофобия: когда стремление к чистоте превращается в одержимость Рипофобия: когда стремление к чистоте превращается в одержимость

Что такое рипофобия и как с ней справиться?

Psychologies
Как правильно искать (и находить!) грибы Как правильно искать (и находить!) грибы

Вернуться с «тихой охоты» пустым обидно и унизительно

Maxim
Искусственные эмбрионы мыши развились до восьмого дня вне матки Искусственные эмбрионы мыши развились до восьмого дня вне матки

Ученые создали мышиные эмбрионы и дорастили их до восьмого дня развития

N+1
10 красивых фотофейков, в которые все поверили 10 красивых фотофейков, в которые все поверили

Самые красивые и впечатляющие вирусные фото, которые оказались подделкой

Maxim
Генотерапия вернула слух мышам Генотерапия вернула слух мышам

Ученые разработали препарат, который вернул мышам слух

N+1
Только не сейчас Только не сейчас

Что делать, если зубная боль настигла в разгар отпуска

Лиза
Открыть в приложении