Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Богатый папа, бедный папа Богатый папа, бедный папа

Чему учат детей богатые родители – и не учат бедные

kiozk originals
«Мы выдернули ребенка в неизвестность»: как россиянки эмигрируют с детьми «Мы выдернули ребенка в неизвестность»: как россиянки эмигрируют с детьми

Каково это объяснять ребенку, что семья не вернется домой?

Forbes
6 способов защиты от болезни Альцгеймера 6 способов защиты от болезни Альцгеймера

Есть полезные привычки, которые помогут сохранить ясность ума

Psychologies
7 романов и циклов космической фантастики, которые буквально просятся на экраны 7 романов и циклов космической фантастики, которые буквально просятся на экраны

Фантастические циклы, которые перенесут тебя на просторы космоса

ТехИнсайдер
«Автостопом по мозгу. Когда вся вселенная у тебя в голове». Все об устройстве и работе мозга «Автостопом по мозгу. Когда вся вселенная у тебя в голове». Все об устройстве и работе мозга

Пора заглянуть внутрь: что же происходит в мозге, когда мы ничем не заняты?

N+1
Блокировка рецептора помогла мышам восстановиться после инсульта Блокировка рецептора помогла мышам восстановиться после инсульта

Лечение пептидом привело к улучшению локомоторных и сенсомоторных функций

N+1
История одной песни: «Gangnam Style», PSY, 2012 История одной песни: «Gangnam Style», PSY, 2012

Летом 2012 года YouTube пережил первое в своей истории музыкальное потрясение

Maxim
«Секс с живыми мне не нравился»: история каширского маньяка Андрея Ежова «Секс с живыми мне не нравился»: история каширского маньяка Андрея Ежова

Задержали каширского маньяка недавно — 2020 году

VOICE
Кино как улика Кино как улика

Как одна телевизионная трилогия спасла троих невинно осужденных

Weekend
Мама, не грусти Мама, не грусти

Мамы проходят испытание послеродовой депрессией, даже не подозревая об этом

Лиза
«Смотришь на эти вывески, и они честно заявляют — стало хуже». Что не так с ребрендингом западных компаний, попавших в руки российских бизнесменов «Смотришь на эти вывески, и они честно заявляют — стало хуже». Что не так с ребрендингом западных компаний, попавших в руки российских бизнесменов

Почему правильный ребрендинг — это важно? И почему он не у всех получается?

Inc.
Как  наш мозг формирует сигнал: «Бояться!» Как  наш мозг формирует сигнал: «Бояться!»

Страх — одно из важнейших для выживания чувств. Но надо уметь им управлять

ТехИнсайдер
«Дом Дракона»: каким получился долгожданный приквел «Игры престолов» «Дом Дракона»: каким получился долгожданный приквел «Игры престолов»

Каким получился один из самых ожидаемых проектов года, «Дом Дракона»

Forbes
Почему отдых вызывает негатив: ловушки выходного дня Почему отдых вызывает негатив: ловушки выходного дня

Как настроиться на мысли о чем-то полезном или радостном в выходной день?

Psychologies
Измельчитель пищевых отходов для раковины: что это такое и зачем он нужен Измельчитель пищевых отходов для раковины: что это такое и зачем он нужен

Диспозер: измельчитель пищевых отходов, который станет частью вашей жизни

CHIP
Как русская девочка влюбила в себя Голливуд, но умерла молодой при загадочных обстоятельствах: трагедия Натали Вуд Как русская девочка влюбила в себя Голливуд, но умерла молодой при загадочных обстоятельствах: трагедия Натали Вуд

Натали Вуд была олицетворением сказки о Золушке

VOICE
Сталинская скорость Сталинская скорость

Несбывшиеся мечты о рекордных автомобилях

Автопилот
Из чего делают стекло: секреты состава удивительного материала Из чего делают стекло: секреты состава удивительного материала

Как в реальности создают стекло?

ТехИнсайдер
Калорийность рациона: зачем нужны белки и жиры Калорийность рациона: зачем нужны белки и жиры

Чем определяется калорийность рациона?

РБК
6 вещей, которыми можно злоупотреблять, хоть все считают иначе 6 вещей, которыми можно злоупотреблять, хоть все считают иначе

Удовольствия, которых мы себя зачем-то лишили, а зря!

Maxim
Синдром одомашнивания: отрывок из книги «Парадокс добродетели» Ричарда Рэнгема Синдром одомашнивания: отрывок из книги «Парадокс добродетели» Ричарда Рэнгема

Почему людям свойственны одновременно доброта и жестокость?

СНОБ
Наш мозг считает быстрее всего не слева направо, а снизу вверх Наш мозг считает быстрее всего не слева направо, а снизу вверх

Самое удобное для нашего мозга расположение чисел — в столбик снизу вверх

ТехИнсайдер
Легко сказать: 9 простых (на деле — не очень) правил, которые помогут стать здоровее и счастливее Легко сказать: 9 простых (на деле — не очень) правил, которые помогут стать здоровее и счастливее

Советы, которые помогут понять: жизнь лучше, чем кажется

Правила жизни
Что мешает вашей карьере: 3 шага для преодоления вредных установок Что мешает вашей карьере: 3 шага для преодоления вредных установок

Почему ваша карьера никак не складывается?

Psychologies
Астрономы ищут в океане неизвестный объект, который, вероятно, прибыл из межзвездного пространства Астрономы ищут в океане неизвестный объект, который, вероятно, прибыл из межзвездного пространства

В 2014 году странный объект упал недалеко от побережья Папуа-Новой Гвинеи

ТехИнсайдер
«Лавка Болотова». Как металлург из Тулы стал поставщиком помидоров в White Rabbit, Selfie и рестораны Новикова «Лавка Болотова». Как металлург из Тулы стал поставщиком помидоров в White Rabbit, Selfie и рестораны Новикова

Можно ли бросить всё, сделать ставку на продажу овощей и выиграть?

Inc.
Никогда больше: как Германия формирует нетерпимость к преступлениям прошлого Никогда больше: как Германия формирует нетерпимость к преступлениям прошлого

Наследие катастроф XX века заставляет Европу пересматривать отношение к истории

Forbes
Какими были валютные магазины «Березка» в СССР Какими были валютные магазины «Березка» в СССР

Что за магазины «Березка» были в СССР

Forbes
Что запускать и где взять деньги: венчурный гид по Латинской Америке Что запускать и где взять деньги: венчурный гид по Латинской Америке

Как устроен венчурный рынок в Латинской Америке

Forbes
9 правил, которые нужно помнить на случай ядерного взрыва 9 правил, которые нужно помнить на случай ядерного взрыва

Как спастись от ядерного взрыва

ТехИнсайдер
Открыть в приложении