Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Женщина с иммуносупрессией заразилась кошачьей бактерией Женщина с иммуносупрессией заразилась кошачьей бактерией

Врачи сообщили о редком случае инфекции, вызванной бактерией Mycoplasma arginini

N+1
Соловецкие «Вавилоны» Соловецкие «Вавилоны»

Соловецкие острова – туристический бренд Архангельской области

Отдых в России
Миниатюрный орнитоптер стал одноногим прыгуном Миниатюрный орнитоптер стал одноногим прыгуном

Как инженеры создали робота-прыгуна массой меньше грамма

N+1
Кирилл Рябов: «Женщина» Кирилл Рябов: «Женщина»

Отрывок из сборника рассказов, соединяющего лейтмотивы гуманистической традиции

СНОБ
8 доказанных наукой привычек, которые действительно повышают интеллект 8 доказанных наукой привычек, которые действительно повышают интеллект

Какие ритуалы стоит добавить в свою рутину, чтобы стать умнее

Maxim
Несовместимая пара: как быть, если ты и твой мужчина слишком разные люди Несовместимая пара: как быть, если ты и твой мужчина слишком разные люди

Как построить счастливые отношения, если вы очевидно не подходите друг другу

VOICE
С кем из знаменитостей знакома королева Елизавета: от Мэрилин Монро до Леди Гаги С кем из знаменитостей знакома королева Елизавета: от Мэрилин Монро до Леди Гаги

Елизавета II за 70 лет в статусе королевы повидала немало знаменитостей

VOICE
4 национальных символа, которые на самом деле «иностранцы» 4 национальных символа, которые на самом деле «иностранцы»

Ты знал, что Сталинградский завод был построен в США?

Maxim
10 научных фактов о фильме «День независимости» 10 научных фактов о фильме «День независимости»

Кинофильм, запрещенный на планетах, где нет чувства юмора

Maxim
Как работает восьмицилиндровый двигатель: полный разбор на наглядном примере Как работает восьмицилиндровый двигатель: полный разбор на наглядном примере

Engineering Explained распечатал на 3D-принтере объемную модель двигателя V8

ТехИнсайдер
«Боже, помоги мне убить маму»: история нижегородского маньяка Олега Белова «Боже, помоги мне убить маму»: история нижегородского маньяка Олега Белова

Олег Белов — «нижегородский детоубийца»

VOICE
Отец объемной мультипликации: как жил и работал Владислав Старевич Отец объемной мультипликации: как жил и работал Владислав Старевич

«Этот человек обогнал всех аниматоров мира на несколько десятилетий»

Правила жизни
Платья непрямого действия Платья непрямого действия

Путеводитель по сюрреалистическим мирам Эльзы Скьяпарелли

Weekend
Почему оборотень Джейкоб из “Сумерек” не стал суперзвездой — как Кристен Стюарт и Роберт Паттинсон Почему оборотень Джейкоб из “Сумерек” не стал суперзвездой — как Кристен Стюарт и Роберт Паттинсон

Почему про Тейлора Лотнера все забыли?

VOICE
Китайские химики смоделировали фильтрацию дыма древней лампы-гуся Китайские химики смоделировали фильтрацию дыма древней лампы-гуся

Древняя масляная лампа-гусь могла снижать загрязнение воздуха в помещении

N+1
Пилоты, солдаты, цензоры: каким профессиям по-настоящему угрожает искусственный интеллект Пилоты, солдаты, цензоры: каким профессиям по-настоящему угрожает искусственный интеллект

Отрывок из книги «Искусственный интеллект и экономика»

Inc.
«Сила женщины в ее слабости»: почему важно быть разной «Сила женщины в ее слабости»: почему важно быть разной

Чередование противоположностей поможет женщинам стать полноценными личностями

Psychologies
«Добрый доктор Нильс»: история медбрата, который сотнями убивал пациентов «Добрый доктор Нильс»: история медбрата, который сотнями убивал пациентов

Когда дежурит Нильс Хёгель, смертность пациентов резко возрастает

VOICE
Кокетливый язык тела: какие жесты заводят мужчин и женщин Кокетливый язык тела: какие жесты заводят мужчин и женщин

Язык тела позволяет выразить наши чувства и желания

Psychologies
«Хочу быть вместе с ней»: каким был Михаил Горбачев в мемуарах своей жены Раисы «Хочу быть вместе с ней»: каким был Михаил Горбачев в мемуарах своей жены Раисы

В день смерти Михаила Горбачева Forbes Woman обратился к мемуарам его жены Раисы

Forbes
Почему пора перестать считать целлюлит недостатком Почему пора перестать считать целлюлит недостатком

Целлюлит — не болезнь: новый взгляд на проблему

Лиза
Одна вокруг света: знаменитая Дорога смерти и Королевская Кордильера Одна вокруг света: знаменитая Дорога смерти и Королевская Кордильера

181-я серия о кругосветном путешествии москвички Ирины Сидоренко: Боливия

Forbes
Как переоформить автомобиль разными способами Как переоформить автомобиль разными способами

Переоформление автомобиля: нормы закона и нюансы

РБК
Работа инсулина и рост нервов: открытия в биологии и медицине, сделанные женщинами Работа инсулина и рост нервов: открытия в биологии и медицине, сделанные женщинами

Женщины-лауреаты Нобелевской премии

Forbes
10 вещей, которые нельзя делать с кошкой 10 вещей, которые нельзя делать с кошкой

10 вещей, которые могут навредить вашей кошке

Maxim
Что делает мужчину сексуальным: 11 возбуждающих качеств Что делает мужчину сексуальным: 11 возбуждающих качеств

«Что ты замечаешь в мужчине в первую очередь?»

Psychologies
Тонизирующий массаж роллами для хорошей осанки и против целлюлита Тонизирующий массаж роллами для хорошей осанки и против целлюлита

Для чего нужны роллы с рельефной поверхностью и как ими пользоваться?

Лиза
Слизь так важна для жизни, что разные виды самостоятельно получали ее в ходе эволюции снова и снова Слизь так важна для жизни, что разные виды самостоятельно получали ее в ходе эволюции снова и снова

Слизь появлялась на мировом эволюционном древе ни один и не два раза

ТехИнсайдер
Сойти за своего: как адаптироваться к жизни в другой стране Сойти за своего: как адаптироваться к жизни в другой стране

Как интегрироваться в новое общество и преодолеть культурные барьеры?

Psychologies
Совсем не игрушки Совсем не игрушки

Сколько могут стоить машины, которые были у дедушки, когда он был внуком

Автопилот
Открыть в приложении