Может ли машинное обучение предсказать свое будущее?

N+1Hi-Tech

Гадание на датасетах

Может ли машинное обучение предсказать свое будущее?

Богдан Сиротич

Вы каждый день сталкиваетесь с машинным обучением и его работой. Вас удивляет, как быстро его учат новым навыкам и совершенствуют в старых. Но что если мы скажем, что все это достигнуто с помощью всего половины процента от имеющихся у человечества данных? Вместе с экспертами Яндекса рассказываем, как в ближайшие годы машинное обучение изменит мир вокруг нас.

N + 1 совместно с экспертами Яндекса, а также членами жюри и лауреатами научной премии им. Ильи Сегаловича представляет материал о ближайших и более дальних перспективах машинного обучения. В 2019 году Яндекс учредил премию имени Ильи Сегаловича в память о создателе первой версии поисковика «Яндекс» и популяризатора компьютерных наук. Это ежегодная премия для молодых исследователей в области машинного обучения, компьютерного зрения, информационного поиска и анализа данных, а также обработки естественного языка.

Если вы студент, аспирант или научный руководитель из России, Беларуси или Казахстана и работаете над подобными задачами, вам стоит рассказать о своих успехах и подать заявку на соискание премии. В этом году они будут приниматься до 1 марта включительно.

Здесь нет заголовка, но машинное обучение может его придумать

Машинное обучение есть почти в каждом гаджете, который нас окружает. С его помощью работают поисковики, агрегаторы такси, камеры, отслеживающие нарушения ПДД. Сейчас этим никого не удивишь. Но в последние годы машинное обучение стало важной частью медицинских и даже гуманитарных исследований.

В январе разработчики из OpenAI представили нейросеть DALL-E, способную создавать изображения по текстовому описанию. Это не первая подобная разработка, но очень интересная и разносторонняя. Пока рано говорить, что у нейросетей появилось воображение, но DALL-E способен рисовать предметы, руководствуясь даже очень абстрактным описанием, — например, «кресло в форме авокадо». Нейросеть также способна дорисовывать существующему изображению прямоугольную область с любой стороны, создавать реалистичные изображения по наброску и разбирается в том, как менялись вещи со временем. К примеру, DALL-E отличает деревянный телефон 1920-х годов от не таких старых домашних барабанных телефонов.

Подобная технология помогает создавать сцену по имеющемуся сценарию — то есть рисовать примерное изображение того действа, которое задумал сценарист. И этим использование машинного обучения в кино не ограничивается. По словам Игоря Куралёнка, члена жюри научной премии им. Ильи Сегаловича, руководителя подразделения AI & ML Yandex.Cloud, можно выполнять дубляж зарубежных фильмов, не используя голоса российских актеров, а при помощи машинного обучения «заставляя» иностранных исполнителей говорить по-русски.

Беспилотные автомобили, которые мы раньше могли видеть только в качестве первых прототипов на специальных полигонах, уже разъезжают по Москве, пока в тестовом режиме. И пускай эта технология еще не достигла полного развития, от нее можно ждать большого прогресса в ближайшем будущем. Другая интересная технология, в которой широко применяется машинное зрение, — магазины без продавцов. Несколько торговых сетей уже запустили пилотные проекты в Москве.

«Технологии глубокого обучения необходимы для обработки данных после сканирования трехмерного пространства — с помощью лидаров, сканеров структурированного света и других инструментов. Результаты применяются и при создании беспилотных авто, и в разработке приложений для мобильных устройств». Евгений Бурнаев, доцент Сколтеха, стал обладателем научной премии им. Ильи Сегаловича среди научных руководителей в 2020 году

Гораздо необычнее то, что сейчас машинное обучение помогает расшифровывать забытую письменность. До начала предыдущего столетия в Японии использовалась письменная система, называемая кузусидзи. Сейчас — спустя более века после реформы системы образования — почти не осталось людей, способных ее понимать. Чтобы решить проблему расшифровки древних текстов Национальный институт японской литературы опубликовал датасет кузусидзи, содержащий более 4 тысяч классов символов и миллион их разнообразных изображений. Чтобы извлечь максимум из имеющихся данных, на платформе Kaggle открыли соревнование, победитель которого достиг F1 = 0,950. Суть соревнования заключалась в распознавании письменности и ее переводе на современную японскую письменность.

Постепенно машинное обучение проникает и в медицину. Как утверждает Александр Крайнов, член совета научной премии им. Ильи Сегаловича и руководитель Лаборатории машинного интеллекта Яндекса, медицина — самое интересное место для внедрения машинного обучения, начиная от распознавания медицинских снимков и заканчивая постановкой диагноза, пусть не в качестве конечного вердикта, но в виде весомого совета для докторов.

Пока машинное обучение помогает врачам иначе. Например, в американском госпитале алгоритм на основе машинного обучения предсказывает заполняемость больницы, распределяет время врачей и медсестер и заказывает расходники.

«Машинное обучение применяется в медицине и в сложных задачах — таких, как модель AlphaFold2, предсказывающая структуру белков. И в более приземленных и доступных — например, при создании элайнеров (ортодонтических капп на зубы)». Лариса Маркеева, лауреат научной премии им. Ильи Сегаловича в 2020 году

Предупрежден, значит вооружен

Может показаться, что машинное обучение всесильно и сможет вскоре заменить человека в любой области. Это не так. Не во всех задачах сейчас можно прибегнуть к помощи машинного обучения. Порой собранных данных просто недостаточно для создания качественного алгоритма. Но, как подсказывает Игорь Куралёнок, возглавляющий подразделения AI & ML Yandex.Cloud, иногда выход все же есть — применение трансферного обучения (transfer learning).

Эта методика позволяет экстраполировать имеющиеся алгоритмы на более узкие проблемы. Подходящим примером является переобучение готовой языковой модели на перевод специфической малоизученной литературы. Возможны ли в этом случае ошибки? Скорее всего, да. Но не стоит забывать, что ошибки, человеческие они или машинные, — это естественная часть совершенствования технологии. И чем больше мы о них знаем, тем проще их обнаружить и исправить.

Но использование даже самых современных методик пока что не позволяет доверить машинному обучению задачи, сопряженные с высоким риском. Дэвид Талбот, руководитель отдела NLP Яндекса и член жюри научной премии им. Ильи Сегаловича, считает, что полностью доверить машинам такие задачи, как, например, операции на сердце или даже управление автомобилем, еще нельзя.

«Очевидно, что приход transfer learning в NLP (от англ. natural language processing — "обработка естественного языка") — очень важный прорыв, который чуть раньше произошел и в компьютерном зрении. Отдельно стоит отметить модели (например, DeBERTa — Decoding-enhanced BERT with Disentangled Attention), которые смогли превзойти человека в задачах понимания текста (на SuperGLUE benchmark). Но стоит обратить внимание и на другие важные работы в области. Использование баз и графов знаний (knowledge bases и knowledge graphs) совместно с языковыми моделями становится популярным и используется, например, в диалоговых системах или для генерации текста». Анастасия Янина, лауреат научной премии им. Ильи Сегаловича в 2020 году

Александр Крайнов из Лаборатории машинного интеллекта Яндекса считает, что нейросети технически несовершенны в сравнении с мозгом. Мозг способен выполнять самые разнообразные задачи, затрачивая несравнимо меньше энергии, чем нейросети. В том числе поэтому не стоит ждать, что в скором времени машина сможет воспроизвести работу человеческого мозга. В ближайшее время нейросети будут эффективны лишь в решении узких конкретных задач.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Пятнистую гиену встретили в Египте впервые за 5000 лет Пятнистую гиену встретили в Египте впервые за 5000 лет

В Гебель-Эльба, Египет, впервые за 5000 лет встретили пятнистую гиену

N+1
Ровно и дерзко: новый кроссовер Mazda приехал в Россию Ровно и дерзко: новый кроссовер Mazda приехал в Россию

Новая Mazda CX-30 — это, по сути, приподнятая и немного увеличенная Mazda3

Forbes
Нейросети в поисках персонала: как компании используют искусственный интеллект в рекрутинге уже сейчас Нейросети в поисках персонала: как компании используют искусственный интеллект в рекрутинге уже сейчас

Как рекрутеры используют нейросети — кейсы из России

ТехИнсайдер
В XXI веке кардинально изменилась статистика по супружеским изменам. Угадай, что произошло? В XXI веке кардинально изменилась статистика по супружеским изменам. Угадай, что произошло?

Опубликована полная статистика супружеских измен за последние 20 лет

Maxim
Почему женщины выбирают мужчин с криминальным прошлым: объясняет психолог Почему женщины выбирают мужчин с криминальным прошлым: объясняет психолог

По каким причинам девушки выбирают парней с криминальным прошлым?

VOICE
10 изречений Энцо Феррари о жизни, любви и смерти в день его рождения 10 изречений Энцо Феррари о жизни, любви и смерти в день его рождения

Лучшие цитаты Энцо Феррари о любви, успехе, автомобилях, победе и жизни

Maxim
Любовь в зрелом возрасте: где и как ее искать? Любовь в зрелом возрасте: где и как ее искать?

Как еще раз построить отношения в зрелом возрасте

Домашний Очаг
Обычные фильмы от обычных режиссеров: Гордей Петрик о том, как в России, наконец, появилось жанровое кино Обычные фильмы от обычных режиссеров: Гордей Петрик о том, как в России, наконец, появилось жанровое кино

Нашему кино не хватает простых историй, рассказанных понятным киноязыком

СНОБ
Золото в шкафу: как крошечный стартап помогает крупным компаниям наживаться на буме перепродаж Золото в шкафу: как крошечный стартап помогает крупным компаниям наживаться на буме перепродаж

Секонд-хенд становится тенденцией, от которой в восторге и покупатели, и бренды

Forbes
Сила Сибири Сила Сибири

Пять городов Сибири, где можно насладиться настоящей зимой

Лиза
Невидимые угрозы: TORCH-инфекции Невидимые угрозы: TORCH-инфекции

Что такое TORCH-инфекции и чем они опасны для ребенка?

Здоровье
Игорь Лифанов: «До сих пор думаю, что многое еще впереди» Игорь Лифанов: «До сих пор думаю, что многое еще впереди»

Актер Игорь Лифанов о Дмитрии Нагиеве и съемках в «Дневном дозоре»

Караван историй
Как очистить воздух в стране и не платить Европе карбоновый налог Как очистить воздух в стране и не платить Европе карбоновый налог

Достойный ответ «зеленой» политике Брюсселя

СНОБ
Сменяемость власти: почему Кирилл Серебренников покидает «Гоголь-центр» Сменяемость власти: почему Кирилл Серебренников покидает «Гоголь-центр»

8,5 лет работы Кирилла Серебренникова в Гоголь-центре — фрагмент бесконечности

Forbes
Проститутки, студенческие оргии и невинные дворянки. Каким был секс в царской России Проститутки, студенческие оргии и невинные дворянки. Каким был секс в царской России

Секс в дореволюционной России

СНОБ
Свидание с Албанией: отправляемся в самую неизвестную страну Европы Свидание с Албанией: отправляемся в самую неизвестную страну Европы

Что вы знаете про Албанию? Скорее всего, ничего

Cosmopolitan
Тихий убийца: почему важно следить за давлением даже в 30 лет Тихий убийца: почему важно следить за давлением даже в 30 лет

Столкнуться с гипертонией можно задолго до пенсии

Cosmopolitan
Гневная инженерия: 9 седанов, которые не получились Гневная инженерия: 9 седанов, которые не получились

Седаны: худшие из худших

Maxim
Старшие и младшие Старшие и младшие

Как правильно воспитывать двух детей с большой разницей в возрасте?

Лиза
«Не хотим продавать бизнес»: братья из Вологды рассказали Тинькову о цели создать крупнейшую игровую компанию «Не хотим продавать бизнес»: братья из Вологды рассказали Тинькову о цели создать крупнейшую игровую компанию

Основатели Playrix решили сделать его самой дорогой игровой компанией в мире

Forbes
Отсечь и отпустить Отсечь и отпустить

Принципы жизни Бурятии

Вокруг света
Субмаринные воды Крыма Субмаринные воды Крыма

Дебет подземных вод Горного Крыма оценивается примерно в 330 млн м3 в год

Наука
Почему есть грибы полезно и для организма, и для планеты Почему есть грибы полезно и для организма, и для планеты

Рассказываем о всех особенностях грибов и развеиваем мифы о них

РБК
Нейтральная территория Нейтральная территория

Бренды, выпускающие гендерно-нейтральную косметику

Glamour
В Стэнфорде назвали 4 причины «усталости от Zoom» и способы ее предотвратить В Стэнфорде назвали 4 причины «усталости от Zoom» и способы ее предотвратить

4 основные причины, по которым видеоконференции утомляют людей

Inc.
«Новости со всех концов света»: Том Хэнкс соединяет штаты Америки и ведет ее в будущее словом «Новости со всех концов света»: Том Хэнкс соединяет штаты Америки и ведет ее в будущее словом

«Новости со всех концов света» — полюбившийся всем вестерн от Пола Гринграсса

Esquire
Веселая вдова: лучшая роль Мишель Пфайффер — женщина, которая неудачно спланировала свою смерть Веселая вдова: лучшая роль Мишель Пфайффер — женщина, которая неудачно спланировала свою смерть

Почему фильм «Уйти не прощаясь» может принести «Оскар» Мишель Пфайффер

Forbes
«Нельзя колоть ботокс в 20» и еще 6 мифов о ботулинотерапии, которые пора забыть «Нельзя колоть ботокс в 20» и еще 6 мифов о ботулинотерапии, которые пора забыть

Как обстоят дела с ботулинотерапией?

Cosmopolitan
Уйди, противный: как устроена профессия экзорциста Уйди, противный: как устроена профессия экзорциста

Главный итальянский экзорцист рассказывает, как вырвать душу из рук Сатаны

Esquire
Читаем свои руки: что такое хиромантия и как ее использовать в личных целях Читаем свои руки: что такое хиромантия и как ее использовать в личных целях

О чем нам могут рассказать наши ладони?

Cosmopolitan
Открыть в приложении