Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Сможет ли ИИ написать «Войну и мир-2»

Рекомендуемые статьи

Разбираемся, как выбрать идеальную систему очистки воды

Пусть всегда будет вкусно: основные правила и приемы домашнего консервирования

Чем состав и технология производства римского бетона отличались от современного

О том, как бороться с изменением климата, когда оно уже наступило

На самом деле китайцы изобрели множество привычных нам вещей

Вера Мухина создала главный советский памятник и культовую советскую посуду

О рынке продуктов и решений в области энергетики и автоматизации

Стив Джобс и его литературные рекомендации: философия и взгляды на жизнь

Каким должен быть уход за кожей после лета?

Из-за чего молодые люди полюбили игрушки и как бизнес этим пользуется

Экокожа — это про экологию или экономию?

Haval H3 просто обречен на любовь – и плевать на законы физики

Что можно чистить спиртом, а что — нет?

Минпромторг предлагает новый вид специальных инвестиционных контрактов

Власти пытаются поднять рождаемость в стране, создав тренд на многодетность

Теннисистка Надежда Петрова — о ритуале пуджа на реке Ганг и запахе кофе

Как «Эмили в Париже» приковывает нас к экрану?

Почему нас так затягивают фильмы и сериалы, рассказывающие о преступлениях

Роль церкви в период правления Ивана Калиты

О том, как создаются транспортные модели и как они работают

ВОЗ обновила список патогенов, способных вызвать очередную эпидемию

Как стать дальнобойщиком и сколько он зарабатывает, выяснил Autonews.ru

5 абсолютно разных граней Большой уральской тропы

Как в России за последнее время усилились меры защиты животных

В каком состоянии находятся главные водные артерии мира?

Картина Антона Лосенко: как Владимир ходил свататься к дочери полоцкого князя

Что такое достигаторство и почему оно опасно хроническим трудоголикам

Машины, по проходимости которым не было бы равных

История Катерины, которая много лет страдала от пробелов в памяти после травли

Отрывок из книги об истории российского ретейла и концепт-сторе КМ20