SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как выбрать фильтр для воды? Есть всего два важных параметра Как выбрать фильтр для воды? Есть всего два важных параметра

Разбираемся, как выбрать идеальную систему очистки воды

ТехИнсайдер
Полные закрома Полные закрома

Пусть всегда будет вкусно: основные правила и приемы домашнего консервирования

Лиза
Раскрыт секретный рецепт римского бетона, который пережил тысячелетия Раскрыт секретный рецепт римского бетона, который пережил тысячелетия

Чем состав и технология производства римского бетона отличались от современного

Inc.
Перегрелись: зачем останавливать глобальное потепление, если оно уже наступило Перегрелись: зачем останавливать глобальное потепление, если оно уже наступило

О том, как бороться с изменением климата, когда оно уже наступило

Forbes
Кетчуп и зубная щетка: неожиданные вещи, которые изобрели китайцы Кетчуп и зубная щетка: неожиданные вещи, которые изобрели китайцы

На самом деле китайцы изобрели множество привычных нам вещей

ТехИнсайдер
Рабочий, колхозница и граненый стакан Рабочий, колхозница и граненый стакан

Вера Мухина создала главный советский памятник и культовую советскую посуду

Правила жизни
«Что можно было локализовать быстро, мы уже локализовали» «Что можно было локализовать быстро, мы уже локализовали»

О рынке продуктов и решений в области энергетики и автоматизации

РБК
Джордж Оруэлл и саморазвитие! Посмотрите, какие 7 книг советовал основатель Apple Стив Джобс Джордж Оруэлл и саморазвитие! Посмотрите, какие 7 книг советовал основатель Apple Стив Джобс

Стив Джобс и его литературные рекомендации: философия и взгляды на жизнь

ТехИнсайдер
Сезонные работы Сезонные работы

Каким должен быть уход за кожей после лета?

Лиза
Игрушки для взрослых: почему зумеры полюбили кукол и пупсов и как на этом заработать Игрушки для взрослых: почему зумеры полюбили кукол и пупсов и как на этом заработать

Из-за чего молодые люди полюбили игрушки и как бизнес этим пользуется

Forbes
Оттенки кожзама: что такое экокожа и стоит ли приобретать изделия из нее Оттенки кожзама: что такое экокожа и стоит ли приобретать изделия из нее

Экокожа — это про экологию или экономию?

ТехИнсайдер
Любовь наперекор Любовь наперекор

Haval H3 просто обречен на любовь – и плевать на законы физики

ТехИнсайдер
10 вещей, которые лучше всего чистить спиртом: мнение профессиональных клинеров 10 вещей, которые лучше всего чистить спиртом: мнение профессиональных клинеров

Что можно чистить спиртом, а что — нет?

VOICE
Роботы и инвесторы Роботы и инвесторы

Минпромторг предлагает новый вид специальных инвестиционных контрактов

Монокль
Социальный заказ на большую семью: как власти будут развивать демографию Социальный заказ на большую семью: как власти будут развивать демографию

Власти пытаются поднять рождаемость в стране, создав тренд на многодетность

ФедералПресс
Я — сноб: теннисистка Надежда Петрова Я — сноб: теннисистка Надежда Петрова

Теннисистка Надежда Петрова — о ритуале пуджа на реке Ганг и запахе кофе

СНОБ
Почему нам нравится сериал «Эмили в Париже» и чего ожидать от выхода 4-го сезона Почему нам нравится сериал «Эмили в Париже» и чего ожидать от выхода 4-го сезона

Как «Эмили в Париже» приковывает нас к экрану?

Psychologies
Доктор наук объяснила, почему истории про маньяков так затягивают нас Доктор наук объяснила, почему истории про маньяков так затягивают нас

Почему нас так затягивают фильмы и сериалы, рассказывающие о преступлениях

Psychologies
Три митрополита Три митрополита

Роль церкви в период правления Ивана Калиты

Дилетант
Математика в реальной жизни: как транспортные модели помогают избавляться от пробок и строить новые маршруты Математика в реальной жизни: как транспортные модели помогают избавляться от пробок и строить новые маршруты

О том, как создаются транспортные модели и как они работают

ТехИнсайдер
Мир готовят к новой пандемии Мир готовят к новой пандемии

ВОЗ обновила список патогенов, способных вызвать очередную эпидемию

Монокль
Сколько зарабатывает дальнобойщик и как им стать Сколько зарабатывает дальнобойщик и как им стать

Как стать дальнобойщиком и сколько он зарабатывает, выяснил Autonews.ru

РБК
Урал, любовь моя Урал, любовь моя

5 абсолютно разных граней Большой уральской тропы

2Xplore
Защита краснокнижных растений и животных: один из национальных приоритетов Защита краснокнижных растений и животных: один из национальных приоритетов

Как в России за последнее время усилились меры защиты животных

ФедералПресс
Дорогие и грязные: почему в Москве-реке, Ганге и Темзе нельзя купаться Дорогие и грязные: почему в Москве-реке, Ганге и Темзе нельзя купаться

В каком состоянии находятся главные водные артерии мира?

Forbes
Владимир и Рогнеда Владимир и Рогнеда

Картина Антона Лосенко: как Владимир ходил свататься к дочери полоцкого князя

Дилетант
Успеть за успехом Успеть за успехом

Что такое достигаторство и почему оно опасно хроническим трудоголикам

РБК
«Это ЗИЛ?!» Как советские инженеры изобретали совершенный вездеход «Это ЗИЛ?!» Как советские инженеры изобретали совершенный вездеход

Машины, по проходимости которым не было бы равных

ТехИнсайдер
«Поводом к травле могло стать любое слово, жест, взгляд» «Поводом к травле могло стать любое слово, жест, взгляд»

История Катерины, которая много лет страдала от пробелов в памяти после травли

Psychologies
Бубновая дама Бубновая дама

Отрывок из книги об истории российского ретейла и концепт-сторе КМ20

Правила жизни
Открыть в приложении