SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Шимпанзе способны оказывать медицинскую помощь друг другу Шимпанзе способны оказывать медицинскую помощь друг другу

Приматы не только залечивают собственные раны, но и помогают сородичам

ТехИнсайдер
Тренеры по красивой жизни Тренеры по красивой жизни

Как не прогадать с покупкой у инфоцыган курсов-пустышек

РБК
Кофе и нейросети: какую роль играет ИИ в привлечении зумеров при кадровом дефиците Кофе и нейросети: какую роль играет ИИ в привлечении зумеров при кадровом дефиците

Как в борьбе за таланты генеративный ИИ становится ключевым инструментом

Forbes
Сад против времени. В поисках рая для всех Сад против времени. В поисках рая для всех

Глава из сборника Оливии Лэнг «Сад против времени. В поисках рая для всех»

Правила жизни
Продать продукт, даже если его еще нет: 5 шагов, чтобы на старте понять, «выстрелит» ‎ли бизнес Продать продукт, даже если его еще нет: 5 шагов, чтобы на старте понять, «выстрелит» ‎ли бизнес

Как проверить бизнес-идею до вложений и не влезть в долги

Inc.
Зайдя в эту комнату, через 15 минут вы сойдете с ума. Рассказываем про самую тихую комнату в мире Зайдя в эту комнату, через 15 минут вы сойдете с ума. Рассказываем про самую тихую комнату в мире

В чем секрет самого тихого помещения в мире?

ТехИнсайдер
Солнечный коллектор vs солнечная панель: как определить, что выгоднее для дома Солнечный коллектор vs солнечная панель: как определить, что выгоднее для дома

Что из них выгоднее и чем отличаются: солнечный коллектор или солнечная панель?

ТехИнсайдер
Нейробиологи рассказали, как в мозге возникает память о страхе Нейробиологи рассказали, как в мозге возникает память о страхе

Память о страхе связана не только с работой нейротрансмиттеров в мозгу

ТехИнсайдер
По грибы, по ягоды: как выбрать сушилку для овощей и сохранить урожай По грибы, по ягоды: как выбрать сушилку для овощей и сохранить урожай

Никаких больше уксусных закаток и баклажанной икры — выбираем сушилку для овощей

ТехИнсайдер
Какой смысл мы вкладываем в слово «душнила»: 4 объяснения Какой смысл мы вкладываем в слово «душнила»: 4 объяснения

Зачем нужен термин «душнила»? Почему мы его используем?

Psychologies
Груминг вызвал стресс у самок медвежьих павианов Груминг вызвал стресс у самок медвежьих павианов

Почему продолжительный аллогруминга повышает стресс медвежьих павианов?

N+1
Как отозвать персональные данные и зачем это нужно Как отозвать персональные данные и зачем это нужно

Как отозвать согласие на обработку персональных данных и когда это не получится

CHIP
Губернатор Забайкалья — о перспективах края в сотрудничестве с Китаем Губернатор Забайкалья — о перспективах края в сотрудничестве с Китаем

За последние пять лет ВРП Забайкалья, по данным Росстата, увеличился в 1,7 раза

РБК
Андрей Миронов. «Он нравился. Он влюблял в себя. В нем была магия...» Андрей Миронов. «Он нравился. Он влюблял в себя. В нем была магия...»

«Быть артистом — это абсолютно его предназначение. Сцена у него затмевала все»

Коллекция. Караван историй
5 точек красоты: как делать массаж лица шиацу правильно 5 точек красоты: как делать массаж лица шиацу правильно

Точечная техника шиацу поможет за несколько минут в день стереть следы усталости

Psychologies
Приручить внутренних драконов: советы для любителей спорить и бездумно говорить «да» Приручить внутренних драконов: советы для любителей спорить и бездумно говорить «да»

Проверенные стратегии для укрощения «драконов» — вредных ментальных привычек

Forbes
Все дороги ведут к пирамидам Все дороги ведут к пирамидам

Почему «все боится времени, но время боится пирамид»

Вокруг света
Художник Роман Сакин: У меня пропадают работы, вместо них появляются деньги. Это как суррогатное материнство Художник Роман Сакин: У меня пропадают работы, вместо них появляются деньги. Это как суррогатное материнство

Художник Роман Сакин — про античность и взгляд на мир игрока в Minecraft

СНОБ
Вино из Воронежа Вино из Воронежа

В мир вина я попал очень просто — мама была большой ценительницей

Bones
Восемь отцов очарованного странника Восемь отцов очарованного странника

«Юг»: путевая мелодрама как русское роуд-муви

Weekend
Рина Зеленая. Каждый день была счастлива с мужем Рина Зеленая. Каждый день была счастлива с мужем

Рина всегда ценила интеллектуалов с неординарным мышлением

Караван историй
Безмолвные слезы вещей: роман о расследовании судеб погибших в концлагерях Безмолвные слезы вещей: роман о расследовании судеб погибших в концлагерях

Отрывок из романа Гаэль Ноан «Бюро расследования судеб»

Forbes
Гжель: сине-бело-голубые Гжель: сине-бело-голубые

Особенности производства гжельской посуды

КАНТРИ Русская азбука
Старость в два захода! Ученые выяснили, когда люди резко стареют Старость в два захода! Ученые выяснили, когда люди резко стареют

Как ученые объясняют всплески проблем со здоровьем в определенном возрасте?

ТехИнсайдер
Крушение «Осоавиахима» Крушение «Осоавиахима»

В 1933 году граждане СССР праздновали триумф науки и техники — полёт стратостата

Дилетант
Грифонаж, страпонтен, глабелла, нёрдл: необычные названия привычных вещей Грифонаж, страпонтен, глабелла, нёрдл: необычные названия привычных вещей

Грифонаж, страпонтен, петрикор: вы точно знаете эти вещи

ТехИнсайдер
Дети и новый муж Дети и новый муж

Cоветы по сближению детей с новым партнером и основные промахи

Лиза
Два «кукурузника»: у нашего родного биплана По-2 нашелся американский брат-близнец Два «кукурузника»: у нашего родного биплана По-2 нашелся американский брат-близнец

Зачем Boeing разрабатывала «кукурузники»?

ТехИнсайдер
Союз спасения: как «Дэдпул и Росомаха» вернули киновселенную Marvel к жизни (или нет) Союз спасения: как «Дэдпул и Росомаха» вернули киновселенную Marvel к жизни (или нет)

«Дэдпул и Росомаха»: фестиваль фансервиса в мультивселенной безумия

Правила жизни
Кого поставить в угол Кого поставить в угол

Взрослые глазами детей: у них тоже есть к нам обоснованные претензии!

Лиза
Открыть в приложении