SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Наиболее сохранившиеся животные ледникового периода Наиболее сохранившиеся животные ледникового периода

Эти доисторические животные дают возможность заглянуть в прошлое

ТехИнсайдер
Груминг вызвал стресс у самок медвежьих павианов Груминг вызвал стресс у самок медвежьих павианов

Почему продолжительный аллогруминга повышает стресс медвежьих павианов?

N+1
Как обработать фото, будто вы сделали его на пленку? Сохраните этот простой метод! Как обработать фото, будто вы сделали его на пленку? Сохраните этот простой метод!

Как сделать цифровые снимки похожими на пленку: инструкция

ТехИнсайдер
Криминальный гардероб: как спортивный костюм стал символом обездоленного класса Криминальный гардероб: как спортивный костюм стал символом обездоленного класса

Как одежда становится маркером преступности?

Forbes
Как научиться довольствоваться тем, что есть, и перестать сравнивать свою жизнь с чужими Как научиться довольствоваться тем, что есть, и перестать сравнивать свою жизнь с чужими

Как перестать вечно гнаться за идеалом?

ТехИнсайдер
Удаляют себе ногти на ногах! Вот на какие жертвы идут бегуны Канады ради победы Удаляют себе ногти на ногах! Вот на какие жертвы идут бегуны Канады ради победы

Профессиональные спортсмены подвергают свои тела экстремальным практикам

ТехИнсайдер
Редкое животное и первые кадры! Фермер из Боливии сумел заснять амазонскую ласку: видео Редкое животное и первые кадры! Фермер из Боливии сумел заснять амазонскую ласку: видео

Об удивительном существе из густых лесов Амазонки известно не так много

ТехИнсайдер
Грипповой эксперимент Грипповой эксперимент

«Идеальный лжец»: карантин и классовые отношения

Weekend
Сербская литиевая драма Сербская литиевая драма

Руководство Сербии дало добро на разработку крупного месторождения лития

Монокль
Мороз, жара и низкая рентабельность: почему Россия потеряла часть урожая картофеля Мороз, жара и низкая рентабельность: почему Россия потеряла часть урожая картофеля

В 2024 году в России соберут на 1,4 млн т, или на 16% меньше картофеля

Forbes
Первая it-girl и «восхитительное пустое место»: Эди Седжвик как икона стиля Первая it-girl и «восхитительное пустое место»: Эди Седжвик как икона стиля

Эди Седжвик — первый модный инфлюенсер середины шестидесятых

Правила жизни
Тандыр Тандыр

Тандыры и еду из них можно встретить на всем протяжении Великого шелкового пути

Bones
Любовная пара незаконно покорила самые высокие здания в мире! Вот как устроены их отношения Любовная пара незаконно покорила самые высокие здания в мире! Вот как устроены их отношения

Они еще не знали, что увлечение городским скалолазанием приведет к отношениям...

ТехИнсайдер
6 остросюжетных новинок для тех, кто любит пощекотать нервы: триллеры, детективы и тру-крайм 6 остросюжетных новинок для тех, кто любит пощекотать нервы: триллеры, детективы и тру-крайм

Что может быть лучше детектива, сюжет которого захватывает с первых страниц?

Maxim
Неудачный «Большой скачок»: зачем Китай закупал воробьев у Канады и СССР Неудачный «Большой скачок»: зачем Китай закупал воробьев у Канады и СССР

«Большой скачок»: зачем Китай решил истребить воробьев?

ТехИнсайдер
Успешный дебют. Как советская программа стала первым чемпионом мира по шахматам Успешный дебют. Как советская программа стала первым чемпионом мира по шахматам

Как технологии совершили революцию в шахматах

СНОБ
Zventa Sventana: мы часто становимся жертвами плагиата Zventa Sventana: мы часто становимся жертвами плагиата

Разговор о современном фолке — интервью с Zventa Sventana

СНОБ
Ресторан на магазинной полке: как устроено производство готовой еды Ресторан на магазинной полке: как устроено производство готовой еды

Ресторан на магазинной полке: как производится готовая еда для «Перекрестка»

СНОБ
Это смело. 5 неочевидных особенностей кроссовера Jaecoo J7 Это смело. 5 неочевидных особенностей кроссовера Jaecoo J7

Кроссовер Jaecoo J7 обладает целым рядом интересных особенностей

РБК
Что нужно знать о бензопилах: 16 самых популярных вопросов Что нужно знать о бензопилах: 16 самых популярных вопросов

Как выбрать цепь для бензиновой пилы, можно ли заливать в нее моторное масло

CHIP
Помнить все! Помнить все!

7 привычек, которые помогут снизить риск деменции

Лиза
Рынок жилья охлаждается, но неохотно Рынок жилья охлаждается, но неохотно

Квартирный рынок входит в этап развития, связанный с отменой льготной ипотеки

Монокль
Баклуши бить Баклуши бить

Кто из нас не мечтал хоть разок побить баклуши?

КАНТРИ Русская азбука
Художник Роман Сакин: У меня пропадают работы, вместо них появляются деньги. Это как суррогатное материнство Художник Роман Сакин: У меня пропадают работы, вместо них появляются деньги. Это как суррогатное материнство

Художник Роман Сакин — про античность и взгляд на мир игрока в Minecraft

СНОБ
5 способов «застраховаться» от развода 5 способов «застраховаться» от развода

Что необходимо делать супругам, чтобы гарантированно укрепить свой брак?

Psychologies
Разумный рацион Разумный рацион

9 способов экономить на еде, продолжая питаться нормально

Лиза
«Участие бизнеса необходимо  на каждом этапе формирования  кадрового резерва» «Участие бизнеса необходимо  на каждом этапе формирования  кадрового резерва»

О роли бизнеса в создании кадрового потенциала для развития нефтегазовой отрасли

РБК
Милая агрессия и боязнь счастья: 5 необычных психологических явлений Милая агрессия и боязнь счастья: 5 необычных психологических явлений

Странные и забавные научные предположения о психологии человека

ТехИнсайдер
Дизайн ИИ: как устроен виртуальный ассистент и кто его создает Дизайн ИИ: как устроен виртуальный ассистент и кто его создает

С какими неочевидными вызовами сталкиваются создатели ИИ-помощников в России

Правила жизни
Юла: кручу-верчу Юла: кручу-верчу

Яркая и шумная юла уже много веков веселит малышню в российских домах

КАНТРИ Русская азбука
Открыть в приложении