SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Ущипните меня: Mazda запатентовала 6-тактный двигатель, который сам для себя делает водород Ущипните меня: Mazda запатентовала 6-тактный двигатель, который сам для себя делает водород

Может ли мотор производить водородное топливо, потребляя бензин?

ТехИнсайдер
Происхождение казахов Синьцзяна смоделировали из четырех предковых компонент Происхождение казахов Синьцзяна смоделировали из четырех предковых компонент

Китайские генетики проанализировали ДНК более чем двухсот этнических казахов

N+1
От «Голубого крейсера» до «Каспийского монстра»: 5 самых быстрых кораблей СССР От «Голубого крейсера» до «Каспийского монстра»: 5 самых быстрых кораблей СССР

Что стимулировало рост скоростей, какие рекорды ставили советские моряки на воде

ТехИнсайдер
Более молодой возраст повысил риск ампутации при реваскуляризации нижних конечностей Более молодой возраст повысил риск ампутации при реваскуляризации нижних конечностей

У кого повышенный риск ампутации при реваскуляризации нижних конечностей?

N+1
Виниры и люминиры: чем отличаются и что выбрать Виниры и люминиры: чем отличаются и что выбрать

Чем виниры и люминиры отличаются между собой и что из них надежнее

ТехИнсайдер
«Презренный человек» «Презренный человек»

Эта статья была опубликована в газете «Правда» 24 августа 1940 года без подписи

Дилетант
«По итогу это будет музейный экспонат». Скульптор Иван Савенков — о работе над копиями львов Медичи «По итогу это будет музейный экспонат». Скульптор Иван Савенков — о работе над копиями львов Медичи

Скульптор Иван Савенков о любимых материалах и специфике коммерческой скульптуры

СНОБ
История с биографией История с биографией

Tabula Rasa в своем изначальном значении: история одного семейного расследования

Знание – сила
Что не так с психотерапией? Что не так с психотерапией?

Почему практика осознанности может привести к неожиданному результату?

Здоровье
Психолог Юлия Дердо: Я по пальцам одной руки могу пересчитать семьи, которые бы не столкнулись с изменой Психолог Юлия Дердо: Я по пальцам одной руки могу пересчитать семьи, которые бы не столкнулись с изменой

Психолог Юлия Дердо — о семейных отношениях и изменах

СНОБ
Диморф унаследовал валуны от Дидима Диморф унаследовал валуны от Дидима

Планетологи сравнили распределение размеров валунов на астероидах Дидим и Диморф

N+1
Достоевский на улице Сезам Достоевский на улице Сезам

«Эрик»: Бенедикт Камбербэтч в Нью-Йорке 1980-х

Weekend
360 000 рублей от государства: как население стимулируют к долгосрочным сбережениям 360 000 рублей от государства: как население стимулируют к долгосрочным сбережениям

Как будет работать программа сбережений и куда пойдут длинные деньги россиян?

Forbes
«Академикам-медикам не нашлось места в зале общего собрания» «Академикам-медикам не нашлось места в зале общего собрания»

Исполнилось 80 лет со дня основания медицинской академии наук СССР

Наука
Самые неприхотливые и выносливые кроссоверы дешевле ₽1,5 млн Самые неприхотливые и выносливые кроссоверы дешевле ₽1,5 млн

Предложения кроссоверов на вторичном рынке дешевле 1,5 млн руб.

РБК
Крис Пратт, Кевин Костнер, Риз Уизерспун: сколько актеры зарабатывают на сериалах Крис Пратт, Кевин Костнер, Риз Уизерспун: сколько актеры зарабатывают на сериалах

Знаменитые актеры все чаще отдают предпочтение сериалам

Forbes
«Человечество не допустит катастрофы»: как гаджеты меняют работу мозга — разбор с нейробиологами «Человечество не допустит катастрофы»: как гаджеты меняют работу мозга — разбор с нейробиологами

Что происходит с нашим мышлением и чувствами в условиях цифровой реальности?

Psychologies
Есть ли у вас порнозависимость? Изучите чек-лист из 5 пунктов Есть ли у вас порнозависимость? Изучите чек-лист из 5 пунктов

Порнозависимость: почему она возникает и как её выявить?

Psychologies
Вот в чем опрос Вот в чем опрос

Зачем проводили опросы общественного мнения и чего этим удавалось добиться

Weekend
Кажется, пора бежать Кажется, пора бежать

Словарь абьюзера — разбираемся в тонкостях совсем не тонких понятий

P.I.C. Partner In Crime
В своих стенах В своих стенах

Советы, чтобы сэкономить при выборе обоев

Лиза
4 убедительные причины, почему взрослым детям не стоит жить с родителями 4 убедительные причины, почему взрослым детям не стоит жить с родителями

Чем же вредна для взрослых детей жизнь с родителями?

Psychologies
«Железный купол»: логика работы и техническое воплощение «Железный купол»: логика работы и техническое воплощение

О принципах работы и основах устройства эффективного противоракетного комплекса

Наука
Как пережить расставание Как пережить расставание

Мучают воспоминания, все вокруг говорит о недавнем романе? Стоп!

Лиза
Как стеклышко Как стеклышко

Заготовки летом. Как стерилизовать стеклянную тару в микроволновке?

Лиза
Замужем за неизвестным Замужем за неизвестным

История одного брака, который превратился в сущий ад

P.I.C. Partner In Crime
Руины поэзии Руины поэзии

Петр Белый: гражданственный формализм

Weekend
Правило двух Миссисипи: что такое «толкаголизм» и как с ним бороться Правило двух Миссисипи: что такое «толкаголизм» и как с ним бороться

Что такое «толкаголизм», к каким последствиям он может привести?

Forbes
Математика седьмой координаты для роботов* Математика седьмой координаты для роботов*

Перспективы и проблемы развития роботостроения в России

Монокль
Еще до прочтения сжечь: почему киберпреступники не снижают фишинговую активность Еще до прочтения сжечь: почему киберпреступники не снижают фишинговую активность

Почему фишинг остается наиболее эффективным способом социальной инженерии

Forbes
Открыть в приложении