SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Скажите «сыр»: почему люди практически всегда улыбаются на фотографиях Скажите «сыр»: почему люди практически всегда улыбаются на фотографиях

Почему мы автоматически улыбаемся перед камерой, как зародился этот феномен?

ТехИнсайдер
Неуправляемый хаос: 7 лучших (и не самых очевидных) книг Владимира Сорокина Неуправляемый хаос: 7 лучших (и не самых очевидных) книг Владимира Сорокина

На примере 7 книг рассказываем, как Владимир Сорокин играет с текстом

Правила жизни
Эволюция платежных сервисов в регионах: от налички до BNPL Эволюция платежных сервисов в регионах: от налички до BNPL

Потенциал платежных систем и развитие финтеха в российских регионах

Inc.
Нужно ли рассказывать всю правду о себе партнеру: 3 истории Нужно ли рассказывать всю правду о себе партнеру: 3 истории

Три истории, которые доказывают: иногда не стоит раскрывать всю правду партнеру

Psychologies
Используй ложку и телефон: 20 способов доставить себе удовольствие Используй ложку и телефон: 20 способов доставить себе удовольствие

Двадцать разных способов мастурбации на любой вкус и цвет

Cosmopolitan
Телескоп горизонта событий достиг рекордно большой точности наблюдений Телескоп горизонта событий достиг рекордно большой точности наблюдений

Как провели наземные наблюдения за квазарами с большим угловым разрешением

N+1
Куда уходят кадры: проблема «атомных городов» Куда уходят кадры: проблема «атомных городов»

Как обстоит ситуация с привлечением сотрудников в «атомных» ЗАТО

ФедералПресс
Строго по записи Строго по записи

Контролировать свой рацион полезно всем без исключения

Лиза
Разумный рацион Разумный рацион

9 способов экономить на еде, продолжая питаться нормально

Лиза
Никогда не сдавайся: атлеты, которые шли к олимпийскому золоту дольше всех Никогда не сдавайся: атлеты, которые шли к олимпийскому золоту дольше всех

Спортсмены, которые десятилетиями шли к победе на Играх

Forbes
Перегрелись: зачем останавливать глобальное потепление, если оно уже наступило Перегрелись: зачем останавливать глобальное потепление, если оно уже наступило

О том, как бороться с изменением климата, когда оно уже наступило

Forbes
«Идущая впереди»: как художница Кэролайн Уэлдон защищала права индейцев севера «Идущая впереди»: как художница Кэролайн Уэлдон защищала права индейцев севера

Как художница-эмигрантка стала секретарем вождя

Forbes
В современном прочтении В современном прочтении

Интерьер на стыке классики и минимализма

SALON-Interior
Опытным путем Опытным путем

20 советов, которые помогут изменить жизнь к лучшему

Men Today
Первые спутники СССР и США: почему они такие разные Первые спутники СССР и США: почему они такие разные

Чем отличались наш и зарубежный первые космические спутники?

ТехИнсайдер
Неудачный «Большой скачок»: зачем Китай закупал воробьев у Канады и СССР Неудачный «Большой скачок»: зачем Китай закупал воробьев у Канады и СССР

«Большой скачок»: зачем Китай решил истребить воробьев?

ТехИнсайдер
Николай Бобров: «Перу — это севиче и чича морада» Николай Бобров: «Перу — это севиче и чича морада»

Николай Бобров о стажировке в Перу, колорите и четырех тысячах видов картошки

Bones
Комариная охота: как выбрать фумигатор и облегчить себе жизнь? Комариная охота: как выбрать фумигатор и облегчить себе жизнь?

Что нужно учитывать при выборе фумигатора?

ТехИнсайдер
10 вредных советов, которые помогут не дожить до старости 10 вредных советов, которые помогут не дожить до старости

Халатное отношение к собственному здоровью способно сильно укоротить вашу жизнь

Psychologies
Полина Luxury Girl: «Не надо выкладывать в дейтинг-сервисы свою фотографию из гаража с гаечным ключом в руках» Полина Luxury Girl: «Не надо выкладывать в дейтинг-сервисы свою фотографию из гаража с гаечным ключом в руках»

Полины Luxury Girl — о сервисах для знакомств и поиске партнера

Maxim
Открытый рот «кричащей» мумии объяснили моментальным трупным окоченением Открытый рот «кричащей» мумии объяснили моментальным трупным окоченением

Египетские ученые исследовали мумию так называемой кричащей женщины

N+1
На авто по автономиям На авто по автономиям

Как увидеть как можно больше этнической самобытности? Садиться за руль!

2Xplore
Худеем по науке Худеем по науке

Какие гормоны отвечают за вес и как похудеть в случае гормонального дисбаланса

Лиза
Парадокс Спящей красавицы Парадокс Спящей красавицы

Возможно ли впасть в оцепенение на столетие и потом вернуться к жизни?

Вокруг света
Михаил Владимиров: «Михаил Державин стал мне вторым отцом» Михаил Владимиров: «Михаил Державин стал мне вторым отцом»

Мои герои в кино не всегда положительные, но зато открытые и веселые люди

Коллекция. Караван историй
Охотник за бактериями: как Роберт Кох обнаружил возбудителей сибирской язвы, туберкулеза и холеры Охотник за бактериями: как Роберт Кох обнаружил возбудителей сибирской язвы, туберкулеза и холеры

Роберт Кох первым обнаружил, что виной холере были маленькие бактерии...

ТехИнсайдер
«Понадобилось 60 лет»: как Япония осмысливает военные преступления прошлого «Понадобилось 60 лет»: как Япония осмысливает военные преступления прошлого

Как Япония подходит к проблемному разговору о вине и ответственности за прошлое

Forbes
Чужбина больше не интересует: как менялось мнение россиян об эмиграции Чужбина больше не интересует: как менялось мнение россиян об эмиграции

В России рекордно снизилось число граждан, желающих попытать счастье за рубежом

ФедералПресс
Люди из будущего Люди из будущего

Время не имеет над тайцами силы, ведь каждый продолжается в вечности

Вокруг света
3 частые ситуации, в которых мы раним близких, сами того не желая 3 частые ситуации, в которых мы раним близких, сами того не желая

Будьте осторожны: подобное поведение действительно может убить отношения!

Psychologies
Открыть в приложении