SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Что происходит в мозге человека, когда он смотрит на шедевр Вермеера Что происходит в мозге человека, когда он смотрит на шедевр Вермеера

Ученые измерили реакцию мозга при просмотре картины Йоханнеса Вермеера

ТехИнсайдер
Как формируется мнение человека о самом себе. Отрывок из книги психиатра Как формируется мнение человека о самом себе. Отрывок из книги психиатра

Отрывок из книги психиатра и нейробиолога Грегори Бернса «Иллюзия себя»

СНОБ
Еще до прочтения сжечь: почему киберпреступники не снижают фишинговую активность Еще до прочтения сжечь: почему киберпреступники не снижают фишинговую активность

Почему фишинг остается наиболее эффективным способом социальной инженерии

Forbes
Старость – не данность Старость – не данность

Можно ли на самом деле хотя бы замедлить старение?

Вокруг света
5 распространенных ошибок при считывании языка тела 5 распространенных ошибок при считывании языка тела

Пять распространенных ошибок, связанных с чтением языка тела других людей

Psychologies
На авто по автономиям На авто по автономиям

Как увидеть как можно больше этнической самобытности? Садиться за руль!

2Xplore
Природа Черногории и гастрономия Адриатики: что делать в Будве и окрестностях Природа Черногории и гастрономия Адриатики: что делать в Будве и окрестностях

Чем заняться в Будве и окрестностях во время путешествия

Forbes
Цена ошибки — сорняк: зачем в СССР сажали борщевик и что из этого получилось Цена ошибки — сорняк: зачем в СССР сажали борщевик и что из этого получилось

Почему советские селекционеры предложили распространять опасное растение

ТехИнсайдер
Радиоэлектронная борьба в армиях стран НАТО Радиоэлектронная борьба в армиях стран НАТО

Программы развития радиоэлектронной борьбы в России и США

Обозрение армии и флота
10 лучших фильмов Дастина Хоффмана 10 лучших фильмов Дастина Хоффмана

Лучшие картины с участием Дастина Хоффмана

Правила жизни
Дмитрий Ливанов: «В XXI веке само понятие специальности становится устаревшим» Дмитрий Ливанов: «В XXI веке само понятие специальности становится устаревшим»

Дмитрий Ливанов о прошлом, настоящем и будущем российского образования

РБК
Держись подальше. 7 признаков токсичного партнера Держись подальше. 7 признаков токсичного партнера

Как вычислить токсичного партнера по определенным признакам в поведении

Лиза
Лоскутное одеяло: в стиле пэтчворк Лоскутное одеяло: в стиле пэтчворк

Как создать лоскутные украшения дома из обрезки старых тканей?

КАНТРИ Русская азбука
Царство покоя Царство покоя

7 интерьерных секретов, которые помогут быстрее засыпать

Лиза
Расплескалась седина Расплескалась седина

Началась новая волна массового обесцвечивания кораллов в Мировом океане

2Xplore
Как установить приложения на телевизор со Smart TV Как установить приложения на телевизор со Smart TV

Как правильно установить стороннюю программу на телевизор?

CHIP
«Никто не идеален»: 5 шагов, чтобы избавиться от недостатков «Никто не идеален»: 5 шагов, чтобы избавиться от недостатков

Признание своих недостатков — первый шаг к изменениям

Psychologies
Ангелы прилетели Ангелы прилетели

Мастер-класс по самодельным ангелам, дарящим ощущение праздника и чудес

КАНТРИ Русская азбука
Россия по-итальянски Россия по-итальянски

Все подробности жизни и «невероятных приключений итальянца в России»

2Xplore
Федор Гамалея Федор Гамалея

Актер Федор Гамалея — праправнук гениального ученого, сделавший себя сам

Собака.ru
Сезонная эстафета клематисов Сезонная эстафета клематисов

Видовое разнообразие рода клематисов для садового дизайна

Наука и жизнь
Заменит ли нейросеть живого архитектора? Заменит ли нейросеть живого архитектора?

Архитекторы пытаются уловить контуры и сущность городов будущего

Монокль
7 суровых автодомов, сделанных российскими умельцами 7 суровых автодомов, сделанных российскими умельцами

Российские автодома с суровым вайбом

Maxim
Сталкер, топор и подземные боги: Игорь Яковенкo выпустил языческий альбом «Пантеон» Сталкер, топор и подземные боги: Игорь Яковенкo выпустил языческий альбом «Пантеон»

Композитор Игорь Яковенко и барабанщик Петр Ившин выпускают альбом «Пантеон»

СНОБ
Эта кукла напугала американцев! Узнайте историю игрушки «с паранормальными способностями» Эта кукла напугала американцев! Узнайте историю игрушки «с паранормальными способностями»

Почему людям страшно находиться рядом с этой куклой?

ТехИнсайдер
Новая смена Новая смена

Как помочь детям адаптироваться в незнакомом классе и не нажить проблем

Лиза
10 фильмов фестиваля «Докер» 10 фильмов фестиваля «Докер»

Самые интересные фильмы из разных программ фестиваля «Докер»

Weekend
Ученый Горелов рассказал, как найти утечки тепла в доме Ученый Горелов рассказал, как найти утечки тепла в доме

Есть ли польза от бесконтактного термометра, где искать «мостики холода»?

ТехИнсайдер
Дело сдвинулось: новый общественный электротранспорт Калининграда Дело сдвинулось: новый общественный электротранспорт Калининграда

Любопытно, какие именно троллейбусы приедут в Калининград?

ФедералПресс
Лето в активе Лето в активе

Если лежать на пляже скучновато, почему бы не попробовать другие виды отдыха?

Лиза
Открыть в приложении