Новый способ оптимизации предварительного обучения Больших языковых моделей

ТехИнсайдерHi-Tech

Разработан более дешевый способ обучения Больших языковых моделей

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы. Это позволит значительно удешевить разработку Больших языковых моделей и сделать их создание более доступным независимым разработчикам.

Владимир Губайловский

ce9cebf76db8bc7877647f1250420a14_ce_1974x1316x0x83.jpg
Unsplash.com. DeepMind

Цель таких работ — сделать Большие языковые модели (такие как GPT), требующие миллионы на обучение, работающие на мощнейших компьютерах с огромными дата-центрами, доступными на домашнем компьютере или смартфоне. И разработчики двигаются в этом направлении.

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы.

ChatGPT и другие приложения, использующие Большие языковые модели (LLM), находят все более широкое применение и привлекают пристальное внимание СМИ. Однако в сфере LLM доминируют несколько крупных технологических компаний, поскольку предварительное обучение этих моделей является чрезвычайно дорогостоящим процессом: стоимость начинается с 10 миллионов долларов. Сколько стоило обучение GPT не сообщается, но оценить его в миллиард долларов не будет серьезным преувеличением.

«Большие языковые модели не очень-то доступны для небольших организаций или академических групп», — говорит Хонг Лю, аспирант факультета информатики Стэнфордского университета.

Чтобы изменить ситуацию, Лю и его коллеги решили усовершенствовать существующие методы оптимизации LLM. В результате был разработан подход под названием Sophia, который сокращает время предварительного обучения вдвое. 

Оптимизация оптимизации

507231df3ff536c824bc47835115b915.jpg
Unsplash.com. DeepMind

Чтобы оптимизировать предварительное обучение LLM ученые использовали два приема. Первый, известный как оценка кривизны, не нов, но команда Стэнфорда нашла способ сделать его более эффективным.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Молекулы, необходимые для жизни, найдены в образцах астероида Бенну Молекулы, необходимые для жизни, найдены в образцах астероида Бенну

В породе, доставленной с астероида Бенну, обнаружены 14 из 20 аминокислот

ТехИнсайдер
В новом свете: почему умный дом прирастает за счет ламп и светильников В новом свете: почему умный дом прирастает за счет ламп и светильников

Светильники и лампы — самый простой способ сделать дом интеллектуальным

Forbes
Здоров ли сайт: как провести аудит самостоятельно и когда привлекать специалистов Здоров ли сайт: как провести аудит самостоятельно и когда привлекать специалистов

Как самостоятельно выявить слабые места сайта?

Inc.
Birkin, корзинки, показы: главные модные моменты Джейн Биркин Birkin, корзинки, показы: главные модные моменты Джейн Биркин

Чем модная индустрия обязана Джейн Биркин?

Правила жизни
В здоровых ли вы отношениях? Проверьте по 13 пунктам опросника В здоровых ли вы отношениях? Проверьте по 13 пунктам опросника

Как выглядит союз, к которому стоит стремиться?

Psychologies
Без огонька Без огонька

Как избежать штрафа за разведение костра на природе и дачном участке

Лиза
Вода: сколько пить в литрах? Вода: сколько пить в литрах?

Правильный питьевой режим — что это за зверь?

Здоровье
«Судьбы икон в Стране Советов» «Судьбы икон в Стране Советов»

Как православное искусство помогло индустриализации

N+1
Панк, алкоголь, нечисть: из чего состоит группа «Король и Шут» Панк, алкоголь, нечисть: из чего состоит группа «Король и Шут»

Покопаемся во вселенной группы КиШ и рассказать, из чего она устроена

Правила жизни
Помоги себе сам: какими бывают практики самотерапии Помоги себе сам: какими бывают практики самотерапии

Как правильно себя поддерживать и почему самопомощь не заменит психолога

Forbes
Как вырваться из институциональной ловушки Как вырваться из институциональной ловушки

Двадцать первый век все чаще называют веком Африки

Эксперт
Ученые прочитали белки парантропа — древнего родственника человека, которому 2 миллиона лет Ученые прочитали белки парантропа — древнего родственника человека, которому 2 миллиона лет

Древние белки раскрывают историю человечества

ТехИнсайдер
Как понять, что партнер «выключается» из отношений: 5 показательных признаков Как понять, что партнер «выключается» из отношений: 5 показательных признаков

Как понять, что партнер больше не видит в отношениях перспектив?

Psychologies
Модное существительное Модное существительное

Noun — региональный фешен-бренд, разросшийся до федеральной сети в 25 точек

Эксперт
Место на кухне: 10 лучших фильмов и сериалов про еду, рестораны и работу шеф-поваров Место на кухне: 10 лучших фильмов и сериалов про еду, рестораны и работу шеф-поваров

Фильмы и сериалы про высокую кухню, забегаловки и вспыльчивых шеф-поваров

Forbes
«Cтрах одиночества родом из детства»: как рождается аутофобия — мнение психиатра «Cтрах одиночества родом из детства»: как рождается аутофобия — мнение психиатра

Почему мы так боимся одиночества и при чем тут отношения с матерью?

Psychologies
Многое теряют Многое теряют

Насколько безопасны новые инъекции для похудения?

VOICE
Кандидат в вакцины Кандидат в вакцины

Российские ученые получили вакцинный штамм, эффективно защищающий свиней от АЧС

Агроинвестор
Комедия случая: Эльдар Рязанов — режиссер, который не стал моряком Комедия случая: Эльдар Рязанов — режиссер, который не стал моряком

О гении советской комедии Эльдаре Рязанове

СНОБ
5 самых интересных книг о космосе 5 самых интересных книг о космосе

Космос на бумаге: книги известных ученых, исследователей и астронавтов

Maxim
Гора идолов Гора идолов

Одно из чудес России – столбы Маньпупунёр

Лиза
Американские студенты одинаково сдали экзамены очно и онлайн Американские студенты одинаково сдали экзамены очно и онлайн

Возможность списать во время онлайн-экзамена не принесла особой выгоды

N+1
Душевная пустота: что это и как ее правильно заполнять — 5 шагов Душевная пустота: что это и как ее правильно заполнять — 5 шагов

Откуда берутся апатия и чувство безысходности?

Psychologies
Астрономы используют дипфейки, созданные ИИ, для исследования солнечной атмосферы Астрономы используют дипфейки, созданные ИИ, для исследования солнечной атмосферы

Как созданные ИИ изображения помогают исследовать корональный солнечный дождь

ТехИнсайдер
«Кормилец» и «хранительница очага»: чему будут учить детей на уроках «Семьеведения» «Кормилец» и «хранительница очага»: чему будут учить детей на уроках «Семьеведения»

Чему посвящены учебные программы по подготовке школьников к семейной жизни?

Forbes
Лечить нельзя исправить Лечить нельзя исправить

Можно ли редактировать геном людей?

ТехИнсайдер
Иномарка для музы и споры с налоговой: как зарабатывал и сколько тратил Маяковский Иномарка для музы и споры с налоговой: как зарабатывал и сколько тратил Маяковский

Владимир Маяковский даже в обращении с деньгами не изменял себе

Forbes
Закон благосостояния Закон благосостояния

Явление сверхтекучести капиталов в экономике. Как его преодолеть?

Эксперт
4 кризиса брака: когда ждать и как преодолеть — мнение психолога 4 кризиса брака: когда ждать и как преодолеть — мнение психолога

Когда в семьях чаще всего случаются кризисы?

Psychologies
Выбираем стиральную машину: на что смотреть, чтобы не потратить деньги зря Выбираем стиральную машину: на что смотреть, чтобы не потратить деньги зря

Не так просто выбрать лучшую стиральную машину по соотношению цены и качества

CHIP
Открыть в приложении