Новый способ оптимизации предварительного обучения Больших языковых моделей

ТехИнсайдерHi-Tech

Разработан более дешевый способ обучения Больших языковых моделей

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы. Это позволит значительно удешевить разработку Больших языковых моделей и сделать их создание более доступным независимым разработчикам.

Владимир Губайловский

ce9cebf76db8bc7877647f1250420a14_ce_1974x1316x0x83.jpg
Unsplash.com. DeepMind

Цель таких работ — сделать Большие языковые модели (такие как GPT), требующие миллионы на обучение, работающие на мощнейших компьютерах с огромными дата-центрами, доступными на домашнем компьютере или смартфоне. И разработчики двигаются в этом направлении.

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы.

ChatGPT и другие приложения, использующие Большие языковые модели (LLM), находят все более широкое применение и привлекают пристальное внимание СМИ. Однако в сфере LLM доминируют несколько крупных технологических компаний, поскольку предварительное обучение этих моделей является чрезвычайно дорогостоящим процессом: стоимость начинается с 10 миллионов долларов. Сколько стоило обучение GPT не сообщается, но оценить его в миллиард долларов не будет серьезным преувеличением.

«Большие языковые модели не очень-то доступны для небольших организаций или академических групп», — говорит Хонг Лю, аспирант факультета информатики Стэнфордского университета.

Чтобы изменить ситуацию, Лю и его коллеги решили усовершенствовать существующие методы оптимизации LLM. В результате был разработан подход под названием Sophia, который сокращает время предварительного обучения вдвое. 

Оптимизация оптимизации

507231df3ff536c824bc47835115b915.jpg
Unsplash.com. DeepMind

Чтобы оптимизировать предварительное обучение LLM ученые использовали два приема. Первый, известный как оценка кривизны, не нов, но команда Стэнфорда нашла способ сделать его более эффективным.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Кетчуп и зубная щетка: неожиданные вещи, которые изобрели китайцы Кетчуп и зубная щетка: неожиданные вещи, которые изобрели китайцы

На самом деле китайцы изобрели множество привычных нам вещей

ТехИнсайдер
Шпион, пытающийся выйти вон Шпион, пытающийся выйти вон

Как «Заключенный» Патрика Макгуэна говорит о возможности и невозможности свободы

Weekend
Революция в мире моды: как технологии меняют нашу одежду Революция в мире моды: как технологии меняют нашу одежду

Как уже сейчас в новинках мира моды проявляются тренды гардероба будущего

Inc.
Почему Мадонна оказалась в реанимации: 6 факторов Почему Мадонна оказалась в реанимации: 6 факторов

Как излишне активный образ жизни и перфекционизм разрушают нас?

Psychologies
Сохраняйте спокойствие Сохраняйте спокойствие

Спокойствие — мощный способ достижения успеха в жизни

kiozk originals
Магнитная буря: что это и как влияет на здоровье — объясняет врач-терапевт Магнитная буря: что это и как влияет на здоровье — объясняет врач-терапевт

Как и когда возникают магнитные бури? Как они cказываются на нашем здоровье?

Psychologies
Эволюционное несоответствие Эволюционное несоответствие

Мы создавались для жизни в дикой природе с определёнными условиями

Robb Report
Почему Великобритания вступила в Первую мировую войну Почему Великобритания вступила в Первую мировую войну

Отрывок из книги «Уинстон Черчилль: его эпоха, его преступления»

СНОБ
Трудные партнеры: 13 типов мужчин и женщин — наблюдения коуча Трудные партнеры: 13 типов мужчин и женщин — наблюдения коуча

Коуч предлагает несколько психологических портретов трудных мужчин и женщин

Psychologies
Спутники Starlink излучают радиоволны и создают помехи астрономам Спутники Starlink излучают радиоволны и создают помехи астрономам

Спутники Starlink от SpaceX создают помехи радиоастрономическим наблюдениям

ТехИнсайдер
Кевин Уилсон: «Не время паниковать». Ностальгическая книга о взрослении Кевин Уилсон: «Не время паниковать». Ностальгическая книга о взрослении

Глава из откровенного и точного романа о взрослении Кевина Уилсона

СНОБ
О желания до жалости: 5 компонентов любви — мнение философа О желания до жалости: 5 компонентов любви — мнение философа

Из чего состоит чувство любви?

Psychologies
Сила притяжения Сила притяжения

Быть желанной хочет каждая женщина. Но что такое «соблазнительность»?

Лиза
Политика и бокс: семь фильмов о женской карьере в «мужских» профессиях Политика и бокс: семь фильмов о женской карьере в «мужских» профессиях

Фильмы о женщинах в политике, силовых видах спорта, армии, на шахте и в такси

Forbes

История бельгийского солдата, которого деньги спасли от смертельного ранения

ТехИнсайдер
«Переполненная комната»: Том Холланд в сериале о подростке с множеством субличностей «Переполненная комната»: Том Холланд в сериале о подростке с множеством субличностей

«Переполненная комната» — новый проект шоураннера Акивы Голдсмана

Forbes
«Посмотри, в каких я сапогах»: как панк-атрибутика вышла за пределы субкультуры «Посмотри, в каких я сапогах»: как панк-атрибутика вышла за пределы субкультуры

Во многом благодаря КиШ стиль панк перестал быть исключительно субкультурным

Правила жизни
Он мог соперничать с Twitter, но был «убит»: как появился и почему провалился Google Reader Он мог соперничать с Twitter, но был «убит»: как появился и почему провалился Google Reader

Почему руководители Google закрыли один из своих «самых дальновидных» проектов?

VC.RU
Высокая и устойчивая: почему инфляция в ЕС не сдает позиции Высокая и устойчивая: почему инфляция в ЕС не сдает позиции

Европейский центральный банк повышает процентные ставки

Forbes
Как перестать ненавидеть понедельники: 3 простых решения Как перестать ненавидеть понедельники: 3 простых решения

Как построить свою жизнь, чтобы мысли о понедельнике приносили радость?

Psychologies
Настоящая женщина: как вредят стереотипы — интервью психолога Настоящая женщина: как вредят стереотипы — интервью психолога

Почему современные женщины слишком зависят от мужского мнения?

Psychologies
Как текстильная промышленность влияла на культуру, экономику и политику Как текстильная промышленность влияла на культуру, экономику и политику

О тканях как об одном из главных товаров в истории человечества

СНОБ
5 антиутопий, которые стоит перечитать 5 антиутопий, которые стоит перечитать

Пять известных романов, которые помогут заглянуть в воображаемый мир

СНОБ
Виртуальный номер телефона: что это, и как его получить Виртуальный номер телефона: что это, и как его получить

Что такое виртуальный номер телефона и зачем он нужен?

CHIP
Цирк не для детей и кинетическое искусство: что нужно знать о художнике Александре Колдере Цирк не для детей и кинетическое искусство: что нужно знать о художнике Александре Колдере

О крошечном цирке и проволочных портретах Александра Колдера

Правила жизни
Когда не было атомов: что телескоп «Евклид» расскажет о природе Вселенной Когда не было атомов: что телескоп «Евклид» расскажет о природе Вселенной

Телескоп «Евклид»: чем они выделяется среди других огромных телескопов?

Forbes
«Изобретение прав человека: история» «Изобретение прав человека: история»

Как в обществе менялось восприятие пыток

N+1
​​Кастер Семеня выиграла суд, самая унизительная история мирового спорта не закончена ​​Кастер Семеня выиграла суд, самая унизительная история мирового спорта не закончена

Самое унизительное и неоднозначное судебное дело в истории мирового спорта

Forbes
Прыщи, усы и седина: «неидеальные» знаменитости, которым плевать на стандарты красоты Прыщи, усы и седина: «неидеальные» знаменитости, которым плевать на стандарты красоты

Эти звезды борются против бьюти-стереотипов, которые нередко портят нам жизнь

VOICE
10 фото Шинейд О'Коннор, которые говорят все о ее жизни 10 фото Шинейд О'Коннор, которые говорят все о ее жизни

Самые важные факты из жизни Шинейд О'Коннор

Maxim
Открыть в приложении