Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

14 способов признаться себе в любви не только на словах 14 способов признаться себе в любви не только на словах

Чтобы дарить любовь другим людям, важно сначала позаботиться о себе

Правила жизни
Оказывается, красотки: как выглядели в молодости актрисы, которых мы знаем только по ролям бабушек Оказывается, красотки: как выглядели в молодости актрисы, которых мы знаем только по ролям бабушек

Как выглядели в молодости актрисы, которых мы знаем только по ролям бабушек?

VOICE
Самые дурацкие афродизиаки в истории человечества Самые дурацкие афродизиаки в истории человечества

Дуриан, картошка, яд жабы и другие странные афродизиаки

Maxim
Эгоактивизм Эгоактивизм

«Свобода в квадрате»: научдок об освоении космоса

Weekend
20 лет «Иракской свободе» 20 лет «Иракской свободе»

Юбилей американской интервенции в Ирак

Эксперт
В чём отличие шкалы Фаренгейта от шкалы Цельсия и какая из них лучше? В чём отличие шкалы Фаренгейта от шкалы Цельсия и какая из них лучше?

Почему американцы так прикипели к шкале Фаренгейта?

ТехИнсайдер
Почему рыбным днём считается именно четверг? Почему рыбным днём считается именно четверг?

Почему из всех семи дней в недели рыбным днем выбрали именно четверг?

ТехИнсайдер
Смерть отца и анорексия: 8 фактов о Кейт Бекинсейл, которых ты не знала Смерть отца и анорексия: 8 фактов о Кейт Бекинсейл, которых ты не знала

8 увлекательных фактов о Кейт Бекинсейл

VOICE
Недостающая деталь пазла: как ChatGPT может улучшить экономику брокеров Недостающая деталь пазла: как ChatGPT может улучшить экономику брокеров

Как ChatGPT помогает создавать дешевый контент

Forbes
Всем Гутцайт! Всем Гутцайт!

Как Сергей Гутцайт за свой счет реставрирует памятники архитектуры

Собака.ru
«Потанцуйте со мной»: каким получился байопик о Уитни Хьюстон «Потанцуйте со мной»: каким получился байопик о Уитни Хьюстон

Почему кино Кейси Леммонс теряется на фоне музыкальных байопиков последних лет

Forbes
Криминальный тур для искателей приключений: 6 захватывающих детективов из разных стран Криминальный тур для искателей приключений: 6 захватывающих детективов из разных стран

О таком туристические агентства не рассказывают в рекламных буклетах!

Maxim
Аллергия на работу Аллергия на работу

Вызвать приступ аллергии может даже неприятный человек и работа!

Лиза
Взлёты и падения. Особенности создания чешского внедорожника Взлёты и падения. Особенности создания чешского внедорожника

В этот раз мы поговорим о создании внедорожника ŠKODA

4x4 Club
Исследование «Мультивселенных» поможет найти лучшие условия для жизни Исследование «Мультивселенных» поможет найти лучшие условия для жизни

Наша Вселенная — это весь мир или может существовать что-то большее?

ТехИнсайдер
Зевают все: ученые объяснили, почему люди зевают, когда это делают другие Зевают все: ученые объяснили, почему люди зевают, когда это делают другие

В чем причина заразительности зевания?

ТехИнсайдер
Городские легенды Москвы Городские легенды Москвы

Что Иосиф Сталин приказал построить под Главным зданием МГУ на Воробьевых горах?

Культура.РФ
Мой дорогой мобильник: завершение истории о роли смартфона в жизни подростков Мой дорогой мобильник: завершение истории о роли смартфона в жизни подростков

Телефон как яблоко раздора между родителями и детьми

СНОБ
Плюсы и минусы самостоятельного ремонта ваших гаджетов Плюсы и минусы самостоятельного ремонта ваших гаджетов

Следует ли вам починить свой треснувший экран самостоятельно?

ТехИнсайдер
Между нами, женщинами Между нами, женщинами

Эндометриоз: стоит ли переживать и можно ли избавиться от него навсегда

Лиза
Премию Абеля присудили за работы по дифференциальным уравнениям в частных производных Премию Абеля присудили за работы по дифференциальным уравнениям в частных производных

Премия Абеля: вклад в теорию регулярности нелинейных дифференциальных уравнений

N+1
Кто решил отмечать День дурака 1 апреля и почему сегодня этот «праздник» перестал быть смешным? Кто решил отмечать День дурака 1 апреля и почему сегодня этот «праздник» перестал быть смешным?

Две теории, как зародился нелюбимый многими День дураков

ТехИнсайдер
Двое школьников зарезали свою одноклассницу, посмотрев фильм «Крик». Они записали радостное видео Двое школьников зарезали свою одноклассницу, посмотрев фильм «Крик». Они записали радостное видео

Как два подростка решили стать убийцами

ТехИнсайдер
«Наступает эпоха умного ESG» «Наступает эпоха умного ESG»

Почему важно придерживаться принципов устойчивого развития

Деньги
Матчасть отечественного планеризма: самые известные планеры, созданные в СССР Матчасть отечественного планеризма: самые известные планеры, созданные в СССР

Изучаем матчасть советского планеризма

ТехИнсайдер
8 легендарных «голых платьев» звезд — от Мэрилин Монро до Рианны 8 легендарных «голых платьев» звезд — от Мэрилин Монро до Рианны

Рассказываем о самых известных нарядах, которые открывали больше, чем скрывали

Правила жизни
Почему можно оживить замороженных лягушек, но не людей? Почему можно оживить замороженных лягушек, но не людей?

Как лягушкам удается возвращаться к жизни после «превращения в ледышки»?

ТехИнсайдер
Формула жизни Формула жизни

Корейцы уверены, что лапша – символ долголетия, а суп – его гарантия

Вокруг света
Брови на зависть Брови на зависть

От аккуратного и ухоженного вида бровей зависит общее впечатление от образа

Лиза
Нюрнбергские расовые законы Нюрнбергские расовые законы

Антисемитизм лежал в основе нацистской идеологии

Дилетант
Открыть в приложении