Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Рогатый нянь Рогатый нянь

«Дело Макмартинов» считается самым дорогостоящим судебным разбирательством в США

Maxim
5 вопросов, которые помогут узнать истинный возраст мозга — протестируй свой! 5 вопросов, которые помогут узнать истинный возраст мозга — протестируй свой!

Можно ли определить возраст мозга?

VOICE
Самые дурацкие афродизиаки в истории человечества Самые дурацкие афродизиаки в истории человечества

Дуриан, картошка, яд жабы и другие странные афродизиаки

Maxim
Траты на спорт Траты на спорт

Во сколько обходятся россиянам тренировки

Деньги
Надевая маску Надевая маску

7 досадных ошибок, которые ты можешь допустить, используя маски для лица

Лиза
Передачи-хиты советского ТВ, которые сегодня смотреть невозможно Передачи-хиты советского ТВ, которые сегодня смотреть невозможно

Деды, вспоминающие любимые программы молодости, хорошего не посоветуют

Maxim
«Я умру, чтобы она получила страховку»: 3 самых безумных поступка русских дворян ради любви «Я умру, чтобы она получила страховку»: 3 самых безумных поступка русских дворян ради любви

Из-за страсти аристократы совершали по-настоящему безумные поступки

VOICE
Музыка, грим, спецэффекты: за какие фильмы женщины впервые получали «Оскар» Музыка, грим, спецэффекты: за какие фильмы женщины впервые получали «Оскар»

Женщины, которые шаг за шагом отвоевывали свое место в киноиндустрии

Forbes
8 Марта: что нужно знать о празднике в XXI веке — исторический разбор 8 Марта: что нужно знать о празднике в XXI веке — исторический разбор

Изучаем, как появилось и изменилось Восьмое Марта в нашем календаре

Psychologies
Смертная уборка: мудрая шведская система наведения порядка, которая легче и понятнее, чем метод Мари Кондо Смертная уборка: мудрая шведская система наведения порядка, которая легче и понятнее, чем метод Мари Кондо

Дёстеднинг — шведское изобретение для обеспечения комфорта в доме

VOICE
Популярный автор любовных романов рассказала, зачем мужчины читают книги этого жанра Популярный автор любовных романов рассказала, зачем мужчины читают книги этого жанра

Что общего у любовных романов и порнофильмов?

Maxim
Лучшие упражнения для любительниц каблуков, которые ты сможешь выполнять прямо дома Лучшие упражнения для любительниц каблуков, которые ты сможешь выполнять прямо дома

Самые простых способах спасти ноги после каблуков

VOICE
Заковать в скандалы Заковать в скандалы

Скандальный манифест – отдельный (если не главный) футуристический жанр

Правила жизни
Британцы — алкоголики? Каждый выпивает примерно 10 литров в год, но цифра снижается Британцы — алкоголики? Каждый выпивает примерно 10 литров в год, но цифра снижается

Британцы много пьют? С чем это связано?

Maxim
7 моментов в ужастиках, где видно халтурные спецэффекты 7 моментов в ужастиках, где видно халтурные спецэффекты

Проматывай эти сцены, чтобы не рассмеяться!

Maxim
Полный, но не только. Тест-драйв Omoda C5 AWD Полный, но не только. Тест-драйв Omoda C5 AWD

Компактный кроссовер С5 свежеиспеченной марки Omoda получил новую модификацию

РБК
Что такое спидран или как пройти Atomic Heart за 6 минут? Что такое спидран или как пройти Atomic Heart за 6 минут?

Почему спидраны заслуживают вашего внимания?

CHIP
Как избавиться от запаха в холодильнике раз и навсегда: натуральные освежители найдутся в каждом доме Как избавиться от запаха в холодильнике раз и навсегда: натуральные освежители найдутся в каждом доме

Как сохранить продукты в холодильнике в свежести и чистоте?

ТехИнсайдер
Самое мощное неядерное оружие в мире: российская вакуумная бомба Самое мощное неядерное оружие в мире: российская вакуумная бомба

TechInsider удалось пообщаться с разработчиками удивительной вакуумной бомбы

ТехИнсайдер
Какой шанс встретить идеального партнера: математические аспекты любви — проверьте на практике Какой шанс встретить идеального партнера: математические аспекты любви — проверьте на практике

Применимы ли математические методы к любовному поиску?

Psychologies
Прозрачное платье и микро-шорты: самые дерзкие студенческие наряды Кейт Миддлтон, вскружившие голову принцу Уильяму Прозрачное платье и микро-шорты: самые дерзкие студенческие наряды Кейт Миддлтон, вскружившие голову принцу Уильяму

Как обычная девушка из университета смогла покорить наследника престола?

VOICE
«Лягушка в кипятке»: как мы привыкаем к домашнему насилию «Лягушка в кипятке»: как мы привыкаем к домашнему насилию

Что такое синдром «лягушки в кипятке»

Psychologies
Найти истину: как на самом деле погиб Гагарин Найти истину: как на самом деле погиб Гагарин

Рассказываем об официальной причине смерти Юрия Гагарина

ТехИнсайдер
Лунная пыль. Как космическая разработка может остановить изменение климата на Земле Лунная пыль. Как космическая разработка может остановить изменение климата на Земле

Какие еще технологии применяют для того, чтобы охладить планету

СНОБ
Пять причин, почему искусственный интеллект не сможет заменить программистов Пять причин, почему искусственный интеллект не сможет заменить программистов

Почему работать с профессионалами выгоднее, чем с искусственным интеллектом

Forbes
Машины времени Машины времени

В чем прелесть старинных вещей, в частности автомобилей?

Y Magazine
«Партнер — зеркало, которое показывает темное внутри нас»: как отношения помогают личностному росту «Партнер — зеркало, которое показывает темное внутри нас»: как отношения помогают личностному росту

В отношениях кроется огромный потенциал для личностного роста

Psychologies
Взлёты и падения. Особенности создания чешского внедорожника Взлёты и падения. Особенности создания чешского внедорожника

В этот раз мы поговорим о создании внедорожника ŠKODA

4x4 Club
От первого лица: 5 зарубежных книг о женщинах, которые стоит прочитать От первого лица: 5 зарубежных книг о женщинах, которые стоит прочитать

Автобиографические книги наших современниц

Правила жизни
«Мы шутили, что к нам еще только медведь не пришел»: Анастасия Стежко о съемках сериала «Вампиры средней полосы» «Мы шутили, что к нам еще только медведь не пришел»: Анастасия Стежко о съемках сериала «Вампиры средней полосы»

Анастасия Стежко раскрыла секреты съемок экшн-сцен «Вампиров средней полосы»

VOICE
Открыть в приложении