Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

9 фактов о клиторе, которые должен знать каждый мужчина! 9 фактов о клиторе, которые должен знать каждый мужчина!

Чтобы демистифицировать клитор, стоит узнать несколько простых вещей

ТехИнсайдер
Свобода и булочка Свобода и булочка

Солистка группы «АлоэВера» Вера Мусаелян и фотограф Катя Алагич встретились

Seasons of life
Гормон-шило Гормон-шило

Новые открытия о нашем главном гормоне – тестостероне

Maxim
Человек может получить крылья, щупальца и дополнительные конечности: как ученые расширяют возможности наших тел Человек может получить крылья, щупальца и дополнительные конечности: как ученые расширяют возможности наших тел

Идея, что у людей могут быть крылья или щупальца, может быть фантастической

ТехИнсайдер
Двое школьников зарезали свою одноклассницу, посмотрев фильм «Крик». Они записали радостное видео Двое школьников зарезали свою одноклассницу, посмотрев фильм «Крик». Они записали радостное видео

Как два подростка решили стать убийцами

ТехИнсайдер

Необычная история неуловимой и нераскаявшейся преступницы

VOICE
Как появляется нелюбовь к телу: 3 неочевидные причины — объяснение фитнес-тренера Как появляется нелюбовь к телу: 3 неочевидные причины — объяснение фитнес-тренера

Фитнес-тренер рассуждает о том, откуда берется нелюбовь к собственному телу

Psychologies
Пчелы ориентируются в полете, как пилоты первых самолетов Пчелы ориентируются в полете, как пилоты первых самолетов

Чем похожи пчелы и пилоты-люди?

ТехИнсайдер
Владелец Regent — о пяти слагаемых ресторанного бизнеса и винной карте Владелец Regent — о пяти слагаемых ресторанного бизнеса и винной карте

Ресторатор Алексей Пинский — о балансе меню и нюансах составления винной карты

РБК
Персона Персона

О кризис-менеджменте, конкурентной борьбе и западных бизнес-стратегиях

Robb Report
Наука о чужих. Жизнь и разум во Вселенной Наука о чужих. Жизнь и разум во Вселенной

Какое место во Вселенной с точки зрения богословия отведено инопланетянам?

Наука и жизнь
Системный анализ Системный анализ

Анастасия Волкова: российский арт-рынок — «непаханое поле возможностей»

Robb Report
Возвращение шедевров: как бренды тратят миллионы на спасение памятников культуры Возвращение шедевров: как бренды тратят миллионы на спасение памятников культуры

Как миллионы евро помогают восстанавливать исторические здания

Forbes
Как бывший гендиректор Microsoft строит новую арену для собственного клуба НБА Как бывший гендиректор Microsoft строит новую арену для собственного клуба НБА

Как Стив Балмер строит для «Лос-Анджелес Клипперс» роскошную спортивную арену

Forbes
Непо-кид и фут-фетишист: 10 фактов про Криса Пайна, которых вы не знали Непо-кид и фут-фетишист: 10 фактов про Криса Пайна, которых вы не знали

Несколько занимательных фактов про Криса Пайна

Правила жизни
Инспектор ГИБДД попросил выйти из машины. Как себя вести Инспектор ГИБДД попросил выйти из машины. Как себя вести

Зачем инспектор ГИБДД просит выйти из машины и есть ли у него на это право?

РБК
Актеры и главные герои сериала Актеры и главные герои сериала

Рассказываем о ролях и актерах турецкого сериала "Истерзанная"

VOICE
За какой незарегистрированный тюнинг накажет ГИБДД. Об этом нужно знать За какой незарегистрированный тюнинг накажет ГИБДД. Об этом нужно знать

Список изменений в автомобилях, которые обязательно нужно регистрировать в ГИБДД

РБК
На темной стороне: как развитие ИИ влияет на уровень кибербезопасности На темной стороне: как развитие ИИ влияет на уровень кибербезопасности

Представляя 2023 год через призму кибербезопасности, точно стоит быть оптимистом

Forbes
«Дейзи Джонс и The Six»: красивая мелодрама о вымышленной рок-группе в стиле 1970-х «Дейзи Джонс и The Six»: красивая мелодрама о вымышленной рок-группе в стиле 1970-х

Сериал «Дейзи Джонс и The Six» — аутентичная история о любви и саморазрушении

Forbes
Когнитивный невролог Сара Мэннинг Пескин: «Истории о том, как ломается мозг» Когнитивный невролог Сара Мэннинг Пескин: «Истории о том, как ломается мозг»

Сара Мэннинг Пескин рассказывает об уязвимости человеческого мозга

СНОБ
Высокобелковое питание обеспечило дрозофил и мышей крепким сном Высокобелковое питание обеспечило дрозофил и мышей крепким сном

Пища, богатая белком, снижает у плодовых мух и мышей пробуждаемость от сна

N+1
Вечный выбор: автомат, вариатор, робот? Вечный выбор: автомат, вариатор, робот?

Преимущества и недостатки разных автоматических коробок передач

4x4 Club
Темнокожая Русалочка и феминизм: почему Disney переделывает старые сказки для зумеров Темнокожая Русалочка и феминизм: почему Disney переделывает старые сказки для зумеров

Шок-контент или поклонение перед зумерами: как Disney меняет свои сказки

Forbes
По рыбным местам По рыбным местам

Куда лучше отправиться в этом году на рыбалку

Деньги
Мамины дочки в Голливуде: краткий обзор главных женских архетипов в кино Мамины дочки в Голливуде: краткий обзор главных женских архетипов в кино

Как в кино обычные женщиныборолись на экране и вне его за себя и других

Правила жизни
Вспоминаем Саманту Смит — девочку, которая всполошила весь СССР своим приездом Вспоминаем Саманту Смит — девочку, которая всполошила весь СССР своим приездом

Как Саманта Смит посетила СССР в апогей холодной войны и ядерной паранойи

Maxim
Как создавать свои картинки в Midjourney: простой гид Как создавать свои картинки в Midjourney: простой гид

Краткое руководство для начинающих изучать Midjourney

Maxim
Этот Ford Bronco 1968 года с двигателем Coyote, способен разорвать любое бездорожье Этот Ford Bronco 1968 года с двигателем Coyote, способен разорвать любое бездорожье

Ford Bronco, определивший внедорожные тренды на много десятилетий вперёд

4x4 Club
Счет в вашу пользу. Пошаговая инструкция Счет в вашу пользу. Пошаговая инструкция

Как составить семейный бюджет, чтобы денег стало больше

Лиза
Открыть в приложении