Компания OpenAI представила мультимодальную генеративную модель GPT-4o

N+1Hi-Tech

OpenAI представила мультимодальную генеративную модель GPT-4o

Она умеет разговаривать, видеть, и имитирует эмоции

Андрей Фокин

0feba817682cb3557f5dd3b9a38f3ae7.jpg
OpenAI / YouTube

Компания OpenAI представила мультимодальную генеративную модель GPT-4o, которая может работать с текстом, аудио и изображениями, включая видео. Модель может общаться с пользователем голосом и поддерживает 50 языков. Она может имитировать различные интонации, шепот, пение, смех. При этом модель работает гораздо быстрее предшествующей версии — время задержки ответа в голосовом режиме составляет в среднем около 0,3 секунды, что сравнимо с временем реакции человека. Также модель может видеть, получая и интерпретируя изображение с камеры в реальном времени. Трансляция презентации велась на YouTube.

Первая генеративная языковая модель уровня GPT-4 была представлена компанией OpenAI в марте 2023 года. В отличие от более ранней версии GPT-3.5, которая могла работать только с текстовой информацией, GPT-4 впервые получила способность принимать в качестве входных данных также и изображения. Кроме этого, в том же году состоялся релиз приложения на основе чат-бота ChatGPT с возможностью распознавания речи и синтеза голоса, что позволяло пользователям разговаривать с моделью и использовать ее в роли голосового ассистента.

В понедельник 13 мая 2024 года во время прямой трансляции на YouTube состоялась презентация новой версии GPT-4, которая получила обозначение GPT-4o (символ «о» в конце означает «omni»). Теперь модель принимает в качестве входных данных любую комбинацию текста, звука и изображения, включая видео. При этом она работает гораздо быстрее своей предшественницы, в том числе и во время голосового общения. Генерация ответа происходит со средней задержкой всего лишь 320 миллисекунд, что сравнимо со временем реакции человека в разговоре.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Вторую межзвездную комету заподозрили в рекордной старости Вторую межзвездную комету заподозрили в рекордной старости

Какие свойства у открытого межзвездного объекта — кометы 3I/ATLAS

N+1
Ученые считают, что запахи природы влияют на здоровье и благополучие человека Ученые считают, что запахи природы влияют на здоровье и благополучие человека

Как естественные запахи могут влиять на наши эмоции, мысли и физическое здоровье

ТехИнсайдер
Физическая сим-карта или eSIM: что лучше? Физическая сим-карта или eSIM: что лучше?

Разбираемся в плюсах и минусах пластиковых сим-карт и eSIM

CHIP
Знай свой двигатель: как отличить компрессор от турбонаддува Знай свой двигатель: как отличить компрессор от турбонаддува

Что такое компрессор? Что такое турбонаддув? Что из них лучше?

ТехИнсайдер
Можно ли плавать в Apple Watch: разбираемся в нюансах умных часов компании Можно ли плавать в Apple Watch: разбираемся в нюансах умных часов компании

Можно ли плавать в Apple Watch? Давайте разбираться. Нюансов здесь хватает

ТехИнсайдер
Гений места Гений места

Настоящие фанаты своих городов, которые открывают их заново

Новый очаг
Секрет молодости и худобы китайцев: удивительные преимущества употребления теплой воды Секрет молодости и худобы китайцев: удивительные преимущества употребления теплой воды

В чем польза горячей и теплой воды?

ТехИнсайдер
Чем опасны лидеры с уязвимым эго: 7 негативных особенностей Чем опасны лидеры с уязвимым эго: 7 негативных особенностей

Как даже хорошо скрываемая уязвимость мешает принимать верные решения

Psychologies
Сомнительные пошлины Сомнительные пошлины

К чему могут привести ограничения на ввоз российской сельхозпродукции в ЕС

Агроинвестор
Капсула памяти Капсула памяти

Как органично вписать в интерьер вещи из путешествий

Новый очаг
Как окружение влияет на наш успех: 3 типа людей, которых стоит избегать Как окружение влияет на наш успех: 3 типа людей, которых стоит избегать

Как негативные люди влияют на наш успех?

Psychologies
Агрессоры в саду Агрессоры в саду

В статье речь пойдёт не о диких сорняках, а об обитателях сада, посаженных нами

Наука и жизнь
Эксперимент Таскиги: одна из самых жестоких медицинских программ в истории человечества Эксперимент Таскиги: одна из самых жестоких медицинских программ в истории человечества

Проект Таскиги стал одним из самых жестоких случаев медицинского расизма

ТехИнсайдер
Что скрывает черная повязка на правом глазу Кутузова? Все это время нас вводили в заблуждение Что скрывает черная повязка на правом глазу Кутузова? Все это время нас вводили в заблуждение

Мы разобрались, откуда растут ноги у исторической ошибки глаза Кутузова

ТехИнсайдер
7 фраз, которые моментально превращают вас в токсичного душнилу 7 фраз, которые моментально превращают вас в токсичного душнилу

Эти слова обрели стилистический окрас: учитывайте, когда хотите их произнести!

Psychologies
Поразительная польза чая матча: ученые утверждают, что полоскание рта этим напитком защищает от заболеваний десен Поразительная польза чая матча: ученые утверждают, что полоскание рта этим напитком защищает от заболеваний десен

Какой эффект можно получить от полоскания рта чаем матча?

ТехИнсайдер
Ген памяти Ген памяти

Какие альтернативные накопители предлагают на рынке хранения данных

РБК
Нет пределов совершенству Нет пределов совершенству

Kalisa — стильная яхта, на которой можно ходить даже в шторм

Y Magazine
Зеленый бум Зеленый бум

Действительно ли натуральная косметика может заменить «химию»?

Лиза
«Муж выбирает блюда на моем сайте, а я их готовлю»: девушка поделилась лайфхаком, как упростить совместный быт «Муж выбирает блюда на моем сайте, а я их готовлю»: девушка поделилась лайфхаком, как упростить совместный быт

Поможет обустроить совместный быт: несколько советов и интересный лайфхак

Psychologies
Мать русского футуризма. Как жил и писал поэт-авиатор Василий Каменский Мать русского футуризма. Как жил и писал поэт-авиатор Василий Каменский

Как поэт Василий Каменский стал одним из первых русских авиаторов

СНОБ
Лизнуть яйцо за миллион: почему жители Урала готовы рискнуть здоровьем ради денег Лизнуть яйцо за миллион: почему жители Урала готовы рискнуть здоровьем ради денег

Почему люди считают деньги приоритетнее своего здоровья?

Psychologies
5 основных теорий человечества о том, что такое сны 5 основных теорий человечества о том, что такое сны

Сны развлекают, пугают и завораживают, но откуда они берутся и для чего?

Psychologies
Не очень милый котик Не очень милый котик

История самого успешного авторского мультфильма и его героя, кота Фрица

Weekend
Как друзья построили в России сервис подбора витаминов и выручили 500 млн рублей Как друзья построили в России сервис подбора витаминов и выручили 500 млн рублей

Halsa не единственный в России сервис подбора витаминов, но лидер в этой нише

Forbes
Не болей! Не болей!

5 признаков того, что твоя собака нездорова

Лиза
Машина для большой семьи, которая вызывает ностальгию: обзор кросс-вэна Suzuki Ertiga Машина для большой семьи, которая вызывает ностальгию: обзор кросс-вэна Suzuki Ertiga

Олдскульный семиместный кросс-вэн Suzuki Ertiga

ТехИнсайдер
Таинственный кот Палласа – манул Таинственный кот Палласа – манул

Если спросить любого, – кто таков Палласов кот, вряд ли кто ответит правильно

Знание – сила
Почему манга читается справа налево и какой в этом смысл Почему манга читается справа налево и какой в этом смысл

Что такое манга и как её читать?

Maxim
Край гор и водопадов Край гор и водопадов

Адыгея — край колоритных деревушек в горах и уникальных памятников природы

Лиза
Открыть в приложении