ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Овечкин Овечкин

Как Овечкин пытается расколоть гретцкий орех

СНОБ
Несбыточная «четверка» Несбыточная «четверка»

Почему неадекватный таргет по инфляции является реальной проблемой

Монокль
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Побег на месте Побег на месте

Как Стив Маккуин всегда играл только самого себя

Weekend
10 предметов, которые нельзя чистить средством для мытья стекол (хотя кажется, что можно) 10 предметов, которые нельзя чистить средством для мытья стекол (хотя кажется, что можно)

Каким предметам можно навредить жидкостью для мытья стекол?

VOICE
Москва зодиакальная Москва зодиакальная

Астрологическая карта столицы: выбери свой счастливый район

Лиза
Эдуард Артемьев Эдуард Артемьев

Правила жизни композитора Эдуарда Артемьева

Правила жизни
Будь как Элтон Джон: почему люди отказываются от новых смартфонов ради ретрогаджетов Будь как Элтон Джон: почему люди отказываются от новых смартфонов ради ретрогаджетов

Что такое цифровая усталость и почему люди переходят на кнопочные телефоны

Forbes
Озон под угрозой из космоса Озон под угрозой из космоса

Природные факторы, ослабляющие озоновый слой Земли

Санкт-Петербургский университет
Зачем люди делают громкий выхлоп на машине Зачем люди делают громкий выхлоп на машине

Люди решили спросить спонсоров бессонницы и владельцев громкого выхлопа напрямую

Maxim
Как управлять через сигналы и не доводить до кризисов Как управлять через сигналы и не доводить до кризисов

Распространенные ошибки руководителей из книги «Менеджмент глазами ресторатора»

Forbes
5 новых американских кроссоверов, которые появились в России. Фото и цены 5 новых американских кроссоверов, которые появились в России. Фото и цены

Какие новые американские кроссоверы привозят в Россию дилеры

РБК
Африканские маски в Москве Африканские маски в Москве

Маски, затягивающие в свой потаенный запредельный мир колдовства и мистики…

Знание – сила
Ростов Великий: Личный опыт Ростов Великий: Личный опыт

Еще один взгляд на Ростов: сквозь автомобильное окно

КАНТРИ Русская азбука
Академики на букву К Академики на букву К

Почему многих советских научных героев миновала премия Нобеля?

Знание – сила
Как мужчины оценивают профили женщин на сайтах знакомств: принцип, о котором тебе надо знать Как мужчины оценивают профили женщин на сайтах знакомств: принцип, о котором тебе надо знать

Когда ты просматриваешь чей-то профиль в дейтинге, на что ты обращаешь внимание?

VOICE
Ешь, молись, люби Ешь, молись, люби

«Лапти» из картофеля по рецепту одной семьи из Иваново

КАНТРИ Русская азбука
Вечная мания завоеваний Вечная мания завоеваний

Александр Великий: «разорванный» портрет героя

Знание – сила
Дизайнер Никита Калмыков — про свой бренд ODOR, реализм и вдохновение — интервью на «Снобе» Дизайнер Никита Калмыков — про свой бренд ODOR, реализм и вдохновение — интервью на «Снобе»

Никита Калмыков о фаст-фешене, старинных кружевах и объемах продаж

СНОБ
Дорогу главной! Дорогу главной!

7 прав, которые у тебя есть при встрече с инспектором ГАИ

Лиза
Как самому проверить шины на брак: 6 неочевидных советов от эксперта шинного центра Как самому проверить шины на брак: 6 неочевидных советов от эксперта шинного центра

Признаки, которые укажут на брак автомобильной резины

ТехИнсайдер
Юрий Чурсин: Театр для меня — отдых Юрий Чурсин: Театр для меня — отдых

Актер Юрий Чурсин — о сериале «Жить жизнь» и театре

СНОБ
Добро пожаловать в филармонию Добро пожаловать в филармонию

Как пианист Илья Папоян стал фронтменом академической музыкальной сцены

Собака.ru
Столетняя икона Столетняя икона

Отрывок из автобиографии самой пожилой fashion-знаменитости в мире

RR Люкс.Личности.Бизнес.
Город Геркулеса Город Геркулеса

Геркуланум уничтожило – и сохранило для нас – то же извержение Везувия

Вокруг света
Что делать, если мать винит вас во всем: 6 способов не вестись на эту манипуляцию Что делать, если мать винит вас во всем: 6 способов не вестись на эту манипуляцию

Как, никого не обидев, освободиться от влияния родителя

Psychologies
Истоки инсектофобии и арахнофобии, или Почему нас так пугают насекомые и членистоногие Истоки инсектофобии и арахнофобии, или Почему нас так пугают насекомые и членистоногие

Почему люди боятся крошечных насекомых?

ТехИнсайдер
«Сейчас у центрального университета более 40 партнеров — это крупнейшие компании страны» «Сейчас у центрального университета более 40 партнеров — это крупнейшие компании страны»

В этом сентябре Центральный университет набрал абитуриентов на обучение

Деньги
История кино: почему в старых фильмах люди двигаются неестественно быстро? История кино: почему в старых фильмах люди двигаются неестественно быстро?

Почему в черно-белых фильмах у людей такие странные движения?

ТехИнсайдер
Пережил айсберги и военный конфликт, а утонул прямо в порту: странная история советского теплохода “Башкирия” Пережил айсберги и военный конфликт, а утонул прямо в порту: странная история советского теплохода “Башкирия”

«Башкирия» — что особенного было в этом советском теплоходе?

ТехИнсайдер
Открыть в приложении