ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Мифы о пиве, в которые все верят Мифы о пиве, в которые все верят

Заблуждения о пиве — это скверно, но не опасно

Maxim
Гигант микрофинансирования Гигант микрофинансирования

Чем прославился глава временного правительства Бангладеш

Деньги
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Вынеси это немедленно Вынеси это немедленно

7 предметов декора, которые выдают дурной вкус

Лиза
Палеонтологи описали жившую по соседству с тираннозаврами хищную птицу Палеонтологи описали жившую по соседству с тираннозаврами хищную птицу

Энанциорнис Avisaurus darwini достигал размеров ястреба и хватал добычу лапами

N+1
Хронология событий Хронология событий

Алжирская война длилась с 1954 по 1962 год, но началось всё гораздо раньше

Дилетант
Хорошо забытое старое Хорошо забытое старое

Увидеть новый Ford и умереть? Ну, почти умереть – на обратном пути, от усталости

Автопилот
Ученые прошлого —   ученым настоящего Ученые прошлого —   ученым настоящего

Выпускники СПбГУ не раз становились лауреатами престижных премий

Санкт-Петербургский университет
«Мне хотелось уйти от своей интеллигентности» «Мне хотелось уйти от своей интеллигентности»

О съемках и потребности играть антагонистов — в беседе с актером Павлом Поповым

OK!
Женская самоценность: 3 ступени к уверенности в себе Женская самоценность: 3 ступени к уверенности в себе

Женская уверенность в себе: из чего она состоит и можно ли её укрепить?

Psychologies
Тиражное, ставшее индивидуальным Тиражное, ставшее индивидуальным

Как Владимир Куприянов отменил неповторимость «решающего момента»

Weekend
Autodesk ушел в историю: чем заменить? Autodesk ушел в историю: чем заменить?

Американская компания Autodesk покинула российский рынок еще в 2022 году

Наука и техника
От Джона Леннона до королевы Елизаветы: 10 знаменитых кадров фотографа Энни Лейбовиц От Джона Леннона до королевы Елизаветы: 10 знаменитых кадров фотографа Энни Лейбовиц

10 лучших снимков американского фотографа Энни Лейбовиц

Forbes
«…яже прозвася грамота Словеньская» «…яже прозвася грамота Словеньская»

Судьба одной из древнейших славянских азбук — глаголицы

Знание – сила
Джим лежа Джим лежа

Героические истории со съемок первых фильмов великих режиссеров

Правила жизни
Женатые, недоступые, первые попавшиеся, не отвечающие взаимностью: как перестать влюбляться не в тех мужчин Женатые, недоступые, первые попавшиеся, не отвечающие взаимностью: как перестать влюбляться не в тех мужчин

Как перестать сближаться с теми, кто приносит лишь боль и разочарование?

Psychologies
Как устроено женское сексуальное желание Как устроено женское сексуальное желание

Женщина может испытывать возбуждение, но не хотеть секса. Это нормально

Psychologies
Стартер не крутит: в чем причины и как завести машину Стартер не крутит: в чем причины и как завести машину

Все про неисправность стартера: из-за чего возникает, как устранить, опасно ли

РБК
Александр Горчилин — о неснятых сценариях и сложных периодах Александр Горчилин — о неснятых сценариях и сложных периодах

Как актер Александр Горчилин оказался в центре конструктивизма

РБК
«Мыльная опера» или «выдохшаяся газировка»: 8 типов расставаний и как их пережить «Мыльная опера» или «выдохшаяся газировка»: 8 типов расставаний и как их пережить

Как пережить расставание?

Psychologies
Истина где-то здесь Истина где-то здесь

Вокруг этих мест ходит много таинственных слухов и даже леденящих душу рассказов

Лиза
Все по полочкам: действительно ли уборка делает нас счастливее Все по полочкам: действительно ли уборка делает нас счастливее

Рассказываем, помогает ли уборка «поймать дзен»

ТехИнсайдер
Обсессивно-компульсивное расстройство: что это такое, как распознать и чем лечить Обсессивно-компульсивное расстройство: что это такое, как распознать и чем лечить

Как распознать грань, после которой наши ритуалы мешают жить?

Psychologies
Зачем сверлить дыру в океане или Как работает маленький флот необычных научных кораблей Зачем сверлить дыру в океане или Как работает маленький флот необычных научных кораблей

5 научных открытий были сделаны на борту единственного судна Joides Resolution

ТехИнсайдер
Неизбывность сюжетов и снега: как прошел фестиваль «Маяк» Неизбывность сюжетов и снега: как прошел фестиваль «Маяк»

О программе фестиваля актуального российского кино «Маяк»

РБК
Революция в камне: как ученые разработали бетон, способный топить снег и лед Революция в камне: как ученые разработали бетон, способный топить снег и лед

Чудо инженерии, способное без источников питания топить лед и снег

Inc.
«Я клоун по жизни». Актриса Ирина Горбачева о «Храбром сердце», продюсерском кино и духовных практиках «Я клоун по жизни». Актриса Ирина Горбачева о «Храбром сердце», продюсерском кино и духовных практиках

Ирина Горбачева — о любимых фильмах, сковывающих амплуа и эзотерике

СНОБ
Обрести опору: как женщины стали ходить на каблуках и почему отказываются от них Обрести опору: как женщины стали ходить на каблуках и почему отказываются от них

Когда и почему женщины начали носить каблуки и зачем протестуют против них

Forbes
Худеем по интуиции Худеем по интуиции

Надо ли заставлять себя есть брокколи и шпинат, если к ним не лежит душа?

Лиза
Палеонтологи впервые описали голову 2,6-метровой многоножки Палеонтологи впервые описали голову 2,6-метровой многоножки

Как выглядело самое крупное сухопутное членистоногое в истории

N+1
Открыть в приложении