ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Красивый — не значит привлекательный? Красивый — не значит привлекательный?

Почему одни люди привлекательны, а другие нет

Psychologies
Почему российские мужчины ревнуют женщин к иностранцам Почему российские мужчины ревнуют женщин к иностранцам

Российские мужчины ревнуют женщин только к иностранцам или вообще ко всем?

Psychologies
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Бюджет высоких обязательств: чем может обернуться желание государства больше тратить Бюджет высоких обязательств: чем может обернуться желание государства больше тратить

Высокий уровень государственных расходов будет стимулировать рост зарплат

Forbes
Инвесторы сделали ставку Инвесторы сделали ставку

Приток капитала идет, но не на все рынки акций

Деньги
Почему произошло извержение вулкана Хунга-Тонга в 2022 году Почему произошло извержение вулкана Хунга-Тонга в 2022 году

Что послужило причиной крупнейшего извержения вулкана в 2022 году?

ТехИнсайдер
Сила в слабости: как состарился самый критикуемый альбом Дрейка Сила в слабости: как состарился самый критикуемый альбом Дрейка

Почему Дрейк до сих пор остаётся на плаву?

Правила жизни
Курс на Восток Курс на Восток

Интерьер как портрет владелицы с учётом принципов древнеиндийской философии

RR Люкс.Личности.Бизнес.
Почему капитанский мостик находится в корме, если с носа обзор лучше Почему капитанский мостик находится в корме, если с носа обзор лучше

Где должен быть установлен капитанский мостик — на корме или на носу корабля?

ТехИнсайдер
В стиле кантри В стиле кантри

Особенности деревенского стиля и правила оформления для каждой комнаты

Лиза
Траектория невозврата Траектория невозврата

Как «Бег» Михаила Булгакова показал необратимость эмиграции

Weekend
Доппельбоди-хоррор Доппельбоди-хоррор

«Другой человек»: проблема двойников в эпоху бодипозитива

Weekend
Многоликий Ян Многоликий Ян

Ян Гинзбург: разархивирование настоящего

Weekend
Когда Африку разрезали как пирог… Когда Африку разрезали как пирог…

Как дикий империализм, облачившись в «цивилизованный костюм», делил Африку

Знание – сила
Искусственный отбор: что не так с венчурными фондами в России Искусственный отбор: что не так с венчурными фондами в России

Почему российский венчурный рынок пока существенно отстает от мировых лидеров

Forbes
Без денег, помощи и независимости: с какими проблемами сталкиваются женщины в селах Без денег, помощи и независимости: с какими проблемами сталкиваются женщины в селах

Как в современных селах живут обычные женщины?

Forbes
Инновации в закрытом контуре Инновации в закрытом контуре

Что дают бизнесу частные сети связи PrLTE

РБК
Андрей Баранников: Сейчас нет «березок» и «балалаек» в национальной повестке, этот лубок остался позади Андрей Баранников: Сейчас нет «березок» и «балалаек» в национальной повестке, этот лубок остался позади

Что нельзя и что нужно доверять ИИ в сфере коммуникации

СНОБ
Инна Чурикова: «Мы с Глебом похожи на персонажей полотен Шагала, когда две головы прорастают из одного туловища» Инна Чурикова: «Мы с Глебом похожи на персонажей полотен Шагала, когда две головы прорастают из одного туловища»

Последнее интервью Инны Чуриковой и фрагменты ее архивов

Коллекция. Караван историй
Из грибов и с грибами Из грибов и с грибами

Заморозка, сушка, соление, маринование — всё о блюдах из грибов, дарах природы

Наука и жизнь
Загадки Иеремии Позье: как в Эрмитаже реставрируют исторические драгоценности Загадки Иеремии Позье: как в Эрмитаже реставрируют исторические драгоценности

Из чего состоят реставрационные процессы в Эрмитаже и кто за них в ответе

Forbes
Как управлять через сигналы и не доводить до кризисов Как управлять через сигналы и не доводить до кризисов

Распространенные ошибки руководителей из книги «Менеджмент глазами ресторатора»

Forbes
Как проверить скорость SSD на запись и чтение Как проверить скорость SSD на запись и чтение

Программы для проверки скорости работы твердотельного накопителя

CHIP
Инновации решают Инновации решают

Каким окажется будущее российской экономики

Деньги
Времен связующая нить Времен связующая нить

Как в трудные времена вышивка помогает не терять присутствие духа

КАНТРИ Русская азбука
Фонотека Фонотека

Композиторы, чей вклад в создание киношедевра не уступает режиссерскому

Правила жизни
Не только Соболев. Главные предательства в истории футбола Не только Соболев. Главные предательства в истории футбола

Фигу, Тевес, Роналдо, и другие футболисты, перешедшие к ненавистным соперникам

СНОБ
(Не)уязвимый лес (Не)уязвимый лес

Что грозит лесным массивам России

Санкт-Петербургский университет
Страшное будущее. Тест-драйв первого в России Tesla Cybertruck Beast Страшное будущее. Тест-драйв первого в России Tesla Cybertruck Beast

Autonews.ru испытал самый мощный Tesla Cybertruck Beast в мире: плюсы и минусы

РБК
Перевести дух Перевести дух

Студенты готовы начать свое дело лишь через пять лет после окончания вуза

РБК
Открыть в приложении