ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

5 лучших адресов 5 лучших адресов

Отличаются ли приложения для знакомств?

Playboy
Отпуск на водах Отпуск на водах

Какова цена оздоровительного путешествия

Деньги
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Что делать, если выбрал не ту профессию: 3 рекомендации от профориентолога Что делать, если выбрал не ту профессию: 3 рекомендации от профориентолога

Как построить новую успешную карьеру, если со старой не сложилось?

Psychologies
Повторение сотворения Повторение сотворения

Тавтология как главный прием Киры Муратовой

Weekend
Опасные элементы Ржевского лесопарка Опасные элементы Ржевского лесопарка

Насколько высока концентрация металлов в грибах и почве Ржевского лесопарка?

Санкт-Петербургский университет
Тиражное, ставшее индивидуальным Тиражное, ставшее индивидуальным

Как Владимир Куприянов отменил неповторимость «решающего момента»

Weekend
Ядовитая смесь: 5 пар чистящих средств, которые ни в коем случае нельзя смешивать Ядовитая смесь: 5 пар чистящих средств, которые ни в коем случае нельзя смешивать

Не пытайтесь примерить на себя роль химика: эта игра может закончиться печально

ТехИнсайдер
Город, сбросивший историческую память Город, сбросивший историческую память

Архангельск: морозное процветание новой стабильности

Weekend
Что такое «мышечный узел» Что такое «мышечный узел»

Существуют ли в мышцах реальные узлы?

ТехИнсайдер
Что такое адаптивный круиз-контроль и чем он отличается от обычного Что такое адаптивный круиз-контроль и чем он отличается от обычного

Адаптивный круиз-контроль: что за устройство, в чем сильные и слабые стороны?

РБК
Вынеси это немедленно Вынеси это немедленно

7 предметов декора, которые выдают дурной вкус

Лиза
Новая физика рождается под землёй Новая физика рождается под землёй

Приключение за неуловимой нейтрино в недра Баксанской нейтринной обсерватории

Наука и жизнь
10 лучших хорроров за 2023 и 2024 годы. Часть II 10 лучших хорроров за 2023 и 2024 годы. Часть II

Фильмы на тот случай, еще последние пару лет недостаточно пощекотали вам нервы

Maxim
Печальная история Бланш Бэрроу: «вынужденной» сообщницы Бонни и Клайда Печальная история Бланш Бэрроу: «вынужденной» сообщницы Бонни и Клайда

Бланш Бэрроу: кто она такая и как познакомилась с Бонни и Клайдом?

ТехИнсайдер
Необычайные приключения одной теории Необычайные приключения одной теории

Почему теория Дарвина не дает покоя стольким умам, профессиональным и досужим?

Знание – сила
Многозадачность: что это и нужно ли ее развивать Многозадачность: что это и нужно ли ее развивать

Почему многозадачность не всегда полезна?

РБК
3 фактора, снижающих либидо у женщин: что делать 3 фактора, снижающих либидо у женщин: что делать

Что влияет на женское либидо и получение удовольствия от секса?

Psychologies
Владимир: А что вокруг? Владимир: А что вокруг?

Владимир, словно его исторический прототип Красно Солнышко, имеет мощные лучи

КАНТРИ Русская азбука
Бюджет высоких обязательств: чем может обернуться желание государства больше тратить Бюджет высоких обязательств: чем может обернуться желание государства больше тратить

Высокий уровень государственных расходов будет стимулировать рост зарплат

Forbes
За что мы любим The Cure: чертова дюжина синглов великой группы За что мы любим The Cure: чертова дюжина синглов великой группы

Знаковые синглы группы The Cure и ее непростой путь

СНОБ
Синяя акула выжила с пробитой меч-рыбой головой Синяя акула выжила с пробитой меч-рыбой головой

Первый случай, когда синюю акулу пронзила меч-рыба, и она выжила

N+1
«Не могу ни спать, ни работать, пока муж в командировке» — это уже созависимость? «Не могу ни спать, ни работать, пока муж в командировке» — это уже созависимость?

Где грань между привязанностью и созависимыми отношениями

Psychologies
Как иммигрантка из Ирана заработала миллиарды благодаря точным инвестициям в биотех Как иммигрантка из Ирана заработала миллиарды благодаря точным инвестициям в биотех

Маки Зангане: от эмиграции из Ирана до успешного проекта в биотехе США

Forbes
Дизайнер Никита Калмыков — про свой бренд ODOR, реализм и вдохновение — интервью на «Снобе» Дизайнер Никита Калмыков — про свой бренд ODOR, реализм и вдохновение — интервью на «Снобе»

Никита Калмыков о фаст-фешене, старинных кружевах и объемах продаж

СНОБ
Там, где раки зимуют Там, где раки зимуют

Какие научные исследования ведутся в подмосковном заповедном озере Глубокое

Наука и жизнь
Яйцо Яйцо

Почему яйца называют чемпионами завтрака?

Здоровье
Не колой единой Не колой единой

Вспоминаем вкус домашнего кваса, морсов и «газировки» из СССР

Лиза
История развития морских беспилотников. Часть 3 История развития морских беспилотников. Часть 3

О создании подводного беспилотника Судного дня и о других морских беспилотниках

Наука и техника
Однажды 20 лет спустя: может ли грузинская оппозиция повторить «революцию роз» Однажды 20 лет спустя: может ли грузинская оппозиция повторить «революцию роз»

Победа правящей в стране «Грузинской мечты» еще не окончательна

Forbes
Открыть в приложении