ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Пятиминутный путеводитель по китайскому Новому году: откуда пришел праздник, как правильно отмечать и почему нельзя есть кашу Пятиминутный путеводитель по китайскому Новому году: откуда пришел праздник, как правильно отмечать и почему нельзя есть кашу

В Китае Новый год уходит корнями в глубокую древность

Правила жизни
Мужчины с высоким интеллектом надежнее при долгосрочных отношениях Мужчины с высоким интеллектом надежнее при долгосрочных отношениях

Как уровень интеллекта влияет на романтические отношения у мужчин?

ТехИнсайдер
Немирное «земледелие» Немирное «земледелие»

Как работает система залпового минирования

Популярная механика
Мыльный кутюр Мыльный кутюр

«Модный дом»: скандалы, интриги и повестка фэшн-индустрии

Weekend
Азбучные неистины Азбучные неистины

Перечислим несколько «азбучных истин» из учебников, опровергнутых временем

Вокруг света
Алина Кугуш Алина Кугуш

Перформер Алина Кугуш в фэшн-арт-объект превращает себя сама

Собака.ru
Вирусы: из врагов в союзники Вирусы: из врагов в союзники

Новые методы борьбы с онкологическими заболеваниями

Наука и техника
Астероиды стали источником цинка и дали возможность развитию земной жизни Астероиды стали источником цинка и дали возможность развитию земной жизни

Без «нерасплавленных» астероидов на Земле не появилось бы жизни

ТехИнсайдер
«Она смотрела на меня серьезно и опасливо всю дорогу, пока не задремала и не стала теплой». Отрывок повести Любы Макаревской «Март, октябрь, Мальва» «Она смотрела на меня серьезно и опасливо всю дорогу, пока не задремала и не стала теплой». Отрывок повести Любы Макаревской «Март, октябрь, Мальва»

Отрывок повести Любы Макаревской о взаимоотношениях человека и собаки

Правила жизни
«Для IPO рынок сейчас слишком спекулятивный» «Для IPO рынок сейчас слишком спекулятивный»

О том, как криптовалюты отбирают аудиторию у классических брокеров

Монокль
Без денег, помощи и независимости: с какими проблемами сталкиваются женщины в селах Без денег, помощи и независимости: с какими проблемами сталкиваются женщины в селах

Как в современных селах живут обычные женщины?

Forbes
Капризная особа Капризная особа

Мастопатия: когда надо беспокоиться

Лиза
Ильич раздора Ильич раздора

Фреска Риверы, которая должна была воспевать бурный научно-технический прогресс

Вокруг света
Как 20 лет назад фильм «Пила» положил начало одной из главных хоррор-франшиз ХХI века Как 20 лет назад фильм «Пила» положил начало одной из главных хоррор-франшиз ХХI века

Кинокритик разбирается в феномене «Пилы» и ее роли в массовой культуре

Forbes
Новый коллектив Новый коллектив

10 правил, чтобы быстро освоиться и стать своей в новом рабочем коллективе

Лиза
На чем цвет стоит На чем цвет стоит

Осени к лицу желтый цвет, чего не скажешь о ваших зубах. Как сделать их белыми?

Men Today
Сергиев Посад: А что вокруг? Сергиев Посад: А что вокруг?

Три города Серебряного, или Малого Золотого, кольца

КАНТРИ Русская азбука
Новый Skoda Elroq нацелен на массового потребителя Новый Skoda Elroq нацелен на массового потребителя

Skoda выпустила бюджетный электро-кроссовер Elroq

4x4 Club
10 лучших «вечных» советов по уходу за кожей, которые передаются из поколения в поколение 10 лучших «вечных» советов по уходу за кожей, которые передаются из поколения в поколение

Какие бьюти-рекомендации выдержали испытание временем.

VOICE
Тока этого мало Тока этого мало

Электроэволюция в одной отдельно взятой стране

Автопилот
Как понять, что вам нужно мыть голову чаще Как понять, что вам нужно мыть голову чаще

Как понять, что вы моете кожу головы недостаточно часто?

ТехИнсайдер
Иран и Израиль: прощупывая предел эскалации Иран и Израиль: прощупывая предел эскалации

Что удерживает Ближний Восток от большой войны

Монокль
Чем больше контента вы смотрите, тем хуже для психического здоровья Чем больше контента вы смотрите, тем хуже для психического здоровья

Чем больше времени вы проводите в сети, тем хуже становится психическое здоровье

ТехИнсайдер
В стиле кантри В стиле кантри

Особенности деревенского стиля и правила оформления для каждой комнаты

Лиза
Жизнь без варикоза Жизнь без варикоза

Как предупредить варикозную болезнь ног

Здоровье
Стоп! Снято Стоп! Снято

История поиска жилья в столице от того самого худшего арендатора

Men Today
Курсовая работа: как выпускники психфака создали заметную школу data science Курсовая работа: как выпускники психфака создали заметную школу data science

Онлайн-школа karpov.courses начиналась как pet-проект выпускников психфака

Forbes
Интервью Дарьи Екамасовой — о фильме «Анора», восприятии российской культуры в мире и Каннском кинофестивале Интервью Дарьи Екамасовой — о фильме «Анора», восприятии российской культуры в мире и Каннском кинофестивале

Актриса Дарья Екамасова — как артисту попасть в зарубежный проект?

СНОБ
Ростов Великий: Личный опыт Ростов Великий: Личный опыт

Еще один взгляд на Ростов: сквозь автомобильное окно

КАНТРИ Русская азбука
«ПСБ стал цифровым хабом для своих клиентов» «ПСБ стал цифровым хабом для своих клиентов»

Алексей Захаров о том, как идет модернизация оборонно-промышленного комплекса

Деньги
Открыть в приложении