ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Все не просто так: почему теннисный мяч ярко-желтого цвета? Все не просто так: почему теннисный мяч ярко-желтого цвета?

Почему в итоге ярко-желтый окрас стал «официальным» для теннисного мяча?

ТехИнсайдер
Город Геркулеса Город Геркулеса

Геркуланум уничтожило – и сохранило для нас – то же извержение Везувия

Вокруг света
Стремительный разгон и быстрый взлет: самые короткие взлетно-посадочные полосы в мире Стремительный разгон и быстрый взлет: самые короткие взлетно-посадочные полосы в мире

Аэропорты, взлетно-посадочные полосы которых проверяют пилотов на прочность

ТехИнсайдер
Утилистический прием Утилистический прием

Как Константин Вагинов изобрел безотходную переработку прошлого

Weekend
8 доказанных наукой привычек, которые действительно повышают интеллект 8 доказанных наукой привычек, которые действительно повышают интеллект

Какие ритуалы стоит добавить в свою рутину, чтобы стать умнее

Maxim
«Джекпот»: криминальная комедия Александра Ханта про выигрыш и проигрыши «Джекпот»: криминальная комедия Александра Ханта про выигрыш и проигрыши

«Джекпот» — лучший фильм Александра Ханта

СНОБ
От малограмотного мальчика до успешного книгоиздателя: история Ивана Сытина От малограмотного мальчика до успешного книгоиздателя: история Ивана Сытина

История Ивана Сытина — крестьянского сына, который стал успешным бизнесменом

ТехИнсайдер
Многоликий Ян Многоликий Ян

Ян Гинзбург: разархивирование настоящего

Weekend
«Мыльная опера» или «выдохшаяся газировка»: 8 типов расставаний и как их пережить «Мыльная опера» или «выдохшаяся газировка»: 8 типов расставаний и как их пережить

Как пережить расставание?

Psychologies
Страшное будущее. Тест-драйв первого в России Tesla Cybertruck Beast Страшное будущее. Тест-драйв первого в России Tesla Cybertruck Beast

Autonews.ru испытал самый мощный Tesla Cybertruck Beast в мире: плюсы и минусы

РБК
Аврора: «Возраст скрывают люди, неуверенные в себе» Аврора: «Возраст скрывают люди, неуверенные в себе»

Телеведущая Аврора о нутрициологии, блефаропластике и роли эндокринолога

Здоровье
Город, сбросивший историческую память Город, сбросивший историческую память

Архангельск: морозное процветание новой стабильности

Weekend
«Начинать нужно с пороха» «Начинать нужно с пороха»

Михаил Хубутия о форуме «ORЁLEXPO 2024» и проблемах отрасли товаров для охоты

Деньги
Из истории британской  Московской  компании Из истории британской  Московской  компании

В середине XVI века Ричард Ченслор открыл новый торговый путь

Наука и техника
Что стало вдохновением для Джокера Хита Леджера? Узнайте о пугающем художнике Фрэнсисе Бэконе! Что стало вдохновением для Джокера Хита Леджера? Узнайте о пугающем художнике Фрэнсисе Бэконе!

Как Фрэнсис Бэкон повлиял на образ Джокера в "Темном рыцаре"?

ТехИнсайдер
«Я-ловушка» и еще 4 тренда дейтинг-приложений, которые ждут нас в 2025 году «Я-ловушка» и еще 4 тренда дейтинг-приложений, которые ждут нас в 2025 году

Пять тенденций в сфере знакомств, которые будут актуальны в 2025 году

Psychologies
«Для IPO рынок сейчас слишком спекулятивный» «Для IPO рынок сейчас слишком спекулятивный»

О том, как криптовалюты отбирают аудиторию у классических брокеров

Монокль
Секты, инфоцыганство, мошенничество: о чем новый фильм Ксении Собчак «Осторожно, коучи» Секты, инфоцыганство, мошенничество: о чем новый фильм Ксении Собчак «Осторожно, коучи»

В рамках кинофестиваля «Горький Fest» прошел показ фильма «Осторожно, коучи»

Psychologies
Что такое думспендинг и почему люди тратят деньги на ненужные и бессмысленные вещи Что такое думспендинг и почему люди тратят деньги на ненужные и бессмысленные вещи

Думспендинг: что это за способ борьбы со стрессом и чем он опасен?

Forbes
От любви до ненависти и обратно От любви до ненависти и обратно

Советская интеллигенция возмутилась разносами, которые Хрущёв устроил художникам

Дилетант
Почувствуй разницу Почувствуй разницу

Самодостаточный мужчина VS инфантильный мальчик: учимся распознавать

Лиза
Автомобили Автомобили

Рекорды мощности, внимание к деталям и всеобщая цифровизация лучших автомобилей

RR Люкс.Личности.Бизнес.
Чем опасен секонд-хенд? Чем опасен секонд-хенд?

Любителям секонд-хенда не стоит расслабляться: вот несколько его опасностей

Здоровье
Не плохой парень. Интервью с актером Андреем Максимовым Не плохой парень. Интервью с актером Андреем Максимовым

Андрея Максимова все чаще можно встретить в главных кино- и сериальных проектах

СНОБ
Сейчас напишут Сейчас напишут

Как бьюти-блогеры меняют индустрию красоты и за что им бывает стыдно

Новый очаг
Опасная экзотика Опасная экзотика

Будь осторожна, покупая во время путешествия колоритные местные безделушки

Лиза
Уютное и доброе фэнтези: 5 бестселлеров и новинок для осеннего чтения Уютное и доброе фэнтези: 5 бестселлеров и новинок для осеннего чтения

Атмосферные, согревающие истории поднимут настроение холодными вечерами

Maxim
7 вещей, которые нельзя мыть средством для окон, и 7, которые станут после него идеально чистыми 7 вещей, которые нельзя мыть средством для окон, и 7, которые станут после него идеально чистыми

Эта жидкость может больше, чем ты думаешь, но иногда ее лучше не использовать

VOICE
Устраивают «вонючие бои» и имеют два языка: 5 внезапных фактов о лемурах Устраивают «вонючие бои» и имеют два языка: 5 внезапных фактов о лемурах

Лемуры — необычные животные, о которых вы многого не знаете

ТехИнсайдер
Рано списывать: 5 главных преимуществ HDD перед SSD Рано списывать: 5 главных преимуществ HDD перед SSD

Почему в некоторых случаях лучше купить HDD, а не SSD?

CHIP
Открыть в приложении