Государствам нужно ускориться в регулировании искусственного интеллекта

МонокльРепортаж

В битвах вокруг ИИ победят корпорации

Государствам нужно ускориться в регулировании искусственного интеллекта и признать, что ситуация критическая

Наталья Быкова

Стоян Васев

Что создают в OpenAI и стоит ли этого бояться? Об этом — в интервью с экспертом по междисциплинарным исследованиям и стратегической аналитике, бывшим топ-менеджером IBM, SGI и Cray Research Сергеем Кареловым.

— Самая обсуждаемая тема в свете событий с OpenAI, — обнаружение специалистами компании у своей модели новой когнитивной способности самостоятельно находить информацию, которой нет в ее базе данных. Поясните, пожалуйста, что это может быть за модель и как у нее получилось выйти за пределы знаний, сформированных на стадии ее обучения?

— Да, основная причина, из-за которой начался весь этот бардак, заключается в том, что был совершен прорыв в исследованиях в сторону сильного искусственного интеллекта. А поскольку условия соглашения Microsoft и OpenAI были таковы, что в случае приближения к подобным результатам все предыдущие соглашения должны пересматриваться, то фактически OpenAI получала право забрать у Microsoft последние рычаги управления. Чтобы избежать этого, была разыграна многосерийная интрига с увольнением, а потом возвращением Сэма Альтмана. В результате чего совет директоров был кардинально обновлен в пользу интересов Microsoft.

Что же касается прорыва, то здесь мы можем только строить предположения. Есть информация, что в главном сегодняшнем проекте компании под кодовым названием Q* (читается Q-Star) велись исследования по трем направлениям.

Первое — это как раз про способность модели не просто искать информацию во внешней базе данных, в том же интернете или корпоративных базах, но и целенаправленно формулировать вопросы. Это означает, что она не привязана на сто процентов к базам, на которых строилось ее обучение, — а это очень неординарный результат. Дело в том, что все модели создаются схожим образом: учатся по нескольку месяцев на огромных объемах информации, выстраивая свои матрицы весов, свои внутренние представления об этой информации. Далее с ними начинают работать аналитики, задают им вопросы, просят высказаться по определенной теме, а модели в ответ обращаются вот к этой сформированной на этапе обучения матрице и на этой основе формулируют ответ. То есть теоретически модель не может выйти за пределы того, чему научилась на этапе обучения.

Новым лингвоботам Claude-2 и Bing дали возможность прямого обращения в сеть, это, конечно, сильно расширило возможности подобных систем, но эти обращения совершались исключительно на базе тех запросов, которые писали лингвоботам люди. Например, если их спрашивали, какие были группировки североамериканских индейцев за год до начала Гражданской войны в США, то боты искали в сети информацию о группировках индейцев и Гражданской войне в США, не понимая сути вопроса.

А вот тот прорыв, о котором мы говорим, связан с принципиально новой способностью модели. Она начала искать ответы в сети на собственные содержательные вопросы, чтобы лучше разобраться в теме: к примеру, что лежало в основе разделения индейцев на группировки — идеология, борьба за территорию и так далее.

Второе направление, которое получило сильный прогресс, — это системы, подобные AlphaZero, обыгрывающей чемпионов в шахматы. Они работают по другим принципам, осуществляют поиск по деревьям Монте-Карло (эвристический алгоритм поиска для некоторых видов процессов принятия решений, в первую очередь тех, которые используются в программном обеспечении, играющем в настольные игры. — «Монокль»). Интеграция поиска траектории токена по дереву Монте-Карло (как в AlphaZero) с традиционными для больших языковых моделей матрицами весов может быть особенно эффективна в таких областях, как программирование и математика, где есть простой способ определить правильность. И это может объяснять утечки о прорывном улучшении в проекте Q* способностей решения математических задач.

Третье направление — это комбинация Q-обучения и алгоритма A*.

Алгоритм A* — это способ нахождения кратчайшего пути от одной точки до другой на карте или в сети. Представьте, что вы ищете самый быстрый маршрут из одного города в другой. Алгоритм A* проверяет разные пути, оценивая, насколько они близки к цели и сколько еще предстоит пройти. Он выбирает путь, который, по его оценке, будет самым коротким. Этот алгоритм очень эффективен и используется во многих областях, например в компьютерных играх для нахождения пути персонажей или в GPS-навигаторах.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Время Кита. Осеннее небо Время Кита. Осеннее небо

Этой осенью мы завершаем разговор о созвездиях семейства Персея

Наука и жизнь
Сколько стоит адаптироваться к климату Сколько стоит адаптироваться к климату

Изменения погодных условий как один из драйверов инвестиций в перспективе

Агроинвестор
Водочный король: история Петра Арсеньевича Смирнова Водочный король: история Петра Арсеньевича Смирнова

Как крепостной крестьянин стал одним из самых богатых людей Российской империи

Maxim
Что делать, если тебе плохо подстригли челку: 5 способов исправить ошибку мастера Что делать, если тебе плохо подстригли челку: 5 способов исправить ошибку мастера

Стрижка челки обернулась провалом? Спокойно: мы знаем, как все исправить

VOICE
Юбилей Тегеранской конференции: как смогли договориться победители Юбилей Тегеранской конференции: как смогли договориться победители

Со времени проведения Тегеранской конференции прошло 80 лет

Наука
Свет в твоем окне Свет в твоем окне

Украшаем волшебными огнями весь дом

Лиза
«75% гостей — женщины»: ресторатор Ксения Механик о гастроиндустрии и стереотипах «75% гостей — женщины»: ресторатор Ксения Механик о гастроиндустрии и стереотипах

Ресторатор Ксения Механик — почему гендерные предрассудки мешают всем

Forbes
«Немой учитель» «Немой учитель»

Тысячелетняя история книги: от глиняных табличек до электронных ридеров

Зеркало Мира
Никита Мещерский: Инженеры Tesla – гении, воплощающие в жизнь безумные идеи Маска Никита Мещерский: Инженеры Tesla – гении, воплощающие в жизнь безумные идеи Маска

В Cybertruck есть гораздо больше, чем угловатый дизайн и невыполненные обещания

4x4 Club
Свободна как птица Свободна как птица

Как отпустить бывшего и перестать на него злиться: советы психолога

Лиза
Сколько секса нужно для счастья? Сколько секса нужно для счастья?

Сколько секса нам нужно?

Добрые советы
От $300 до $1300 в час: кто нанимает бухгалтеров-криминалистов и сколько это стоит От $300 до $1300 в час: кто нанимает бухгалтеров-криминалистов и сколько это стоит

Кто такие бухгалтера-криминалисты и кто пользуется их услугами?

Forbes
Как устроен рынок спешелти-кофе Как устроен рынок спешелти-кофе

Почему кофе считают более сложным продуктом, чем вино?

СНОБ
А мы тебя ждали А мы тебя ждали

Как впустить в жизнь новое – разбираемся с психологом Еленой Голяковской

Новый очаг
Чат-бот, смерть и роботы: что такое цифровое бессмертие и кто его обещает уже сейчас Чат-бот, смерть и роботы: что такое цифровое бессмертие и кто его обещает уже сейчас

Возможно ли цифровое бессмертие на самом деле?

Forbes
«Черные лебеди»–2024 «Черные лебеди»–2024

Основные опасения за будущее респондентов связаны с вооруженными конфликтами

Деньги
«Необъятный мир: Как животные ощущают скрытую от нас реальность» «Необъятный мир: Как животные ощущают скрытую от нас реальность»

Головастики лягушек спасаются из икринок, улавливая присутствие хищника

N+1
Дружба с Канье Уэстом и сотрудничество с мировыми брендами: чем известен дизайнер Гоша Рубчинский Дружба с Канье Уэстом и сотрудничество с мировыми брендами: чем известен дизайнер Гоша Рубчинский

Чем прославился российский дизайнер Гоша Рубчинский  — в материале «Сноба»

СНОБ
Уходят в лед Уходят в лед

Российская полярная наука переживает настоящий ренессанс

Men Today
Ревизия аптечки. 4 типа лекарств, которые плохо влияют на зубы Ревизия аптечки. 4 типа лекарств, которые плохо влияют на зубы

Насколько безобидны всем привычные препараты, которые мы часто используем?

Лиза
Строить, не ломать Строить, не ломать

Очень надеемся, что облик XXI века определят не конфликты, а проекты городов

Robb Report
Слегка несдержанный Слегка несдержанный

Квартира со сдержанным, но при этом эмоциональным интерьером

Идеи Вашего Дома
Россияне пока не догоняют Россияне пока не догоняют

Как сравнить уровень жизни в разных странах?

Монокль
В новый год с новым телом. 10 жиросжигающих тренировок, которые помогут быстро похудеть к празднику В новый год с новым телом. 10 жиросжигающих тренировок, которые помогут быстро похудеть к празднику

С помощью каких небанальных видов спорта можно скорректировать фигуру

Лиза
Когда приедешь? Когда приедешь?

Что значит для молодых взрослых из ПНИ самостоятельная жизнь

Новый очаг
Рынок жилья охлаждают Рынок жилья охлаждают

Правительство ввело ограничения в программы льготной ипотеки

Монокль
Мусор оптом: проблема стихийных свалок на Южном Урале Мусор оптом: проблема стихийных свалок на Южном Урале

Как устранить очаги захламления земель?

ФедералПресс
Что такое поколение «альфа»: разбираем, чем эти дети отличаются от своих родителей Что такое поколение «альфа»: разбираем, чем эти дети отличаются от своих родителей

Поведение поколения альфа: чего ждать от тех, кто придет на смену зумерам

Psychologies
Борис Порфирьев, Александр Широв: «Решить климатические проблемы в лоб невозможно» Борис Порфирьев, Александр Широв: «Решить климатические проблемы в лоб невозможно»

Как и кем формируется глобальная климатическая повестка

Монокль
«Лучший контент производят телевизионные люди» «Лучший контент производят телевизионные люди»

Будущее телевидения, онлайн-платформ и то, как на нем скажется смена эпох

Правила жизни
Открыть в приложении