Три мнения экспертов о том, какое будущее ждет нас с нейросетями

ТехИнсайдерHi-Tech

Нейросети 2026: прогнозы и инсайды

Текст: Савва Сафонов

Лина Кочетова

Качество нейросетей растет циклически, периодами по шесть-восемь месяцев. При этом процесс идет по цепочке: кто-то вырвался вперед – и остальные начинают нагонять.

НЕ ТЕРЯТЬ ЛИЦО

Сейчас одна из главных проблем при генерации изображений или видео – консистентность персонажей. То есть обеспечение постоянства образа, в частности лица, от картинки к картинке и от кадра к кадру. Эта проблема будет решаться весь следующий год: люди много работают именно с лицами, генерируют персонажей.

РАБОТА С РАКУРСОМ

Еще одна проблема – изменение ракурса. Даже когда виртуальную камеру удается переместить, возникает проблема консистентности объектов. Генеративная сеть от Google Nana Banana с этим уже справляется, но пока неидеально. Я слышала, что готовится релиз второй версии, – ожидается, что там функция смены ракурса будет работать лучше.

ОТВЕТЫ СТАНУТ ТОЧНЕЕ

В 2026 году качество текстов планируется улучшить, очищая датасеты, на которых обучается ИИ. Появятся новые архитектуры, начнут отфильтровываться «мусорные» данные. Вероятно создание множества узкоспециализированных нейросетей – например, для врачей, юристов и т.д.

РАБОТА НАД ПОНИМАНИЕМ

Специалисты учат нейросеть лучше понимать человека даже в тех случаях, когда запрос нельзя назвать качественным. Впрочем, пока и при нормальном запросе я бы оценила понимание как среднее.

ДЕТАЛИ НА ФОНЕ

Еще одна проблема, решение которой хотелось бы увидеть, – детали на фоне при генерации изображений. На переднем плане все может выглядеть прилично, но, например, если на заднем плане есть люди, они по-прежнему будут кривые-косые. Так что создание сцен с большим количеством статистов пока нереально.

Я работаю практически со всеми нейросетевыми проектами в области изображений и могу утверждать, что подобные недостатки есть у всех.

ТОП НЕЙРОСЕТЕЙ: КАРТИНКА И ВИДЕО

Какие из нейросетей дают сейчас лучшее качество картинки? На первом месте Nana Banana, потом Midjourney, потом Flux. Неплохие художественные изображения создает Reve. Есть, конечно, еще ChatGPT – эта нейросеть отлично понимает промпт, так что мы ждем обещанного на 2026 год обновления, которое подтянет и качество генерации.

Андрей Мурашев

Думаю, в 2026 году появятся ИИ-агенты, способные если не управлять бизнесом, то как минимум проходить цепочки из 50–100 шагов без постоянного присмотра.

СЛОВО ИИ-АГЕНТАМ

Что обычный человек делает с ChatGPT? Ищет рецепт, просит написать текст или предложить идеи для поста, уточняет значение слова. 95% всех обращений к ИИассистентам – одиночные запросы, краткие диалоги. На таких задачах открытые модели уже неотличимы от ChatGPT. Разница проявляется, только когда требуется цепочка рассуждений из 20 шагов или математика олимпиадного уровня. Так что монополии OpenAI для повседневного использования больше нет.

БУДУЩЕЕ ЗА ИИ-АГЕНТАМИ

Зато ИИ-агенты способны привнести новые бизнес-возможности в индустрию. Поэтому такие компании, как OpenAI, Anthropic и Google, сейчас нацелены на разработку инструментов, способных решать многоступенчатые, протяженные во времени задачи. Например, не просто «напиши письмо», а «найди свободное время в календаре, подбери ресторан, забронируй столик и отправь приглашения». Или «проанализируй документы конкурентов и составь отчет для совета директоров». Моделям дают инструменты для решения реальных бизнес-задач – в частности, OpenAI заявляла об интеграциях с Booking.com. Но пока нейросеть там используется для простых повторяющихся действий. Думаю, в 2026 году появятся ИИ-агенты, способные как минимум проходить цепочки из 50–100 шагов. Компании начнут специально под них обучать модели, нейросети станут ломаться, позволяя получать тренировочные данные из реальных провалов, – и так по кругу, все больше совершенствуясь.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Открыть в приложении