Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Твой персональный код Твой персональный код

Какими бывают тесты ДНК

Популярная механика
Морская прогулка Морская прогулка

Интерьер в эклектичном стиле, вдохновленный островом Санторини

SALON-Interior
Летящие над водой Летящие над водой

Одна из самых интересных технологий, переживающая настоящий ренессанс – фойлы

ТехИнсайдер
«Голос поэта» «Голос поэта»

О проекте «Голос Поэта» прямо как в лучшие годы, когда стихи печатали в журналах

OK!
Новый главный Новый главный

Самый большой, сложный и мощный космический телескоп в истории

Популярная механика
Баба-Яга и все-все-все: (очень) краткая история сказок в отечественном кино Баба-Яга и все-все-все: (очень) краткая история сказок в отечественном кино

Историю жанра сказочных фильмов, ключевые периоды и важнейшие имена

СНОБ
Автобудущее Автобудущее

Мы находимся на пороге одних из самых быстрых перемен в работе транспорта

Популярная механика
4 ситуации, когда передаривать подарки даже нужно, — и как правильно это делать 4 ситуации, когда передаривать подарки даже нужно, — и как правильно это делать

По этикету, вручить ненужные презенты другому человеку еще как можно

ТехИнсайдер
Полетим Полетим

Уже в 2030-х можно будет добраться за город на летающем такси

ТехИнсайдер
«Он совершенно чокнутый»: как гипнотизер проклял «Манчестер Сити» и его тренера «Он совершенно чокнутый»: как гипнотизер проклял «Манчестер Сити» и его тренера

Почему футбольный клуб «Манчестер Сити» переживает самый глубокий кризис

Forbes
Испытание делом Испытание делом

Экзоскелеты появляются в новостях нечасто и кажутся вещью из будущего

ТехИнсайдер
Бесчеловечные хищники морских глубин Бесчеловечные хищники морских глубин

Автономные необитаемые подводные аппараты ВМС США

Обозрение армии и флота
Рождение и гибель мегаполисов Рождение и гибель мегаполисов

Почему Вавилон пришел в упадок?

Вокруг света
Американский ситком, Gucci и Бурунов: эволюция батиного свитера Американский ситком, Gucci и Бурунов: эволюция батиного свитера

Как уродливый свитер перевесили из отцовского гардероба в раздел постмодерна

Правила жизни
Всего две точки над «е»: приключения одной буквы Всего две точки над «е»: приключения одной буквы

Как и откуда взялась буква Ё?

Знание – сила
В турецкой пещере нашли практически целую корзину позднего бронзового века В турецкой пещере нашли практически целую корзину позднего бронзового века

Археологи обнаружили в турецкой пещере Инёню практически целую древнюю корзину

N+1
Зимовье людей Зимовье людей

Как живут российские деревни и поселки, отрезанные от большой земли

Популярная механика
Историческая сага: 5 книг для ценителей масштабных историй Историческая сага: 5 книг для ценителей масштабных историй

Романы-саги, которые позволят рассмотреть мировые события с разных точек зрения

Maxim
Идея! Оставлять чаевые Идея! Оставлять чаевые

Учись правильно благодарить тех, кто оказывает тебе услуги

Maxim
«Путь к диалогу человека с Богом открыт каждому» «Путь к диалогу человека с Богом открыт каждому»

В чем в сущности своей различаются восточная и западная ветви христианства?

Монокль
«Мониторинг магнитного поля — это наш компас» «Мониторинг магнитного поля — это наш компас»

Каково вырасти в семье политического деятеля и философа, а стать математиком?

Наука
Что бы такого ре-анимирировать Что бы такого ре-анимирировать

Герои отечественных мультфильмов, не нуждающихся в оживлении

Weekend
Променад по выставке с картинками: лучшие музыкальные произведения, вдохновленные живописью Променад по выставке с картинками: лучшие музыкальные произведения, вдохновленные живописью

Удивительные примеры музыки, навеянной живописью

СНОБ
11 возможных причин того, что вы все еще одна 11 возможных причин того, что вы все еще одна

Скорее всего, у того, что вы пока не в отношениях, есть весомая причина

Psychologies
Ананас Ананас

Польза ананаса, ананасовая диета и рецепты с этим фруктом

Здоровье
«Роналду в дартсе»: как любитель фастфуда стал самым популярным спортсменом Британии «Роналду в дартсе»: как любитель фастфуда стал самым популярным спортсменом Британии

О слабости Люка к фастфуду и увлечении компьютерными играми

Forbes
Эра Тейлор Свифт: чем одна из главных поп-артисток вдохновляет женщин по всему миру Эра Тейлор Свифт: чем одна из главных поп-артисток вдохновляет женщин по всему миру

Почему тысячи женщин пытаются быть похожими на Тейлор Свифт?

Forbes
Пол Гетти: история бережливого миллиардера, который отказывался платить выкуп за похищенного внука Пол Гетти: история бережливого миллиардера, который отказывался платить выкуп за похищенного внука

Рассказываем историю одного из самых богатых и жадных людей планеты

ТехИнсайдер
Ученые утяжелили фекалии планктона минеральной пылью Ученые утяжелили фекалии планктона минеральной пылью

Минеральная пыль делает его фекалии планктона более плотными

N+1
Уменьшить хроническую боль можно с помощью качественного питания Уменьшить хроническую боль можно с помощью качественного питания

Как связаны употребление качественной пищи и хронические боли?

ТехИнсайдер
Открыть в приложении