Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Мы из будущего Мы из будущего

«Белая Вежа» — один из самых интересных научных центров

ТехИнсайдер
Дизайн человека Дизайн человека

Что такое Нuman design — красивая теория или опасный самообман?

Лиза
Полетим Полетим

Уже в 2030-х можно будет добраться за город на летающем такси

ТехИнсайдер
«Операция „Барбаросса“: Начало конца нацистской Германии» «Операция „Барбаросса“: Начало конца нацистской Германии»

Что мешало немцам продвигаться к Москве

N+1
Автобудущее Автобудущее

Мы находимся на пороге одних из самых быстрых перемен в работе транспорта

Популярная механика
Мир, где весело и нет времени Мир, где весело и нет времени

Все самое важное о Дживсе и Вустере

Weekend
Немирное «земледелие» Немирное «земледелие»

Как работает система залпового минирования

Популярная механика
Премиальный минимализм Премиальный минимализм

Эта ванная — пример идеального премиального минимализма

Идеи Вашего Дома
Испытание делом Испытание делом

Экзоскелеты появляются в новостях нечасто и кажутся вещью из будущего

ТехИнсайдер
«Мой друг Лапшин»: шепоты и крики «Мой друг Лапшин»: шепоты и крики

Новый спектакль соткан из мучительных интонаций и горестных предчувствий

Ведомости
Винтокрыл против конвертоплана Винтокрыл против конвертоплана

«Вертолет» не самый подходящий термин для описания этих воздушных монстров

Популярная механика
Огненная саламандра Огненная саламандра

Мифический «дух огня» с точки зрения биологии

Вокруг света
Солнце в спирали Солнце в спирали

Стеллараторы — новые фавориты в гонке за будущую термоядерную энергетику

ТехИнсайдер
Как подключить телефон к машине: 3 способа Как подключить телефон к машине: 3 способа

Зачем подключать телефон к машине и как это сделать?

РБК
Как вылечить робота Как вылечить робота

На участке окончательной приемки врач пытается реанимировать пациента-андроида.

ТехИнсайдер
Безопасно ли прыгать в сухие листья Безопасно ли прыгать в сухие листья

Прыжки в кучи сухих листьев могут представлять опасность для здоровья

ТехИнсайдер
Оцифрованный фитнес Оцифрованный фитнес

Виртуальная реальность и искусственный интеллект добрались и до тренажеров

ТехИнсайдер
В этот раз я не родился курьером В этот раз я не родился курьером

Ведь доставлять можно не только продукты... можно нести что-то большее

Правила жизни
Арктический город будущего Арктический город будущего

Реальные технологии строительства в Арктике приходили из Норильска

ТехИнсайдер
10 неожиданных вопросов группе X4 10 неожиданных вопросов группе X4

Группа X4 — о финансовых приоритетах и детских утренниках

VOICE
Эдуард Веркин: Литературе не особо требуется спасение Эдуард Веркин: Литературе не особо требуется спасение

Эдуард Веркин рассуждает, чем young adult отличается от подростковой литературы

Ведомости
Шапито Шапито

«Скорее приезжайте в «Шапито»! Женщине плохо!»

Правила жизни
Налоговые оговорки в договорах: защита бизнеса от налоговых рисков Налоговые оговорки в договорах: защита бизнеса от налоговых рисков

Что такое налоговые оговорки?

Inc.
Нефтесервис хочет заказов Нефтесервис хочет заказов

Почему растет выручка нефтесервисных компаний

Ведомости
Наука в фантастике: эпизоды истории Наука в фантастике: эпизоды истории

Творчество Аркадия и Бориса Стругацких в контексте развития научных взглядов

Наука и жизнь
Мягкая сила Мягкая сила

Искусствовед — о дарах и уроках Великого шелкового пути

Seasons of life
«Всегда» уже заканчивается «Всегда» уже заканчивается

Что может исчезнуть из нашей жизни раньше, чем мы успеем это осознать?

Вокруг света
Светлая сила Светлая сила

Что такое фотовольтаические системы и из чего они состоят?

Y Magazine
Почему мир заговорил о белом водороде: новый источник чистой энергии Почему мир заговорил о белом водороде: новый источник чистой энергии

Белый водород — новый уникальный источник энергии?

ТехИнсайдер
Уплотнение экономического пространства Уплотнение экономического пространства

Почему нужно ускорять транспортное сообщение с Сибирью и Дальним Востоком

Деньги
Открыть в приложении