Словарь нового веба
Как сегодня говорят про нейросети, мемы и жизнь в интернете
Культура меняется быстро. Позавчера мы смотрели демотиваторы на сайтах, сегодня ждем, когда любимый канал с мемами выложит новую порцию. Вчера мы перестали звонить без разрешения («Наберу?»), сегодня оправдываемся за голосовые сообщения. Рисовали в фотошопе — а теперь скармливаем Midjorney содержание сна. За этой сменой правил, законов и обычаев интернета следят антропологи, культурологи, искусствоведы и социологи. Мы составили краткий словарь новых терминов — и очертили круг вопросов, которые обозначаемые явления вызывают у исследователей. Просто чтобы вы были в курсе и могли без переводчика послушать выступления гостей междисциплинарной конференции о вебе, цифровой среде и интернет-культуре Screenshot_2023, которую провел Музей криптографии. Записи выступлений спикеров и публичных дискуссий, а также видеоролик по итогам конференции можно посмотреть здесь.
Новые явления
Вокруг только и разговоров, что о нейросетях, генерирующих то, что раньше умели создавать только люди: речь, текст, картинки. Какие слова появились для описания явлений, порожденных пришествием новых инструментов на основе нейросетей?
Дипфейк
Дипфейк — это, например, когда Арнольд Шварценеггер играет в комедии Гайдая или Олаф Шольц цитирует Данилу Багрова. Ни губернатор Калифорнии, ни немецкий канцлер никогда ничего подобного не делали, но видео есть, и вполне убедительные. Только наметанный глаз — а в некоторых случаях только разработанные с этой целью программы — отличит настоящие кадры от сгенерированных с помощью нейросетей.
Технология замены фрагментов видео или голоса, в отличие от многих других прорывов, напугала всех и сразу. Дурные последствия ее нерегулируемого использования очевидны. Люди доверяют видео гораздо больше, чем текстам, и не склонны проверять их, поэтому даже опровергнутый дипфейк может сломать репутацию или заставить людей делать то, что они в противном случае делать бы не стали.
Подрывая позиции видео как доказательства, дипфейк лишает человечество одного из важнейших оснований для справедливости. И просвещение здесь не помощник, заметили в 2018 году двое американских юристов Даниэль Ситрон и Роберт Чесни. Чем больше люди знают о возможностях дипфейков, тем менее они склонны доверять любым видео, в том числе и настоящим. Такое недоверие на руку недобросовестным акторам: правда кажется публике недостижимой, а тем, кто нарушает общественные нормы, становится легче уйти от ответственности, просто объявив доказательства своей вины фейками. Эту ситуацию юристы назвали «выгода обманщика» (от англ. liar’s dividend). Всеобщее недоверие к любой информации, которое можно описать ставшей мемом фразой «всей правды мы никогда не узнаем», в итоге выгодно тем, кто распространяет ложь.
AI-изображение
Сгенерированная компьютером картинка, генеративное изображение и просто «нейросеть нарисовала» — мы еще не до конца определились с тем, как называть такие изображения.
Сначала были стилизаторы — программы, способные превратить любое изображение в «картину в стиле Ван Гога». В 2015 году Google представила DeepDream, которая умела в любой горстке пикселей увидеть глаза и почему-то собак. Время от времени появлялись отдельные сервисы, рисующие простенькие дудлы по текстовому описанию (системы Text2Image).
Но настоящий бум случился два года назад, когда Open AI — кстати, название этой компании тоже стоит внести в список важных слов — выпустила DALL-E, нейронную сеть, способную по текстовым описаниям на естественном языке генерировать высококачественные изображения. Открытая для публики на год позже нейросеть Midjourney продолжила тренд на повышение качества картинки, задрав его до небывалых высот.
В связи с развитием генеративных нейросетей принято задавать несколько вопросов. Кого считать автором этих изображений? Искусство ли это? Насколько законно обучать такие нейросети на картинках из интернета? Заменят ли нейросети дизайнеров и художников? И как будет выглядеть следующее поколение таких инструментов? Ответов на эти вопросы пока не знает, кажется, никто.
Промпт
Текстовое описание, по которому AI-инструменты генерируют изображения, называется промптом. И это очень важное слово, потому что скоро написание качественных промптов может стать если не новой профессией, то очень востребованным навыком. Уже сейчас есть люди, которые научились добиваться от нейросетей именно тех картинок, каких требует заказчик. Подробнее о том, как профессионалы работают с генеративными нейросетями, читайте в материале «Совместный сновидческий процесс».
С языковыми моделями тоже нужно уметь говорить так, чтобы с наибольшей вероятностью получать наилучший результат. Это искусство чем-то сродни написанию поисковых запросов лет десять назад, когда поисковики еще не были усилены с помощью машинного обучения. Тогда, чтобы добиться правильных результатов, нужно было написать не «как продать гараж в Балашихе», а «гараж Балашиха продать». Сегодня мощные языковые модели понимают естественный язык и поймут даже «как мне лучше всего продать гараж в Балашихе». Но для наилучших результатов с ними тоже нужно уметь разговаривать. Крупные IT-компании уже размещают объявления о наборе на новые вакансии; кроме промпт-инженера новая должность иногда называется AI-whisperer — буквально «заклинатель ИИ».