Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Генетики прочитали ДНК последних охотников-собирателей Гималаев Генетики прочитали ДНК последних охотников-собирателей Гималаев

Генетики проанализировали ДНК больше ста представителей группы рауте

N+1
Чрезвычайное происшествие Чрезвычайное происшествие

Прощание Натальи Поклонской с Москвой, Госдумой и другими иллюзиями

Tatler
Палеогенетики прочитали ДНК четырех людей эпохи неолита из памятника Лепенски-Вир Палеогенетики прочитали ДНК четырех людей эпохи неолита из памятника Лепенски-Вир

Палеогенетики прочитали ДНК четырех человек на памятнике Лепенски-Вир

N+1
Тайна хрущёвок: зачем в старых квартирах делали окно между кухней и ванной? Тайна хрущёвок: зачем в старых квартирах делали окно между кухней и ванной?

Правда и мифы о том, зачем в квартирах делали окно между кухней и ванной

Cosmopolitan
Как набрать мышечную массу согласно науке: секреты рельефного тела Как набрать мышечную массу согласно науке: секреты рельефного тела

Набор мышечной массы – это не просто про штангу и куриную грудку

ТехИнсайдер
Как ретейл меняет Россию? Глава из книги «Цивилизация X5» о команде X5 Group Как ретейл меняет Россию? Глава из книги «Цивилизация X5» о команде X5 Group

Как «Перекресток» и «Пятерочка» изменили российскую торговлю

Esquire
«Что в чемоданах — неизвестно»: как работает Unclaimed Baggage из США, который продаёт потерянный в аэропорту багаж «Что в чемоданах — неизвестно»: как работает Unclaimed Baggage из США, который продаёт потерянный в аэропорту багаж

Unclaimed Baggage — магазин, перепродающий вещи из невостребованного багажа

VC.RU
Как проверить сердце: кому и когда это нужно делать Как проверить сердце: кому и когда это нужно делать

Кому и когда пора проверять сердце

РБК
Инновации для животных. Как выглядит современная ветеринария Инновации для животных. Как выглядит современная ветеринария

Как работают современные ветеринары?

СНОБ
Стрельба по орбите: зачем Россия сбила советский спутник Стрельба по орбите: зачем Россия сбила советский спутник

Россия продемонстрировала свои возможности сбивать спутники на низкой орбите

Forbes
Как это вынести: кто хоронит Ленина в российском YouTube Как это вынести: кто хоронит Ленина в российском YouTube

На чьи деньги автор «Расстанного проезда 3» выносит вождя революции из мавзолея

Forbes
8 способов сделать образ с пуховиком стильным — лучшие модные приемы зимы 8 способов сделать образ с пуховиком стильным — лучшие модные приемы зимы

Запоминай 8 классных способов, как носить пуховик этой зимой

Cosmopolitan
Обучение за границей: как выбрать лучшую школу или вуз для вашего ребенка Обучение за границей: как выбрать лучшую школу или вуз для вашего ребенка

Как выбрать учебное заведение за рубежом

СНОБ
6 рецептов осенних салатов, которые вам стоит приготовить дома 6 рецептов осенних салатов, которые вам стоит приготовить дома

Шеф-повара поделились своими секретными рецептами салатов

GQ
Вот скажи мне, американец: каково это — быть российским предпринимателем в США Вот скажи мне, американец: каково это — быть российским предпринимателем в США

Российские предприниматели — о негативном и предвзятом отношении к себе в США

Esquire
Извержения вулканов подтолкнули предков пуэбло к оседлости Извержения вулканов подтолкнули предков пуэбло к оседлости

Археологи изучили последствия похолодания VI века

N+1
Своя игра Своя игра

Стася Милославская в премьере спектакля «Двенадцатая ночь, или Все что угодно»

Grazia
Правила счастливой жизни: 33 совета, за которые ты скажешь спасибо Правила счастливой жизни: 33 совета, за которые ты скажешь спасибо

Три десятка способов обеспечить себе счастливое будущее

Cosmopolitan
В переговорах о покупке доли в Natura Siberica появился новый участник В переговорах о покупке доли в Natura Siberica появился новый участник

В переговорах о разделе долей в компании Natura Siberica участвует Павел Грачев

Forbes
Стрелки котенка: легкий макияж, который идет всем и всегда получается Стрелки котенка: легкий макияж, который идет всем и всегда получается

Макияж должен быть одинаково уместен и в дневное, и в вечернее время

Cosmopolitan
Налево пойдешь... Самые популярные мифы и факты об изменах Налево пойдешь... Самые популярные мифы и факты об изменах

Что специалисты думают об изменах?

Maxim
Австралийский мист Австралийский мист

Не все, что живет в Австралии, так и норовит нас убить

Weekend
Дедвлей, Намибия Дедвлей, Намибия

Пятачок, на котором встретились сразу несколько природных аномалий и подружились

Maxim
Воин света Воин света

В деревню в гости к креативному директору Maison Margiela Джону Гальяно

Vogue
Как встать на ноги после тяжелых травм: возможности современной медицины Как встать на ноги после тяжелых травм: возможности современной медицины

Сегодня технологии позволяют подняться на ноги буквально в день операции

Популярная механика
Поехали за зимой Поехали за зимой

Куда можно отправиться за волшебным настроением по просторам России

Домашний Очаг
Дефицит кератина Дефицит кератина

Тусклая кожа, сухие и ломкие волосы? Виноват дефицит кератина

Здоровье
«Он — лучший клиент». Проститутка рассказала о связи с мужчиной, больным ДЦП «Он — лучший клиент». Проститутка рассказала о связи с мужчиной, больным ДЦП

История Олив и Гэвина, открывших свой канал в ТикТоке об интимных практиках

Cosmopolitan
Перестань заедать стресс! Как победить жор на нервной почве? Перестань заедать стресс! Как победить жор на нервной почве?

Мы часто едим вовсе не потому, что голодны, а от скуки или в состоянии стресса

Cosmopolitan
Мария Нагая: мать Дмитрия и... Лжедмитрия Мария Нагая: мать Дмитрия и... Лжедмитрия

Последняя жена Ивана IV Грозного пережила не только мужа, но и двух сыновей

Дилетант
Открыть в приложении