Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Австралиец нашел прижизненные фотографии вымершего почти сто лет назад бандикута Австралиец нашел прижизненные фотографии вымершего почти сто лет назад бандикута

Куратор музея обнаружил в архивах черно-белые фотографии бандикута

N+1
Кто и когда изобрёл ластик Кто и когда изобрёл ластик

Как только человек овладел письмом, ему понадобился инструмент для стирания

Популярная механика
Что случилось с пауками, отправленными в космос в 1973 году — и как это помогло науке Что случилось с пауками, отправленными в космос в 1973 году — и как это помогло науке

Пауки все еще плетут паутину в условиях микрогравитации?

Inc.
Эмоции мешают думать: чему можно научиться у Майкла Корлеоне Эмоции мешают думать: чему можно научиться у Майкла Корлеоне

Чему можно научиться у мафиози Корлеоне

Правила жизни
Почему свистит ремень генератора и как его проверить Почему свистит ремень генератора и как его проверить

Свистит ремень генератора: что делать и как проверить

РБК
«Нас считают вампирами». Мать и дочь преследуют за кожную аллергию на солнце «Нас считают вампирами». Мать и дочь преследуют за кожную аллергию на солнце

Женщину и ребенка преследуют религиозные фанатики, называя их вампирами

Cosmopolitan
«Счастье не за горами»: 7 шагов на пути к лучшей жизни «Счастье не за горами»: 7 шагов на пути к лучшей жизни

Чтобы стать счастливее, достаточно пары несложных действий

Psychologies
«Миф — это вирус» «Миф — это вирус»

Александр Зельдович о своей «Медее», ресентименте и феминизме

Weekend
Коммунисты на привале. Стоит ли верить охотничьим байкам Валерия Рашкина Коммунисты на привале. Стоит ли верить охотничьим байкам Валерия Рашкина

У депутата Госдумы от КПРФ Валерия Рашкина не выдержала совесть

СНОБ
Насколько разумны осьминоги: 10 фактов о головоногих Насколько разумны осьминоги: 10 фактов о головоногих

Что вы могли не знать об осьминогах?

Популярная механика
Почему кошек в древности считали магическими животными? Почему кошек в древности считали магическими животными?

Почему именно кошки не оставляют людей равнодушными?

Cosmopolitan
Он - великан, а она - карлица: фильмы о необычных историях любви Он - великан, а она - карлица: фильмы о необычных историях любви

Все различия не имеют значения, когда речь заходит о любви

Cosmopolitan
8 способов сделать образ с пуховиком стильным — лучшие модные приемы зимы 8 способов сделать образ с пуховиком стильным — лучшие модные приемы зимы

Запоминай 8 классных способов, как носить пуховик этой зимой

Cosmopolitan
Учёные оценили время жизни одиночного нейтрона Учёные оценили время жизни одиночного нейтрона

Время жизни одиночного нейтрона составляет 887 секунд

Популярная механика
Корейский мастер-класс Корейский мастер-класс

Сияющие ухоженные лица жительниц Кореи – визитная карточка этой страны

Здоровье
Анна Седокова: «Я обвиняла себя в том, что рожала детей от разных мужчин!» Анна Седокова: «Я обвиняла себя в том, что рожала детей от разных мужчин!»

Певица Анна Седокова рассказала о причинах драматичных переживаний в жизни

Cosmopolitan
1200 калорий в день: план питания на неделю с рецептами 1200 калорий в день: план питания на неделю с рецептами

План питания на 1200 калорий, рассчитанный на неделю

Cosmopolitan
Всемирная выставка в Дубае: что смотреть на Экспо 2020 Всемирная выставка в Дубае: что смотреть на Экспо 2020

Самые заметные и яркие павильоны на Всемирной выставке

РБК
Обязательно ли завтракать? Вот что говорят исследования Обязательно ли завтракать? Вот что говорят исследования

Вокруг питания и завтрака, в частности, существует множество предубеждений

РБК
«Она похожа на соль — улучшит любое блюдо, если не переборщить»: как инженер-пианист создал гитарную педаль Big Muff «Она похожа на соль — улучшит любое блюдо, если не переборщить»: как инженер-пианист создал гитарную педаль Big Muff

Майк Мэтьюс придумал «золотой стандарт» гитарных педалей с искажением

VC.RU
Не просто упаковка для еды, но и предмет искусства: история коробок для пиццы, рынок которых оценивается в $2 млрд Не просто упаковка для еды, но и предмет искусства: история коробок для пиццы, рынок которых оценивается в $2 млрд

Как появились коробки для пиццы из гофрокартона

VC.RU
Неравный брак: звездные пары с огромной разницей в возрасте Неравный брак: звездные пары с огромной разницей в возрасте

Звездные пары с большой разницей в возрасте

VOICE
Опростоволосились: 9 роковых красавиц, которых испортил блонд Опростоволосились: 9 роковых красавиц, которых испортил блонд

Звезды, решившиеся на блонд, который оказался им не к лицу

VOICE
Основатель «2ГИС» Александр Сысоев: «Сейчас мы даём технологии экосистеме “Сбера”, потом — она нам» Основатель «2ГИС» Александр Сысоев: «Сейчас мы даём технологии экосистеме “Сбера”, потом — она нам»

Основатель «2ГИС» — как сервис вписался в экосистему «Сбера»

VC.RU
«Черная пятница» в разгаре: что покупают россияне и в чем подвох «Черная пятница» в разгаре: что покупают россияне и в чем подвох

Краткая занимательная статистика «Черной пятницы» в России

Playboy
Включили цвет Включили цвет

Жители этих районов в разных уголках мира не знают, что такое серые будни

Лиза
12 способов повысить продуктивность в течение дня 12 способов повысить продуктивность в течение дня

5-минутные действия, которые приведут к грандиозным результатам

Psychologies
Уронили гроб, помпезный пафос, парад и принудиловка: воспоминания и мифы о похоронах Брежнева (и видео) Уронили гроб, помпезный пафос, парад и принудиловка: воспоминания и мифы о похоронах Брежнева (и видео)

Самые помпезные похороны в истории СССР (после похорон Сталина)

Maxim
Дочери Газманова, Табакова, Крапивиной: как выглядят дебютантки бала Tatler-2021 Дочери Газманова, Табакова, Крапивиной: как выглядят дебютантки бала Tatler-2021

Посмотрим на девушек, которых скоро будет обсуждать вся страна!

Cosmopolitan
Углекислый газ выступил катализатором получения амидов Углекислый газ выступил катализатором получения амидов

Ученые предложили экологичный и дешевый метод переамидирования

N+1
Открыть в приложении