Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Глубоководная добыча полезных ископаемых заглушит биологически важные звуки Глубоководная добыча полезных ископаемых заглушит биологически важные звуки

Как шум от разработки морского дна мешает коммуникации морских обитателей

N+1
Как охотники за багами и хакеры будут бороться с дискриминацией на рынке труда Как охотники за багами и хакеры будут бороться с дискриминацией на рынке труда

Могут ли нейросети помешать вам получить работу мечты?

Forbes
CAR-NK-терапия из донорских стволовых клеток помогла пациентке с системной склеродермией CAR-NK-терапия из донорских стволовых клеток помогла пациентке с системной склеродермией

Исследователи сообщили об успешном лечении тяжелой системной склеродермии

N+1
У крымского степняка обнаружили крупнейшую для бронзового века прижизненную трепанацию черепа У крымского степняка обнаружили крупнейшую для бронзового века прижизненную трепанацию черепа

Древний хирург провел трепанацию черепа с помощью каменных инструментов

N+1
Интроверты​​​​ Интроверты​​​​

Как использовать особенности своего характера

kiozk originals
Невероятное будущее: футуролог о том, как изменится наша жизнь через 15 лет Невероятное будущее: футуролог о том, как изменится наша жизнь через 15 лет

Наши родители бы сказали, что это невозможно

Playboy
Как голуби находят дорогу домой Как голуби находят дорогу домой

Как голуби ориентируются в сложных и меняющихся ландшафтах?

Популярная механика
Мужчина подменил злую кошку на добрую, и жена этого не заметила Мужчина подменил злую кошку на добрую, и жена этого не заметила

Герой истории нашел необычный способ ужиться с неприятным животным своей девушки

Psychologies
Синдром менеджера: что это такое и как его предотвратить Синдром менеджера: что это такое и как его предотвратить

Как проявляется синдром менеджера и можно ли его избежать?

Psychologies
Быть Стрельцом — это… 10 вещей, которые поймет только этот знак Быть Стрельцом — это… 10 вещей, которые поймет только этот знак

Поскольку сейчас на дворе сезон Стрельцов, поговорим именно о них

Cosmopolitan
Утопия или повседневность? Почему рано говорить о метавселенных Утопия или повседневность? Почему рано говорить о метавселенных

Откуда взялась идея metaverse, что она из себя представляет?

Популярная механика
Таки хороший доктор Таки хороший доктор

«Психиатр по соседству»: комедийный психотриллер о реальных событиях

Weekend
История древней кукурузы: как одомашнивали маис 5000 лет назад История древней кукурузы: как одомашнивали маис 5000 лет назад

Какие именно гены преобладали у предков современных злаков?

Популярная механика
Спектроскопия помогла недеструктивно измерить красноту мякоти яблок Спектроскопия помогла недеструктивно измерить красноту мякоти яблок

Спектроскопия поможет повысить эффективность их сортировки

N+1
Рома Штайн «Не хочу в эту кабалу!» Рома Штайн «Не хочу в эту кабалу!»

Певец и блогер Рома Штайн — что можно считать настоящей музыкой?

ЖАРА Magazine
Окислительная вечеринка Окислительная вечеринка

«Кислородная катастрофа» или Великое кислородное событие

Наука и жизнь
Охота на невидимок: как ученые ищут черные дыры Охота на невидимок: как ученые ищут черные дыры

Черные дыры — возможно, самые странные объекты во Вселенной

Forbes
10 легальных антидепрессантов 10 легальных антидепрессантов

Мы собрали средства от вселенской тоски, на которые не нужен рецепт врача

Maxim
Зумеры придумали магазин-кооператив: поставлять товар, убираться и помогать с упаковкой будут сами покупатели Зумеры придумали магазин-кооператив: поставлять товар, убираться и помогать с упаковкой будут сами покупатели

Магазин-кооператив — что это такое?

VC.RU
Когда смартфон разряжается быстрее — при подключении к Wi-Fi или к мобильному интернету Когда смартфон разряжается быстрее — при подключении к Wi-Fi или к мобильному интернету

Какое подключение — через Wi-Fi или сотовую связь — сохранит проценты заряда

Популярная механика
А ты умеешь? Как правильно ходить – объясняет эксперт А ты умеешь? Как правильно ходить – объясняет эксперт

Оказывается, ходить нужно не только много и часто, но и правильно

VOICE
Михаил Врубель: «В сияньи многоцветных крыл» Михаил Врубель: «В сияньи многоцветных крыл»

Выставка, посвященная творчеству Михаила Врубеля, открылась в Новой Третьяковке

СНОБ
Дмитрий Бозин. Уроки волшебства Дмитрий Бозин. Уроки волшебства

Дмитрий Бозин — о своем театральном пути и целях

Коллекция. Караван историй
«Локомотивом сближения может стать «зеленая» энергетика» «Локомотивом сближения может стать «зеленая» энергетика»

Тадзио Шиллинг о перспективах энергетического сотрудничества России и ЕС

РБК
5 ошибок Дмитрия Федорова, основателя сервиса по доставке еды Catery 5 ошибок Дмитрия Федорова, основателя сервиса по доставке еды Catery

Основатель сервиса Catery — об ошибках, которые мешали его бизнесу развиваться

Inc.
Стрельба по орбите: зачем Россия сбила советский спутник Стрельба по орбите: зачем Россия сбила советский спутник

Россия продемонстрировала свои возможности сбивать спутники на низкой орбите

Forbes
Живой детектор лжи: агент секретной службы США о мышлении пуленепробиваемых людей Живой детектор лжи: агент секретной службы США о мышлении пуленепробиваемых людей

Отрывок из книги «Стань неуязвимым» о том, как научиться распознавать ложь

Forbes
Нюхай апельсины, полюби лаванду: 5 привычек, которые изменят жизнь к лучшему Нюхай апельсины, полюби лаванду: 5 привычек, которые изменят жизнь к лучшему

Каждая из этих привычек поможет тебе изменить жизнь к лучшему в рекордные сроки

Cosmopolitan
Тест: Чего вы хотите на самом деле, когда мечтаете о деньгах? Тест: Чего вы хотите на самом деле, когда мечтаете о деньгах?

А какая у вас мотивация зарабатывать? Пройдя тест, вы узнаете ответ

Psychologies
«Нам было так хорошо вместе»: почему вы на самом деле скучаете по бывшему «Нам было так хорошо вместе»: почему вы на самом деле скучаете по бывшему

Почему тоска и грусть по бывшим все еще беспокоят вас?

Psychologies
Открыть в приложении