Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

N+1Наука

«Полный бред! Скептицизм в мире больших данных». Как относиться к получаемой информации критически

Манн, Иванов и Фербер, научно-популярные книгоиздатели

Если кто-то подкрепляет утверждения затейливыми терминами, цифрами и красивыми графиками, это еще не значит, что ему можно доверять. Статистика и язык точных наук могут быть всего лишь инструментами, призванными скрыть обман. Тот, кто умеет анализировать и перепроверять информацию, скорее всего, заметит подвох — остальные рискуют попасться в ловушку. В книге «Полный бред! Скептицизм в мире больших данных» (издательство «Манн, Иванов и Фербер»), переведенной на русский Елизаветой Пономаревой, ученые Карл Бергстром и Джевин Уэст рассказывают, как распознать чушь (в оригинале — bullshit) и почему для этого совсем не обязательно быть специалистом, а достаточно воспользоваться обыкновенной логикой. Предлагаем вам ознакомиться с фрагментом, посвященным «ошибке прокурора» и уровню значимости (p-value).

Ошибка прокурора

Как мы видели, в большинстве научных исследований ищут закономерности в данных, позволяющие делать выводы о мире. Но как отличить закономерность от случайного шума? И как определить, насколько она значима? Существует несколько способов это сделать, и самый распространенный — это использование р-значения. Грубо говоря, р-значение указывает, насколько вероятно, что наблюдаемая закономерность возникла по чистой случайности. Если это маловероятно, то мы можем сказать, что результат статистически значим. Но что это на самом деле означает и как нам трактовать р-значение? Мы ответим на эти вопросы с помощью короткой истории.

Представьте, что вы известный адвокат, который защищает скромного биолога, обвиняемого в самом поразительном похищении предмета искусства в современной истории.

Это сенсационное преступление. Богатая собирательница отправила частную коллекцию из тридцати шедевров европейского искусства на охраняемом поезде из своего особняка в Санта-Кларе в аукционный дом в Нью-Йорке. Когда поезд достиг пункта назначения, коробки отнесли в аукционный дом для распаковки. Путешествие прошло без происшествий, и к коробкам, на первый взгляд, никто не прикасался. Но, к всеобщему ужасу, четыре самые ценные картины были вырезаны из рам и исчезли! Ни полиция, ни страховая компания не нашли ни единой улики, не считая единственного отпечатка пальца на раме одной из пропавших работ. Украденные шедевры так никогда и не отыскали.

При отсутствии каких-либо иных наметок полиция прогнала от печаток пальца через огромную базу данных ФБР и нашла совпадение — отпечаток вашего клиента. (Он сдал свои отпечатки Администрации транспортной безопасности в обмен на возможность проходить досмотр в аэропорту, не снимая ботинок.) На допросе выяснилось, что у вашего клиента нет алиби. Он утверждает, что ни с кем не контактировал две недели, пока выслеживал окольцованную куропатку в горах Высокая Сьерра в рамках научного проекта.

Несмотря на отсутствие алиби, вы уверены, что ваш клиент не может быть виновен. Он всего лишь застенчивый ученый, а не хладнокровный похититель шедевров. У него уже есть два гранта NSF на исследование размножения куропаток, и, похоже, он не нуждается в дополнительных источниках дохода. К тому же, насколько вы заметили, он ни черта не понимает в искусстве; да что там, он считает, что Донателло — это черепашка-ниндзя.

Тем не менее начинается судебный процесс, и вы сталкиваетесь с блестящей молодой звездой прокуратуры. После описания всех остальных доказательств вины вашего клиента — слабых и косвенных — прокурор переходит к своему козырю, отпечатку пальца. Прокурор рассказывает присяжным, как именно компьютер сопоставляет отпечатки пальцев, и завершает свое выступление словами: «Нет абсолютно никаких шансов случайного совпадения настолько идентичных отпечатков».

Вы опровергаете его заявление: «По вашим словам, нет абсолютно никаких шансов настолько точного совпадения. Но так не бывает. В каждом тесте есть по крайней мере небольшой шанс ошибки». — «Конечно, — уступает он, — в принципе, тесты могут ошибаться. Но на практике шанс, что это случится, нулевой. Исследования ФБР показывают, что существует один шанс на десять миллионов, что два отпечатка совпадут настолько же точно. Один на десять миллионов — тут нет места сомнениям!»

Именно этого вы и ждали. Вы обращаетесь к присяжным и рисуете таблицу на три строки и два столбца на большом листе бумаги. Выглядит она примерно вот так.

«Я думаю, все мы согласны, что это преступление было кем-то совершено. И давайте также предположим, что отпечатки виновного есть в базе данных. Может быть, и нет, — обращаетесь вы к прокурору, — но это ослабит ваши доказательства. Так что давайте предположим, что они есть в базе». Прокурор кивает. «Тогда таблица должна выглядеть примерно вот так». Вы заполняете верхний ряд большим красным маркером.

Повернувшись к прокурору, вы интересуетесь: «Сколько человек включены в эту вашу базу ФБР?» Он перебивает вас: «Возражение, Ваша честь! Какое отношение это имеет к делу?» — «В этом и есть вся суть дела, — объясняете вы. — Я убежден, что объясню это все в течение следующих нескольких минут». — «Возражение отклонено». Сторона обвинения признается, что, если учесть все отпечатки пальцев преступников в США, все отпечатки гражданских лиц, полученные при проверке их биографий, и все отпечатки из базы Администрации транспортной безопасности, в базе представлено приблизительно пятьдесят миллионов американцев. И конечно, большинство отпечатков в базе не совпадают с тем, что найден на раме.

«Итак, теперь мы можем заполнять таблицу дальше», — говорите вы и вписываете число 50 000 000 в нижний правый угол.

Теперь вы указываете на нижний левый угол (это невиновные люди, чьи отпечатки тем не менее совпадут с найденным) и спрашиваете: «Как вы думаете, что нужно вписать сюда?»

Вы смотрите прямо на прокурора. «Вы сказали, что существует один шанс на десять миллионов, что алгоритм нашел неправильное совпадение. Это значит, что среди пятидесяти миллионов человек в этой базе должно быть примерно пять, чьи отпечатки совпадают с найденным и на месте преступления. Так что давайте заполним таблицу следующим образом»

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Ночное освещение сделало листья городских деревьев слишком прочными для поедания насекомыми Ночное освещение сделало листья городских деревьев слишком прочными для поедания насекомыми

Искусственное освещение делает листья городских деревьев прочнее

N+1
3 проверенных способа начать делать то, что не хочется 3 проверенных способа начать делать то, что не хочется

Вам очень не хочется приступать к важному делу?

Psychologies
Опубликованы первые результаты лабораторных исследований грунта с обратной стороны Луны Опубликованы первые результаты лабораторных исследований грунта с обратной стороны Луны

Что из себя представляют образцы грунта с обратной стороны Луны?

N+1
Шутки Кубрика и исповедь рэп-легенды: 5 самых интересных фильмов Beat Film Festival Шутки Кубрика и исповедь рэп-легенды: 5 самых интересных фильмов Beat Film Festival

Интервью Джейн Биркин, гонки на лодках Венеции и звезды подростковой драмы 90-х

Forbes
Рост заболеваемости раком легких в России объяснили распространением методов диагностики Рост заболеваемости раком легких в России объяснили распространением методов диагностики

К концу 2010-х годов в России наблюдался рост заболеваемости раком легких

N+1
Собирательный образ Собирательный образ

Как разделять со своим сообществом ответственность?

Seasons of life
Время тинейджера Время тинейджера

Что такое подросток в постсоветском кино и что из него можно понять о взрослых

Weekend
Огромная свалка комет: подлинная природа Плутона Огромная свалка комет: подлинная природа Плутона

Плутон больше не считают планетой, но от этого он не становится менее интересным

ТехИнсайдер
«Чучело» в 2022 году: 3 причины посмотреть «Невидимый мир» «Чучело» в 2022 году: 3 причины посмотреть «Невидимый мир»

Чем примечателен «Невидимый мир» Лауры Вандель?

Psychologies
Уходим на каникулы: 5 признаков, что вам пора в отпуск Уходим на каникулы: 5 признаков, что вам пора в отпуск

Как понять, что действительно пора в отпуск?

Psychologies
Вечное лето не за горами: ученые назвали природный пояс России, который скоро исчезнет Вечное лето не за горами: ученые назвали природный пояс России, который скоро исчезнет

Человечество может потерять уникальную фауну и флору

Вокруг света
Это все неправда! 5 главных стереотипов о женщинах, не имеющих отношения к реальности (ну, почти) Это все неправда! 5 главных стереотипов о женщинах, не имеющих отношения к реальности (ну, почти)

Пришло время развенчать главные стереотипы о женщинах

VOICE
Маленькая непобедоносная война Маленькая непобедоносная война

«Зимняя война» — кино о том, как маленькая война может стать провалом

Дилетант
Вся власть доносам Вся власть доносам

Как донос стал частью российской государственности

Weekend
«Синдром Отелло»: как отличить обычную ревность от болезни «Синдром Отелло»: как отличить обычную ревность от болезни

Шекспир не зря называл ревность «зеленоглазым монстром»

VOICE
История советского контрснайпера: как школьный завхоз уложил 422 фашиста История советского контрснайпера: как школьный завхоз уложил 422 фашиста

Василий Теркин действительно существовал и был одним из лучших контрснайперов

ТехИнсайдер
Чем опасен избыток сна и что делать, если хронически не высыпаешься Чем опасен избыток сна и что делать, если хронически не высыпаешься

Долгий сон может быть вреден для организма так же, как недосып

ТехИнсайдер
Кровно заработанное Кровно заработанное

Учимся рассчитывать свою будущую пенсию

Лиза
Ваша честь! С помощью этого фэшн-трюка адвокат Деппа влюбила в себя весь мир Ваша честь! С помощью этого фэшн-трюка адвокат Деппа влюбила в себя весь мир

Разбирательство между Деппом и Херд запомнится нам надолго

VOICE
Живой будильник: почему петухи кричат по утрам Живой будильник: почему петухи кричат по утрам

Утренний крик петуха был первым будильником, который появился у человека

ТехИнсайдер
Опасная косметика: косметолог рассказала, какими средствами вредно пользоваться летом Опасная косметика: косметолог рассказала, какими средствами вредно пользоваться летом

Летом некоторые компоненты ваших уходовых средств могут причинить вред

Psychologies
«Тут была заброшенная мусорка»: как актриса Ирина Чеснокова открыла бар в Турции «Тут была заброшенная мусорка»: как актриса Ирина Чеснокова открыла бар в Турции

Ирина Чеснокова — о том, как русский бар встречают за границей

Forbes
Игорь Горьков Игорь Горьков

Генеральный директор Nexign Игорь Горьков — можно ли предсказать будущее?

Собака.ru
Вопрос дня: как все успевать? Вопрос дня: как все успевать?

Как успевать реализовывать свои амбиции и не забывать про личные интересы?

СНОБ
Какой была бы современная Россия, если бы Петра I не существовало Какой была бы современная Россия, если бы Петра I не существовало

Чего мы бы лишились без пресловутого окна в Европу

Maxim
Люди Веры Люди Веры

Каждый день наши герои помогают людям жить

Seasons of life
Как поменять работу после 40 лет Как поменять работу после 40 лет

Как преодолеть страх и безболезненно сменить род деятельности в зрелом возрасте

Maxim
Такой ошибки не простит история: 10 древних артефактов, уничтоженных по глупости людей Такой ошибки не простит история: 10 древних артефактов, уничтоженных по глупости людей

Многие ценнейшие артефакты были разрушены случайно, из-за банального невежества

ТехИнсайдер
Книги, способные прокачать ваш мозг: лучшие научно-популярные издания о том, как устроен мир Книги, способные прокачать ваш мозг: лучшие научно-популярные издания о том, как устроен мир

Книги, которые приоткроют тайны удивительного мира вокруг

ТехИнсайдер
Гений генетики: как устроена биотех-компания, которая умеет редактировать ДНК Гений генетики: как устроена биотех-компания, которая умеет редактировать ДНК

Intellia Therapeutics: Нобелевская премия и финансовые проблемы

Forbes
Открыть в приложении