Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

N+1Наука

«Полный бред! Скептицизм в мире больших данных». Как относиться к получаемой информации критически

Манн, Иванов и Фербер, научно-популярные книгоиздатели

Если кто-то подкрепляет утверждения затейливыми терминами, цифрами и красивыми графиками, это еще не значит, что ему можно доверять. Статистика и язык точных наук могут быть всего лишь инструментами, призванными скрыть обман. Тот, кто умеет анализировать и перепроверять информацию, скорее всего, заметит подвох — остальные рискуют попасться в ловушку. В книге «Полный бред! Скептицизм в мире больших данных» (издательство «Манн, Иванов и Фербер»), переведенной на русский Елизаветой Пономаревой, ученые Карл Бергстром и Джевин Уэст рассказывают, как распознать чушь (в оригинале — bullshit) и почему для этого совсем не обязательно быть специалистом, а достаточно воспользоваться обыкновенной логикой. Предлагаем вам ознакомиться с фрагментом, посвященным «ошибке прокурора» и уровню значимости (p-value).

Ошибка прокурора

Как мы видели, в большинстве научных исследований ищут закономерности в данных, позволяющие делать выводы о мире. Но как отличить закономерность от случайного шума? И как определить, насколько она значима? Существует несколько способов это сделать, и самый распространенный — это использование р-значения. Грубо говоря, р-значение указывает, насколько вероятно, что наблюдаемая закономерность возникла по чистой случайности. Если это маловероятно, то мы можем сказать, что результат статистически значим. Но что это на самом деле означает и как нам трактовать р-значение? Мы ответим на эти вопросы с помощью короткой истории.

Представьте, что вы известный адвокат, который защищает скромного биолога, обвиняемого в самом поразительном похищении предмета искусства в современной истории.

Это сенсационное преступление. Богатая собирательница отправила частную коллекцию из тридцати шедевров европейского искусства на охраняемом поезде из своего особняка в Санта-Кларе в аукционный дом в Нью-Йорке. Когда поезд достиг пункта назначения, коробки отнесли в аукционный дом для распаковки. Путешествие прошло без происшествий, и к коробкам, на первый взгляд, никто не прикасался. Но, к всеобщему ужасу, четыре самые ценные картины были вырезаны из рам и исчезли! Ни полиция, ни страховая компания не нашли ни единой улики, не считая единственного отпечатка пальца на раме одной из пропавших работ. Украденные шедевры так никогда и не отыскали.

При отсутствии каких-либо иных наметок полиция прогнала от печаток пальца через огромную базу данных ФБР и нашла совпадение — отпечаток вашего клиента. (Он сдал свои отпечатки Администрации транспортной безопасности в обмен на возможность проходить досмотр в аэропорту, не снимая ботинок.) На допросе выяснилось, что у вашего клиента нет алиби. Он утверждает, что ни с кем не контактировал две недели, пока выслеживал окольцованную куропатку в горах Высокая Сьерра в рамках научного проекта.

Несмотря на отсутствие алиби, вы уверены, что ваш клиент не может быть виновен. Он всего лишь застенчивый ученый, а не хладнокровный похититель шедевров. У него уже есть два гранта NSF на исследование размножения куропаток, и, похоже, он не нуждается в дополнительных источниках дохода. К тому же, насколько вы заметили, он ни черта не понимает в искусстве; да что там, он считает, что Донателло — это черепашка-ниндзя.

Тем не менее начинается судебный процесс, и вы сталкиваетесь с блестящей молодой звездой прокуратуры. После описания всех остальных доказательств вины вашего клиента — слабых и косвенных — прокурор переходит к своему козырю, отпечатку пальца. Прокурор рассказывает присяжным, как именно компьютер сопоставляет отпечатки пальцев, и завершает свое выступление словами: «Нет абсолютно никаких шансов случайного совпадения настолько идентичных отпечатков».

Вы опровергаете его заявление: «По вашим словам, нет абсолютно никаких шансов настолько точного совпадения. Но так не бывает. В каждом тесте есть по крайней мере небольшой шанс ошибки». — «Конечно, — уступает он, — в принципе, тесты могут ошибаться. Но на практике шанс, что это случится, нулевой. Исследования ФБР показывают, что существует один шанс на десять миллионов, что два отпечатка совпадут настолько же точно. Один на десять миллионов — тут нет места сомнениям!»

Именно этого вы и ждали. Вы обращаетесь к присяжным и рисуете таблицу на три строки и два столбца на большом листе бумаги. Выглядит она примерно вот так.

«Я думаю, все мы согласны, что это преступление было кем-то совершено. И давайте также предположим, что отпечатки виновного есть в базе данных. Может быть, и нет, — обращаетесь вы к прокурору, — но это ослабит ваши доказательства. Так что давайте предположим, что они есть в базе». Прокурор кивает. «Тогда таблица должна выглядеть примерно вот так». Вы заполняете верхний ряд большим красным маркером.

Повернувшись к прокурору, вы интересуетесь: «Сколько человек включены в эту вашу базу ФБР?» Он перебивает вас: «Возражение, Ваша честь! Какое отношение это имеет к делу?» — «В этом и есть вся суть дела, — объясняете вы. — Я убежден, что объясню это все в течение следующих нескольких минут». — «Возражение отклонено». Сторона обвинения признается, что, если учесть все отпечатки пальцев преступников в США, все отпечатки гражданских лиц, полученные при проверке их биографий, и все отпечатки из базы Администрации транспортной безопасности, в базе представлено приблизительно пятьдесят миллионов американцев. И конечно, большинство отпечатков в базе не совпадают с тем, что найден на раме.

«Итак, теперь мы можем заполнять таблицу дальше», — говорите вы и вписываете число 50 000 000 в нижний правый угол.

Теперь вы указываете на нижний левый угол (это невиновные люди, чьи отпечатки тем не менее совпадут с найденным) и спрашиваете: «Как вы думаете, что нужно вписать сюда?»

Вы смотрите прямо на прокурора. «Вы сказали, что существует один шанс на десять миллионов, что алгоритм нашел неправильное совпадение. Это значит, что среди пятидесяти миллионов человек в этой базе должно быть примерно пять, чьи отпечатки совпадают с найденным и на месте преступления. Так что давайте заполним таблицу следующим образом»

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Гейдельбергский человек из Петралонской пещеры умер не меньше 277 тысяч лет назад Гейдельбергский человек из Петралонской пещеры умер не меньше 277 тысяч лет назад

Как ученые установили датировку древнего черепа из пещеры Петралона

N+1
Как сделать яркий макияж: тренды, идеи и советы эксперта Как сделать яркий макияж: тренды, идеи и советы эксперта

Яркий макияж популярен, но важно уметь расставлять акценты

РБК
Почему голубые пейзажи вызывают ностальгию и улучшают психическое самочувствие Почему голубые пейзажи вызывают ностальгию и улучшают психическое самочувствие

Как ностальгия влияет на наше психическое благополучие

ТехИнсайдер
Нырнуть в Баренцево море и поймать волну в Финском заливе: 5 направлений для экстремального водного туризма в России Нырнуть в Баренцево море и поймать волну в Финском заливе: 5 направлений для экстремального водного туризма в России

Экстремальный водный туризм России: рассказывают профессионалы

Вокруг света
Страдания от избытка красоты: что такое синдром Стендаля Страдания от избытка красоты: что такое синдром Стендаля

Что такое синдром Стендаля и в чем он выражается

ТехИнсайдер
Жара, насекомые и другие опасности Жара, насекомые и другие опасности

Как обеспечить безопасность детей летом

СНОБ
Отдохните от себя: как быть свободным в свободное время Отдохните от себя: как быть свободным в свободное время

Три проверенных способа по-настоящему отдохнуть

VC.RU
«Зеленый роутер»: ученые из Москвы и Тель-Авива раздали Wi-Fi через кактус «Зеленый роутер»: ученые из Москвы и Тель-Авива раздали Wi-Fi через кактус

Новые «зеленые» возможности в области беспроводной связи

Вокруг света
Австралопитекам из Колыбели человечества оказалось 3,4–3,7 миллиона лет Австралопитекам из Колыбели человечества оказалось 3,4–3,7 миллиона лет

Археологи пересмотрели датировку находок из Стеркфонтейна

N+1
Археологи нашли под Анапой редкий перстень с кельтским воином со щитом Археологи нашли под Анапой редкий перстень с кельтским воином со щитом

Археологи представили результаты исследования двух редких металлических перстней

N+1
Диета при панкреатите: что можно и нельзя есть. Советы экспертов Диета при панкреатите: что можно и нельзя есть. Советы экспертов

Какие ограничения панкреатит накладывает на привычный рацион?

РБК
Сибирский КОТ, или Прототип термоядерного реактора нового поколения Сибирский КОТ, или Прототип термоядерного реактора нового поколения

Как на промышленных предприятиях воспитывают сибирского КОТа

Наука
Еще 6 бередящих душу фотографий за несколько минут до смерти Еще 6 бередящих душу фотографий за несколько минут до смерти

Подборка фотографий с удивительными и жуткими историями

Maxim
Московский оборотень: история первого советского маньяка, который ненавидел богачей Московский оборотень: история первого советского маньяка, который ненавидел богачей

Первым серийным убийцей в СССР стал Василий Комаров, убивший 29 человек

VOICE
Настасья Кербенген. Голубая кровь Настасья Кербенген. Голубая кровь

Настасья Кербенген никогда не думала о том, чтобы стать актрисой

Коллекция. Караван историй
Энергетическая коллекция Энергетическая коллекция

Высокотехнологичное будущее российской энергетики и 11 ярких его примеров

ТехИнсайдер
«Не будут больше надо мной смеяться у твоего подъезда пацаны»: краткая история Юры Шатунова и «Ласкового мая» «Не будут больше надо мной смеяться у твоего подъезда пацаны»: краткая история Юры Шатунова и «Ласкового мая»

Вспоминаем историю Юры Шатунова и делимся архивными фотографиями

Правила жизни
СССР vs США: что показал эксперимент по сравнению образования 1958 года СССР vs США: что показал эксперимент по сравнению образования 1958 года

Много лет назад журналисты выяснили, где образование лучше: в США или в СССР

VOICE
Виноваты гаджеты: 5 способов остановить появление второго подбородка Виноваты гаджеты: 5 способов остановить появление второго подбородка

Какая связь между появлением второго подбородка и увлечением гаджетами?

VOICE
Polnalyubvi Polnalyubvi

Инди-певица Polnalyubvi отправляет серебряный век в TikTok

Собака.ru
5 садовых лайфхаков, которые облегчат вашу жизнь 5 садовых лайфхаков, которые облегчат вашу жизнь

Садоводство — это целое искусство

ТехИнсайдер
Су-25: чем прославился легендарный советский штурмовик Су-25: чем прославился легендарный советский штурмовик

Советский штурмовик Су-25: легенда в небесах

ТехИнсайдер
Мировой кубок Мировой кубок

Как создали чемпионат мира по футболу

Вокруг света
Что стало с корейским певцом PSY, который заработал сумасшедшие деньги на одной песне, а потом исчез неизвестно куда Что стало с корейским певцом PSY, который заработал сумасшедшие деньги на одной песне, а потом исчез неизвестно куда

Почему PSY исчез с горизонта так же внезапно, как появился

VOICE
Механизмы зрения: наука и жизнь Механизмы зрения: наука и жизнь

С чего начинается зрение?

Наука и жизнь
Как стать сотрудником, которого не уволят даже в кризис Как стать сотрудником, которого не уволят даже в кризис

В меняющемся мире очень важно уметь быстро адаптироваться под новые реалии

Лиза
Любовь зла Любовь зла

В один из самых дорогих отелей в Петербурге поселяется странный гость из Москвы

СНОБ
Чем полезна жимолость: 7 фактов Чем полезна жимолость: 7 фактов

В чем именно польза жимолости

РБК
8 травяных чаев, которые тебя взбодрят 8 травяных чаев, которые тебя взбодрят

Начинать утро с кофе – классика жанра. Но не всем его можно пить

Лиза
Небоскреб для избранных Небоскреб для избранных

Уже с момента застройки этот дом считался самым престижным в столице

Караван историй
Открыть в приложении