Все лгут
Поисковики, Big Data и Интернет знают о вас все
В 2017 году его книга «Все лгут. Поисковики, Big Data и интернет знают о вас все» была признана бестселлером. Не в последнюю очередь потому, что Стивенс-Давидовиц пишет в энергичной и остроумной манере и приводит много личных примеров, иллюстрируя свою точку зрения, например, использованием своей бабушки в качестве источника больших данных. В качестве одного из своих источников вдохновения он называет книгу Стивена Левитта и Стивена Дабнера «Фрикономика». Хотя автор и признает, что во многих интеллектуальных кругах к этому исследованию отнеслись негативно, он, тем не менее надеялся, что книга «Все лгут» сможет стать аналитической версией «Фрикономики», в большей степени ориентированной на данные.
Наш обзор не заменит вам прочтение книги «Все лгут» в полном объёме. Однако, мы готовы разжечь ваше любопытство и побудить к её самостоятельному изучению. Начнём?
Для кого эта книга?
Желание человека быть лучшей версией себя в глазах других вполне естественно. Это одна из главных причин, по которой многие так или иначе врут окружающим и даже самим себе. Но никто не будет врать поисковой системе. Она знает, что вы смотрите, покупаете, чем интересуетесь и даже чем вы болеете. Если вам интересно знать, кто, как и для чего использует миллиарды наших ежедневных запросов, книга «Все лгут» — лучший способ это сделать. Ведь она написана ученым, практиком и теоретиком науки о данных, работавшим в Google — «Мекке» интернет-поиска.
Не все интернет-данные одинаково полезны
«Все лгут» – это исследование человеческого поведения и психологии, которое опирается на данные поиска в интернете. В отличие от других работ в области социальных наук, которые были вынуждены полагаться на информацию, полученную путем опросов, Стивенс-Давидовиц в своих суждениях основывается на гораздо более правдивом и надежном источнике – на поисковых данных Google.
Большие данные невероятно могущественны, поскольку обеспечивают доступ к ранее недоступной информации. Субъекты исследования могут лгать – намеренно или сами того не осознавая. Нет никакого способа узнать, что люди на самом деле делают за закрытыми дверями, когда за ними никто не наблюдает. Данные поиска и активности в интернете распахивают перед исследователями окно в тайные мысли множества пользователей. При помощи полученной таким образом информации можно сделать новые выводы о психологии и действиях людей.
Сегодня самым ценным источником больших данных, проливающих свет на мотивы человеческого поведения, является архив поисковых запросов Google. Эти запросы анонимны, поэтому у людей нет причин лгать. Людям приходится быть честными, так как они стремятся найти ответы на конкретные вопросы или исследовать интересующие их области. Никому не придет в голову задавать поисковику вопрос, который на самом деле его не интересует.
Но не все интернет-данные одинаково полезны. Тогда как поисковые запросы в Google являются золотым стандартом достоверной информации о людях, данные социальных сетей часто не отличаются правдивостью. В социальных сетях люди стараются произвести эффект: тут они демонстрируют лучшие версии самих себя. Женщина, которая публикует очаровательные фотографии своего новорожденного ребенка на Facebook (соцсеть признана в РФ экстремистской и запрещена), возможно, только что гуглила «как справиться с послеродовой депрессией?».
Большие данные могут быть крайне полезны для общества. При правильном использовании они бы точно предсказали результаты выборов 2016 года в США, с чем, кстати, промахнулись социологи. Но когда правительства, корпорации или даже просто потенциальные преступники получают доступ к большим данным, этические последствия могут быть ошеломляющими. Например, некоторые люди ищут в Google информацию об убийствах, прежде чем лишить кого-то жизни. Но подавляющее большинство людей, которые делают подобные запросы, никогда не совершают никаких актов насилия. Следует ли разрешить полиции допрашивать тех, кто гуглит про убийства? – Конечно, нет! Необходимо создать системы защиты общества от злоупотреблений доступом к большим данным, не препятствуя при этом возможности использовать эту информацию с пользой для социума, считает автор этой книги.
А теперь – обо всем подробнее!
Большие данные являются мощным инструментом, потому что они позволяют получить доступ к новой, объективной информации, которая может быть использована для лучшего понимания человеческого общества.
У хорошего специалиста по анализу данных есть чутье на уникальные свежие источники информации. Например, исследователи могут проверить, насколько активны пользователи порнографического агрегатора Pornhub, чтобы предсказать данные по безработице еще до того, как будут опубликованы официальные цифры. Большие данные также позволяют исследователям получить доступ к достоверным сведениям, которые не искажаются из-за того, что мы хотим выглядеть лучше в глазах других. В анонимной обстановке люди готовы высказать свои самые сокровенные опасения – ведь Google не станет их судить. Пользователи могут не осознавать или не заботиться о том, что их информация собирается и анализируется.