Разделы
Материалы

Цифры тоже врут. Почему нельзя слепо верить статистике

Анна Синящик
Фото: открытые источники

Профессор Чарльз Уилан рассказал Фокусу о манипуляциях данными, отличительной черте нуждающегося человека и ахиллесовой пяте статистики

Авторитетный американский экономист Чарльз Уилан умеет просто объяснить сложные вещи. Вслед за бестселлером "Голая экономика" он написал книгу "Голая статистика", которая доступно объясняет гуманитариям, что представляет собой эта наука.

50-летний профессор рассказал Фокусу о причинах, побудивших его написать новую книгу, проблемах, решить которые может только статистика, и вопросах, ответить на которые не может даже она.

КТО ОН

Профессор, преподаватель экономики и политики в Чикагском университете и Дартмутском колледже, автор бестселлера "Голая экономика", переведенного на 13 языков

ПОЧЕМУ ОН

Его новая книга "Голая статистика" переведена на русский и входит в топ-5 книг по статистике на Amazon.com

У каждой моей книги своя история. К примеру, книга "10 ½ вещей" появилась благодаря выступлению перед студентами Дартмута. Я подготовил для них лекцию о пяти простых истинах, несправедливо игнорируемых другими выступающими. Пункт первый звучал так: "Время, проведенное в подвале студенческого братства, было потрачено не зря". Этот доклад снимали на видео, он стал невероятно популярным в интернете. Потом я трансформировал его в книгу.

За несколько лет до этого я должен был преподавать курс экономики в одной из школ журналистики. Я стал искать учебник, в котором основные экономические принципы были бы изложены доступным языком, без глубокого погружения в математику. Оказалось, что такого учебника не существует. Тогда я написал "Голую экономику".

У "Голой статистики" похожая история. Меня, мягко говоря, потрясли учебники, которыми мне приходилось пользоваться, будучи аспирантом: в них было слишком много математики и очень мало реальных примеров. Я подумал, что читателю наверняка будет интересно прочитать книгу об интуитивном понимании статистики. Между тем в издательской компании W.W. Norton подметили огромную популярность книги Дарелла Хаффа "Как лгать при помощи статистики". Они хотели опубликовать еще одну книгу на эту тему. Можно сказать, идея написать "Голую статистику" появилась в самый благоприятный для этого момент.

Автор "Голой статистики" не математик и не статист, в этом особенность книги. Большинство работ, посвященных этой науке, объединяет сильный математический уклон, множество формул. Допустим, я политолог — это означает, что меня волнует только практическая польза статистики в моей работе. Что полезного в таком случае я могу почерпнуть из учебника? Как статистические данные влияют на политику? Какие ошибки мы чаще всего совершаем, ссылаясь на эти данные? В своей рецензии на "Голую статистику" The Economist написал: "Проблема в том, что этому предмету обычно обучают те, кто любит статистику, а не те, кого волнует, как применить ее на практике". Мне кажется, журналист очень точно подметил проблему.

"Любые долги, даже если речь идет о небольшой сумме, являются признаком нужды"

"Любовь" слишком сильное слово для того, чтобы описать мои отношения со статистикой. У нас взаимная симпатия. Помню, впервые теплые чувства к ней у меня проснулись, когда я, аспирант, писал научно-исследовательскую работу, целью которой было определить признаки близости семьи к черте нищеты. Оказалось, чтобы узнать, испытывает ли человек финансовые трудности, достаточно проверить, берет ли он взаймы. Любые долги, даже если речь идет о небольшой сумме вроде $500, являются признаком нужды. Это не было чем-то очевидным, и я бы никогда не пришел к такому выводу, если бы не статистический анализ данных.

Статистика наука о признании закономерности. Приведу вам один из самых вдохновляющих примеров. Американские военнослужащие столкнулись с серьезной проблемой — частыми случаями суицида среди солдат и ветеранов. Процент самоубийств у этой категории значительно выше, чем аналогичный показатель среди всего населения. Сегодня американские военные используют статистическую модель, чтобы определить, кто из солдат находится в зоне риска, и вмешаться до того, как они попытаются себе навредить.

Мы каждый день сталкиваемся с откровенной манипуляцией статистическими данными. Меня всегда поражало, насколько небрежно люди относятся к статистическим данным в образовании. Здесь, в Штатах, мы делим школы на "хорошие" и "плохие". Мы, как правило, смотрим на результаты вступительных тестов и предполагаем, что школы с высокими результатами являются лучшими. По факту американские школы делятся на категории по расовому признаку и уровню дохода родителей. Поэтому учебные заведения с высоким баллом зачастую учат более привилегированных детей. Там не обязательно лучше преподают. Просто в таких школах больше студентов с высокообразованными родителями. Чтобы понимать, какие школы работают эффективнее других, нужно знать, какой прогресс показали ученики в процессе учебы в этой школе, а не какими умными они туда пришли. Этот момент часто упускают из виду.

Статистика не всемогуща. У нее плохо с предсказанием "переломных моментов". Мы прибегаем к статистике, чтобы узнать, что там, впереди, но на самом деле оборачиваемся и смотрим назад. Наши прогнозы на будущее основаны на том, что уже случилось в прошлом. Как только что-то меняется — спортивная команда покупает нового игрока или интересы потребителей сместились в другую сторону — прошлое сразу же перестает быть объективным предсказателем того, что произойдет в будущем.

"Я не расширяю границы знаний, не открываю ничего нового. Я всего лишь делаю уже известное более понятным"

Статистика не является детерминистической наукой. Если что-то и произошло в прошлом, это не означает, что оно в точности повторится в будущем. Кроме того, каждый из нас может изменить поведение и избежать роли жертвы обстоятельств. Говорите, многие погибают в результате дорожных происшествий? Значит, я буду ездить медленнее, пристегиваясь ремнем.

Я не боюсь стать жертвой собственных знаний. Глядя на жену, я не думаю о статистике разводов или измен. Общаясь со студентами, не вспоминаю, сколько процентов из них регулярно прогуливают мои лекции.

Газета The New York Times сравнила меня с лауреатом Пулитцеровской премии Дэйвом Барри. Это не может не льстить. Но я не питаю по этому поводу иллюзий. Вероятность того, что в течение следующих десяти лет я получу какую-нибудь престижную литературную премию, почти равна нулю. Бесспорно, мои книги хорошо продаются и выполняют важную образовательную функцию. Но я не расширяю границы знаний, не открываю ничего нового. Я всего лишь делаю уже известное более понятным. Это не то, за что вручают награды.

Выдержки из книги "Голая статистика" Чарльза Уилана

"Рассмотрим следующую гипотетическую новость из интернета: "Люди, которые делают короткие перерывы в работе в течение дня, имеют гораздо больше шансов умереть от рака". Представьте появление такого сообщения, когда вы занимаетесь веб-серфингом. Согласно весьма впечатляющим результатам обследования 36 тыс. работников, у тех, кто выходил из офиса на регулярные десятиминутные перерывы в течение каждого рабочего дня, вероятность заболевания раком в последующие пять лет оказалась на 41% выше, чем у тех, кто офисы не покидал. Понятно, что узнав такую новость, мы обязаны как-то на нее реагировать: возможно, провести общенациональную кампанию за запрет коротких перерывов в течение рабочего дня.

А может, следует подойти к проблеме с другой стороны и задуматься над тем, чем именно обычно занимаются работники во время таких десятиминуток? Не мне вам рассказывать, что многие кучкуются неподалеку от входа в офисное помещение, покуривая сигареты (и создавая при этом облако дыма, через которое вынуждены проходить те, кто входит или выходит из здания). Смею предположить, что именно сигареты, а не кратковременные перерывы в работе являются основной причиной раковых заболеваний"

"Если я сообщу, что по итогам проведения единого экзамена штата Иллинойс ученик третьего класса одной из начальных школ штата набрал 43 балла из 60 возможных, то этот абсолютный показатель скажет вам не так много. Но если я преобразую его в процентиль — то есть помещу в некое распределение, содержащее показатели всех учеников третьих классов начальных школ штата Иллинойс, — то он обретет гораздо больший практический смысл"