Как-то я столкнулся с утверждением, что якобы по наблюдению стюардесс пассажиры бизнес-класса чаще читают книги, а пассажиры эконома – смотрят фильмы и играют на смартфонах. По-моему, эта была какая-то популярная бизнес-книга, точно не помню, но это и не важно. Мы будем использовать этот тезис, чтобы с его помощью посмотреть на то, как по-разному могут быть связаны друг с другом факты чтения книги во время полета и нахождения в бизнес-классе.
В контексте этой книги подразумевалась прямая причинно-следственная связь:
Может быть такое? Запросто. Но, с другой стороны, связь может быть и обратной:
Почему бы и нет? И такая причинно-следственная связь вероятна. А может быть, между этими утверждениями нет прямой причинно-следственной связи. Но они могут являться следствиями единой причины и поэтому появляются вместе или как еще говорят коррелируют:
Как понять, какая из перечисленных выше схем ближе к истине? Для этого надо начать анализировать предположения или посылки, скрывающиеся за стрелками и выбрать то, что в нашем конкретном случае кажется боле правдоподобным.
В первом варианте посылкой может быть наличие у человека высокооплачиваемой работы:
Направление чтения диаграммы по форме напоминает улитку:
В итоге наша схема читается следующим образом:
ЕСЛИ человек читает книги во время полета, ТО человек летает бизнес-классом, ПОТОМУ ЧТО у человека есть высокооплачиваемая работа.
Если такая схема не кажется вам убедительной, то утверждение внутри стрелки можно рассмотреть детальнее. Например, в этом случае его можно представить в виде промежуточного следствия и проанализировать новые стрелки:
В итоге получатся две последовательные улитки, которые будут звучать следующим образом:
ЕСЛИ человек читает книги во время полета, ТО у человека есть высокооплачиваемая работа, ПОТОМУ ЧТО цитаты из книг помогают человеку проходить интервью на высокооплачиваемые позиции.
ЕСЛИ у человека есть высокооплачиваемая работа, ТО человек летает бизнес-классом, ПОТОМУ ЧТО высокооплачиваемые должности воспитывают нетерпимость к длинным очередям и тесным креслам.
Кажется эта связь аргументированной и правдоподобной? На самом деле при таком обосновании не обязательно читать именно в самолете. Возможно, у человека просто есть привычка много и часто читать. Именно эта привычка дает ему высокооплачиваемую работу, а также проявляет себя как чтение книги на глазах у стюардесс. В этом случае причинно-следственные связи будут выглядеть так:
Так лучше?
Давайте теперь посмотрим, как может выглядеть обоснование во втором варианте:
В общем тоже – почему бы и нет?...
Обоснования в третьем варианте (пример корреляции) могут выглядеть так:
Правдоподобно?
А может оказаться так, что чтение книг и место в бизнес-классе вообще никак между собой не связаны, но стюардессе так показалось. Строго говоря, читают книги и играют в смартфон и там и там. Надо понять, правда ли в бизнес-классе читают чаще, а это, скажем так, задача нетривиальная. Давайте я попробую показать на сколько.
Предположим, стюардесса подошла к делу строго научно и пересчитала всех, кто чем занят в полете и составила вот такую таблицу:
Таблица показывает, что вроде как в экономе больше половины пассажиров играют в смартфон, а в бизнесе больше половины читают книгу. Можно ли из этого сделать вывод, что между активностью в полете и классом билета есть связь?...
Если подойти к этому вопросу с уровнем математической подготовки 5-го класса, то с уверенностью можно сказать, что связь есть. Для убедительности можно даже построить график:
Теперь-то точно никто не сможет оспорить наличие связи! Никто, кроме статистического критерия хи-квадрат Пирсона… Он-то скажет, что при данной таблице утверждение о наличии связи между видом досуга (читать книгу или играть в смартфон) и классом билет будет ошибочным с вероятностью почти 50%, а тот, кто на основе таких данных сделал вывод о наличии корреляции (или хуже того – причинно-следственной связи) оказался одураченным случайностью.
Работа с цифрами и защита от одурачивания случайностью выходит за рамки этой книги, но, если кому интересно погрузиться в тему чуть глубже, есть прекрасная книга Владимира Савельева «Статистика и котики», где азы статистического анализа объясняются на песиках, котиках и слониках (без излишних математических сложностей).
А вот, если бы таблица выглядела бы так:
А график вот так:
То тут уже можно было бы с очень высокой вероятностью (p<0,001 с учетом поправки Йейтса на непрерывность) утверждать наличие связи, но связь эта – корреляционная, а не причинно-следственная.
В общем, смотрите и не перепутайте!
Но может оказаться так, что на данном рейсе в бизнес-классе летела многодетная мама с папой и семью детьми, которых она заставляла готовиться к ЕГЭ, в связи с чем они все как один уткнулись в книги, тогда это наблюдение окажется совпадением.
В общем, запомните, все что угодно может быть всем, чем угодно: причиной, следствием, коррелятом или просто совпадением и понять, что есть что в каждом конкретном случае – задача нетривиальная, требующая замечать ошибки в обосновании и аргументации причинно-следственных связей. Кстати, сколько ошибок в аргументации вы нашли в этом разделе?
Мне почему-то кажется, что формулировки вида
довольно запутанны. Я предпочитаю пользоваться упрощенной формой
Сразу становятся видны узкие места связей. Например, человек может читать в полете, но не иметь высокооплачиваемую работу.
А так тоже можно ;-) Это разворачивание улитки вглубь и потом превратится в
Кажись, буквы не хватает...