Самое простое объяснение

Фото: REUTERS/Stephane Mahe

Несколько месяцев назад я писал о том, что футбол – очень сложная игра, с трудом сводящаяся к простым числовым параметрам, и для его осмысленного анализа необходимы какие-то новые способы. Старые способы (включая здравый смысл и мнение экспертов), впрочем, тоже могут иметь под собой какую-то научную основу. Сегодня я хочу немного рассказать о простом статистическом феномене, который объясняет сразу несколько проявлений этого самого здравого смысла в спорте, включая некоторые надоедливые клише. Он называется статистической регрессией к среднему, и формулируется настолько просто, что выглядит практически очевидным.

Этот феномен можно объяснить на таком популярном примере. Представьте, что в школе провели контрольный тест по математике по стобалльной системе. Отобрав 10% лучших учеников по результатам теста (средний балл которых был, скажем, 90), комиссия через два дня проводит новое тестирование по той же теме. По его итогам выясняется, что эти лучшие ученики в среднем набрали всего лишь 85 баллов – как будто бы они вместо того, чтобы чему-то научиться на своих ошибках, внезапно поглупели. Начинается скандал, учителей обвиняют в подтасовках, а учеников – в списывании.

На самом же деле никто ни в чем не виноват, если мы примем во внимание, что результат теста зависит не только от знаний, но имеет и какую-то случайную составляющую. Описки и пропуски чего-то по невнимательности, угадывание правильного ответа в непонятной задаче, плохое самочувствие и настроение, в конце концов – все это вместе превращается в непредсказуемую случайную величину, которую можно назвать «удачей». В топ-10% попали, во-первых, средние ученики, которым очень повезло, а во-вторых, очень хорошие при обычном везении. Во второй раз всем этим средним вряд ли повезет так же сильно, а некоторым из очень хороших может сильно не повезти. Это и приводит к регрессии результатов.  

Даже если класс игрока вырос, влияние случайной составляющей может быть слишком велико

Еще один пример из школьной жизни. В свое время в штате Массачусетс составлялись планы, по которым каждая школа должна была неуклонно повышать свои результаты на централизованном тестировании. В результате уже на следующий год выяснилось, что поставленной цели добились многие отстающие школы, но при этом провалились некоторые из самых лучших учебных заведений. И те, и другие, возможно, вообще ничего не изменили в процессе подготовки – просто результат измерения оказался ближе к среднему значению. В итоге в штате отказались от такого способа оценки работы школ.

Неумение отличать статистическую регрессию от реальных причинно-следственных связей часто ведет к неэффективным решениям. В свое время в Англии устанавливали измеряющие скорость камеры на тех участках шоссе, где в последнее время происходило много аварий. Сразу после установки число аварий, как правило, сокращалось. Дорожная полиция хвалилась эффективностью своего метода до тех пор, пока в дело не вмешались статистики. Изучив проблему, они не обнаружили какого-либо существенного влияния камер на общую статистику аварий и предположили, что деньги налогоплательщиков можно было бы использовать более полезными способами. 

Надеюсь, суть явления ясна – я сознательно стараюсь избегать точных математических терминов (и прошу простить меня за это специалистов по статистике). Будет вполне естественно предположить, что выступление спортсмена в конкретном матче турнира тоже зависит от уровня его мастерства и удачи. Вы можете возразить, что существует куча других факторов, влияющих на каждую конкретную игру: судейство, погода, влюбленность, травмы партнеров, что угодно – но именно потому, что этих факторов очень много, они направлены в разные стороны, не связаны и не формализуемы, их вполне можно принять за случайную величину. В принципе, существует даже народная мудрость, подтверждающая справедливость такой модели. «Это футбол», говорят тогда, когда происходит что-то непредсказуемое. 

Итак, вот небольшой список спортивных явлений, выражений и общих мест, которые можно объяснить проявлениями статистической регрессии.

Синдром второго сезона

Давно замечено, что подающий надежды молодой игрок часто проводит второй сезон хуже, чем первый, хотя, казалось, он должен был бы привыкнуть к уровню соперников и чему-то попутно научиться. Секрет этого явления, разумеется, в том, что внимание обращают не на тех игроков, которые в первом сезоне лишь на несколько минут появлялись в основе, а о тех, чей первый сезон был выдающимся. Даже если класс игрока вырос, влияние случайной составляющей может быть слишком велико – и на следующий сезон происходит возврат к более реальным значениям.

Примерно то же самое объяснение у американского термина rookie wall, обозначающего момент, когда ударно начавший новичок вдруг сдувается в середине сезона. Новичков, начинающих не ударно, в американских лигах часто отправляют обратно в младшие лиги, а у тех, кто остается, рано или поздно может произойти регрессия к среднему. 

Формируется впечатление, что наказания приносят результат, а похвала сказывается отрицательно

«Звездная болезнь» и эффективность «твердой руки»

Если достаточно долго хвалить блестяще проявляющего себя игрока, он начинает играть хуже (видимо, зазнавшись). Если достаточно долго ругать игрока, который выступает плохо, он начинает играть лучше (видимо, все осознав).

Вы уже, надеюсь, поняли, что главные слова в предыдущем абзаце – «достаточно долго», а объяснения в скобках – попытка рационализировать непонятную, бездушную статистику (что-то вроде тех чудовищ, которых мы видели в детстве в темной комнате, и которые оказывались всего лишь кофтой, висящей на стуле). Очень может быть, что игрок начнет играть хуже (или лучше), даже если вообще ничего не делать.  

Этот феномен управления, в частности, изучался Нобелевским лауреатом по экономике Канеманом – действительно, у учителей, менеджеров, родителей, инструкторов формируется впечатление, что наказания приносят результат, а похвала сказывается отрицательно, даже когда эффективность подопечного никак не зависит от метода воздействия. Прежде чем доверять своему опыту, вспомните о законе регрессии к среднему.

Смена тренера помогает встряхнуть команду

Руководители клубов в определенный момент увольняют тренеров – обычно после затянувшейся серии поражений или одного особенно позорного. С новым тренером, как правило, команда начинает играть лучше. Руководители укрепляются во мнении, что они хорошо разбираются в проблеме. Когда команда нового тренера через какое-то время вдруг снова начинает всем проигрывать больше обычного, руководители снова увольняют тренера – и довольно скоро это снова помогает. Так и устроен спорт.

Вы уже понимаете: серия поражений или громкий разгром от аутсайдера, скорее всего, связаны со случайной составляющей. Команда, скорее всего, начнет играть лучше, чем на дне формы, даже если ничего не делать – но руководитель, который ничего не делает и ждет милости случая, вряд ли найдет понимание у владельца (если тот, конечно, не разбирается в статистике). 

С игроком, попавшим на обложку Sports Illustrated, в скором времени происходит что-то нехорошее

Стабильность – признак мастерства 

Эта житейская мудрость также известна в формулировке «молодой – значит, нестабильный». Или, если чуть перефразировать: не так страшна регрессия к среднему, если среднее достаточно велико, а дисперсия достаточно мала. Если игрок несколько сезонов играет на одном уровне – скорее всего, это действительно его уровень. Чем больше «нестабильность», тем дальше среднее (то есть реальный класс) от лучших игр, пусть они и запоминаются в первую очередь.

Уровень тренера становится понятен после первой полноценной предсезонки

К этому моменту вы уже должны понимать, что это значит. Эту фразу обычно произносят о тренерах, которые приняли команду в середине сезона (см. пункт «Смена тренера...»). На самом деле, класс тренера попросту становится тем понятнее, чем дольше он тренирует. Более того, если ему поначалу везло, то с какого-то момента, скорее всего, перестанет так везти.

Я нашел исследование, автор которого утверждает, что в АПЛ удача перестает оказывать существенное влияние примерно через 30 игр сезона. В статье рассматривается в первую очередь процент реализации голов и попадания ударов в створ, но в качестве грубого приближения число 30 вполне сгодится и в других случаях. Это придает, в частности, дополнительный смысл фразе «очки по осени считают», которую было принято произносить, когда чемпионат России по футболу проходил по системе «весна-осень».

Защитить чемпионство сложнее, чем завоевать

Пример регрессии к среднему в чистом виде: в достаточно конкурентном турнире практически невозможно выиграть чемпионат без доли удачи. 

И да, это означает, в частности, что Курбан Бердыев – скорее всего, действительно хороший тренер.

Проклятие обложки Sports Illustrated

Одно из самых известных спортивных суеверий: с игроком, попавшим на обложку Sports Illustrated, в скором времени происходит что-то нехорошее – травма, происшествие, или попросту внезапный спад. В 2002 году у SI был целый спецпроект, посвященный влиянию обложки на судьбу спортсменов.

Думаю, вы уже знаете, к каким выводам пришел статистик Уильям Бриггз, узнав, что 37% из 2456 попаданий на обложки привели к каким-либо неприятностям. Игроки попадают на обложку именно тогда, когда выступают лучше всего – чаще всего, когда выступают заметно лучше своего среднего. И в какой-то момент они возвращаются к своему среднему (заметьте – именно к среднему; не допускайте ошибки игрока, который думает, что после 20 орлов шанс на выпадение решки увеличивается). Иногда они травмируются, иногда попадают в аварии – просто потому, что игроки в принципе иногда травмируются и попадают в аварии, а когда это происходит с яркой звездой, это лучше запоминается.

В общем, помните: бывает ложь, бывает наглая ложь, бывают суеверия – а бывает статистика, которой не стоит бездумно доверять, но которую бывает необходимо понимать.

P.S.: тактичные сообщения об ошибках и важные дополнения по теме крайне приветствуются в комментариях.

+3
Популярные комментарии
+2
Дзюбиньо
Миша Калашников, как всегда, на высоте
0
baalexxx
Интересная статья.
На самом деле эти выкладки достаточно просто промоделировать с помощью обычной монетки (ну, или кубика).
Представим себе, что монетка - это футболист. Выпадание, к примере подряд 8 орлов - значит, что футболист забил голы в 4 матчах подряд. Стал звездой. Размещаем его (условно) на обложке журнала.
Что происходит в дальнейшем? Понятно, что монетка продолжает подчиняться статистике, и следующее повторение 8 орлов будет нескоро. И все будут в панике: факт размещения фотографии футболиста на обложке будет "приводит" к снижению результатов.
Написать комментарий 2 комментария

Еще по теме

Реклама 18+