Какой смысл вкладывают во фразу «вероятность выпадения решки 50%»?
Исторически сложилось так, что у этого вопроса есть два популярных варианта ответа: «частотный» и «субъективистский» (он же «байесианский»), которые, в свою очередь, порождают два радикально различных подхода к экспериментальной статистике. Есть еще и третий вариант — «склонность», но он в значительной степени дискредитирован (если предполагать, что монета детерминирована). Если кратко описать эти три варианта, то получится вот что:
-
Интерпретация «склонности»: Некоторые вероятности являются частью нашего мира. Сказать, что монета выпадает решкой в половине случаев — высказать о монете голый факт. У подбрасываемой монеты есть фундаментальная склонность выпадать решкой в 50% случаев. И когда мы говорим, что монета имеет 50% вероятность выпадения решки, мы говорим именно про эту склонность.
-
Частотная интерпретация: Когда мы говорим, что у монеты есть 50% вероятность выпадения решкой, мы подразумеваем наличие класса событий подобных этому подбрасыванию монеты, и что внутри этого класса событий монета выпадала решкой примерно в половине случаев. Т.е. частота выпадения решки в 50% именно внутри этого класса событий, которыми могут быть события вроде «все другие подобные подбрасывания этой монеты» или же «все другие подбрасывания похожей монеты» и т.д.
-
Субъективистская интерпретация: Неопределенность — это характеристика разума, а не окружающей среды. Если я поймал подброшенную монету и не вижу как она упала, она все равно уже выпала либо орлом либо решкой. Отсутствие у меня знания о том, орел это или решка — это факт обо мне, а не о монете. Утверждение «я назначаю 50%-ю вероятность тому, что монета выпала решкой» является выражением моего невежества, и эти 50% означают, что я оцениваю шансы как 1:1 (или лучше), что монета выпала решкой.
Визуализацию различий между этими тремя точками зрения см. в “Визуализация разных интерпретаций «вероятностей»”. Примеры различий см. в “Интерпретации вероятности: примеры”. См. также статью об интерпретациях вероятности в Стэнфордской энциклопедии философии.
Интерпретация «склонности» — наиболее естественная для человеческой интуиции, ведь многим людям кажется, что случайность — это свойство, присущее самой монете. Тем не менее этот вариант трудновато сочетать с фактом того, что монета, будучи пойманной, уже выпала либо орлом, либо решкой. Если обсуждаемое событие детерминировано, интерпретацию «склонности» можно рассматривать как случай ошибки проецирования ума: когда мы в голове рассматриваем подбрасывание монеты, то чувствуем, что у нее есть 50% вероятности упасть решкой, и легко представляем себе мир, в котором монета фундаментально 50%-но-решковая. Но это ощущение — факт о нас, а не о монете; и монета не имеет скрытого где-то внутри физического свойства выпадать решкой в половине случаев. Это просто монета.
Две другие интерпретации внутренне непротиворечивы и порождают разные практические подходы к статистике, о сравнительной полезности которых идет немало споров. Субъективистская интерпретация применима в большем количестве ситуаций, так как позволяет назначать вероятности (выраженные как ставки) даже единичным событиям.
Частотность против субъективизма
В качестве примера, на котором можно показать разницу между частотностью и субъективизмом, рассмотрим вопрос: «Какова вероятность выигрыша Хиллари Клинтон на президентских выборах 2016 года?». Воспользуемся данными, доступными на момент лета 2016.
Стереотипный (соломенный) частотник скажет: «Президентские выборы 2016 года — уникальное событие, случающееся лишь один раз. Мы не можем наблюдать частоту, с которой Клинтон выигрывает президентские выборы. Так что мы не можем тут выполнить статистическое исследование или назначить вероятности».
Стереотипный субъективист ответит: «Ну, рынки предсказаний довольно хорошо откалиброваны для таких событий — в том смысле, что если рынок назначает вероятность в 20%, то такое событие происходит примерно 1 раз из 5. И рынки предсказаний ставят сейчас на победу Клинтон с шансами 3 к 1. Так что я могу вполне уверенно сказать, что она победит с вероятностью примерно в 75%. Если бы кто-то предложил мне ставку с шансами 20:1 против нее (т.е. этот человек получает 1 доллар в случае ее проигрыша, а я 20 долларов в случае ее победы на выборах), то я бы принял эту ставку. Разумеется, вы могли бы отказаться от такой ставки, мотивируя это тем, что вы Просто Неспособны Говорить О Вероятностях Единичных Событий, но это будет значить, что вы необоснованно упускаете возможность сделать очень выгодную ставку».
Стереотипный (не-соломенный) частотник ответит: «Разумеется, я бы тоже принял эту ставку. Но это решение не было бы принято на основе строгой эпистемологии, и мы не можем допускать такие виды рассуждений в эмпирической науке и других важных областях применения вероятностей. Вы можете использовать субъективные рассуждения о вероятностях при оценке ставок, но мы не должны допускать такие рассуждения в научные журналы — для них предназначена частотная статистика. Заключение вашего исследования не должно содержать вещей вроде: «и вот, пронаблюдав такие-то данные об уровне углекислого газа, я бы поставил 9:1 на то, что антропогенное глобальное потепление реально происходит», ведь мы не можем строить научный консенсус на основе личных мнений».
…и вот тут начинаются сложности. Субъективист ответит: «Во-первых, я согласен с тем, что не следует размещать в работах апостериорные шансы, во-вторых, ваш метод тоже не особо объективный: выбор класса «подобных событий» произволен, им легко злоупотребить и, как результат, мы имеем хаки p-значений и кризис воспроизводимости». На что частотник скажет: «ну а ваш выбор априорных еще более субъективен, и посмотрел бы я как вы себе поведете, когда давление со стороны сообщества толкает на злоупотребление статистикой и преувеличение результатов» — и вот мы отправляемся в путешествие вниз по кроличьей норе.
Субъективистская интерпретация вероятностей распространена среди исследователей искусственного интеллекта (которые часто разрабатывают компьютерные системы, манипулирующие субъективными распределениями вероятностей), биржевых трейдеров (которым приходится делать ставки даже в относительно уникальных ситуациях) и в обычной жизни (где люди могут давать оценки вроде вероятности выпадения осадков завтра в 30%, несмотря на то, что завтра случится лишь однажды). Тем не менее, именно частотную интерпретацию обычно преподают на лекциях по введению в статистику и она составляет золотой стандарт большинства научных журналов.
С точки зрения среднего частотника, хороший статистик должен иметь разные статистические инструменты в своем распоряжении. Есть место и для субъективистских, но никакого особенного отношения они не заслуживают (и уж точно их не стоит принимать во внимание, когда приходит время оценивать работы для публикации в серьезном журнале).
С точки зрения агрессивного субъективиста, частотники изобрели какое-то количество хороших инструментов, многие из которых действительно полезны, но их отказ рассматривать субъективные вероятности токсичен. Частотная статистика была разработана как (провалившаяся) попытка исключить субъективность из науки во времена, предшествующие постижению законов теории вероятности человечеством. Сейчас же у нас есть теоремы о корректном использовании субъективных вероятностей и о том, как факторизировать личные убеждения на основе объективных свидетельств из данных, и если эти теоремы игнорировать, то легко попасть в беду. Частотная интерпретация сломана — поэтому в науке распространен p-хакинг и наступил кризис воспроизводимости, в то время как трейдеры и исследователи ИИ используют байесовскую интерпретацию. Идея «давайте найдем компромисс и согласимся, что все точки зрения валидны» хорошо звучит, но сколько еще потребуется провалов, прежде чем наступит пора сказать «ой» и признать субъективистскую интерпретацию во всех областях науки?
Однако, большинство ученых и исследователей скорее агностики, в том смысле что: «используй любые удобные статистические инструменты, но когда придет пора отдавать работу на публикацию в журнале, используй частотные, ведь так люди делали на протяжении многих десятилетий и именно этого все от тебя и ждут».
См. также “Субъективная вероятность” и “Функции правдоподобия, p-значения и кризис воспроизводимости”.
Какая из интерпретаций наиболее полезна?
Видимо, это субъективистская интерпретация, ведь она вбирает в себя и «склонность», и «частотность» как частные случаи, при этом являясь более гибкой.
Когда частотный класс «подобных событий» ясно обозначен, субъективист может учесть эти частоты (часто именуемые в таких случаях априорными вероятностями). Однако, в отличии от частотника, он может совмещать их с другими наблюдаемыми свидетельствами, назначать вероятности единичным событиям, делать деньги на рынках предсказаний и/или на рынках ценных бумаг (если у него есть информация, которой нет у рынка).
В тех случаях, когда законы физики все же «содержат неопределенность» — например, когда они утверждают, что вы получите множество разных наблюдений с разными отношениями правдоподобия (как часто бывает в случае с уравнением Шредингера), субъективист может скомбинировать неопределенность «склонности» со своей личной неопределенностью для получения агрегированных субъективных вероятностей. Но в отличии от теоретика «склонности», ничто не принуждает его думать, будто вся неопределенность носит физический характер. Он может думать как теоретик «склонности» о предоставленной уравнением Шредингера неопределенности, но при этом все еще верить в то, что его неопределенность в отношении уже упавшей монеты находится в его разуме, а не в монете.
Вывод же такой: частотные методы хороши для ответа на частотные вопросы. Из того, что лично вы можете назначать вероятности для единичных событий (т.е. оценивать насколько хороша какая-то ставка на рынке предсказаний или ценных бумаг) не следует, что инструменты, обозначенные как «байесианские», всегда лучше тех, что обозначены как «частотные». Какую бы интерпретацию «вероятностей» вы бы ни использовали, мы надеемся, что вы задействуйте наиболее удобные для вас статистические методы, независимо от того, из какого они «лагеря». Не позволяйте факту того, что вы можете назначать вероятности единичным событиям, стоять на вашем пути, если вы захотите использовать частотные инструменты!