Вы бросаете игральную кость до тех пор, пока не выпадет 6. Каково среднее ожидаемое число бросков (включая тот, который дал 6) при условии, что во всех предыдущих бросках выпадали четные числа?
Большинство, в том числе и среди математиков, считает, что ответ равен 3. Они объясняют это примерно так: раз могут выпадать только четные числа, то задача эквивалентна бросанию кубика, у которого на двух гранях написано «2», на двух — «4», а еще на двух — «6». Но тогда вероятность выпадения грани «6» равна 1/3, следовательно, ожидаемое число бросков до выпадения первой шестерки равно 3.
Эти рассуждение и ответ — неправильны!
Давайте аккуратно опишем, как устроены бросания и в чем на самом деле состоит условие, что во всех предыдущих бросках выпадали четные числа. Мы рассматриваем (потенциально бесконечную) последовательность выпадения на кубике чисел 1, 2, 3, 4, 5, 6. Каждая последовательность заканчивается первым выпадением шестерки. Среди всех таких последовательностей выбираются только те, в которых до шестерки не было нечетных чисел 1, 3, 5. Спрашивается, какова «в среднем» длина таких последовательностей.
Разумеется, эту задачу можно решить с помощью «тяжелой артиллерии» типа формулы Байеса, но мы покажем очень элегантное и простое решение, придуманное Полом Каффом.
Пусть мы начинаем бросать кость и записываем результаты в строчку. Если выпадает нечетное число (1, 3, 5), то объявляем серию бросков неудачной и переходим на следующую строчку. Как только выпала шестерка — броски заканчиваются. Средняя длина последней строчки и будет ответом на задачу.
Отметим, что средняя длина последней строчки будет ровно такой же, как и средняя длина любой строчки. Это можно объяснить так. Рассмотрим бросание кубика, на котором написаны числа 2, 4, 6(1), 6(3), 6(5), 6. Пусть по-прежнему каждая из четырех шестерок заканчивает эксперимент (строчку), но если это «истинная» шестерка, то мы объявляем эксперимент удачным и подсчитываем число сделанных в нем бросков, а если это шестерка с нечетной цифрой в скобках, то объявляем эксперимент неудачным и забываем. Ясно, что средняя длина эксперимента не зависит от того, объявляли мы какие-то из экспериментов неудачными или нет. Поэтому достаточно сосчитать среднюю длину произвольной строчки.
В каждой написанной нами строчке все цифры, кроме последней — двойки и четверки. Любая из цифр 1, 3, 5, 6 заканчивает строчку, поэтому при каждом броске вероятность окончания строчки равна 4/6. Теперь если S — математическое ожидание длины строки (то, что мы имели в виду, говоря о «среднем ожидаемом числе бросков»), то S вычисляется из уравнения
откуда сразу находим S = 1,5. Смысл этого уравнения такой: с вероятностью 4/6 результатом броска будет цифра, которая закончит строчку, а с вероятностью 2/6 строчка продолжится. Но так как продолжение строчки состоит в таком же бросании кубика, то оно имеет среднюю длину, также равную S, то есть вся строчка, если она не закончилась сразу, имеет среднюю длину 1 + S.
Эту забавную головоломку предложил профессор MIT Эльханан Мозель (Elchanan Mossel). Строго говоря, она не является парадоксом, поскольку имеет четкое и совершенно строгое решение. Парадоксальность ей придает только то, что очень многие люди отказываются принимать это решение и настаивают на своей (ошибочной) версии с ответом 3.
Израильский математик Гиль Калай опубликовал задачу Мозеля в своем блоге под рубрикой TYI — test your intuition («проверьте свою интуицию»), предложив читателям блога выбрать один из вариантов ответа. Среди вариантов предлагались 1, 3/2, 2, 5/2, 3, 7/2 и 4. Поначалу перевес неправильного ответа «3» был просто подавляющим — количество выбравших его превышало 77%. Потом, после того, как в блоге Гиля появились несколько комментариев известных математиков о том, что задача не столь проста, как кажется на первый взгляд, результаты голосования чуть-чуть изменились. Однако и сейчас, на момент публикации Послесловия, на страничке голосования принят 1881 голос, из которых 975 (52%) предпочли вариант «3», а правильный ответ выбран всего 413 участниками (22%).
Разумеется, это не первая вероятностная задача, в которой интуитивно очевидный ответ оказывается неверным. Приведу еще несколько примеров таких задач. Начну с относительно малоизвестной.
Представьте, что в нашем распоряжении есть неограниченный запас белых и черных шариков и урна, в которой поначалу лежит всего два шарика — черный и белый. Мы начинаем повторять следующие действия:
1) вытаскиваем из урны случайный шарик;
2) возвращаем его обратно;
3) добавляем в урну еще один шарик того же цвета.
В какой-то момент количество шариков в урне станет равным 1000. Какова вероятность, что белых из них не менее 800?
Интуиция буквально кричит, что если в начале нам «повезет» и первый вытащенный шарик окажется белым, то дальше уже белый вытаскивается с вероятностью 2/3, а, следовательно, на очередном ходу в урне будет уже три белых шарика из четырех, и так далее. В общем, кажется, что попадание «на край», когда шариков одного цвета будет существенно больше, чем другого, является очень вероятным событием, — ну, а в половине таких случаев этот цвет окажется именно белым.
На самом же деле все расклады от 1:999 до 999:1 оказываются равновероятными (это называется равномерным распределением), поэтому вероятность наступления события «не менее 800 белых шариков» в точности равна отношению количества вариантов, в которых таких шариков не менее 800 (то есть 999 − 799 = 200), к общему количеству равновозможных вариантов (999). Ответ 200/999 настолько контринтуитивен, что в него просто невозможно поверить, пока не сосчитаешь аккуратно.
Еще один очень простой пример основан на бросании монетки (его часто называют нетранзитивной игрой Пеннея в честь Уолтера Пеннея, открывшего эту нетранзитивность в 1969 году).
Алиса и Боб бросают монетку до появления одной из двух комбинаций — «орел, орел, решка» или «решка, орел, орел». Первая из них (ООР) пусть будет выигрышем Алисы, а вторая (РОО) — выигрышем Боба. Кто будет выигрывать чаще, и во сколько раз?
Интуиция говорит, что если сами комбинации равновероятны, то Алиса и Боб будут выигрывать одинаково часто. Однако это вовсе не так (объяснение см., например, в статье «Лучшее пари для простаков», в которой приведены вероятности выигрыша для этой и других подобных игр). А в рассказе Сергея Мельникова «Прыжок через козла» описан случай, когда студенты-математики играют в эту игру со своим преподавателем физкультуры, чтобы получить у него зачет.
Пожалуй, еще более известным является «парадокс двух детей»:
У мистера Смита два ребенка, по крайней мере один из которых — мальчик. Чему равна вероятность того, что оба его ребенка — мальчики?
Правильным ответом на него обычно считается 1/3 (а не интуитивно напрашивающийся ответ 1/2), хотя на самом деле все немного сложнее, потому что у этой задачи нет однозначно понимаемой постановки. В частности, непонятно, как именно «случайно» выбирается один из детей Смита. Если мистер Смит выбирает одного из своих детей (старшего или младшего) с помощью подбрасывания монетки, а затем просто сообщает нам его пол при помощи словесной конструкции «по крайней мере один из моих детей — {мальчик/девочка}», то интуиция нас не обманывает: вероятность того, что пол другого ребенка будет таким же, строго равна 1/2.
Еще одной контринтуитивной вероятностной задаче была посвящена прошлогодняя задача «Игра в кости». Ну и, безусловно, в этом же ряду одно из почетных мест занимает задача Монти Холла, которой была посвящена одна из первых статей в задачном разделе на «Элементах».