Сколько раз бросать монетку?

Задача

Представьте, что вы подбрасываете монетку до тех пор, пока два раза подряд не выпадет «орел». Сколько бросков (в среднем) вам потребуется?

А теперь другой эксперимент: вы подбрасываете монетку до тех пор, пока последовательно не выпадет пара «орел + решка» (именно в таком порядке). Сколько бросков (в среднем) потребуется для этого?

Прежде чем вы начнете решать, попробуйте угадать, одинаковы ли ответы на эти два вопроса. Если, по-вашему, они разные, то в каком случае среднее число бросков будет больше?


Подсказка 1

Разумеется, мы считаем монетку «честной», то есть имеющей равные шансы выпадения «орла» и «решки». Ответ требует понимания того, что такое среднее число бросков. Математики обычно говорят о «математическом ожидании» числа бросков. Полезно заметить, что если результатом первого броска стало выпадение решки, то весь эксперимент как бы начался заново и продлится на один ход дольше.


Подсказка 2

На первый взгляд кажется, что поскольку вероятности выпадения двух орлов (ОО) и комбинации «орел + решка» (ОР) одинаковы, то и число бросков до появления нужной комбинации будет одинаковым. Подумайте, почему это может оказаться не так. В чем разница между выпадением (невыигрышных) двух орлов во второй игре и выпадением комбинации ОР в первой?


Решение

Начнем с двух орлов. Пусть B — количество ходов, через которое в среднем наступит выигрыш. Рассмотрим также две вспомогательных величины BР и ВО: первая из них будет означать среднее число ходов до выигрыша, если на первом ходу выпала решка, а вторая — среднее число ходов до выигрыша, если на первом ходу выпал орел.

Заметим, что так как орел и решка на первом ходу имеют равные шансы, то В = (BР + ВО)/2.

Однако это не все, что можно получить «на пальцах» из условий задачи и введенных только что обозначений. Действительно, если на первом ходу выпал орел, то на втором ходу с вероятностью 1/2 игра заканчивается и имеет длину 2, а с вероятностью 1/2 выпадает решка, и игра продолжается. Длина такого продолжения (опять же, в среднем!) на 1 больше чем длина игры, начавшейся решкой, потому что тут решка выпала на втором ходу. Это означает, что ВО = (2 + (1 + BР))/2. Если же игра началась с решки, то она точно не закончится после второго хода, то есть после решки игру можно считать начавшейся заново и длящейся на один ход больше, чем если бы этой решки вначале не было. Иначе говоря, BР = 1 + В.

Мы получили три линейных уравнения, связывающих величины В, BР и ВО. Решив полученную систему, найдем ВО = 5, BР = 7, В = 6. Итак, в среднем выпадение двух орлов можно ожидать на шестом ходу.

Теперь исследуем игру, в которой выигрыш наступает после комбинации «орел + решка».

Пусть D — средняя длина игры во всех случаях, а DО и DР — длины в случае первого орла и в случае первой решки соответственно. Как и в первой игре, равенство D = (DО + DР)/2 следует из равенства шансов выпадения орла и решки на первом ходу.

Далее, если игра началась с орла и не закончилась на втором ходу, то это означает, что вторым ходом тоже выпал орел. То есть длина такой игры в среднем равна 1 + DО (мы можем забыть про первого орла и считать, что игра началась со второго хода) — получаем уравнение DО = (2 + (1 + DО))/2, из которого сразу находим DО = 3. Наконец, если игра началась с решки, то она фактически началась заново, то есть DР = 1 + D. Из уравнений D = (3 + DР)/2 и DР = 1 + D находим D = 4, DР = 5.

Итак, в этом случае игра в среднем закончится на четвертом ходу — на два хода быстрее.


Послесловие

Как бы изменились ответ и решение, если бы игра шла не до двух орлов, а до трех? Применим тот же прием для большего числа переменных.

Пусть ЕОО, ЕОР, ЕРО и ЕРР — средние продолжительности для игр, которые начались с выпадения «ОО», «ОР», «РО» и «РР» соответственно. Тогда средняя длина произвольной игры равна Е = (ЕОО + ЕОР + ЕРО + ЕРР)/4. С другой стороны, ЕОО = (3 + (1 + ЕОР))/2, поскольку после «ОО» игра с равной вероятностью либо заканчивается, либо продолжается выпадением решки, и тогда длится в среднем на один ход дольше, чем игра, начавшаяся с «ОР». Аналогично, ЕОР = (1 + ЕРО + 1 + ЕРР)/2, ЕРО = (1 + ЕОР + 1 + ЕОО)/2 и ЕРР = (1 + ЕРО + 1 + ЕРР)/2. Эта система уравнений немного труднее предыдущих, но если не бояться трудностей, то из нее можно получить, что ЕОО = 10, ЕОР = 16, ЕРО = 14 и ЕРР = 16, поэтому Е = (10 + 14 + 16 + 16)/4 = 14.

Перечислим еще несколько обобщений полученных результатов.

Если считать выигрышем выпадение не обязательно трех орлов, но и трех решек подряд, то ждать придется ровно вдвое меньше — всего 7 ходов. В общем случае ждать выпадения комбинации из N одинаковых заданных результатов (то есть либо орлов, либо решек) при бросании монетки в среднем приходится 2N + 1 − 2 хода, а если выигрышем считать появление любой из двух комбинаций, то — 2N − 1 ход.

Если заменить монетку 6-гранной игральной костью, то ждать выпадения комбинации из N одинаковых заданных граней придется в среднем (6 + ... + 6N) ходов, а комбинации из любых N одинаковых граней — в шесть раз меньше. Почему так? Попробуйте доказать это самостоятельно.

А теперь представьте, что вы играете против «однорукого бандита». За участие в каждой игре вы платите определенную сумму, а в случае выигрыша сразу уходите с ним. Правда ведь полезно понимать, как часто можно ждать выигрыша? И стоит ли вообще его ждать, если в среднем сумма выигрыша оказывается меньшей, чем то, что вы тратите на продолжение игры?

Если бы вместо однорукого бандита вы играли в описанную в задаче игру с бросанием монетки (до двух орлов) и за каждый бросок платили 1, а за выигрыш получали N, то при каком наименьшем N вы бы сочли игру справедливой и согласились играть? Эквивалентен ли этот вопрос тому, который был задан в задаче? Не торопитесь отвечать...

Вот еще одна ситуация с заведомо невыгодной игрой, в которой требуется аккуратный математический расчет. Пусть условия игры таковы, что ваш выигрыш в каждом раунде происходит с вероятностью, меньшей 1/2 (например, именно так обстоят дела в рулетке, где из-за наличия сектора «зеро» вероятность выигрыша при любой ставке не превышает 18/37, то есть с такой вероятностью можно удвоить ставку, а с вероятностью 19/37 — потерять ее). Если можно сыграть один раунд, то считается разумным поставить всю сумму на кон и рискнуть. А если разрешается сыграть только четное число раундов и победителем игры можно стать, только выиграв больше половины из них? Многие считают, что в этой ситуации нужно играть две игры и «уносить ноги». На самом же деле (как показывают математические расчеты) выгоднее всего сыграть достаточно большое число игр — 18 или 20. Именно при таком количестве вероятность победы в игре в целом оказывается наибольшей.

В теории вероятностей и теории игр известно много задач, при решении которых интуиция подводит даже очень искушенных в математике людей. Часто такие задачи оформляются в виде парадоксов. Например, парадокс двух братьев обычно формулируется так: каждый из братьев — Ваня и Даня — «выбрасывает» 1 или 2 пальца, потом они складывают количество пальцев, и если сумма четна, то Даня дает Ване число щелбанов, равное этой сумме, а если нечетна — то Ваня дает Дане число щелбанов, равное этой сумме.

На первый взгляд, кажется, что игра вполне честная — Ваня ставит щелбаны в двух случаях из четырех равновозможных, и при этом выдает 3 + 3 щелбана. Даня ставит брату щелбаны в двух остальных случаях, и при этом выдает 2 + 4 щелбана. Загвоздка, однако, в том, что интуиция ошибается — оптимальная стратегия для каждого из братьев отличается от стратегии «выбрасывать 1 или 2 пальца с одинаковыми вероятностями», и поэтому игра оказывается невыгодной для одного из них и выгодной для другого. Как вы думаете, для кого именно она выгодна? Проверьте свою интуицию.

Вернемся к разобранной нами задаче с выпадением орлов. Использование линейных уравнений в этой задаче избавляет от гигантских вычислительных трудностей. Ведь если бы мы просто «в лоб» постарались перечислить все (равновероятные) случаи игр, продолжавшихся не более чем N ходов, для каждой такой игры установить точную ее продолжительность (момент первого появления двух орлов подряд) и усреднить все полученные значения, то столкнулись бы с необходимостью подсчета сложных рекуррентных соотношений и вычисления «телескопических» сумм. Даже задача подсчета числа игр, в которых первое появление двух орлов происходит ровно на k-м ходу, — это не самая простая задача, а ведь для нашей задачи она являлась бы легкой разминкой перед «основным блюдом».

Если вы хотите продолжить знакомство с теорией вероятности, рекомендуем следующие книги:
1) Г. Секей, «Парадоксы в теории вероятностей и математической статистике» — книга венгерского математика Габора Секея, содержащая огромное количество неожиданных утверждений из теории вероятностей, математической статистики и теории случайных процессов.
2) Ф. Мостеллер, «Пятьдесят занимательных вероятностных задач» — подборка несложных задач для начинающих.
3) В. А. Никифоровский, «Вероятностный мир» — научно-популярная книга об истории развития теории вероятностей и ее приложений.
4) David Salsburg, The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century — современная популярная книжка о математической статистике.


14
Показать комментарии (14)
Свернуть комментарии (14)

  • Malcolm  | 22.07.2016 | 12:43 Ответить
    Провел эксперимент с рандомными числами в экселе, получилось 4 для двух орлов, 5 для орел решка.
    Что-то я смотрю теория расходится с практикой.
    Ответить
    • Malcolm > Malcolm | 22.07.2016 | 13:36 Ответить
      Вобщем пересчитал с большим количеством чисел, получил 4,7 для 2 орлов, 4 орел решка. Опять мимо теории.
      Ответить
      • Олег Чечулин > Malcolm | 23.07.2016 | 04:53 Ответить
        Вы так уверены в экселевском генераторе случайных чисел?
        Сколько экспериментов Вы провели, кстати?
        Ответить
      • Олег Чечулин > Malcolm | 23.07.2016 | 06:07 Ответить
        Вот специально для Вас провёл в Экселе серию из 10 экспериментов по 10 опытов в каждом. В каждом опыте одновременно определялся номер броска, на котором впервые выпадет 2 орла, и номер броска, на котором впервые выпадет решка после орла. Количество бросков в каждом опыте - 31 (при реальном броске монет, естесственно, игра заканчивалась бы после наступления обоих событий, но в Экселе пришлось генерировать все 31 число, а только потом анализировать, когда произошли нужные события).
        Результаты экспериментов - здесь: http://s019.radikal.ru/i642/1607/d3/2871b31a4a8c.png
        Как видите, не очень расходится с теорией. Но по левой таблице сразу видно, что Экселевскому ГПСЧ доверять не стоит :)
        Ответить
        • pale > Олег Чечулин | 23.07.2016 | 09:40 Ответить
          Я иначе это моделировал в экселе. Брал серию из нескольких тысяч бросков, подсчитывал для неё число событий "орёл-орёл" и "орёл-решка", число бросков серии делил на число событий. От случая к случаю "среднее" число бросков различалось, но колебалось около 6 для "О-О" и 4 для "О-Р".
          Не слишком разбираюсь в статистических расчётах :) Достаточно ли вашего опыта 10х10, чтобы делать вывод "что Экселевскому ГПСЧ доверять не стоит"?
          Ответить
          • Malcolm > pale | 25.07.2016 | 11:36 Ответить
            Если генерить только орел - решка (0 - 1), генератор часто чудит. Я делал рандом от 0 до 99, с округлением до сотен. Так более рандомно получается, чаще проскакивают большие числа, много орлов или решек подряд.
            Ответить
      • pale > Malcolm | 23.07.2016 | 09:16 Ответить
        Проверьте свои расчёты или проведите больше опытов. Я тоже моделировал в экселе и получил как раз значения очень близкие к 4 и 6.
        Ответить
  • pale  | 23.07.2016 | 09:41 Ответить
    Хотелось бы добавить, что по условиям задачи нас интересует первое вхождение двух "орлов" или "орла-решки", что принципиально для "орлов". Если в серии бросков подсчитать общее число выпавших подряд пар "орлов" (скажем, три "орла" подряд - это два случая, когда один "орёл" выпадал следом за другим), то разница между комбинациями "О-О" и "О-Р" будет мала для конкретной серии бросков, а в принципе, вероятно, равна нулю.
    Ответить
  • Malcolm  | 25.07.2016 | 12:02 Ответить
    Я провел новый эксперимент. Сгенерировал большую последовательность и в одной последовательности стал искать оба события или орел-орел или орел решка, как и должна по идее происходить игра на щелбаны. Оба варианта выпали примерно одинаковое количество раз. Проверьте кто-нибудь, может и правда у меня генератор чудной, только желательно на рандоме 0-99, а не 0-1.
    Ответить
    • pale > Malcolm | 25.07.2016 | 22:42 Ответить
      Malcolm, прочитайте мой комменарий выше. Всё верно: выпадение орла и решки равновероятно, равновероятно же и выпадение любой их последовательности в пределах заданной серии бросков (формулами подкрепить это не могу, но и логика, и опыты в экселе - ваш и мой - это подтверждают). Но вы смоделировали не совсем то, что требуется по условиям задачи:) А генератор как раз отработал правильно.
      Ответить
  • Zelo78  | 25.07.2016 | 14:22 Ответить
    Ответ к задаче из послесловия: Ваня (получающий щелбаны, если их чётное количество) должен показывать 1 палец с частотой 7/12 и 2 пальца с частотой 5/12. Тогда, если Даня (его противник) будет "выбрасывать" 1 палец, то Ваня за 12 игр получит 7*(1+1) = 14 щелбанов, но сам отвесит 5*(2+1) = 15 щелбанов - то есть будет в плюсе. Если же Даня будет показывать 2 пальца, то Ваня за 12 игр получит 5*(2+2) = 20 щелбанов, но отвесит их Дане 7*(1+2) = 21 раз - то есть тоже будет в плюсе. Стратегия Ваня не зависит от поведения Дани. Поскольку любая стратегия Дани - это смесь стратегии "1" и "2" - то при любом своём поведении он будет получать больше щелбанов, чем давать (за большое количество игр).
    Ответить
  • persicum  | 14.03.2017 | 11:48 Ответить
    Проверил в Матлабе, получилось 6 и 4:

    S=0;
    M=0;

    for i=1:100000,
    found=0;
    x=rand(1);
    n=1;
    while ~found,
    n=n+1;
    x1=rand(1);
    if (x>0.5) && (x1>0.5), %два орла
    found=1;
    M=M+1;
    S=S+n;
    else
    x=x1;
    end;
    end;
    end;

    S/M
    Ответить
  • taras  | 08.10.2017 | 18:42 Ответить
    "а первый взгляд кажется, что поскольку вероятности выпадения двух орлов (ОО) и комбинации «орел + решка» (ОР) одинаковы, " Энто когда же четверть сравнялась с половиной? В задаче сказано, что они должны выпасть в определённом порядке, а в подсказке толкуете просто о комбинации, которая соответствует двум последовательностям "элементарных" событий: орёл, потом решка и решка, потом орёл.
    Ответить
    • kknop > taras | 08.10.2017 | 20:00 Ответить
      Да, в задаче сказано, что под комбинацией "орел+решка" понимается упорядоченная пара, и повторять это каждый раз в решении я считаю лишним.
      Ответить
Написать комментарий
Элементы

© 2005–2025 «Элементы»