Эдвард Шейнерман

«Путеводитель для влюблённых в математику». Глава из книги

Глава 20. Вероятность в медицине

Объявлено медицинское тестирование, диагностирующее наличие или отсутствие некой редкой болезни. Это чрезвычайно надежный тест. Вы принимаете решение пройти его и с ужасом получаете положительный результат. Насколько стоит беспокоиться?

Перевести беспокойство на язык цифр непросто, но в подобных ситуациях нужно сосредоточиться, потому переформулируем вопрос: насколько велика вероятность, что вы действительно подхватили это редкое заболевание?

Для ответа необходимо знать уровень надежности теста, а кроме того, как мы скоро увидим, уровень распространения болезни. Вот эти данные.

Редкая болезнь поразила 0,1% населения. Состояние здоровья одного человека из тысячи вызывает тревогу.

Тест не идеален, как и всякий медицинский тест. Предположим, он дает верную информацию в 98% случаев. Таким образом:

  • среди 100 здоровых людей 98 человек получают верный отрицательный результат и 2 человека — неверный положительный;
  • среди 100 больных людей 98 человек получают верный положительный результат и 2 человека — неверный отрицательный.

Разумеется, мы хотим пройти еще более надежный тест, но предположим, что это единственный возможный способ диагностировать наличие или отсутствие болезни.

Вопрос: если результаты теста положительные, какова вероятность того, что вы больны?

Ответ выглядит очевидным. Мы указали, что тест дает верные результаты в 98% случаев. Таким образом, вы больны с вероятностью 98%. Верно?

Вообразим город с миллионом жителей. Один из тысячи болен. Другими словами, 1000 жителей больны и 999 000 здоровы.

Все жители проходят медицинское тестирование. Посмотрим, сколько будет положительных результатов, если тест эффективен на 98%.

  • Среди тысячи больных жителей положительный результат получит большинство, но не все. Их количество 1000 × 0,98 = 980.
  • Среди 999 000 здоровых жителей большинство покинет поликлинику с радостной новостью об отсутствии болезни, но 2% получат ложный результат. Это дает еще 999 000 × 0,02 = 19 980 положительных результатов.

В общей сложности 980 + 19 980 = 20 960 жителей получат положительный результат.

Теперь мы можем правильно ответить на поставленный вопрос: какова вероятность того, что вы больны, если ваш результат тестирования положительный?

Среди двадцати с лишним тысяч людей с положительным результатом всего лишь меньше тысячи действительно больны. Точная вероятность правильности теста в этом случае равна

$$ \frac{980}{20960} \approx 4{,}7 \% $$

Вероятность того, что вам стоит беспокоиться, не равна 98%! На самом деле вероятность того, что вы заражены этой редкой болезнью, меньше 5%!

Стало быть, тесту грош цена? Не совсем.

Во-первых, если ваш лечащий врач имеет веские причины предполагать у вас наличие этого редкого заболевания, вы больше не «случайный» пациент. И если у вас действительно прослеживаются определенные симптомы, вероятность того, что вы заражены, уже не одна тысячная, а скажем, одна четвертая1. В этом случае положительный результат тестирования имеет гораздо больший смысл, чем нестрого обоснованные выводы.

Во-вторых, если болезнь действительно опасна, тест, эффективный на 98%, позволяет хорошо просеять большие массы населения на предмет наличия или отсутствия болезни. Пациенты с положительным результатом могут пройти вторую диагностику, дающую еще более точные результаты.

Разумеется, отрицательный результат — не повод успокаиваться полностью. Какова вероятность того, что он верен? (Ответ я дам в конце главы.)

Интуиция отказывается принимать тот факт, что тест, надежный на 98%, может быть настолько несовершенным, но вычисления говорят сами за себя. Впрочем, голые цифры могут обманывать нашу интуицию. Попробуем нарисовать картинку.

Заметим: диаграмма не соблюдает пропорции (0,1% больных, эффективность теста 98%).

На чертеже большой прямоугольник изображает все население. Фрагмент прямоугольника слева вверху обозначает группу больных жителей, оставшаяся часть — группу здоровых жителей. Серая полоса сверху — это все жители (из обеих групп) с положительным результатом. Белая область внизу — все жители (опять-таки из обеих групп) с отрицательным результатом.

Чертеж иллюстрирует основные детали вышеописанной ситуации:

  • болезнь редкая — крохотный фрагмент большого прямоугольника символизирует больную часть населения;
  • тест верно диагностирует наличие болезни у подавляющей части больных — почти весь прямоугольник слева вверху закрашен серым;
  • тест верно диагностирует отсутствие болезни у подавляющего большинства здоровых людей — огромная область большого прямоугольника остается белой;
  • ключевой момент: большая часть серой полосы приходится на здоровых людей, поэтому вы, скорее всего, здоровы, если получили отрицательный результат, но не обязательно больны, если получили положительный.

Условная вероятность2

Мы вычислили вероятность того, что пациент с положительными результатами медицинского тестирования действительно болен. Мы вообразили гипотетический город, где живет миллион человек, и посчитали численность разных категорий населения. Это был способ ad hoc3. В общем случае мы должны руководствоваться языком теории вероятностей, и я завершу главу разъяснениями по этому поводу.

Для события \(A\) мы обозначаем \( P\left ( A \right ) \) вероятность того, что событие \(A\) произойдет, и \( P\left ( \bar{A} \right ) \) — вероятность того, что событие \(A\) не произойдет; таким образом, \( P\left ( \bar{A} \right ) = 1-P\left ( A \right ) \).

Для событий \(A\) и \(B\) мы обозначаем \( P\left ( A \wedge B \right ) \) вероятность того, что произойдут оба события — и \(A\), и \(B\).

Запись \( P\left ( A \mid B \right ) \) означает вероятность того, что из события \(A\) следует событие \(B\); это условная вероятность того, что \(A\) влечет за собой \(B\). Формула Байеса4 говорит нам:

$$ P\left ( A \mid B \right )=\frac{P\left ( A \wedge B \right )}{P \left ( B \right )} $$

Надежность диагноза, вынесенного на основе упомянутого медицинского теста, может быть выражена на языке математики следующим образом. Пусть \( S \) означает, что некто заражен редкой болезнью, а \( T \) означает положительный результат тестирования. Таким образом:

  • болезнь поразила 0,1% населения, откуда следует, что \( P \left ( S \right ) = 0{,}001\);
  • тест дает верную информацию о наличии или отсутствии заболевания в 98% случаев, откуда следует, что \( P\left ( T \mid S \right ) = 0{,}98\);
  • тест дает верную информацию о том, что человек здоров, в 98% случаев, откуда следует, что \( P\left ( \bar{T} \mid \bar{S} \right ) = 0{,}98\). Иначе говоря, тест ошибочен в 2% случаев: \( P\left ( T \mid \bar{S} \right ) = 0{,}02\).

Вопрос: какова вероятность того, что пациент с положительным результатом тестирования действительно болен?

Если перевести задачу на язык символов, то мы ищем величину \( P\left ( T \mid S \right ) \). По формуле Байеса эта вероятность равна \( \frac{P\left ( S \wedge T \right )}{P\left ( T \right )} \). Нам нужно узнать \( P\left ( S \wedge T \right ) \) и \( P\left ( T \right ) \)

Начнем хоть с \( P\left ( S \wedge T \right ) \), хоть с \( P\left ( T \wedge S \right ) \). По формуле Байеса

$$ P\left ( T \mid S \right )=\frac{P\left ( S \wedge T \right )}{P\left ( S \right )} $$

Мы знаем, что \(P\left ( T \mid S \right ) = 0{,}98\) , а \(P\left ( S \right )= 0{,}001\) . Следовательно,

$$ P\left ( S \wedge T \right )=P\left ( T \wedge S \right )=P\left ( T \mid S \right )\times P\left ( S \right )=0{,}98 \times 0{,}001=0{,}00098. $$

Теперь вычислим \(P\left ( T \right )\). Нам известно, что \(P\left ( T \mid S \right ) = 0{,}98\), а \(P\left ( T \mid \bar{S} \right ) = 0{,}02\). В то же время \(P\left ( T \right )=P\left ( T \wedge S \right )+P\left ( T \wedge \bar{S} \right )\) Далее:

$$ P\left ( T \wedge S \right )=P\left ( T \mid S \right )\times P\left ( S \right )=0{,}98\times 0{,}001=0{,}00098 \\ P\left ( T \wedge \bar{S} \right )=P\left ( T \mid S \right )\times P\left ( S \right )=0{,}02\times 0{,}999=0{,}01998 \\ \Downarrow \\ P\left ( T \right )=P\left ( T \wedge S \right )+P\left ( T \wedge \bar{S} \right )=0{,}00098+0{,}01998=0{,}02096. $$

Применим формулу Байеса в последний раз:

$$ P\left ( S \mid T \right )=\frac{P\left ( S \wedge T \right )}{P\left ( T \right )}=\frac{0{,}00098}{0{,}02096}\approx 0{,}0468. $$

Это совпадает с нашими предыдущими вычислениями.

Если у вас есть симптомы

Предположим, шансы быть пораженным болезнью при наличии определенных симптомов равны 25%. Какова вероятность того, что вы и вправду больны, если результат тестирования положительный? Снова вообразим город с миллионом жителей. На сей раз 250 000 больны и 750 000 здоровы.

  • Среди 250 000 больных верный положительный результат тестирования получают 250 000 × 0,98 = 245 000 жителей.
  • Среди 750 000 здоровых ложный положительный результат тестирования получают 750 000 × 0,02 = 15 000 жителей.

В общей сложности 260 000 получают положительный результат, и среди них 245 000 действительно больны. Таким образом, при положительном результате теста вероятность того, что вы тоже подхватили заразу, увеличивается до \(\frac{245}{260}\approx 94{,}2\%.\)

Если ваш результат тестирования отрицательный

Предположим, вы прошли тестирование и получили отрицательный результат. Какова вероятность того, что вы действительно здоровы?

В нашем городе с миллионным населением 1000 человек больны и 999 000 здоровы. Сколько всего будет отрицательных результатов теста?

  • Среди 1000 больных 2% получат ложные отрицательные результаты; всего 1000 × 0,02 = 20 человек.
  • Среди 999 000 здоровых 98% получат верные отрицательные результаты. Всего 999 000 × 0,98 = 979 020 человек.

Вероятность того, что вы здоровы и получили отрицательный результат теста, равна

$$ \frac{979020}{20+979020}=\frac{979020}{979040}\approx 99{,}998\%. $$

Фантастические новости! Но помните: и безо всякого теста вероятность быть здоровым 99,9%. Величина добавочной уверенности на основе теста ничтожна.


1 Предположим, вы попали в категорию людей, где 25% поражены болезнью. Какова вероятность того, что вы заражены, если результат тестирования положительный? Ответ — в конце главы.

2 Этот раздел предназначен для тех, кто уже изучал теорию вероятностей и хочет освежить свои знания. Другие читатели могут листать до следующего раздела.

3 По особому случаю (лат.). — Прим. пер.

4 Томас Байес (1702–1761) — британский пресвитерианский священник, богослов и математик. — Прим. пер.


1
Показать комментарии (1)
Свернуть комментарии (1)

  • OlegCh  | 18.10.2018 | 10:51 Ответить
    Как видно, вероятность того, что вы действительно больны, очень сильно зависит от распространенности болезни (при одной и той же достоверности теста). Было бы полезно привести график этой зависимости.
    Ответить
Написать комментарий
Элементы

© 2005–2025 «Элементы»