Пик эпидемии

Модели, описывающие распространение инфекций в популяции, стали появляться еще в первой половине XX века. Некоторые из них, пусть с изменениями, уточнениями и усложнениями, применимы сейчас — в том числе и к нынешней ситуации с пандемией COVID-19.

Мы рассмотрим простейшую модель распространения инфекции. Она называется SIR (по первым буквам английских слов susceptible — восприимчивый, infected — инфицированный и removed или recovered — выбывший или выздоровевший) или моделью Кермака — МакКендрика в честь двух эпидемиологов начала XX века, которые в 1927 году опубликовали статью с похожими идеями (см. Kermack–McKendrick theory).

Сразу следует оговориться, что модель — это лишь грубое приближение к реальности, которое не учитывает огромное количество факторов, потенциально влияющих на реальную картину. Как выразился главный санитарный врач Англии Кристофер Уитти (Chris Whitty), «ключевым является не то, что модели являются „правдивыми“, а то, что они могут представлять некую неожиданную точку зрения, предсказание, которое не следует из здравого смысла» (Christopher J. M. Whitty, 2015. What makes an academic paper useful for health policy?).

В модели SIR рассматривается популяция из N человек. В каждый момент времени каждый человек из этой популяции принадлежит одной из трех групп: в группе S состоят все люди, которые еще не подверглись инфекции, затем по мере распространения вируса они переходят в группу I инфицированных, а затем — в группу R (скончавшиеся от вируса либо выздоровевшие, которые повторно не заражаются).

Очевидно, что полное число людей в популяции равно сумме численностей этих трех групп: N = S + I + R.

Далее под буквами S, I или R будут подразумеваться функции S(t), I(t) и R(t), выражающие число людей в каждой из групп в момент времени t (отсчитываемый в днях от начала пандемии).

Нам нужно смоделировать, как меняется число людей в каждой из этих групп в зависимости от времени. У модели будет два числовых параметра. Первый — это время, в течение которого человек является заразным. Будем обозначать его Tinf и считать, что через время Tinf человек неизбежно перемещается из группы I в группу R (либо вылечившись, либо умирая). Второй параметр — это количество здоровых людей, которых в среднем успевает заразить инфицированный за время болезни; обозначим «заразность» (которую также называют базовым репродуктивным числом инфекции, см. Basic reproduction number) через R0. Для кори этот параметр принимает очень большие значения — от 12 до 18 (при Tinf ~ 5 дней), для ВИЧ он составляет 2–5 (носитель потенциально заразен много лет), для сезонного гриппа в зависимости от штамма этот параметр лежит в пределах от 1 до 2, а для коронавируса SARS-CoV-2 его значение в среднем по миру колеблется в районе 2,2.

Обозначим количество «новых» людей в группе S за один день (то есть просто дневное изменение числа ее членов) через S' (такое обозначение неслучайно — тем, кто знаком с производной, лучше думать об этом именно как о производной). Так как число восприимчивых может только уменьшаться (из-за карантина популяция не пополняется извне), значение S' всегда неположительное. Аналогично, ежедневные пополнения групп I и R обозначим I' и R', соответственно. Подчеркнем, что эти три величины могут меняться день ото дня и также являются функциями времени t.

Теперь, наконец, построим модель SIR, считая, что все смерти в популяции вызваны инфекцией.

Количество новых инфицированных S' вычисляется, исходя из того, что каждый инфицированный из группы I в среднем за время Tinf заражает R0 человек из группы S. В виде формулы это записывается так:

\[ S' = -\dfrac{R_0}{T_{\rm inf}}\dfrac{IS}{N},\]

где, напомним, число N постоянно, а I и S зависят от времени.

Также ясно, что за время Tinf число вылечившихся или умерших возрастает пропорционально числу зараженных — раз каждый инфицированный человек за Tinf дней перейдет из группы I в группу R, то можно считать, что за один день переходит \(\frac{1}{T_{\rm inf}}\) от него. Поэтому

\[ R' = \frac{1}{T_{\rm inf}} I.\]

Задача

    а) Как меняется число зараженных? Напишите уравнение на функцию \(I'\).

    б) Пусть в самом начале число зараженных равно \(I_0\), а число восприимчивых \(S\approx N\gg I\). При \(R_0\approx 2{,}5\) и \(T_{\rm inf} \approx 3\) дня каким будет темп роста числа зараженных? Через какое время число зараженных удваивается?

Рост числа зараженных не может продолжаться бесконечно. В какой-то момент большая часть людей в популяции заразится или уже переболеет, став невосприимчивой к инфекции. Тогда же число инфицированных людей в группе \(I\) достигнет максимума. Это очень важный момент для предсказательных моделей, так как именно тогда на медицинскую систему ожидается наибольшая нагрузка. Этот момент мы будем обозначать \(T_{\rm peak}\) (отсчитывая время от начала эпидемии).

    в) Каким будет число людей в группе \(S\) в момент \(T_{\rm peak}\), если размер начальной популяции \(N\)? Найдите время \(T_{\rm peak}\) для популяции 150 млн человек, в которой изначально было всего несколько инфицированных (то есть \(I_0\sim1\)).


Подсказка 1

В пунктах а) и б) можно воспользоваться тем, что если \(I' = a I\), то из этого следует, что \(I = I_0 e^{a t}\) (подумайте, почему это так!). В задаче, по сути, надо найти значение параметра \(a\).

А чтобы проверить правильность выведенного вами выражения для \(I'\), подумайте, чему должна быть равна сумма \(S' + I' + R'\).


Подсказка 2

Пусть \(I=I_0 e^{a t}\), где \(a\) — параметр из первой подсказки. Из уравнения для \(S'\) следует, что

\[ \ln{S(t)} = -\frac{R_0}{T_{\rm inf}}\frac{I_0}{N}\frac{1}{a}e^{a t}. \]

Попробуйте записать эти выражения для \(\ln{S(t)}\) для двух разных моментов времени и вычесть одно из другого.


Решение

Сначала выведем выражение для I'.

Очевидно, что прирост числа зараженных (пополнение группы I) равен убыли в группе S, а убыль в группе I равна и приросту в группе R. Таким образом, так как полное число людей сохраняется, имеем равенство \(S' + I' + R' = 0\), и, как следствие, можем записать:

\[ I' = \dfrac{R_0}{T_{\rm inf}}\dfrac{IS}{N} -\dfrac{1}{T_{\rm inf}} I. \]

В самой начальной стадии эпидемии, когда \(S\sim N\gg I\), выполняется приближенное равенство

\[ I' \approx \frac{R_0-1}{T_{\rm inf}} I. \]

Тогда, как говорилось в подсказке, \(I = I_0 e^{at}\), где \(I_0\) — изначальное число зараженных (этот множитель возникает из-за того, что \(I(0)=I_0\)), а коэффициент \(a = (R_0 -1) / T_{\rm inf}\). Вот и появился экспоненциальный рост числа зараженных. Важно, что это правило работает только поначалу, когда число людей, затронутых эпидемией, мало по сравнению с размером популяции.

Чтобы понять, почему возникает экспонента, нужно еще раз внимательно посмотреть на уравнение \(I’ = a I\). Величина \(I’\) — это изменение величины \(I\) за единицу времени (то есть, по сути, скорость изменения величины \(I\)). Уравнение говорит нам, что скорость изменения \(I\) прямо пропорциональна самой величине \(I\), и чем больше значение \(I\), тем быстрее оно растет. Такое поведение соответствует именно экспоненциальной функции \(e^{at}\).

Из полученного выражения для I(t) легко вычислить, что за каждые \(\ln{2}\cdot T_{\rm inf} / (R_0- 1) \approx 1{,}4\) дня (или 33–34 часа) число зараженных в нашей модельной ситуации будет удваиваться. В реальности же действует множество факторов, которые в модели совсем никак не учтены: например, у реального вируса есть латентный период, в течение которого заразившийся человек не опасен для окружающих. Так что полученная оценка темпа роста числа заразившихся несколько завышена.

Когда экспоненциальный рост прекращается? Нетрудно догадаться, что максимум числа зараженных достигается, когда ежедневный прирост в группе инфицированных уменьшается до нуля, то есть когда \(I' = 0\). Приравнивая нулю выражение для \(I'\), находим, что в момент, когда число заражений максимально, число людей в группе риска S равно \(N/R_0\).

Но нам интересно узнать, через сколько дней после начала эпидемии это произойдет. Для этого используем формулу для \(\ln{S(t)}\) из подсказки, которую можно получить, проинтегрировав выражение для \(S'/S\). В момент \(t=0\) (в начале эпидемии), число людей в группе риска \(S=N\), а в момент \(t = T_{\rm peak}\), как мы только что выяснили, в группе риска остается \(S = N / R_0\) человек. Записав формулы для \(\ln{S(t)}\) в эти два момента времени и вычтя одну из другой, получим следующее:

\[ \ln{S(T_{\rm peak})}- \ln{S(0)} = -\dfrac{R_0}{T_{\rm inf}}\dfrac{I_0}{N}\dfrac{1}{a}\left(e^{a T_{\rm peak}}- 1\right). \]

Будем считать, что \(e^{a T_{\rm peak}} \gg 1\) и что \(\ln{R_0}\sim 1\), и упростим это выражение:

\[ 1 = \dfrac{R_0}{T_{\rm inf}}\dfrac{I_0}{N}\dfrac{1}{a}e^{a T_{\rm peak}}, \]

Откуда, подставив найденное выше значение \(a\), получим формулу для пикового момента эпидемии:

\[ T_{\rm peak} \approx T_{\rm inf}\frac{1}{R_0 -1}\ln{\frac{R_0-1}{R_0}\frac{N}{I_0}}. \]

Для наших модельных значений \(R_0\sim 2{,}5\), \(T_{\rm inf} \sim 3\) дня, \(N\sim 150\cdot 10^6\) и \(I_0 = 1\) получаем, что \(T_{\rm peak} \sim 36{-}37\) дней, то есть своего пика эпидемия достигнет через месяц с небольшим.


Послесловие

Наше решение даже в рамках модели SIR является приближенным, однако оно достаточно точно предсказывает темп роста в начальную фазу эпидемии, а также положение ее пика. На рис. 1 показано точное SIR-моделирование с исходными данными из условия. Обратите внимание, что вертикальная ось логарифмическая (из-за этого привычный ускоряющий рост экспоненты выглядит как прямая линия). Черные точки показывают полученный нами в решении прогноз об удвоении числа зараженных примерно каждые 33–34 часа. Момент пика эпидемии (Tpeak) отмечен вертикальным пунктиром.

Рис. 1.

Рис. 1.

В рамках этой простой модели получается, что эпидемия продлится 3–4 месяца, вирусом заразится в итоге примерно 89% населения, а в пиковой фазе одновременно зараженными окажется примерно 35 млн человек!

Однако модель SIR не учитывает важную особенность вирусной инфекции, которая уже упоминалась в решении: латентный и инкубационный периоды. После заражения у вируса уходит некоторое время, чтобы размножиться в организме нового носителя. Поэтому некоторое время — латентный период — заразившийся человек не опасен для окружающих. Инкубационный период — это время от заражения до начала проявления симптомов болезни. Для коронавируса медианное значение инкубационного периода равно 5,1 дня, а у 97,5% больных симптомы проявились к 12 дню после заражения или раньше (см. S. A. Lauer et al., 2020. The Incubation Period of Coronavirus Disease 2019 (COVID-19) From Publicly Reported Confirmed Cases: Estimation and Application — в этой работе был исследован 181 заболевший между 4 января и 24 февраля). С одной стороны эти данные оправдывают двухнедельный срок карантина, который был введен во многих странах как мера по замедлению распространения инфекции, но с другой стороны (и в указанной статье это особо подчеркивается) примерно у 1% инфицированных инкубационный период может быть больше двух недель. А это означает, что, по-хорошему, сроки, на которые ограничиваются контакты потенциально больных людей, должны быть больше.

Инкубационный период учитывается в модели SEIR. Она устроена похоже на модель SIR, но в ней люди после заражения из группы S сначала переходят в промежуточную группу E (англ. exposed — подверженный), а только потом — по прошествии инкубационного периода \(T_{\rm inc}\) — в группу инфицированных I. Такая модель предсказывает слегка более медленный темп роста числа зараженных: удвоение числа зараженных за каждые 5 дней.

В реальности во многих странах этот показатель выше. Например, в России по состоянию на 3 апреля число выявленных зараженных удваивается почти ровно за 3 дня, а в США — примерно за 2,5 дня (подробную статистику можно посмотреть на сайте ourworldindata.org). Это скорее всего означает, что значение показателя R0 на самом деле выше чем принятое нами значение 2,5, которое мы использовали в расчетах. На сайте gabgoh.github.io можно в интерактивном режиме изменять параметры и смотреть, что будет предсказывать модель SEIR.

На рис. 2 показаны результаты SEIR-моделирования с параметрами из условия (в частности, размер популяции равен 150 млн человек) и инкубационным периодом 5 дней. Видно, что пик заражаемости наступает примерно через 4 месяца с пиковым числом зараженных примерно 13 млн человек. Излишне говорить, насколько катастрофической может стать такая нагрузка для медицинской систему любой страны, если даже совсем небольшой доле из такого количества зараженных людей понадобится госпитализация.

Рис. 2.

Рис. 2.

Не стоит, конечно, забывать, что все это — математические модели, не учитывающие огромного количества нюансов, которые потенциально могут понизить или повысить темпы распространения вируса (например, наличие мест высокой концентрации людей, типа школ, заводов и т. д.). Но эти простые модели вполне дают прочувствовать общую картину.

Основная проблема таких моделей состоит в том, что предсказания, полученные с их помощью, очень чувствительны ко входным параметрам (\(R_0\), \(T_{\rm inf}\) и т. д.). Между тем, эти параметры можно измерить лишь эмпирическим путем, набрав достаточную статистику. Статистические данные обычно собираются в тех странах, где вирус уже достаточно сильно распространен — в случае коронавируса сейчас это в первую очередь Китай и Италия. Но применять эти параметры напрямую для моделирования ситуации в другой стране нельзя, так как при этом не учитываются ни региональные особенности, ни средний иммунитет людей, ни возможные мутации вируса. Скажем, высказывается мнение, что прививки от туберкулеза (БЦЖ) могут значительно снизить тяжесть симптомов COVID-19 (см., например, A. Miller et al., 2020. Correlation between universal BCG vaccination policy and reduced morbidity and mortality for COVID-19: an epidemiological study), и поэтому в тех странах, в которых эти прививки были обязательными (например, СССР/Россия), темпы распространения эпидемии могут быть ниже, а последствия болезни — в среднем легче.

Гораздо более точными и детальными являются агентные модели, где учитывается каждый отдельно взятый человек, а общение представляется в виде сложного графа социальных связей. В таких моделях можно уже учитывать различные важные детали: например, распределение людей по возрастам, количество социальных связей, наличие так называемых «хабов» (мест массового скопления людей — школ, заводов, торговых центров и т. д.) и, что самое важное, эффективность тех или иных ограничительных мер. Если модели типа SEIR дают некую общую динамику и понимание ситуации, то агентные модели позволяют просимулировать эффективность мер по борьбе с распространением инфекции. Подробнее об этом можно почитать в недавней обзорной статье в Nature (D. Adam, 2020. Special report: The simulations driving the world’s response to COVID-19).

Тем не менее, можно, пожалуй, утверждать с уверенностью, что пока все только начинается, так как большинство стран сейчас (на начало апреля 2020 года) находятся пока только на стадии экспоненциального роста. Важно помнить, что каждый из нас может быть распространителем инфекции, не подозревая об этом и не имея никаких симптомов. Лучшее, что можно сейчас сделать, чтобы хотя бы немного понизить этот параметр R0, — это следовать рекомендациям ВОЗ. Берегите себя и заботьтесь об окружающих.


6
Показать комментарии (6)
Свернуть комментарии (6)

  • MZRULL  | 06.04.2020 | 09:00 Ответить
    Прочитал статью в Начур, ужас какой низкий уровень. Эти люди хоть что-то знают о IMM (adaptive interactive multiple model algorithm) или хотя бы AFMM (adaptive forgetting with multiple models)?
    Ответить
    • detris@yandex.ru > MZRULL | 07.04.2020 | 07:07 Ответить
      Добрый день! Спасибо за статью. Мы рассматривали на уроке модель эпидемии гриппа. Эта тема проходится по учебнику Гейна по информатике в 10 классе. Модель строится в Excel. В учебнике изложена непонятно. В итоге мы составляли модель с формулой ограниченного роста, но учитывали, что у выздоровевших людей появляется иммунитет. Пожалуйста, адаптируйте вашу статью для школьников 10 класса. Будем решать в Excel .
      Ответить
      • MZRULL > detris@yandex.ru | 07.04.2020 | 07:58 Ответить
        Я боюсь что Вы ставите перед автором невыполнимую задачу. Цель статьи - не цифры, а понимание (с) Хэмминг. Автор даже не стал касаться вопроса устойчивости решения (для нестационарных (вирус мутирует) стохастических неустойчивых систем) - что, я согласен, правильно, это материал старших курсов универа.
        Ответить
      • haykh > detris@yandex.ru | 26.04.2020 | 06:07 Ответить
        На самом деле я изначально что-то подобное хотел, но формат задач здесь несколько другой. Если есть некоторая масса действительно заинтересованных людей, то можно придумать куча задач с практикой, где надо будет либо в экселе построить что-нибудь, либо накодить что-то простое.
        Ответить
  • workinghorse  | 14.04.2020 | 15:47 Ответить
    Спасибо за материал. Я хотел-бы присоединиться к обсуждению проблемы.
    Со своей стороны приглашаю в библиотеку канала ЗНАНИЕ=СИЛА?
    URL: https://zen.yandex.ru/id/5e7e0eb66300d51ddf2f12c5
    на просмотр очередной Антилапши.
    Антилапша родилась в соответствии с Третьим законом Ньютона, который гласит:
    «Два тела воздействуют друг на друга с силами, противоположными по направлению, но равными по модулю.»
    Первое тело – информационный демпинг Интернета, вызванный эпидемией COVID-19.
    Второе - Антилапша.

    Присоединяйтесь, поговорим
    В библиотеке четыре публикации
    Антилапша № 1. COVID-19 ЧЕГО И КОГДА ОЖИДАТЬ?
    Антилапша № 2. COVID-19: ЗАЧЕМ НУЖНЫ НАУКА С КАРАНТИНОМ?
    Антилапша № 3. COVID-19 В БОЛЬШОМ ГОРОДЕ
    Антилапша № 4. COVID-19: ЛАВИНА, НАКРЫВШАЯ ЕВРОПУ
    Публикации будут появляться периодически.
    Смею надеяться, что они будут полезными.

    Пандемия продолжается, мы внимательно следим за ее развитием.

    Искренне ваш,

    VK
    Ответить
  • Sergey Shavkunov  | 28.04.2020 | 18:25 Ответить
    Спасибо за подробное описание модели! По-моему Tinf должно быть 25-30 дней - нахождение на лечении (3-4 недели) с одним из 2-х исходов. В период лечения пациент является инфицированным и только его изоляция в больнице не позволяет заражать других. Только после завершения лечения он переходит из I в R. Появляется задержка в процессе на время лечения. Таким образом, пик I сместится вправо на 30 дней. К Tinc - это не относится, как я понял, так как фактически это время описывает период, когда инфицированный начал заражать окружающих до его изоляции.
    Ответить
Написать комментарий

Сюжет


Коронавирус SARS-CoV-2

Коронавирус SARS-CoV-2


Элементы

© 2005–2025 «Элементы»