24. April 2020 – Oliver Rheinbach Allgemein

Modellierung von Epidemien mit einem einfachen Modell (SIR-Modell und SARS-CoV-2-Daten)

Um Entscheidungen zu Epidemien zu treffen (oder zu verstehen) muss man zuerst exponentielles Wachstum verstehen: aus 100 Infizierten werden schon nach 20 Verdopplungen 100 Millionen Infizierte.

Dieses explosive Wachstum führt dazu, dass Krankenhäuser überlastet werden. Um die Geschwindigkeit des Wachstums zu reduzieren, kam es in fast allen Ländern der Welt mit exponentiell schnellen Ausbrüchen zu radikalen Maßnahmen, wie etwa die Kontaktbeschränkungen (+weiteren Maßnahmen) in Deutschland. Einige Länder kamen ohne solche Maßnahme aus, weil Sie den jeden Ausbruch früh genug unter Kontrolle bekommen haben. Italien, Frankreich und Spanien hatten dagegen deutlich strengere Maßnahmen als Deutschland (d.h. echte Ausgangssperren), mit ähnlichem Erfolg wie Deutschland.

Exponentielles Wachstum tritt am Anfang einer Epidemie auf. Durch erworbene Immunität schwächt sich die Epidemie ab, sobald ein substantieller Anteil der Bevölkerung die Infektion durchgemacht hat.

Die einfachsten Modelle, die dieses Verhalten beschreiben, sind die schon erwähnten SIR-Modelle und verfeinerte Varianten davon. Solche Modelle sind nötig, um Fragen zu beantworten wie: Wie hoch wird die Zahl der gleichzeitig Infizierten maximal sein und wann wird das sein? Wie hoch wird der Anteil der Bevölkerung sein, der sich im schlimmsten Fall ansteckt? Auch das RKI verwendet Varianten von SIR-Modellen für Grippesimulationen und jetzt auch für SARS-CoV-2.

Es gibt ein paar Online-Rechner zu SIR-Modellen, zum Teil mit sehr vielen Parametern. Das einfachste Modell kommt jedoch mit zwei Parametern aus: alpha und beta. Die sogenannte Basisreproduktionszahl R0, über die zur Zeit so viel diskutiert wird, ist dann der Quotient beta/alpha.

Das Modell hat nur drei Variablen:

  • S (susceptibles; Ansteckbare)
  • I (infected; Infizierte)
  • R (recovered/removed; Geheilte oder Verstorbene)

Die Werte der Variablen liegen immer zwischen 0 und 1, was sich dann als 0 Prozent bis 100 Prozent der Bevölkerung interpretieren lässt.

Das SIR-Modell wird durch ein System gewöhnlicher Differentialgleichungen beschrieben (vielleicht folgt in einem weiteren Beitrag die diskretisierte Variante, die dann ohne sichtbare Ableitung auskommt), in der einfachsten Variante:

  • S'(t)=-beta*S(t)*I(t)
  • I'(t)=beta*S(t)*I(t) – alpha*I(t)
  • R'(t)=alpha*I(t)

Hier gibt die Konstante beta an, wieviele andere ein Infizierter pro Zeiteinheit (z.B. pro Tag) ansteckt. Aus I(t) Infizierten (z.B. 10 Prozent der Bevölkerung) werden also nach einem Tag beta*I(t) Infizierte (also z.B. 15 Prozen, wenn beta=3/2), sofern jeder infizierbar ist. Da aber nur S(t) infizierbar ist (90 Prozent sind noch infizierbar, weil 10 Prozent ja schon infiziert sind), wird noch mit S(t) multipliziert.

Die mittlere Gleichung sagt also: Pro Tag kommen beta*S(t)*I(t) Infizierte dazu (immer in Prozent gerechnet, da alle Variablen zwischen 0 und 1 sind).

Die erste Gleichung sagt, dass die Anzahl der Infizierbaren entsprechend sinkt.

Die letzte Gleichung sagt, dass pro Zeiteinheit (z.B. pro Tag) ein Anteil alpha der Infizierten gesundet (oder stirbt, das wird hier nicht unterschieden). Daher ist 1/alpha ist die durchschnittliche Krankheitsdauer (z.B. 7 Tage).

Wenn beta die Infektionen pro Tag sind und 1/alpha die Krankheitsdauer in Tagen, dann sind beta/alpha die Infektionen, die ein Kranker während seiner gesamten Krankheit verursacht (wenn niemand immun oder bereits infiziert ist). Das ist die Basisreproduktionszahl R0.

Das Modell weicht natürlich von der Realität der SARS-CoV-2-Epidemie ab. Beispiel: Ein Infizierter ist im Modell während seiner Krankheit jeden Tag gleich ansteckend. Bei SARS-CoV-2 ist es so, dass ein Infizierter in den ersten Tagen nach seiner eigenen Infektion besonders ansteckend ist (mit einem Höhepunkt am Tag unmittelbar vor dem Symptombeginn), obwohl er noch keine Symptome hat (im Median 5 Tage lang). In der zweiten Woche ist ein Infizierter kaum mehr ansteckend (außer bei engem Kontakt z.B. mit Krankenhauspersonal) – obwohl er sich dann erst richtig krank fühlt.

Aus diesem Grund wollen wir für unser Modell 1/alpha = 7 Tage Krankheitsdauer annehmen. Das heißt, wir nehmen an, dass alle Ansteckungen während der ersten 7 Tage passiert (und ignorieren die zweite Krankheitswoche des durchschnittlichen Covid-19-Patienten).

Wenn wir nun versuchen, beta so zu wählen, dass es auf die SARS-CoV-2-Infektionsdaten in Deutschland vom Anfang März 2020 passt, bekommen wir den folgenden Verlauf (S blau, I rot, R grün). Tag 0 ist wieder der 1. März 2020. Die genauen Parameter sind beta=2.85/7 und alpha=1/7. Dementsprechend ist R0=2.85, also knapp unter 3. Das passt grob zur (rückwärts berechneten) Schätzung des RKI von R0 für Anfang März 2020 und zu anderen Quellen.

Dieses Szenario beschreibt, was passiert wäre, hätte es gar keine eindämmenden Maßnahmen gegeben – für diesen Fall ist dieses einfache Modell sogar relativ gut geeignet. Man sieht, dass kurz nach Tag 50 (genauer: am Tag 54, das wäre der 23. April 2020 gewesen, also vorgestern) das Maximum bei den Infizierten erreicht wird (rote Kurve): Es sind an diesem Tag fast 30 Prozent (genauer: 28 Prozent) der Bevölkerung gleichzeitig infiziert. Eine Katastrophe für die Krankenhäuser, denn selbst wenn nur ein Prozent schwere Verläufe angenommen werden, bedeutet das über 200000 Schwerkranke (bei aktuell 30000 Intensivbetten in Deutschland, von denen maximal 2/3 für Covid-19 zur Verfügung stehen werden.)

Ingesamt werden innerhalb der 100 Tage Berechnungszeit über 90 Prozent der Bevölkerung infiziert (grüne Kurve).

Ich habe oben geschrieben, dass beta=2.85/7 (bei angenommenen alpha=1/7, also 7 Tage Erkrankungsdauer) so gewählt wurde, dass es zu den deutschen Daten von Anfang März passt. Hier ist dargestellt, wie gut es passt:

Der Vergleich von I(t) (rote Kurve) mit den Infektionszahlen (Daten von NTV, siehe den allerersten Blog-Beitrag) geteilt durch 80 Millionen (schwarze Punkte). Die Kurve passt gut.

Hier die Messwerte (schwarze Punkte) noch einmal, aber eingetragen ein einen semilogarithmischen Plot von S, I und R (in der Standarddarstellung wie oben, könnte man nichts zu erkennen).

Man sieht, dass die rote Kurve sehr gut zu den Infektionszahlen in Deutschland (1. März bis 21. März 2020) passt. Da die y-Achse logarithmsch aufgetragen ist (semilog) ist, ist die Phase des exponentiellen Wachstums als Geradenabschnitt zu sehen. Die Steigung passt gut zusammen.

Im ersten Beitrag haben wir gesehen, dass das exponentielle Modell für den Tag 40 etwa 4,4 Millionen Infizierte prognostiziert hat. In der semilogarithmischen Plot (y-Achse logarithmisch) sieht man, dass das exponentielle Modell ungefähr bis Tag 45 gültig ist, hier der Ausschnitt bis Tag 45:

Das bedeutet aber, dass auch dieses Modell (ohne Eindämmungsmaßnahmen) vorhersagt, dass innerhalb von 40 Tagen aus 100 Infizierten mehr als 4 Millionen werden (etwa 5 Prozent der Bevölkerung bzw. 5e-2).

Nach Tag 45 ist die Phase des exponentiellem Wachstum (mit konstantem Wachstumsfaktor) beendet. Allerdings sind nach Tag 46 fast 15 Prozent der Bevölkerung infiziert (entsprechend 12 Mio Infizierten) – erst dann kommt es zu einer sichtbaren Abschwächung des Wachstums.

Bemerkung zu R0: Wenn man aus echten Daten den Wert von R0 schätzen will, muss man immer eine Generationenzeit annehmen. Das RKI berechnet R0 so (S. 14):

“Bei einer konstanten Generationszeit von 4 Tagen, ergibt sich R als Quotient der Anzahl von Neuerkrankungen in zwei aufeinander folgenden Zeitabschnitten von jeweils 4 Tagen. Der so ermittelte R-Wert wird dem letzten dieser 8 Tage zugeordnet, weil erst dann die gesamte Information vorhanden ist. Daher beschreibt dieser R-Wert keinen einzelnen Tag, sondern ein Intervall von 4 Tagen. Das dazu gehörende Infektionsgeschehen liegt jeweils eine Inkubationszeit vor dem Erkrankungsbeginn. Hat sich die Anzahl der Neuerkrankungen im zweiten Zeitabschnitt erhöht, so liegt das R über 1. Ist die Anzahl der Neuerkrankungen in beiden Zeitabschnitten gleich groß, so
liegt die Reproduktionszahl bei 1. Dies entspricht dann einem linearen Anstieg der Fallzahlen. Wenn dagegen nur jeder zweite Fall eine weitere Person ansteckt, also R = 0,5 ist, dann halbiert sich die Anzahl der neuen Infektionen innerhalb der Generationszeit.”

Schlussbemerkungen: Wir haben nur zwei Parameter (beta und alpha), dennoch gibt es noch andere Kombinationen von beta und alpha, die ähnlich gut zu den Daten passen. Sie liefern aber auch Ergebnisse, die ähnlich sind.

Eigentlich wollte ich Ihnen Octave-Implementierung (entweder mit Euler oder mit dem eingebautem ODE-Löser) an die Hand geben, damit Sie die Rechnungen nachvollziehen können – das verschieben wir aber.

Korrektur (06.07.2020): In der zweiten Gleichung des (einfachsten) SIR-Modells fehlte “- alpha*I(t)”. Danke für den Hinweis.

 

 

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.