Viele Fragezeichen: Die Datenkrise des Robert-Koch-Instituts

Gastbeitrag von Klaus Lindinger

Wer sich einer Aufarbeitung des „heißen Eisens“ COVID-19 nähert, gerät schnell zwischen die Fronten der Befürworter und Kritiker des Krisenmanagements der Bundesregierung. Zentral bei der Bewertung der Gefährlichkeit des Virus und den zu treffenden Maßnahmen war das Robert-Koch-Institut (RKI) und dessen Zahlen. Ich habe zum einen eine pflegebedürftige 90-jährige Mutter und eine 85-jährige Schwiegermutter, die beide zur oft thematisierten Risikogruppe zählen und deren Verunsicherung mein tiefergehendes Interesse an diesem Thema geweckt haben. Zum anderen habe ich 32 Jahre Berufserfahrung mit Datenanalyse-Software und deren Vermarktung. “Big Data“ war und ist ein zentrales Thema unserer Branche. Womöglich bekommt man so ein gewisses Gefühl für größere Zahlenwerke.

Deshalb erschien mir die Aufbereitung und Darstellung der Daten zum COVID-19-Infektionsgeschehen in Deutschland durch das RKI von Anfang an nur in Teilen plausibel. Denn in den Lageberichten des RKI schlummern viele Daten, die von großer Relevanz sind. Nur werden diese Daten nicht oder nur unzureichend in Zusammenhang mit den COVID-19 Fallzahlen und Todesfällen gebracht.

Warum das so ist, kann nur spekuliert werden. Auf Basis meiner langjährigen Erfahrung mit Systemen für Datenanalyse und Datenmanagement würde ich vermuten, dass man intern einfach keinen Überblick über die vielen verschiedenen Datenquellen hat und es eventuell keine Datenharmonisierung oder Datenabgleiche gibt. Dazu kommt sicherlich die große Beanspruchung der RKI-Ressourcen im Zuge der Corona-Pandemie.

1. Das Problem mit den absoluten Fallzahlen

  • Fokussierung auf absolute Fallzahlen führt zu einer irreführenden Darstellung des Infektionsgeschehens.
  • Entscheidender Kontext fehlt:o    Anzahl der getesteten Menschen + Relation Getestete / positive COVID-19-Fälle.o    Genesene und Verstorbene werden generell nicht von der Gesamtanzahl der positiv Getesteten abgezogen („inzwischen fast 200.000 Infizierte in Deutschland“) was zu einer Wahrnehmungsverzerrung führt.o    Keine Unterscheidung zwischen Infizierten, Erkrankten und Hospitalisierten.o    Fehlende Relation im Vergleich zu anderen Krankheiten, damit eine sachliche Gefahreneinschätzung möglich wird.

Was mich von Anfang an störte, war die reine Fokussierung – sowohl des RKI als auch der Leitmedien – auf kumulierte Fallzahlen sowie die Darstellung optisch exponentiell steigender Infektionskurven (siehe Abbildung 1). Der hier extrem wichtige Kontext, nämlich die Anzahl der “aktiven“ positiv getesteten Menschen – das sind die verbleibenden potentiell infektiösen Menschen, wenn man die Genesenen und Verstorbenen von der Gesamtanzahl der positiv getesteten Menschen abzieht – wurde aber vor allem in den ersten Wochen fast komplett ausgeblendet.

Nachdem immer mehr Menschen Unmut über die Kommunikation des RKI äußerten, führte man vermutlich als Reaktion zunächst die „Verdopplungsrate der neu-positiven Fälle in Tagen“ als Kennzahl ein, änderte die Zielgröße für „Lockerungen“ schnell von zehn auf 14 Tage, um dann kurz danach den „R-Wert“ einzuführen, mit dem verbundenen Ziel, dieser müsse unter „1“ gehalten werden.

Ich habe die Berichterstattung täglich verfolgt und war auch nicht überrascht, als das RKI am 17. März nach den erschreckenden Geschehnissen in Norditalien und zwölf registrierten Todesfällen in Deutschland seine Risikoeinschätzung auf “hoch“ stufte. Viel mehr verwunderte mich infolgedessen die Darstellung der Infektionszahlen im RKI-Dashboard. Hier werden die COVID-19-Fallzahlen Tag um Tag aufaddiert. Diese Kurve flachte rein optisch erst Mitte April leicht ab. Der Eindruck entsprach aber in keiner Weise der Realität, denn der Tag mit der höchsten Fallzahl von 6.294 neuen positiv Getesteten, war schon am 28. März erreicht (siehe Abbildung 2). Auch bis zu diesem Tag gab es nie eine anhaltend exponentielle Entwicklung der Infektionen und schon Mitte April halbierten sich die neuen COVID-19 Fälle auf weniger als die Hälfte, durchschnittlich 2.800 pro Tag.

COVID-19-Fallzahlen ohne Relation und Kontext

Ein entscheidender Faktor, der weiterhin bei fast allen Datenvisualisierungen zum Infektionsgeschehen außer Betracht gelassen wird, ist die Population, auf die sich die Anzahl der positiv getesteten Menschen bezieht. Diese Population ist nicht statisch, denn sie ist primär davon abhängig, wie viele Menschen täglich getestet werden. Das Testvolumen der Labore wird nur in Wochenzyklen gemeldet. Es lag bis zu den ersten Meldungen in Kalenderwoche 10 und 11 Anfang März jeweils bei etwas weniger als 130.000 Testungen. Mit 957 positiv Getesteten im Zeitraum vom 3. bis zum 9. März, also der Woche vor KW 11, lag deren Anteil innerhalb der Testpopulation bei lediglich 0,75%.

In der darauffolgenden Woche wurde das Testvolumen auf 348.619 weit mehr als verdoppelt. Gleichzeitig verfünffachte sich die absolute Anzahl der positiv Getesteten auf 4.873 Menschen. Der Anteil der positiv getesteten Menschen innerhalb der Testpopulation ist jedoch nur von 0,75% auf 1,4% gestiegen. Dies bedeutet, dass unter Berücksichtigung der wesentlich größeren Testpopulation lediglich eine Verdopplung und keine Verfünffachung der Fallzahlen erfolgte. Dies hätte damals schon einer sehr viel flacheren Steigerungsrate entsprochen und nicht einer von aufaddierten Fallzahlen suggerierten Steilkurve.

Schauen wir nun auf die aktuellen Zahlen, so weist das RKI von Beginn der Erfassungen bis zum 13. Juli kumulativ 198.963 positiv getestete COVID-19 Fälle aus. Interessant ist, dass bis zur Kalenderwoche 21 auch 193.596 Influenza-Fälle ermittelt wurden (RKI, Epidemiologisches Bulletin 24/2020 – Seite 11).

Subtrahiert man nun von den bislang ermittelten COVID-19 Fällen die 185.100 kumulativ ausgewiesenen Genesenen und die 8.064 Verstorbenen der bestätigten Fälle, dann verbleiben lediglich noch 4.799 „aktive“ Fälle. Die einzige mir bekannte Quelle, die diese Sicht auf die COVID-19 Daten von Beginn an bis zuletzt am 9. Juni in einem internationalen Vergleich in einer Infografik darstellt, war bei Statista zu finden (siehe Abbildung 3).

2. Das Problem mit den falsch-positiven Tests

Das Problem mit falsch-positiven Tests ist inzwischen bekannt. Man muss sich bewusst sein, dass es sich bei jedem positiven Test um nicht-infektiöse Virenfragmente, eine asymptomatische Infektion oder eben um ein falsch-positives Resultat handeln kann. Nicht jeder COVID-19-Positive ist „erkrankt“. In den Worten von Gesundheitsminister Jens Spahn:

3. Das Problem mit der Dunkelziffer

test alt text

Kommen wir nochmals zurück zur Bezugsgröße der Testpopulation. Die zuletzt vom RKI veröffentlichten Testzahlen in der Kalenderwoche 27 (also vom 29. Juni bis zum 7. Juli) lagen bei 494.146 Testungen und insgesamt 2.836 positiv Getesteten. Dies bedeutet (auch unter Berücksichtigung von Mehrfachtestungen) einen Anteil von lediglich 0,7% (oder 7 von 1.000 Personen) innerhalb der getesteten Population von knapp einer halben Million Menschen und mit 55 verstorbenen Menschen in diesem Zeitraum, sind dies 0,01% der getesteten Menschen (siehe Abbildung 4).

Laut RKI wurden bis zur ersten Juliwoche insgesamt 6,4 Millionen Testungen durchgeführt, somit wurde zwischenzeitlich etwa jeder 20-zigste oder umgerechnet etwas mehr als 6,5% der 83 Millionen Einwohner Deutschlands auf COVID-19 getestet. Bis zum 13. Juli 2020 sind insgesamt 9.064 der 5½ Millionen mit Verdacht auf COVID-19 getesteten Menschen verstorben, das ist ein Anteil von umgerechnet 0,16% der getesteten Population.

Die Quintessenz: eine statistische Einbeziehung der wöchentlich vom RKI veröffentlichten Testpopulationen, welche den rechnerischen Nenner der positiv Getesteten darstellt, hätte schon im März erkennen lassen müssen, dass wir in Deutschland keine explosionsartige SARS-Epidemie bekommen werden und eine bundesweite Ausgangssperre in dieser Form ganz sicher nicht erforderlich gewesen wäre.

Rechnet man die 4.799 aktiven Fälle von der Test-Population (ca. 5 1/2 Millionen) auf die amtliche Einwohnerzahl von 83,02 Millionen hoch, verbleiben in Deutschland insgesamt weniger als 7.500 infektiöse COVID-19 Fälle. Diese errechnete “Dunkelziffer“ auf Basis der Erkenntnisse einer Modellierungsstudie von Endo et al. stützt diese Annahme. Basierend auf den Daten der WHO-Länderberichte wurde geschätzt, dass mit einem median k von 0,1 (95 %-KI: 0.05–0.2) von nur etwa 10 % infektiöser Indexfälle 80 % der Folgefälle ausgehen.

Ein gutes Beispiel, wie schwierig die Einschätzung der Dunkelziffer der tatsächlichen „Durchseuchung“ ist, zeigen zwei Studien: im „Epizentrum“ Ischgl haben mehr als 42% aller Einwohner Antikörper, 85% bemerkten von einer Infektion gar nichts und nur 2 Personen sind mit einem positiven COVID-19-Testergebnis verstorben. In Deutschland hat eine erste Antikörperstudie hingegen einen Wert von 1,3% Durchseuchung ermittelt. Dass immer noch keine umfangreichen repräsentativen Studien (Reihentests) zur Durchseuchung der Bevölkerung abgeschlossen wurden – wir befinden uns immerhin in Monat fünf der Pandemie – ist aus meiner Sicht ein großes Versäumnis.

4. Das Problem mit der Zweideutigkeit von COVID-19 als Todesursache

Laut Definition des Robert-Koch-Instituts wäre George Floyd ein Opfer von COVID-19 und würde in der entsprechenden Statistik so ausgewiesen werden. Dies fasst die unseriöse Zählweise prägnant zusammen. Außerdem werden einmal positiv Getestete auch nach vollständiger Genesung und dann späterem Ableben mit in die Statistik der Toten aufgenommen, wie in dem aktuellen Fall in Krefeld (siehe 6. Juli):

„Obwohl es laut Feststellung des städtischen Fachbereichs Gesundheit keinen neuen Todesfall im Zusammenhang mit Covid-19 zu verzeichnen gibt, muss die Zahl der Verstorbenen systemrelevant um einen Fall auf nun 23 heraufgesetzt werden, um die Statistik an die des Robert-Koch-Institutes anzupassen. Grund ist, dass Personen, die einmal positiv auf das Coronavirus getestet wurden und später versterben grundsätzlich in dieser Statistik aufgeführt werden. Im vorliegenden Krefelder Todesfall galt die Person (mittleren Alters und mit multiplen Vorerkrankungen) nachdem es mehrfach negative Testergebnisse gab inzwischen seit längerem als genesen.“

Aus wissenschaftlicher Sicht sind damit alle Zahlen zu „Coronatoten“ in Frage zu stellen bzw. nicht eindeutig. Solange es keine Evidenz gibt, kann man aus der Zahl der COVID-19 Todesopfer keine klaren Schlussfolgerungen ziehen.

Dass das RKI anfangs vom Obduzieren abriet, wirft Fragen auf. Entgegen dem Rat des RKI durchgeführte Obduktionen zeigten dann, dass alle mit COVID-19 Verstorbenen an anderen Vorerkrankungen litten und nach Aussage des obduzierenden Professors für Rechtsmedizin Klaus Püschel der Tod unabhängig von COVID-19 bald eingetreten wäre.

Etwa 70% der erfassten Fälle enthalten die Angabe des Test-Orts. In diesem Zeitraum sind lediglich 125 = 11% aller COVID-19 Fälle im Krankenhaus verstorben. Außerdem gibt es große Unterschiede zu den Angaben der Verstorbenen, die aus dem DIVI-Intensivregister der Krankenhäuser in den täglichen Lageberichten des RKI nachzuverfolgen sind. Im Vergleichszeitraum sind dort angeblich 309, also fast dreimal so viele Menschen auf Basis einer offensichtlich stark differierenden Erhebungsweise in Krankenhäusern verstorben. Erklärungen für diese massiven Unterschiede waren für mich bislang nicht gegeben.

Erst seit dem 23. April führt das RKI den Erfassungsort “Pflegeheim“ in seinen täglichen Lageberichten auf. Im Zeitraum bis zum 15. Mai, also dem Tag vor dem Höhepunkt der täglichen Todesfälle, wurden insgesamt 2.945 COVID-19 Todesfälle gemeldet, wovon 1.371 = 46,5% mit COVID-19 Verstorbene in Pflegeheimen und 255 = 8,7% in Krankenhäusern registriert wurden. Hieraus kann durchaus geschlussfolgert werden, dass der Schwerpunkt der Testungen kontinuierlich auf Pflegeheime hin ausgeweitet wurde. Das DIVI-Register weist in diesem Zeitraum 1.294 = 44% mit COVID-19 Verstorbene aus.

5. COVID-19 und Übersterblichkeit – Korrelation ja, Kausalität nein

Natürlich kann man die Ergebnisse aus Studien wie beispielweise in Ischgl (siehe oben) nicht verallgemeinern, zu speziell sind immer die örtlichen Umstände und die Dynamik des Ausbruchsgeschehens. Aber genau so wenig kann man aus den Zuständen in Norditalien oder New York Rückschlüsse auf das Pandemiegeschehen in Deutschland ziehen.

Die gravierenden Unterschiede im Infektionsgeschehen und bei der Übersterblichkeit zwischen beispielsweise Deutschland und Italien oder Portugal und Spanien lassen sich nicht alleine mit COVID-19 erklären. Es müssen hier lokale Gegebenheiten wie Schwächen der Gesundheitssysteme oder die Luftverschmutzung massiven Einfluss auf das Pandemie- und Sterblichkeitsgeschehen gehabt haben. So ist im EUROMOMO in vielen Ländern eine eindeutige zeitliche Korrelation zwischen Ausgangssperren im März /April und einer Übersterblichkeit zu erkennen. Ob diese Übersterblichkeit durch COVID-19 verursacht wurde, kann man da jedoch nicht herauslesen. Oft haben wir in letzter Zeit den Satz „Ein Virus kennt keine Grenzen“ gehört – die Auswirkungen der Pandemie sind lokal jedoch sehr unterschiedlich.

Eindimensionale Daten führen andernorts zu Opfern

Auch wenn nicht absehbar ist, dass die Pandemie in Deutschland zu einer Übersterblichkeit führt, so ist sie doch für alle Beteiligten kein Pappenstiel. Aus den unterschiedlichsten Quellen strömen kontinuierlich Daten auf das RKI ein. Wenn die Daten allerdings nicht in Einklang gebracht werden, so kann dies zu erheblichen Konsequenzen führen.

Wir sollten uns bewusst sein, dass die Statistiken und täglichen Beurteilungen des Robert-Koch-Instituts auch zur Verschiebung von über 50.000 Krebsoperationen geführt haben. Das Ärzteblatt schreibt dazu am 15. Mai: „28 Millionen chirurgische Eingriffe weltweit aufgrund von COVID-19 verschoben.“ Darunter sind laut CovidSurg 908.759 aufgeschobene Operationen für Deutschland, inklusive rund 850.000 elektive (oder gutartig genannte) Eingriffe. Das sind 85 % aller elektiven Operationen. Außerdem sind 52.000 Krebsoperationen aufgeschoben worden, somit 24 % aller Eingriffe bei malignen Erkrankungen.

Weitere Kollateralschäden

Wir können viel lernen

Auch wenn die Zahlen aus meiner Sicht eine klare Sprache sprechen: die Geschehnisse können nicht mehr revidiert werden und ich möchte hier auch niemanden verurteilen. Wir können aber sehr viel für die Zukunft lernen und gerade in einer solch bedrohlichen Situation täglich neu eruieren, ob an den neuralgischen Punkten tatsächlich Engpässe auftreten und wie sich ein neuer Krankheitserreger im Vergleich zu bekannten Virenstämmen verhält. Und es wäre wünschenswert, wenn dann weniger Fokus auf spektakuläre Einzelfälle und Brandherde und mehr auf alle Bevölkerungsschichten gelegt würde.

Wenn Ihnen an der weiteren Aufklärung des Geschehens gelegen ist, dann können Sie über die beim Bundestag einberufene Petition 109562 die Einberufung einer Expertenkommission mit Befürwortern und Kritikern der Maßnahmen der Regierung im Zuge der Corona-Pandemie unterstützen. Nur der offene Dialog kann uns als Gesellschaft von dieser Krise lernen lassen.


Hinweis von Boris Reitschuster:

Gastbeiträge geben immer die Meinung des Autors wieder, nicht meine.

Gerade im Zuge der Corona-Krise halte ich es für wichtig, auch kritischen Stimmen eine Plattform zu geben, die in den großen Medien kaum zu Wort kommen. So können die Leser unterschiedliche Sichtweisen kennenlernen und sich dann als erwachsene Menschen selbst eine Meinung bilden. Das ist leider kaum noch möglich ist, wenn man sich nur auf das „betreute Informieren“ in den meisten großen Medien verlässt.


Klaus Lindinger ist Digital Innovation Officer bei Data Virtuality. Er verfügt über mehr als 30 Jahre Erfahrung in der Datenverarbeitung, im Vertrieb und Management u.a. bei Oracle, Interflex, Sopra Steria und SAP. Kontakt: LinkedIn.


Bild: Pixabay

Text: Gast

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert