Corona: Ist Dußlingen special?

Die Neu-Corona-Fälle im Landkreis Tübingen, letzte Zahlen:

Ort Fälle Einwohner
Ammerbuch 4 11302
Bodelshausen 5 5850
Dettenhausen 4 5390
Dusslingen 12 6241
Gomaringen 5 9077
Hirrlingen 6 3135
Kirchentelllinsfurt 4 5642
Kusterdingen 0 8629
Moessingen 19 20455
Nehren 1 4376
Neustetten 0 3715
Ofterdingen 0 5152
Rottenburg 7 43843
Starzach 0 4335
Tuebingen 26 91506

Mit 12 Fällen bei 6200 Einwohner fällt Dußlingen doch als etwas Besonderes auf. Schauen wir mal, wie das in der Grafik unten aussieht. Dabei habe ich das relative Risiko aufgetragen, im Vergleich zu allen Fällen im Kreis gemittelt. Ein Wert kleiner 1 bedeutet, dass die Wocheninzidenz kleiner war als im Durchschnitt des Kreises, im Bild sind das die grünen Balken. Ein Wert von größer 1 steht für ein überdurchschnittliches Risiko.

rr

Dußlingen ist mit einem RR von 4.7 schon ziemlich hoch. Aber halt, ist das ganz fair? Bei den kleinen Gemeinden mit 0 fällt das in die andere Richtung auf, so immun sind die Starzacher doch auch nicht.

Um die natürliche Schwankungsbreite wegen der kleinen Zahlen zu berücksichtigen, kann man die Wurzelregel verwenden: Bei unabhängigen Ereignissen ist die Quadratwurzel aus der Anzahl der Ereignisse eine Schätzung für den Standardfehler. Bei 100 Ereignissen ist die Wurzel 10, wir haben also einen Standardfehler von 10. Im Bereich von zweimal dem Standardfehler um den Wert herum, also zwischen 80 und 120, liegt der „wahre“ Wert - das 95% Konfidenzintervall lässt grüßen, die Mediziner würde das gerne mit Signifikanz übersetzen, aber da kriege ich die Krise.

Ich habe die so geschätzten Konfidenzintervalle als Balken eingetragen. Da zeigt sich, dass nur Dußlingen und Mössingen den Strich bei 1 nicht berühren, dass die also wirklich etwas Besonderes sind. In der anderen Richtung berührt Rottenburg den Strich bei 1 nicht - die sind also auch etwas besonderes. Über Starzach bis Kusterdingen kann man nix sagen, denen geht es wie Bielefeld.

Und jetzt die Preisfrage für alle Mediziner und ähnliche

Die obige Argumentation enthält bei der Abschätzung der Streuungen einen Fehler. Kein einfacher Rechenfehler, es muss medizinisch/epidemiologisch argumentiert werden. Man denke zum Vergleich an andere Viren, etwa HIV oder Warzen-HPV.

Ein Wort genügt, es kam in den Zeitung gelegentlich vor. Erklärung reicht auch. Wer sich zuerst meldet, kriegt ein Frei-Abo für den Irusweg.

Ok, allgemeine Coronamüdigkeit macht sich breit, drum sind die Antworten auf die Preisfrage auch nur so eingerauscht…

Die Antwort auf die Preisfrage in einem Wort: Cluster

Ausführlicher: die Schätzung der zu erwartenden Standardfehler setzt unabhängige Ereignisse voraus. Musterbeispiel ist der radioaktive Zerfall: Wenn ein Atomkern beschließt, sich der schwachen Wechselwirkung hinzugeben und zu strahlen, dann tut er das ganz alleine von sich aus. Egal, ob er oder sie sich in der Sonnenhitze oder im Weltraum befindet, und völlig unabhängig davon, ob die Nachbarn auch mit der schwachen Wechselwirkung liebäugeln. Dann gilt die Wurzelregel für die Schätzung des Standardfehlers exakt.

Bei Corona-Ansteckungen haben wir aber Cluster: Wenn sich in einer Familie, einer Kita, einem Kleinbetrieb jemand ansteckt, dann werden einige im Cluster auch mit angesteckt - so etwa mit 50% Wahrscheinlichkeit in der Familie, legt mich nicht fest.

Wenn in Dußlingen also 12 Fälle vorliegen, sind das in Wirklichkeit vielleicht nur 3 primäre Ansteckungen. Und wenn in Starzach jetzt eine Ansteckung erfolgt, werden das flugs 5, und schon ist Starzach scheinbar special.

1 „Gefällt mir“

Bei anderen stark ansteckenden Krankheiten wie Masern ist die Wurzel-Regel auch nicht brauchbar: ein Kind im Kindergarten, und es sind gleich 15.

Bei HIV stimmt die Regel ganz gut. Bei Warzen weiß ich es nicht genau, es könnte sein, dass Schwimmbäder Cluster-Punkte sind.

Interessante und einleuchtende Lösung! War schon gespannt, worauf es hinausläuft. Ich hatte vermutet, es läge auch v.a. an unterschiedlicher „Testwilligkeit“ der Bevölkerung bzw. vielen unerkannten Fällen.

Testwilligkeit - unbekannte Fälle: Ja, das kommt alles noch dazu.

Allerdings führen die zu einem Bias („Fehlweisung“) im geschätzten Wert, das würde also die Länge der dicken Balken ändern. Die Clusterung lässt den Schätzwert erst mal unverändert, wirkt sich hauptsächlich auf die Fehlerbalken aus.

1 „Gefällt mir“