Sonnenflecken: Bonferroni vs. Prof. Labitzke
Der Kommentator schrieb:
Karin Labitzke hat diese Nuss geknackt. Sie hat als Erste die Korrelation nachgewiesen zwischen nicht einem, sondern gleich zwei stratosphärischen Parametern und Sonnenaktivität. Nach fast 40 Jahren sind ihre Erkenntnisse immer noch valide, und dank ihrer Arbeit wissen wir, dass die Stärke des Polarwirbels von der Sonnenaktivität abhängt, moduliert durch die Quasi-zweijährige Oszillation.
Nachdem ich die Daten von der Freien Universität Berlin erhalten hatte, konnte ich ihre Ergebnisse replizieren. Die von Prof. Labitzke et al. gefundene Beziehung zwischen Sonnenflecken und polaren stratosphärischen Temperaturen sieht so aus:
Was also ist damit? Die Grundlage für die Antwort bildet mein voriger Beitrag „Sea Level and Effective N“ [auf Deutsch beim EIKE hier]. Darin diskutiere ich die Bonferroni-Korrektur und die langzeitliche Persistenz LTP.
Die Bonferroni-Korrektur wird gebraucht, wenn man mehr als eine Stelle und mehr als einmal nach etwas Ungewöhnlichem gesucht hat.
Beispiel: Nehmen wir an, wir würfeln mit drei Würfeln auf einmal und alle drei zeigen die Vier … etwas verdächtig, oder? Kann sogar schon reichen, um zu sagen, dass die Würfel gezinkt sind. Die Chance, drei mal die Vier mit einem einzigen Wurf mit drei Würfeln zu bekommen, beträgt 5 zu 1000.
Aber nehmen wir mal an, wir würfeln mit den drei Würfeln 100 mal. Wäre es seltsam oder ungewöhnlich, dann irgendwann drei mal die Vier zu würfeln? Nun … nein. Tatsächlich hat man bei so vielen Würfen eine Chance von etwa 40%, irgendwann auch drei mal die Vier zu erhalten.
Mit anderen Worten, falls man nur oft genug schaut, findet man alle Arten von Ungewöhnlichem, einfach durch Zufallsverteilung.
In der Klimawissenschaft ist es nun so, dass falls etwas als statistisch signifikant angesehen wird, die Wahrscheinlichkeit, dieses Ereignis durch Zufall allein zu finden, weniger als fünf pro einhundert betragen muss. Oder wie allgemein üblich ausgedrückt muss das, was der „p-Wert“ genannt wird, weniger als fünf Hundertstel betragen, üblicherweise geschrieben als „p-Wert < 0,05“.
ALLERDINGS – und es ist ein großes ,allerdings‘ – schaut man an mehr als nur einer Stelle, muss etwas, das signifikant ist, einen geringeren p-Wert haben. Die Bonferroni-Korrektur sagt, dass man den gewünschten p-Wert durch die Anzahl der Stellen dividieren muss, an denen man geschaut hat. Sucht man beispielsweise an zehn Stellen nach einem gegebenen Effekt, muss man den p-Wert von weniger als 0,05 durch zehn dividieren, um die Signifikanz des Effektes festzustellen, weil man an zehn Stellen geschaut hat. Das heißt, der p-Wert muss 0,005 oder weniger betragen, damit der Effekt statistisch signifikant ist.
Und nun … an wie vielen Stellen hat man geschaut? Um das zu beantworten, möchte ich noch etwas genauer beschreiben, was man eigentlich herausgefunden hat.
Die Graphik oben zeigt das Ergebnis … welches sich ergibt, falls man die Temperatur im Februar betrachtet in einer von sieben verschiedenen möglichen Schichten der Stratosphäre über dem Nordpol, verglichen mit den Sonnenflecken im Januar und um einen Monat verzögert über etwa die Hälfte der Zeit, in der die äquatorialen stratosphärischen Winde eher Ost- als Westwinde sind. Der p-Wert beträgt 0,002.
An wie vielen Stellen haben sie nach einer Relation geschaut? Nun, sie haben die Temperatur eines von zwölf Monaten in einer von sieben atmosphärischen Schichten gewählt mit einer von drei möglichen Sonnenflecken-Verzögerungen (0, 1 oder 2 Monate Verzögerung) und einen von zwei möglichen äquatorialen Windbedingungen.
Das ergibt 504 verschiedene Kombinationen. Selbst wenn wir die sieben Schichten außen vor lassen, ergeben sich immer noch 72 unterschiedliche Kombinationen. Mit einem sehr konservativen Ansatz finden wir also etwas mit einem p-Wert von 0,05 dividiert durch 72, was 0,0007 ergibt … und der von ihnen gefundene p-Wert ist etwa drei mal so hoch. Nicht signifikant.
Und das gilt noch nicht einmal für die räumliche Sub-Auswahl. Sie betrachten nur die Temperaturen über dem Nordpol, und das Gebiet nördlich des Polarkreises macht nur 4% der Erdoberfläche aus… was die Bonferroni-Korrektur sogar noch größer machen würde.
Das ist das erste Problem, eine sehr große Bonferroni-Korrektur. Das zweite Problem, welches ich in meinem oben verlinkten Beitrag diskutiert habe ist, dass wir die langzeitliche Persistenz LTP berücksichtigen müssen. Danach steigt der p-Wert dessen, was in der Abbildung gezeigt wird, auf 0,09 … was nicht statistisch signifikant ist, sogar ohne Berücksichtigung der Bonferroni-Korrektur.
Zusammenfassung:
● Wie Labitzke et al. gefunden haben, sind die Februar-Temperaturen 22 km über dem Nordpol während einer Zeit stratosphärischer Ostwinde tatsächlich mit den Januar-Sonnenflecken und einem Monat Verzögerung korreliert.
● Der nominelle p-Wert ohne Berücksichtigung von Bonferroni oder LTP beträgt 0,002, was signifikant zu sein scheint.
● Wenn man jedoch diese beiden Faktoren berücksichtigt, beträgt der p-Wert 0,09, was nicht signifikant ist.
● Und wenn man die Bonferroni-Korrektur heranzieht, um lediglich in eine Vielfalt von Stellen und Bedingungen zu schauen, muss der p-Wert unter etwa 0,0007 Grad liegen, um statistisch signifikant zu sein.
● Die Berücksichtigung von entweder LTP oder der Bonferroni-Korrektur allein reicht aus, um festzustellen, dass die behauptete Korrelation NICHT statistisch signifikant ist … und wenn man beide Faktoren zusammen berücksichtigt, ergeben sich Resultate, die weit, weit entfernt sind von jedweder statistischen Signifikanz.
Unglücklicherweise ist diese Art schlampiger statistischer Berechnungen, wie sie in der Studie hervortritt, nur zu verbreitet in der Klimadebatte, und zwar auf beiden Seiten. …
ERGÄNZUNG: Wie eine Eingebung kam mir dann plötzlich der Gedanke „Moment … was?!“ Folgendes machte mich stutzig: falls man nach irgendwelchen Effekten mit Bezug zur Sonne im Februar sucht – wo würde man Derartiges am Wenigsten auf der Erde finden?
Richtig … es wäre das Nordpolargebiet, wo im Februar niemals die Sonne scheint … das macht es zwar nicht unmöglich, aber weniger wahrscheinlich.
Und schließlich, heißt das, dass die geringen Solarvariationen aufgrund von Sonnenflecken keine Auswirkung auf der Erde haben? Nein, keineswegs. Als Amateurfunker (H44WE) weiß ich zum Beispiel, dass Sonnenflecken die elektrischen Eigenschaften der Ionosphäre beeinflussen.
Was ich NICHT gefunden habe, ist irgendein Beweis dafür, dass die geringen Solarvariationen aufgrund von Sonnenflecken irgendeine Auswirkung auf der Erdoberfläche haben. Das heißt nicht, dass es sie nicht gibt … sondern nur, dass ich diese trotz extensiver Suche nicht gefunden habe.
Link: https://wattsupwiththat.com/2019/02/25/labitzke-meets-bonferroni/
Übersetzt von Chris Frey EIKE
Bemerkung des Übersetzers: So gut Eschenbach auch arbeitet – aber der letzte Absatz scheint mir zu zeigen, dass er noch nie etwas vom Svensmark-Effekt gehört hat. Kann das wirklich sein?