Etwa 66% aller globalen Temperaturdaten bestehen aus geschätzten Werten
Die Adjustierungen sind irgendwie kontrovers, weil sie vermutlich Roh- und genaue Daten heranziehen. Dann werden sie durch ein oder mehrere mathematische Modelle laufen gelassen und erzeugen eine Schätzung, wo die Temperatur unter bestimmten gegebenen Bedingungen hätte liegen sollen. Beispiel: Der Messzeitpunkt (time of observation TOB) nimmt einen Rohdatenpunkt um – sagen wir – 7 Uhr morgens und erzeugt eine Schätzung, wo die Temperatur um Mitternacht gelegen haben könnte. Der Skill eines solchen Modells ist auf monatlicher Basis fast unmöglich zu bestimmen, aber es ist unwahrscheinlich, dass man dabei permanent ein Ergebnis erhält, das bis auf ein Hundertstel Grad genau in der Aufzeichnung gespeichert ist.
Nehmen wir einen einfachen Beispielfall. Die Station in Berlin-Tempelhof begann mit Temperaturmessungen im Januar 1701 und misst dort bis heute [im 2. Weltkrieg wurde um diese Station ein großer Flughafen gebaut, der zunächst als Militärbasis, dann als einziger Verkehrsflughafen im Westteil Berlins genutzt wurde, bis man in Tegel den neuen Flughafen in Betrieb nahm! Anm. d. Übers.] Bis Dezember 1705 war es in der GHCN-Aufzeichnung die einzige Station, an der Temperatur gemessen worden ist. Von den 60 theoretisch möglichen Monaten jenes Zeitraumes gab es aus 48 Monaten (nach den Qualitäts-Kontrollchecks) eine nicht veränderte mittlere Roh-Temperatur, und während der übrigen 12 Monate liegt keine Messung vor. Jeder einzelne dieser 48 Monate wurde durch das Adjustierungs-Modell nach unten geschätzt, und zwar um genau 1,14°C. Im Januar 1706 kam eine zweite Station zum Netzwerk hinzu – De Bilt in den Niederlanden. Während der folgenden 37 Jahre gab es eine valide Temperatur in jedem Monat, und während der meisten Monate war es die einzige GHCN-Station, von der eine Temperaturmessung vorlag. Die Temperatur für jeden dieser Einzelmonate wurde um genau 0,03°C nach unten geschätzt.
Ist es möglich, dass die Modelle gut genug sind, die „korrekte“ Temperatur an diesen beiden Stationen im Verlauf von über vierzig Jahren mittels nur zweier Konstanten zu ermitteln? Zwar ist alles möglich, aber es ist äußerst unwahrscheinlich.
Wie viele Rohdaten sind verfügbar?
Die folgende Graphik zeigt die in den GHCN-Aufzeichnungen verfügbare Datenmenge für jeden Monat vom Januar 1700 bis zur Gegenwart. Auf der Y-Achse ist die Anzahl der Messstationen aufgetragen, so dass jeder Punkt der Kurve die Anzahl der Messungen im gegebenen Monat repräsentiert. Die grüne Kurve repräsentiert die Anzahl von reinen, unveränderten Messungen, und die violette Kurve repräsentiert die Anzahl der geschätzten Messungen. Die Differenz zwischen grüner und violetter Kurve repräsentiert die Anzahl der Roh-Messungen, die nicht von den Adjustierungsmodellen verändert worden sind. Das bedeutet, dass die Differenz zwischen geschätztem und Rohwert Null ist. Die blaue Kurve unten repräsentiert die Messungen, bei denen ein unkorrigierter Rohwert durch die Adjustierungs-Modelle ausgesondert und durch einen ungültigen Wert ersetzt worden ist (repräsentiert durch -9999). Die Anzahl der ausgesonderten Rohdaten (blaue Kurve) ist in der grünen Kurve der Gesamtzahl nicht enthalten.
Anzahl der monatlichen Roh- und geschätzten GHCN-Temperaturen von 1700 bis heute
Die zweite Graphik zeigt die selben Daten, aber der Startzeitpunkt liegt diesmal am 1. Januar 1880. Dies ist der Startzeitpunkt für die GISS-Analyse.
Anzahl der monatlichen Roh- und geschätzten GHCN-Temperaturen von 1880 bis heute
Wie viele der Daten sind modelliert?
Zur Erinnerung für diesen Beitrag: „Rohdaten“ sind Daten, die die Qualtitäts-Kontrolltests durchlaufen haben (nicht gekennzeichnet). Gekennzeichnete Daten werden von den Modellen ausgesondert und durch ungültige Werte ersetzt (-9999).
In der nächsten Graphik repräsentiert die violette Kurve die Prozentzahl der Messungen, die geschätzt sind (geschätzt dividiert durch roh x 100). Die blaue Kurve repräsentiert die Prozentzahl der ausgesonderten Messungen relativ zu den Roh-Messungen, die nicht ausgesondert worden sind (ausgesondert dividiert durch roh x 100). Vor dem Jahr 1935 wurden etwa 80% aller Rohdaten in eine Schätzung umgeändert, und von 1935 bis 1990 erfolgte eine stetige Abnahme auf etwa 40% der Daten, die in Schätzungen umgewandelt wurden. Im Jahre 1990 gab es eine aufwärts gerichtete Spitze von etwa 55%, gefolgt von einer stetigen Abnahme auf heute 30%.
Die blaue Kurve unten zeigt, dass etwa 7% bis 8% der Rohdaten von den Adjustierungs-Modellen ausgesondert worden sind mit Ausnahme einer Spitze von 20% in jüngerer Zeit. (Ja, die beiden Kurven zusammen sehen komischerweise wie die Silhouette von Homer Simpson aus, wenn er auf dem Rücken liegt und schnarcht).
Prozentzahl der GHCN-Rohdaten, die durch Schätzungen ersetzt oder ausgesondert wurden.
Die nächste Graphik zeigt die Prozentzahlen der Schätzungen von ländlichen und nicht-ländlichen Stationen. In den meisten Teilen der Aufzeichnung sind die Werte nicht-ländlicher Stationen häufiger geschätzt worden als die von ländlichen Stationen. Allerdings wurden während der letzten 18 Jahre beide Datenarten in etwa gleicher Weise geschätzt.
Prozentzahl von ländlichen und städtischen GHCN-Rohdaten, die durch eine Schätzung ersetzt wurden.
Die fünfte Graphik zeigt die mittlere Änderung der Rohdaten aufgrund der Ersetzung durch geschätzte Werte seitens der Modelle. Zwei Kurven finden sich in der Graphik. Die rote Kurve ist die mittlere Änderung, wenn man Messungen, bei denen der geschätzte Wert gleich dem Rohwert war, mit einschließt. Allerdings ist es möglich, dass die Adjustierungs-Modelle einen geschätzten Wert von Null erzeugen. Die blaue Kurve berücksichtigt diese Möglichkeit und repräsentiert alle Messungen, einschließlich jener ohne Unterschied zwischen den Rohwerten und den geschätzten Werten. Die Trendlinien für beide sind ebenfalls eingezeichnet, und es ist interessant zu sehen, dass die Neigung beider Kurven fast identisch ist.
Mittlere Änderung in Grad Celsius mal 100, wenn Schätzungen Rohdaten ersetzen
Was ist mit den ausgesonderten Daten?
Zur Erinnerung: die ersten beiden Graphiken zeigten die Anzahl der Rohmessungen, die von den Adjustierungs-Modellen entfernt worden waren (blaue Kurve in beiden Graphiken). Die geschätzten Daten wurden nicht gekennzeichnet, um anzuzeigen, warum die Rohdaten entfernt worden waren. Die violette Kurve in der folgenden Graphik zeigt die Anomalie der entfernten Daten in Grad Celsius mal 100 (Bezugszeitraum 1951 bis 1980). Es gibt einen leichten Aufwärtstrend von 1880 bis 1948, einen großen Sprung nach oben von 1949 bis 1950, gefolgt von einem moderaten Abwärtstrend von 1950 bis heute. Die blaue Kurve ist die Anzahl der von den Modellen ausgesonderten Messungen. Man sollte bei der Analyse dieser einzelnen Graphik vorsichtig sein, weil bei der Berechnung der Anomalie kein gridding [Zuordnung zu den Planquadraten in denen die Messstation liegt] vorgenommen worden ist, und vor 1892 wird nur eine Handvoll von Messungen durch die Daten repräsentiert.
Mittlere Anomalie in Grad Celsius mal 100 der ausgesonderten GHCN-Daten
Schlussfolgerung
Alles in allem enthalten alle Temperaturdaten von 1880 bis heute etwa 66% in den adjustierten GHCN-Temperaturdaten geschätzte Werte, erzeugt von Adjustierungs-Modellen, während 34% der Daten Rohwerte sind, abgeleitet aus direkten Messungen. Der ländliche Anteil enthält 60% geschätzte und 40% direkter Daten. Unter den nicht-ländlichen Daten sind etwa 68% geschätzt und 32% Rohdaten. Die Gesamtzahl der nicht-ländlichen Messungen übersteigt die ländlichen Messungen um einen Faktor 3.
Die Schätzungen der NOAA für die GHCN-Daten führen einen Erwärmungstrend ein von etwa einem Viertelgrad Celsius pro Jahrhundert. Jene Schätzungen werden mit einer etwas höheren Rate für nicht-ländliche Stationen erzeugt als für ländliche Stationen während der meisten Zeit der Aufzeichnung. Während der ersten 60 Jahre der Aufzeichnung wurden Messungen mit einer Rate von 75% geschätzt mit einem graduellen Rückgang bis 40% Anfang der neunziger Jahre, gefolgt von einer kurzen Spitze in der Rate vor dem weiteren Rückgang auf das heutige Niveau.
Etwa 7% der Rohdaten wurden ausgesondert. Falls man diese Daten bei der Endaufzeichnung berücksichtigt hätte, hätte sich wahrscheinlich von 1880 bis 1950 ein Erwärmungstrend ergeben, dem ein Abkühlungstrend von 1950 bis heute gefolgt wäre.
Epilog
Die Anzahl von Schätzungen und deren Auswirkungen ändern sich mit der Zeit. Grund hierfür ist das Hinzufügen neuerer Daten, die die Zeitreihe verlängern, die als Input für die Adjustierungs-Modelle genutzt werden. Die folgende Graphik zeigt die Prozentzahl der geschätzten Messungen (violette Kurven) und die Prozentzahl der ausgesonderten Messungen. Die dunklere Kurve wird erzeugt aus dem Datensatz bis zum 23. 9. 2015 (bis August 2015 sind die Daten komplett). Die helleren Kurven werden erzeugt aus dem Datensatz bis zum 27. 6. 2014 (Daten sind komplett bis Mai 2014). Eindeutig wurden im gegenwärtigen Datensatz weniger Messungen geschätzt als im Datensatz aus der Vergangenheit. Allerdings wurden im gegenwärtigen Datensatz mehr Messungen aus dem frühen Teil der Aufzeichnung ausgesondert als im gegenwärtigen Datensatz.
Prozent der GHCN-Rohdaten, die durch Schätzungen ersetzt oder ausgesondert wurden (August 2015 im Vergleich zu Mai 2014)
Eine Graphik, die die mittlere Änderung zu den Rohdaten zeigt, ist nicht abgebildet, weil eine Überlagerung praktisch ununterscheidbar ist. Allerdings ist die Neigung des geschätzten Datentrends erzeugt durch den gegenwärtigen Datensatz etwas größer als vom Datensatz der Vergangenheit (0,0204 bzw. 0,0195). Der Grund dafür, dass sich die Neigung von 0,0204 von der Neigung in der fünften Graphik oben (blaue Kurve) unterscheidet ist, dass das Vergleichsende der Mai 2014 ist, während die Graphik oben im August 2015 endet.
Link: http://wattsupwiththat.com/2015/09/24/summary-of-ghcn-adjustment-model-effects-on-temperature-data/
Übersetzt von Chris Frey EIKE