Autokorrelation in CO2- und Temperatur-Zeitreihen

Autor: Andy May – CO2 Science

Status: Analysis – not peer reviewed

In meinem letzten Beitrag habe ich die CO2- und die HadCRUT5-Aufzeichnungen der NASA von 1850 bis 2020 aufgetragen und verglichen. Dies war eine Reaktion auf eine von Robert Rohde auf Twitter gepostete Handlung, die implizierte, dass sie gut korrelierten. Die beiden Datensätze scheinen zu korrelieren, da das resultierende R2 0,87 beträgt. Die verwendete Funktion der kleinsten Quadrate machte die globale Temperaturanomalie zu einer Funktion des Logarithmus zur Basis 2 der CO2-Konzentration (oder „log2CO2“). Das heißt, die Temperaturänderung wurde als linear mit der Verdopplung der CO2-Konzentration angenommen, eine gängige Annahme. Die Methode der kleinsten Quadrate (oder „LS“) geht davon aus, dass die Messungen der CO2-Konzentration fehlerfrei sind und alle Fehler, die sich aus der Korrelation (den Residuen) ergeben, in den HadCRUT5-Schätzungen der globalen durchschnittlichen Oberflächentemperatur enthalten sind.

In den Kommentaren zum vorherigen Beitrag wurde deutlich, dass einige Leser verstanden, dass das berechnete R2 (oft als Bestimmtheitsmaß bezeichnet) von LS künstlich aufgeblasen wurde, da sowohl X (log2CO2) als auch Y (HadCRUT5) autokorreliert waren und mit der Zeit zunahmen . Aber einige wenige verstanden diesen entscheidenden Punkt nicht. Wie die meisten Investoren, Ingenieure und Geowissenschaftler wissen, haben zwei Zeitreihen, die beide autokorreliert sind und mit der Zeit zunehmen, fast immer ein überhöhtes R2. Dies ist eine Art von „falscher Korrelation“. Mit anderen Worten, ein hohes R2 bedeutet nicht zwangsläufig, dass die Variablen miteinander in Beziehung stehen. Die Autokorrelation spielt in der Zeitreihenanalyse und in der Klimawissenschaft eine große Rolle, wird aber zu häufig ignoriert. Um eine Korrelation zwischen CO2 und HadCRUT5 zu beurteilen, müssen wir nach Autokorrelationseffekten suchen. Das am häufigsten verwendete Werkzeug ist die Durbin-Watson-Statistik.

Mathematische Details am Website.

Diskussion

Das R2, das sich aus einer LS-Anpassung der CO2-Konzentration und der globalen Durchschnittstemperaturen ergibt, wird künstlich aufgebläht, da sowohl CO2 als auch Temperatur autokorrelierte Zeitreihen sind, die mit der Zeit zunehmen. Daher ist R2 in diesem Fall eine ungeeignete Statistik. R2 geht davon aus, dass jede Beobachtung unabhängig ist, und wir stellen fest, dass 76 % der durchschnittlichen globalen Temperatur jedes Jahres von der Temperatur des Vorjahres bestimmt werden, sodass nur wenig von CO2 beeinflusst wird. Darüber hinaus werden 90 % der jährlichen CO2-Messung durch den Vorjahreswert bestimmt.

Ich kam zu dem Schluss, dass die beste Funktion zum Entfernen der Autokorrelation ein Polynom zweiter Ordnung war, aber selbst wenn dieser Trend entfernt wird, sind die Residuen immer noch autokorreliert und die Nullhypothese, dass dies nicht der Fall war, musste zurückgewiesen werden. Es ist enttäuschend, dass Robert Rohde, ein PhD, ein Diagramm einer Korrelation von CO2 und globaler Durchschnittstemperatur verschickt hat, was impliziert, dass die Korrelation zwischen ihnen ohne weitere Erklärung sinnvoll war (wie wir in Abbildung 1 des vorherigen Beitrags gezeigt haben), aber er hat es getan .

Jamal Munshi hat 2018 in einem Artikel eine ähnliche Analyse wie wir durchgeführt (Munshi, 2018). Er stellt fest, dass die Konsensvorstellung, dass zunehmende CO2-Emissionen eine Erwärmung verursachen und dass die Erwärmung linear mit der Verdopplung von CO2 (Logbasis 2) ist, eine überprüfbare Hypothese ist. Diese Hypothese hat sich nicht gut bewährt, weil die Unsicherheit bei der Schätzung der Erwärmung durch CO2 (Klimasensitivität) seit über vierzig Jahren hartnäckig groß geblieben ist, im Grunde ± 50 %. Dies hat dazu geführt, dass der Konsens versucht hat, sich von der Klimasensitivität zu Vergleichen der Erwärmung mit den aggregierten Kohlendioxidemissionen zu bewegen, in der Annahme, dass sie eine engere und gültigere Korrelation mit der Erwärmung erhalten können. Munshi fährt fort:

„Dieser Stand der Dinge in der Klimasensitivitätsforschung ist wahrscheinlich das Ergebnis unzureichender statistischer Strenge in den angewandten Forschungsmethoden. Diese Arbeit zeigt falsche Proportionalitäten in Zeitreihendaten, die Klimasensitivitäten ergeben können, die keine Interpretation haben. � [Munshis] Ergebnisse implizieren, dass die Eine große Anzahl von Klimasensitivitäten, über die in der Literatur berichtet wird, sind wahrscheinlich größtenteils falsch. Eine ausreichende statistische Disziplin wird wahrscheinlich das Problem der Klimasensitivität auf die eine oder andere Weise lösen, entweder um ihren bisher schwer fassbaren Wert zu bestimmen oder um zu zeigen, dass die angenommenen Beziehungen dies tun in den Daten nicht vorhanden.“ (Munshi, 2018)


Während wir in diesem Beitrag die CO2-Konzentration verwendet haben, verwenden viele im „Konsens“ jetzt die gesamten Emissionen fossiler Brennstoffe in ihrer Arbeit, weil sie denken, dass es eine statistisch validere Größe ist, um sie mit der Temperatur zu vergleichen. Ist es nicht, die Probleme bleiben bestehen und sind in gewisser Weise schlimmer, wie Munshi in einem separaten Artikel erklärt (Munshi, 2018b). Ich stimme Munshi zu, dass es der Klima-Community an statistischer Strenge mangelt. Die Community verwendet allzu oft Statistiken, um ihren Mangel an Daten und ihre statistische Bedeutung zu verschleiern, anstatt zu informieren.

Schreibe einen Kommentar