Frage:
Kann jemand die Bedeutung der mittleren Stationarität in Zeitreihen erklären?
confused
2020-06-01 10:18:54 UTC
view on stackexchange narkive permalink

Bei regelmäßiger Regression wird der erwartete Wert von Y |X darf sich ändern.Tatsächlich verwenden wir im Allgemeinen die Regression, wenn wir diese Änderung des bedingten Mittelwerts modellieren möchten.

Ich verstehe nicht, warum wir in Zeitreihen wollen, dass unsere Reihen gemein stationär sind.Ich erhalte die Annahme einer stationären Varianz, da diese der identisch verteilten Annahme in der regulären Regression ähnlich ist.Aber warum ist mittlere Stationarität so wichtig?

Zuvor habe ich eine sehr einfache Antwort veröffentlicht, die nur auf dem Titel basiert und die Details in Ihrem Beitrag über die mittlere Stationarität nicht berücksichtigt hat.Nachdem ich Ihren Beitrag erneut gelesen habe, habe ich ihn mit Details aktualisiert, die spezifischer für Ihre Frage sind und die meiner Meinung nach jetzt vollständig beantwortet werden.
Nehmen wir zum Beispiel das Preisniveau und das reale BIP im Zeitverlauf.Beide nehmen tendenziell zu, sind also nicht stationär und es besteht eine positive Korrelation zwischen ihnen, manchmal eine sehr hohe Korrelation [wie in Großbritannien von 1993 bis 2007] (https://economics.stackexchange.com/questions/14259/can-cpi-und-real-gdp-haben-hohe-Korrelation / 14261).Es wäre jedoch falsch zu glauben, dass dies irgendeine Beziehung zwischen Inflation und realem BIP-Wachstum impliziert - die Beziehung zwischen den Zeitreihen für die Niveaus wird weitgehend von den Zeitreihen bestimmt, in denen beide Änderungsmaßnahmen positive Mittel haben
Fünf antworten:
#1
+18
Skander H.
2020-06-01 11:46:04 UTC
view on stackexchange narkive permalink

Bei der Vorhersage von Zeitreihen müssen Sie zunächst verstehen, dass Stationarität vor allem im Zusammenhang mit ARMA und verwandten Modellen wichtig ist (AR: Auto-Regressive, MA: Moving Average). Es gibt andere Arten von Zeitreihen-Prognosemodellen, bei denen Stationarität nicht erforderlich ist, z. B. Holt-Winters oder Facebook Prophet.

Hier sind zwei intuitive, wenn auch nicht ganz mathematisch strenge Erklärungen, warum mittlere AR-Stationarität im ARMA-Fall wichtig ist:

  • Die AR-Komponente von ARMA-Modellen behandelt die Zeitreihenmodellierung als überwachtes Lernproblem. $ Y_t = a_1Y_ {t-1} + ... a_nY_ {tn} + c + \ sigma (t) $ span>. Eine gängige Faustregel beim überwachten Lernen lautet, dass die Verteilung der Trainingsdaten und die Verteilung der Testdaten gleich sein sollten, da Ihr Modell sonst bei Tests außerhalb der Stichprobe und bei Produktionsdaten schlecht abschneidet. Da für Zeitreihendaten Ihr Zugsatz die Vergangenheit und Ihr Testsatz die Zukunft ist, stellt die Stationaritätsanforderung lediglich sicher, dass die Verteilung über die Zeit gleich bleibt. Auf diese Weise vermeiden Sie die Probleme, die beim Training Ihres Modells mit Daten auftreten, die eine andere Verteilung als die Test- / Produktionsverteilung haben. Insbesondere die mittlere Stationarität besagt lediglich, dass der Mittelwert des Zugsatzes und der Mittelwert des Tests gleich bleiben sollten.

  • Eine noch einfachere Überlegung: Nehmen Sie das grundlegendste ARMA-Modell, ein $ AR (1) $ span> -Modell: $$ Y_t = aY_ {t-1} + c + \ sigma $$ span> Die rekursive Beziehung für die Schätzung eines Schritts basierend auf dem vorherigen lautet also: $$ \ hat {Y} _t = a \ hat {Y} _ {t-1} + c $$ span>, $$ \ hat {Y} _t - c = a \ hat {Y} _ {t-1} $$ span> den erwarteten Wert angenommen: $$ E (\ hat {Y} _t) - c = aE (\ hat { Y} _ {t-1}) $$ span> bedeutet: $$ a = \ frac {E (\ hat {Y} _t) - c} {E ( \ hat {Y} _ {t-1})} $$ span> Wenn also $ a $ span> über die Zeit konstant bleiben soll, ist dies der Anfang Annahme eines $ AR (1) $ span> -Modells, da es einer linearen Regression ähneln soll, dann $ E ( \ hat {Y} _t) $ span> muss für alle $ t $ span> gleich bleiben, dh Ihre Serie hat gemein stationär sein.

Die obigen Überlegungen gelten auch für den allgemeinen ARMA-Fall mit $ AR (p) $ span> und $ MA (q) $ span> -Begriffe, obwohl die Mathematik etwas komplizierter ist als das, was ich beschreibe, aber intuitiv ist die Idee immer noch dieselbe. Das 'I' in ARIMA steht für "Integriert" und bezieht sich auf den Differenzierungsprozess, der es ermöglicht, eine allgemeinere Zeitreihe in eine stationäre Zeitreihe umzuwandeln, die mithilfe von ARMA-Prozessen modelliert werden kann.

Ich bin mit der @ Alexis-Charakterisierung nicht einverstanden, dass " dass Zeitreihen stationär sind, mehr oder weniger die Weltanschauung verkörpert, dass die Vergangenheit keine Rolle spielt " - wenn überhaupt, ist es umgekehrt: Eine Zeit transformierenBei einer in eine stationäre Reihe zu Modellierungszwecken geht es genau darum zu sehen, ob es in der Zeitreihe kausale / deterministische Strukturen gibt, die über Trend und Saisonalität hinausgehen.Das heißt,Beeinflusst die Vergangenheit die Gegenwart oder die Zukunft auf subtilere Weise als nur die großen Variationen?(Aber ich könnte einfach falsch interpretieren, was sie zu sagen versucht).

Sie, nicht er.Ich frage mich, ob wir aneinander vorbei reden.Ich stimme "jenseits von Trends und jenseits der Saisonalität" zu.Mein Punkt ist, dass Sie, wenn Sie beispielsweise ein Modell wie $ y_ {ti} = \ beta_0 + BX_ {ti} + f (t, T) + \ text {error} $ (dh "Längsmodelle") erstellenignorieren die dynamische / nichtlineare Natur der Vergangenheit von $ y $ und beeinflussen sie zum Zeitpunkt $ t $.
@Alexis meine absolut tiefste Entschuldigung.(Skander bedeutet auf Arabisch "Alexander", daher neige ich dazu, mich auf jemanden mit einem ähnlichen Namensmuster zu projizieren.) Und ja, wir scheinen uns über die Fakten einig zu sein. Eine Sache möchte ich jedoch darauf hinweisen, dass in meinemErfahrung, selbst ein einfacher Prozess, der "wirklich" AR und auch stationär ist, ist äußerst selten. Es gibt alle möglichen instationären Beispiele (z. B. Populationsdynamik), aber es besteht die Möglichkeit, dass ein Prozess sowohl stationär ist als auch einen DGP aufweistsieht aus wie $ Y_t = a_1Y_ {t-1} + a_2Y_ {t-2} $? ARIMA ist also eine ziemlich starke Annahme.
Keine Sorgen!Nun, ich habe zwei Beispiele angeführt (Konsum von Suchtmitteln und Prävalenz von Infektionskrankheiten), bei denen die Kausalmodelle die Vergangenheit * beeinflussen * müssen, die die Gegenwart beeinflusst.:) :)
"Die kausalen Modelle müssen dazu führen, dass die Vergangenheit die Gegenwart beeinflusst", aber das ist der Punkt: Sie sind absolut sinnvoll, aber aus dem gleichen Grund, aus dem sie sinnvoll sind, können sie auch unmöglich stationär sein (z. B. zeigt das von Ihnen angegebene Beispiel für Infektionskrankheiten exponentiellWachstum, nicht einmal linear oder polynomisch, was ARIMA am meisten mit Differenzierung bewältigen kann).
Nun ... Sie würden simultane Gleichungen benötigen, keine einzige Gleichung, um beispielsweise ein Kompartimentmodell zu erstellen (und das die von Ihnen erwähnten Wachstumsarten modellieren kann) ... (Außerdem: Ich argumentiere * nicht *, dass ARIMAund sich um Stationarität / Nichtstationarität zu kümmern, ist das A und O).Modellierung (stationär) * Veränderung * ist wichtiger als Modellierungsebene (nicht stationär), um kausale Schlussfolgerungen zu ziehen.Stil: Ich mag deinen Standpunkt ... er ist zäh und wird das sein, woran ich denke, also danke!
Warum gibt es in Ihrer Definition des AR (1) -Modells ein $ \ sigma $ anstelle von $ \ varepsilon_t $?Und wie erhält man aus Ihrer Definition $ \ hat Y_t = a \ hat Y_ {t - 1} + c $?
@RichardHardy $ \ sigma $, $ \ sigma (t) $, $ \ sigma_t $, $ \ epsilon_t $, verschiedene Arten, dasselbe zu sagen.
Hier ist eine Referenz (unter vielen) für die Prognosegleichung: https://people.duke.edu/~rnau/411arim.htm#arima100
Vielen Dank.$ \ sigma $ und $ \ sigma_t $ können nicht dasselbe sein, da ersteres über die Zeit konstant ist, während letzteres mit der Zeit variiert.Darüber hinaus ist $ \ sigma $ die Standardnotation für Standardabweichung.In einer Zeitreiheneinstellung kann sie konstant sein oder sich zeitlich ändern, was allgemein mit $ \ sigma $ bzw. $ \ sigma_t $ bezeichnet wird.Um Verwirrung zu vermeiden, würde ich $ \ varepsilon_t $ (oder das weniger beliebte, aber immer noch weit verbreitete $ u_t $ oder $ v_t $ oder sogar das ungewöhnliche $ a_t $ wie in den Lehrbüchern von Ruey S. Tsay) verwenden, um den Fehlerbegriff des AR zu bezeichnen, MA und ARMA Modelle.
Wo finden Sie in dem zitierten Dokument $ Y $ mit Hüten auf * beiden Seiten * einer Gleichung?
@RichardHardy Wenn Sie mehr als einen Schritt gleichzeitig prognostizieren, ist das Y auf beiden Seiten der Gleichung $ \ hat {Y} $ Schätzungen. Siehe das Konzept der iterativen oder rekursiven Prognose.
#2
+10
Thomas Lumley
2020-06-01 11:26:27 UTC
view on stackexchange narkive permalink

Stationarität ist wichtig, da es sich um eine mathematisch starke Annahme handelt, die immer noch viel schwächer ist als Unabhängigkeit oder Abhängigkeit von endlichen Bereichen.

In einigen Einstellungen ist dies vor allem für die mathematische Nachvollziehbarkeit wichtig: Es ist einfacher, zuerst herauszufinden, was für stationäre Zeitreihen gilt, und dann daran zu arbeiten, wie die Annahmen gelockert werden können. Vielleicht brauchen Sie nur eine Stationarität mit schwachem Sinn oder eine mittlere Stationarität plus eine gewisse Schwanzbedingung oder was auch immer. Oder vielleicht brauchen Sie Stationarität, damit ein Ergebnis genau stimmt, aber es gilt ungefähr unter schwächeren Annahmen.

In anderen Einstellungen ist Stationarität wichtig, da es so viele Möglichkeiten gibt, nicht stationär zu sein, dass es schwierig wäre, mit jeder einzelnen davon umzugehen. Wenn ein Problem durch eine stationäre Serie angenähert werden kann, ist dies ein großer praktischer Vorteil. Hierbei ist zu beachten, dass die stationäre Reihe $ X (t) $ span>, die in der Mathematik angezeigt wird, möglicherweise nicht Ihre Rohdaten sind. Beispielsweise sind herkömmliche ARMA-Modelle stationär, aber Sie möchten normalerweise Saison- und Trendbeziehungen entfernen, bevor Sie eines anpassen. Möglicherweise möchten Sie eine Reihe mit zunehmendem Mittelwert und zunehmender Varianz logarithmisch transformieren. Und so weiter.

#3
+4
Alexis
2020-06-01 10:36:56 UTC
view on stackexchange narkive permalink

Erstens sind Ihre mittleren Schätzungen und Ihre Standardfehler stark verzerrt, wenn Sie eines der Inferenzwerkzeuge verwenden, die i.i.d annehmen, was bedeutet, dass Ihre Ergebnisse möglicherweise falsch sind.Dies kann sogar der Fall sein, wenn Ihre Daten schwach stationär sind, Ihre Studienzeit jedoch kürzer ist als die Zeit, die Ihre Serie benötigt, um nach einer Störung das Gleichgewicht zu erreichen.

Zweitens verkörpert die Annahme, dass Zeitreihen stationär sind, mehr oder weniger die Weltanschauung, dass die Vergangenheit keine Rolle spielt (z. B. ist die heutige Prävalenz von COVID-19 völlig unabhängig von der gestrigen Prävalenz von COVID-19; Die Pro-Kopf-Ausgaben für Suchtmittel wie Zigaretten in diesem Jahr sind völlig unabhängig von den Pro-Kopf-Ausgaben, die letztes Jahr für sie ausgegeben wurden.)… irgendwie unrealistisch.

Ich bin mit Ihrer zweiten Aussage respektvoll nicht einverstanden.Siehe meine Antwort.
Wenn die Vergangenheit keine Rolle spielen würde, wäre es sinnvoll, frühere Daten zu sammeln, um Rückschlüsse auf die aktuellen Eigenschaften des interessierenden Prozesses zu ziehen oder die zukünftige Realisierung des Prozesses vorherzusagen?
@SkanderH.Ich glaube nicht, dass Sie meine zweite Aussage verstehen.
@RichardHardy Es wäre nur in dem Sinne von Bedeutung, dass Ihre Stichprobengröße bei Ihrem Versuch, eine Eigenschaft eines i.i.d.Variable.Mein Kommentar basiert auf den Ausbildungsprogrammen von * vielen * promovierten Bevölkerungswissenschaften, die mehr oder weniger blind für Fragen der Stationarität und der Modellierung von Zeitreihen sind und es vorziehen, Forschern beizubringen, einfach eine Funktion der Zeit in das Modell zu werfen und es als a zu bezeichnenTag.
@RichardHardy, "wenn die Vergangenheit keine Rolle spielte" bedeutet hier, dass eine Lösung des dynamischen Systems nicht pfadabhängig ist (außer vielleicht auf triviale Weise) und dass feste Parameter (unabhängig vom Pfad) durch eine geeignete Technik geschätzt werden müssen.
@PatrickT, danke, das ist hilfreich.
@PatrickT Vielen Dank, dass Sie präziser sind.:) :)
#4
+1
Noah Tsaying
2020-06-02 08:35:41 UTC
view on stackexchange narkive permalink

Stationär bedeutet, dass die Statistiken, die den Zufallsprozess beschreiben, konstant sind. "Ein memoryloser Markov-Prozess" ist eine andere Möglichkeit, stationär zu sagen, da die Wahrscheinlichkeitsgenerierungsfunktion keine "Feedback" -Begriffe enthält. Wenn Sie diese Wörter jedoch erkannt haben, stellen Sie diese Frage möglicherweise nicht. FWIW „schwach stationär“ ist nicht ganz dasselbe, eine konstante oder erkennbare Änderungsrate der Statistiken wäre schwach stationär, ebenso wie etwas, das sich im Durchschnitt ergibt, aber es ist etwas komplizierter. Betrachten Sie diese faire Warnung, dass es mehr zu wissen gibt Falls dies Teil des Puzzles ist, aber alles, was nicht stationär ist, im Detail zu beschreiben, würde eine einfache Antwort zu einer komplexen Antwort machen.

Warum ist stationär wichtig? Die üblicherweise verwendeten statistischen Formeln werden erstellt, um mithilfe eines Datensatzes eine ungenaue Beschreibung mit einer schätzbaren Genauigkeit eines ansonsten unbekannten Zufallsprozesses zu extrahieren. Die Formeln gehen davon aus, dass das Hinzufügen weiterer Stichproben die Genauigkeit der Beschreibung erhöht, indem die Unsicherheit verringert wird. Dafür muss die mittlere zentrale Tendenz, d. H. Ergodisch im Mittelwert, wahr sein. Wenn sich der Zufallsprozess selbst ändert, z. Wenn sich der Durchschnittswert oder die Varianz ändert, ist eine wesentliche zugrunde liegende Annahme ungültig. Sie können keine bessere Schätzung vornehmen.

Als allgemeines „Was passiert“, wenn sich der Mittelwert als lineare Funktion der Zeit bewegt, repräsentiert der berechnete Mittelwert den Mittelwert zu einer gewichteten mittleren Zeit und die berechnete Varianz wird aufgeblasen. Es ist möglich, eine "optimale a posteriori" (nachträgliche) Schätzung eines nicht stationären Prozesses zu berechnen und diese dann zu verwenden, um aussagekräftige Statistiken zu extrahieren, da die beste Schätzung der Zeitfunktion die Varianz minimiert. Es ist auch einfach, eine Zeitfunktion hoher Ordnung zu hypothetisieren und ein komplexes Modell zu erstellen, das gültig und vorhersagbar erscheint und tatsächlich keine Vorhersagekraft besitzt, da es eine Momentaufnahme der Zufälligkeit und keinen zugrunde liegenden Zeittrend modelliert.

#5
  0
Ryan
2020-06-02 20:44:32 UTC
view on stackexchange narkive permalink

Kurz und bündig:

Die Parameter müssen konstant sein. Wenn die Reihe nicht stationär ist, sind die von Ihnen geschätzten Parameter selbst Funktionen der Zeit. Das Modell geht jedoch davon aus, dass es sich um Konstanten handelt. Daher schätzen Sie den durchschnittlichen Parameterwert über den Zeitraum. Siehe Skanders Antwort, warum, ich werde nicht in die Mathematik eintauchen, da er es bereits getan hat.

Dies führt zu mindestens zwei Problemen:

  1. Ihre Schätzungen für den wahren Parameterwert sind wahrscheinlich falsch, da der Parameterwert zu jedem Zeitpunkt wahrscheinlich von seinem Durchschnittswert abweicht. Daher ist jede Schlussfolgerung, die Sie aus den Daten ziehen, wahrscheinlich falsch. Dies führt zu falschen Regressionen / Korrelationen.
  2. Sie können das Modell nicht verwenden, um die Zukunft vorherzusagen. Da Ihr Parameter jetzt eine Funktion der Zeit ist und Sie nicht wissen, wie er sich im Laufe der Zeit entwickelt, ist jede Prognose, die Sie machen, vollständig (entschuldigen Sie mein französisches) Horseshit.
  3. ol>

    Die Stationarität zu erreichen ist eigentlich ziemlich einfach. Wir müssen nur unterscheiden, bis wir eine stationäre Serie haben. Also mach das einfach.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 4.0-Lizenz, unter der er vertrieben wird.
Loading...