Obwohl dies ein alter Thread ist, hoffe ich, dass meine Antwort jedem hilft, der nach einer Antwort auf dieselbe Frage sucht.
Wenn wir über Zeitreihenanalyse sprechen, meinen wir meistens die Untersuchung von ARIMA-Modellen (und ihren Varianten). Daher werde ich in meiner Antwort zunächst dasselbe annehmen.
Zunächst einmal gibt es, wie der frühere Kommentator R. Astur erklärt, keinen guten RMSE, da er skalierungsabhängig ist, d. h. von Ihrer abhängigen Variablen abhängt. Daher kann man eine universelle Zahl nicht als guten RMSE beanspruchen.
Selbst wenn Sie sich für skalierungsfreie Anpassungsmaße wie MAPE oder MASE entscheiden, können Sie dennoch keine Schwelle für eine gute Leistung beanspruchen. Dies ist nur ein falscher Ansatz. Sie können nicht sagen "Meine MAPE ist so und so, daher ist meine Passform / Prognose gut". Ich glaube, Sie sollten sich Ihrem Problem wie folgt nähern. Finden Sie zuerst ein paar "bestmögliche" Modelle, indem Sie eine Logik wie das Durchlaufen der arima () - Funktionsausgänge in R verwenden, und wählen Sie die besten n geschätzten Modelle basierend auf dem niedrigsten RMSE oder MAPE oder MASE aus. Da es sich um eine bestimmte Serie handelt und nicht versucht wird, einen universellen Anspruch geltend zu machen, können Sie eine dieser Maßnahmen auswählen. Natürlich müssen Sie die Restdiagnose durchführen und sicherstellen, dass Ihre besten Modelle White Noise-Residuen mit gut verhaltenen ACF-Plots erzeugen. Nachdem Sie einige gute Kandidaten gefunden haben, testen Sie die MAPE außerhalb der Stichprobe jedes Modells und wählen Sie die mit der besten MAPE außerhalb der Stichprobe aus.
Das resultierende Modell ist das beste Modell in dem Sinne, dass es:
- Bietet Ihnen eine gute In-Sample-Anpassung, verbunden mit geringen Fehlermaßen und WN-Residuen.
- Und vermeidet Überanpassung, indem Sie die beste Prognosegenauigkeit außerhalb der Stichprobe erzielen.
ol>
Ein entscheidender Punkt ist nun, dass es möglich ist, eine Zeitreihe mit einem ARIMA (oder seinen Varianten) zu schätzen, indem genügend Verzögerungen der abhängigen Variablen oder des Restterms berücksichtigt werden. Dieses angepasste "beste" Modell kann jedoch nur zu stark passen und Ihnen eine dramatisch niedrige Genauigkeit außerhalb der Stichprobe bieten, d. H. Meinen Aufzählungspunkt 1 erfüllen, aber nicht 2.
In diesem Fall müssen Sie Folgendes tun:
- Fügen Sie eine exogene erklärende Variable hinzu und wählen Sie ARIMAX,
- Fügen Sie eine endogene erklärende Variable hinzu und wählen Sie VAR / VECM,
- Oder ändern Sie Ihren Ansatz vollständig in nichtlineare Modelle für maschinelles Lernen und passen Sie sie mithilfe eines Cross-Validation-Ansatzes an Ihre Zeitreihen an. Passen Sie beispielsweise ein neuronales Netzwerk oder eine zufällige Gesamtstruktur an Ihre Zeitreihe an. Wiederholen Sie den Leistungsvergleich innerhalb und außerhalb der Stichprobe. Dies ist ein Trendansatz für Zeitreihen, und die Artikel, die ich gesehen habe, begrüßen die Modelle des maschinellen Lernens für ihre überlegene Prognoseleistung (außerhalb der Stichprobe).
ol>
Hoffe das hilft.