Autoregressiven Moving Average Time Serie Modell
Einführung in ARIMA Nichtseasonale Modelle. ARIMA p, d, q Vorhersage Gleichung ARIMA Modelle sind in der Theorie die allgemeinste Klasse von Modellen für die Vorhersage einer Zeitreihe, die gemacht werden kann, um stationär zu sein, indem sie gegebenenfalls, wenn auch in Verbindung mit nichtlinearen Transformationen, differenziert werden Wie z. B. Protokollierung oder Abblendung, wenn nötig Eine zufällige Variable, die eine Zeitreihe ist, ist stationär, wenn ihre statistischen Eigenschaften alle über die Zeit konstant sind. Eine stationäre Serie hat keinen Trend, ihre Variationen um ihren Mittelwert haben eine konstante Amplitude, und sie wackelt in einer konsistenten Weise Dh ihre kurzfristigen zufälligen Zeitmuster sehen immer in einem statistischen Sinn gleich aus. Die letztere Bedingung bedeutet, dass ihre Autokorrelationskorrelationen mit ihren eigenen vorherigen Abweichungen vom Mittel konstant über die Zeit bleiben oder äquivalent, dass sein Leistungsspektrum über die Zeit konstant bleibt Variable dieses Formulars kann wie gewöhnlich als eine Kombination von Signal und Rauschen betrachtet werden, und das Signal, wenn man offensichtlich ist, könnte ein Muster der schnellen oder langsamen mittleren Reversion oder sinusförmigen Oszillation oder eines schnellen Wechseles im Zeichen sein, und es könnte auch haben Eine saisonale Komponente Ein ARIMA-Modell kann als ein Filter betrachtet werden, der versucht, das Signal vom Rauschen zu trennen, und das Signal wird dann in die Zukunft extrapoliert, um Prognosen zu erhalten. Die ARIMA-Prognosegleichung für eine stationäre Zeitreihe ist eine lineare, dh regression - Typ-Gleichung, in der die Prädiktoren aus Verzögerungen der abhängigen Variablen und / oder Verzögerungen der Prognosefehler bestehen. Das ist. Gezahlter Wert von Y eine Konstante und / oder eine gewichtete Summe aus einem oder mehreren neueren Werten von Y und einer gewichteten Summe von eins oder Neuere Werte der Fehler. Wenn die Prädiktoren nur aus verzögerten Werten von Y bestehen, ist es ein reines autoregressives, selbstregressives Modell, das nur ein Spezialfall eines Regressionsmodells ist und mit Standardregressionssoftware ausgestattet werden könnte Erstklassiges autoregressives AR 1 - Modell für Y ist ein einfaches Regressionsmodell, bei dem die unabhängige Variable nur Y um eine Periode LAG Y, 1 in Statgraphics oder YLAG1 in RegressIt liegt. Wenn einige der Prädiktoren Fehler der Fehler sind, ein ARIMA-Modell Es handelt sich dabei nicht um ein lineares Regressionsmodell, denn es gibt keine Möglichkeit, den letzten Periodenfehler als eigenständige Variable anzugeben, die Fehler müssen auf einer Periodendauer berechnet werden, wenn das Modell an die Daten angepasst ist. Aus technischer Sicht ist die Problem bei der Verwendung von verzögerten Fehlern als Prädiktoren ist, dass die Vorhersagen des Modells keine linearen Funktionen der Koeffizienten sind, obwohl sie lineare Funktionen der vergangenen Daten sind. Daher müssen Koeffizienten in ARIMA-Modellen, die verzögerte Fehler enthalten, durch nichtlineare Optimierungsmethoden hill-climbing geschätzt werden Anstatt nur ein System von Gleichungen zu lösen. Das Akronym ARIMA steht für Auto-Regressive Integrated Moving Average Lags der stationären Serie in der Prognose Gleichung heißen autoregressive Begriffe, Verzögerungen der Prognosefehler werden als gleitende durchschnittliche Ausdrücke und eine Zeitreihe bezeichnet Die gestört werden muss, um stationär zu sein, soll eine integrierte Version einer stationären Serie sein. Random-Walk - und Random-Trend-Modelle, autoregressive Modelle und exponentielle Glättungsmodelle sind alle Sonderfälle von ARIMA-Modellen. Ein nicht seasonales ARIMA-Modell wird klassifiziert Als ARIMA p, d, q Modell, wobei p die Anzahl der autoregressiven Terme ist. d ist die Anzahl der für die Stationarität benötigten Nichtseasonalunterschiede und ist die Anzahl der verzögerten Prognosefehler in der Vorhersagegleichung. Die Prognosegleichung ist Konstruiert wie folgt Zuerst bezeichne y die d-te Differenz von Y, die bedeutet. Hinweis, dass die zweite Differenz von Y der d 2 Fall ist nicht der Unterschied von 2 Perioden vor Vielmehr ist es die erste Differenz-of-the-first Unterschied, das ist das diskrete Analog einer zweiten Ableitung, dh die lokale Beschleunigung der Serie und nicht die lokale Tendenz. In Bezug auf y die allgemeine Prognose Gleichung ist. Hier sind die gleitenden durchschnittlichen Parameter s definiert, so dass ihre Zeichen sind negativ in der Gleichung, nach der Konvention von Box und Jenkins eingeführt Einige Autoren und Software einschließlich der R-Programmiersprache definieren sie so, dass sie Pluszeichen statt haben Wenn die tatsächlichen Zahlen in die Gleichung gesteckt sind, gibt es keine Mehrdeutigkeit, aber es ist wichtig zu wissen, welche Konvention Ihre Software verwendet, wenn Sie die Ausgabe lesen Oft werden die Parameter dort mit AR 1, AR 2, und MA 1, MA 2, etc. identifiziert. Um das passende ARIMA-Modell für Y zu identifizieren, beginnen Sie mit der Bestimmung der Reihenfolge der differenzierenden d Notwendigkeit Um die Serie zu stationieren und die Brutto-Features der Saisonalität zu entfernen, vielleicht in Verbindung mit einer Varianz-stabilisierenden Transformation wie Logging oder Deflating Wenn Sie an dieser Stelle stoppen und voraussagen, dass die differenzierte Serie konstant ist, haben Sie nur einen zufälligen Spaziergang oder zufällig platziert Trendmodell Allerdings können die stationärisierten Serien noch autokorrelierte Fehler aufweisen, was darauf hindeutet, dass in der Prognosegleichung auch eine Anzahl von AR-Terme p1 und / oder einige Anzahl MA-Terme q1 erforderlich sind. Verfahren zur Bestimmung der Werte von p, d und Q, die am besten für eine gegebene Zeitreihe sind, werden in späteren Abschnitten der Notizen besprochen, deren Links oben auf dieser Seite stehen, aber eine Vorschau auf einige der Arten von nicht-seasonalen ARIMA-Modellen, die häufig angetroffen werden, ist unten angegeben. ARIMA 1 , 0,0 erstklassiges autoregressives Modell, wenn die Serie stationär und autokorreliert ist, vielleicht kann es als ein Vielfaches ihres eigenen vorherigen Wertes prognostiziert werden, plus eine Konstante Die Prognosegleichung in diesem Fall ist. das ist Y, das auf sich selbst zurückgeblieben ist Eine Periode Dies ist ein ARIMA 1,0,0 Konstante Modell Wenn der Mittelwert von Y Null ist, dann wäre der konstante Term nicht enthalten. Wenn der Steigungskoeffizient 1 positiv und kleiner als 1 in der Größenordnung ist, muss er kleiner als 1 in sein Größe, wenn Y stationär ist, beschreibt das Modell das Mittel-Rückkehr-Verhalten, bei dem der nächste Perioden-s-Wert 1 mal so weit weg von dem Mittelwert liegen sollte, wie dieser Periodenwert Wenn 1 negativ ist, prognostiziert er das Mittel-Rückkehr-Verhalten mit Wechsel Von Zeichen, dh es sagt auch voraus, dass Y unterhalb der mittleren nächsten Periode sein wird, wenn es über dem Mittelwert dieser Periode liegt. In einem autoregressiven Modell der zweiten Ordnung ARIMA 2,0,0 würde es einen Y-t-2-Term geben Genau so gut und so weiter Abhängig von den Zeichen und Größenordnungen der Koeffizienten könnte ein ARIMA 2.0,0 Modell ein System beschreiben, dessen mittlere Reversion in einer sinusförmig oszillierenden Weise stattfindet, wie die Bewegung einer Masse auf einer Feder, die Wird zufälligen Schocks ausgesetzt. ARIMA 0,1,0 zufälliger Spaziergang Wenn die Serie Y nicht stationär ist, ist das einfachste Modell für sie ein zufälliges Spaziergangmodell, das als Begrenzungsfall eines AR 1 - Modells betrachtet werden kann Autoregressiver Koeffizient ist gleich 1, dh eine Reihe mit unendlich langsamer mittlerer Reversion Die Vorhersagegleichung für dieses Modell kann wie überall geschrieben werden, wo der konstante Term die durchschnittliche Periodenänderung ist, dh die Langzeitdrift in Y Dieses Modell könnte sein Als ein Nicht-Intercept-Regressionsmodell, bei dem die erste Differenz von Y die abhängige Variable ist, da sie nur eine nicht-seasonale Differenz und einen konstanten Term enthält, wird sie als ARIMA 0,1,0-Modell mit Konstante klassifiziert. Die zufällige Walk - Ohne - Drift-Modell wäre ein ARIMA-0,1,0-Modell ohne constant. ARIMA 1,1,0 differenzierte Autoregressive Modell erster Ordnung Wenn die Fehler eines zufälligen Walk-Modells autokorreliert sind, kann das Problem eventuell durch Hinzufügen einer Verzögerung behoben werden Der abhängigen Variablen zur Vorhersagegleichung - dh durch Rückkehr der ersten Differenz von Y auf sich selbst verzögert um eine Periode Dies würde die folgende Vorhersagegleichung ergeben, die umgeordnet werden kann. Dies ist ein autoregressives Modell erster Ordnung mit einer Ordnung von Nonseasonal differenzing und ein konstanter term - dh ein ARIMA 1,1,0 model. ARIMA 0,1,1 ohne konstante einfache exponentielle Glättung Eine weitere Strategie zur Korrektur autokorrelierter Fehler in einem zufälligen Walk-Modell wird durch das einfache exponentielle Glättungsmodell vorgeschlagen Für einige nichtstationäre Zeitreihen, z. B. solche, die geräuschvolle Schwankungen um ein langsam variierendes Mittel aufweisen, führt das zufällige Spaziergangmodell nicht so gut wie ein gleitender Durchschnitt der vergangenen Werte. Anders ausgedrückt, anstatt die jüngste Beobachtung als die Prognose der Nächste Beobachtung ist es besser, einen Durchschnitt der letzten Beobachtungen zu verwenden, um das Rauschen herauszufiltern und den lokalen Mittel genauer zu schätzen. Das einfache exponentielle Glättungsmodell verwendet einen exponentiell gewichteten gleitenden Durchschnitt der vergangenen Werte, um diesen Effekt zu erzielen. Die Vorhersagegleichung Denn das einfache exponentielle Glättungsmodell kann in einer Anzahl von mathematisch äquivalenten Formen geschrieben werden, von denen eine die sogenannte Fehlerkorrekturform ist, in der die vorherige Prognose in Richtung des von ihr vorgenommenen Fehlers eingestellt wird. Weil e t-1 Y T-1 - t-1 per definitionem kann dies umgeschrieben werden, da ist eine ARIMA 0,1,1 - without-konstante Prognosegleichung mit 1 1 - das bedeutet, dass man eine einfache exponentielle Glättung platzieren kann, indem man sie als ARIMA 0,1,1 Modell ohne Konstante, und der geschätzte MA 1 - Koeffizient entspricht 1-minus-alpha in der SES-Formel Erinnern Sie sich, dass im SES-Modell das Durchschnittsalter der Daten in den Prognosen von 1 Periode 1 beträgt Was bedeutet, dass sie tendenziell hinter Trends oder Wendepunkten um etwa 1 Perioden zurückbleiben. Daraus folgt, dass das Durchschnittsalter der Daten in den 1-Periodenprognosen eines ARIMA 0,1,1 - without-constant-Modells 1 1 - 1 Wenn also 1 0 8 das Durchschnittsalter 5 ist, so nähert sich das ARIMA 0,1,1 - without-konstantes Modell zu einem sehr langfristigen gleitenden Durchschnitt, und wenn 1 sich nähert, wird es Ein zufälliges Spaziergang ohne Drift-Modell. Was ist der beste Weg, um die Autokorrelation zu korrigieren, indem man AR-Terme hinzufügt oder MA-Terme hinzufügt. In den vorangegangenen zwei Modellen, die oben diskutiert wurden, wurde das Problem der autokorrelierten Fehler in einem zufälligen Walk-Modell auf zwei verschiedene Arten festgelegt Durch Hinzufügen eines verzögerten Wertes der differenzierten Reihe zur Gleichung oder Hinzufügen eines verzögerten Wertes des Prognosefehlers, welcher Ansatz am besten ist. Ein Schlüsselbund für diese Situation, der später ausführlicher erörtert wird, ist die positive Autokorrelation In der Regel am besten behandelt durch Hinzufügen eines AR-Begriffs zum Modell und negative Autokorrelation ist in der Regel am besten durch Hinzufügen eines MA-Begriffs In Business-und wirtschaftlichen Zeitreihen, negative Autokorrelation oft entsteht als Artefakt der Differenzierung Im Allgemeinen, differenziert reduziert positive Autokorrelation und kann sogar verursachen Ein Wechsel von positiver zu negativer Autokorrelation So wird das ARIMA-0,1,1-Modell, bei dem die Differenzierung von einem MA-Term begleitet wird, häufiger als ein ARIMA 1,1,0-Modell verwendet. ARIMA 0,1,1 mit konstantem Einfache exponentielle Glättung mit Wachstum Durch die Implementierung des SES-Modells als ARIMA-Modell erhalten Sie tatsächlich eine gewisse Flexibilität Zunächst einmal darf der geschätzte MA 1 - Koeffizient negativ sein, dies entspricht einem Glättungsfaktor größer als 1 in einem SES-Modell In der Regel nicht erlaubt durch das SES-Modell-Anpassungsverfahren Zweitens haben Sie die Möglichkeit, einen konstanten Begriff in das ARIMA-Modell einzubeziehen, wenn Sie es wünschen, um einen durchschnittlichen Nicht-Null-Trend zu schätzen. Das ARIMA-0,1,1-Modell mit Konstante hat Die Vorhersagegleichung. Die Prognosen für ein Periodenabschätzung von diesem Modell sind qualitativ ähnlich denen des SES-Modells, mit der Ausnahme, dass die Trajektorie der Langzeitprognosen typischerweise eine abfallende Linie ist, deren Steigung gleich mu ist, anstatt einer horizontalen Linie. ARIMA 0,2,1 oder 0,2,2 ohne konstante lineare exponentielle Glättung Lineare exponentielle Glättungsmodelle sind ARIMA-Modelle, die zwei Nichtseason-Differenzen in Verbindung mit MA-Terme verwenden. Der zweite Unterschied einer Serie Y ist nicht einfach der Unterschied zwischen Y und Selbst ist von zwei Perioden verzögert, aber vielmehr ist es der erste Unterschied der ersten Differenz - der Wechsel-in-der-Änderung von Y in der Periode t. Somit ist die zweite Differenz von Y in der Periode t gleich Yt-Y T-1 - Y t-1 - Y t-2 Y t - 2Y t-1 Y t-2 Eine zweite Differenz einer diskreten Funktion ist analog zu einer zweiten Ableitung einer stetigen Funktion, die die Beschleunigung oder Krümmung in der Funktion misst Zu einem gegebenen Zeitpunkt. Das ARIMA-0,2,2-Modell ohne Konstante prognostiziert, dass die zweite Differenz der Serie gleich einer linearen Funktion der letzten beiden Prognosefehler ist, die umgestellt werden kann, wo 1 und 2 die MA 1 sind Und MA 2 Koeffizienten Dies ist ein allgemeines lineares exponentielles Glättungsmodell, das im Wesentlichen das gleiche wie das Holt-Modell ist, und das Brown-Modell ist ein Spezialfall Es verwendet exponentiell gewichtete Bewegungsdurchschnitte, um sowohl eine lokale Ebene als auch einen lokalen Trend in der Serie zu schätzen. Term-Prognosen aus diesem Modell konvergieren zu einer Geraden, deren Steigung von der durchschnittlichen Tendenz abhängt, die gegen Ende der Serie beobachtet wird. ARIMA 1,1,2 ohne konstante gedämpfte Trend lineare exponentielle Glättung. Dieses Modell ist in den begleitenden Folien auf ARIMA dargestellt Modelle Es extrapoliert den lokalen Trend am Ende der Serie, aber legt es bei längeren Prognosehorizonten ab, um eine Note des Konservatismus einzuführen, eine Praxis, die empirische Unterstützung hat. Sehen Sie den Artikel auf Warum der gedämpfte Trend von Gardner und McKenzie und der Goldenen Regel arbeitet Artikel von Armstrong et al für Details. Es ist in der Regel ratsam, an Modellen, in denen mindestens eines von p und q ist nicht größer als 1, dh nicht versuchen, ein Modell wie ARIMA 2,1,2, wie dies zu passen Dürfte zu Überfüllung und Gemeinsamen Faktoren führen, die in den Anmerkungen zur mathematischen Struktur von ARIMA-Modellen näher erörtert werden. Spreadsheet-Implementierung ARIMA-Modelle wie die oben beschriebenen sind einfach in einer Tabellenkalkulation implementierbar. Die Vorhersagegleichung ist einfach ein Lineare Gleichung, die sich auf vergangene Werte der ursprünglichen Zeitreihen und vergangene Werte der Fehler bezieht. So können Sie eine ARIMA-Prognosekalkulationstabelle einrichten, indem Sie die Daten in Spalte A, die Prognosemethode in Spalte B und die Fehlerdaten abzüglich Prognosen in Spalte speichern C Die Prognoseformel in einer typischen Zelle in Spalte B wäre einfach ein linearer Ausdruck, der sich auf Werte in vorhergehenden Zeilen der Spalten A und C bezieht, multipliziert mit den entsprechenden AR - oder MA-Koeffizienten, die in anderen Zellen auf der Kalkulationstabelle gespeichert sind. Es gibt eine Anzahl von Ansätze zur Modellierung von Zeitreihen Wir skizzieren einige der häufigsten Ansätze unten. Trend, saisonale, restliche Zerlegungen. Ein Ansatz ist, die Zeitreihe in einen Trend, saisonale und restliche Komponente zu zerlegen. Triple exponentielle Glättung ist ein Beispiel für diesen Ansatz Ein anderes Beispiel, genannt saisonale Löss, basiert auf lokal gewichteten kleinsten Quadraten und wird von Cleveland 1993 diskutiert Wir diskutieren nicht saisonalen Löss in diesem Handbuch. Frequenzbasierte Methoden. Ein weiterer Ansatz, der häufig in wissenschaftlichen und technischen Anwendungen verwendet wird, ist die Serie zu analysieren Im Frequenzbereich Ein Beispiel für diesen Ansatz bei der Modellierung eines sinusförmigen Typs Datensatz ist in der Strahlablenkung Fallstudie gezeigt Die Spektralplot ist das primäre Werkzeug für die Frequenzanalyse von Zeitreihen. Autoregressive AR-Modelle. Ein gemeinsamer Ansatz für die Modellierung univariate Zeit Serie ist das autoregressive AR Modell Xt Delta Phi1 X Phi2 X Cdots Phip X At, wobei Xt die Zeitreihe ist, At ist weißes Rauschen und Delta links 1 - Summe p phii rechts mu mit mu, die den Prozessmittel bedeuten. Ein autoregressives Modell ist Einfach eine lineare Regression des aktuellen Wertes der Serie gegen einen oder mehrere vorherige Werte der Serie Der Wert von p heißt die Reihenfolge der AR-Modell. AR-Modelle können mit einer von verschiedenen Methoden analysiert werden, einschließlich standardmäßiger linearer Quadrate-Techniken Sie haben auch eine einfache Interpretation. Moving Average MA Models. Another gemeinsamen Ansatz für die Modellierung univariate Zeitreihen Modelle ist die gleitenden Durchschnitt MA Modell Xt mu At - theta1 A - theta2 A - cdots - thetaq A, wobei Xt ist die Zeitreihe, mu Ist der Mittelwert der Serie, A sind weiße Rauschbegriffe und theta1, ldots, thetaq sind die Parameter des Modells Der Wert von q heißt die Reihenfolge des MA-Modells. Das ist ein gleitendes Durchschnittsmodell konzeptionell a Lineare Regression des aktuellen Wertes der Serie gegen das weiße Rauschen oder zufällige Schocks eines oder mehrerer vorheriger Werte der Serie Die zufälligen Schocks an jedem Punkt werden von der gleichen Verteilung, typischerweise einer Normalverteilung, mit der Position bei Null und angenommen Konstante Skala Die Unterscheidung in diesem Modell ist, dass diese zufälligen Schocks auf zukünftige Werte der Zeitreihe übertragen werden. Die Anpassung der MA-Schätzungen ist komplizierter als bei AR-Modellen, da die Fehlerterme nicht beobachtbar sind. Dies bedeutet, dass iterative nichtlineare Anpassungsverfahren erforderlich sind Anstelle von linearen kleinsten Quadraten verwendet werden MA Modelle haben auch eine weniger offensichtliche Interpretation als AR-Modelle. Manchmal werden die ACF und PACF vorschlagen, dass ein MA-Modell wäre eine bessere Modellwahl und manchmal sowohl AR und MA Begriffe sollten in der gleichen verwendet werden Modell siehe Abschnitt 6 4 4 5.Beachten Sie jedoch, dass die Fehlerausdrücke nach dem Modell fit sind, unabhängig sein und den Standardannahmen für einen univariaten Prozess folgen. Box und Jenkins popularisierten einen Ansatz, der den gleitenden Durchschnitt und die autoregressiven Ansätze kombiniert Das Buch Time Series Analysis Forecasting und Control Box, Jenkins und Reinsel, 1994. Obwohl sowohl autoregressive als auch gleitende durchschnittliche Ansätze bereits bekannt waren und ursprünglich von Yule untersucht wurden, war der Beitrag von Box und Jenkins in der Entwicklung einer systematischen Methodik zur Identifizierung und Schätzung Modelle, die beide Ansätze beinhalten können Dies macht Box-Jenkins Modelle eine leistungsfähige Klasse von Modellen Die nächsten paar Abschnitte werden diese Modelle im Detail diskutieren. Autoregressive Moving Average ARMA p, q Modelle für Zeitreihenanalyse - Teil 3.Dies ist das dritte und letzte Post in der Mini-Serie auf Autoregressive Moving Average ARMA Modelle für die Zeitreihenanalyse Wir haben Autoregressive Modelle und Moving Average Modelle in den beiden vorherigen Artikeln eingeführt Nun ist es Zeit, sie zu kombinieren, um ein anspruchsvolleres Modell zu produzieren Die ARIMA - und GARCH-Modelle, die es uns erlauben, die Vermögensrenditen vorherzusagen und die Volatilität zu prognostizieren. Diese Modelle bilden die Grundlage für den Handel von Signalen und Risikomanagementtechniken. Wenn Sie Teil 1 und Teil 2 gelesen haben, werden Sie gesehen haben, dass wir ein Muster folgen Für unsere Analyse eines Zeitreihenmodells werde ich es hier kurz wiederholen. Begründung - Warum sind wir an diesem bestimmten Modell interessiert. Definition - Eine mathematische Definition, um die Mehrdeutigkeit zu reduzieren. Korrelogramm - Plotten eines Beispiel-Korrelogramms, um ein Modell-Verhalten zu visualisieren. Simulation und Anpassung - Anpassung des Modells an Simulationen, um sicherzustellen, dass wir das Modell richtig verstanden haben. Real Financial Data - Bewerben Sie das Modell auf echte historische Vermögenspreise. Prediction - Prognose nachfolgende Werte, um Trading-Signale oder Filter zu bauen. Um diesen Artikel zu folgen, Ist ratsam, einen Blick auf die vorherigen Artikel auf Zeitreihenanalyse Sie können alle hier gefunden werden. Bayesian Information Criterion. In Teil 1 dieser Artikel-Serie sahen wir die Akaike Information Criterion AIC als Mittel zur Unterstützung uns wählen zwischen separaten besten Zeitreihenmodelle. Ein eng verwandtes Werkzeug ist das Bayesian Information Criterion BIC Im Wesentlichen hat es ein ähnliches Verhalten gegenüber der AIC, dass es Modelle für zu viele Parameter bestraft. Dies kann zu Überfüllung führen Der Unterschied zwischen dem BIC und AIC ist, dass die BIC mehr ist Streng mit der Bestrafung von zusätzlichen Parametern. Bayesian Information Criterion. Wenn wir die Wahrscheinlichkeit Funktion für ein statistisches Modell, die k Parameter hat und L maximiert die Wahrscheinlichkeit dann die Bayesian Information Criterion ist gegeben. Wenn n ist die Anzahl der Datenpunkte In der Zeitreihe. Wir werden die AIC und BIC unten bei der Auswahl geeigneter ARMA p, q models. Ljung-Box Test. In Teil 1 dieser Artikel-Serie Rajan erwähnt in der Disqus kommentiert, dass die Ljung-Box-Test war besser geeignet Als das Akaike Information Criterion des Bayesschen Informationskriteriums bei der Entscheidung, ob ein ARMA-Modell eine gute Anpassung an eine Zeitreihe war. Der Ljung-Box-Test ist ein klassischer Hypothesentest, der entworfen ist, um zu prüfen, ob ein Satz von Autokorrelationen einer angepassten Zeit ist Serienmodell unterscheiden sich deutlich von Null Der Test testet nicht jede einzelne Verzögerung für Zufälligkeit, sondern prüft die Zufälligkeit über eine Gruppe von Lags. Ljung-Box Test. Wir definieren die Null-Hypothese als Die Zeitreihen-Daten bei jeder Verzögerung sind iid das ist , Sind die Korrelationen zwischen den Populationsreihenwerten null. Wir definieren die Alternativhypothese als Die Zeitreihendaten sind nicht iid und besitzen eine serielle Korrelation. Wir berechnen die folgende Teststatistik Q. Wenn n die Länge der Zeitreihenprobe ist, Hut k Ist die Stichprobenautokorrelation bei Verzögerung k und h ist die Anzahl der Verzögerungen unter dem Test. Die Entscheidungsregel, ob die Nullhypothese zurückgewiesen werden soll, besteht darin, zu prüfen, ob Q chi 2 für eine chi-quadratische Verteilung mit h Freiheitsgraden an der 100 1-alpha-ten Perzentil. Während die Details des Tests kann etwas komplex erscheinen, können wir in der Tat R verwenden, um den Test für uns zu berechnen, vereinfachen die Prozedur etwas. Autogressive Moving Average ARMA Modelle der Ordnung p, q. Now, dass wir Haben wir den BIC und den Ljung-Box-Test besprochen, wir sind bereit, unser erstes gemischtes Modell zu besprechen, nämlich den Autoregressiven Moving Average der Ordnung p, q oder ARMA p, q. Zum haben wir autoregressive Prozesse und gleitende Mittelprozesse betrachtet. Das ehemalige Modell betrachtet sein eigenes vergangenes Verhalten als Inputs für das Modell und als solche Versuche, Marktteilnehmer-Effekte wie Impuls und Mittelwert-Reversion im Aktienhandel zu erfassen. Das letztere Modell wird verwendet, um Schock-Informationen zu einer Serie zu charakterisieren, wie z. B. a Überraschungs-Gewinn-Ankündigung oder unerwartete Veranstaltung wie die BP Deepwater Horizon Ölpest. Daher ein ARMA-Modell versucht, diese beiden Aspekte bei der Modellierung von finanziellen Zeitreihen zu erfassen. Hinweis, dass ein ARMA-Modell nicht berücksichtigt Volatilität Clustering, ein wichtiger empirischer Phänomene Von vielen finanziellen Zeitreihen Es ist kein bedingungslos heteroscedastisches Modell Für das müssen wir auf die ARCH - und GARCH-Modelle warten. Das ARMA p, q-Modell ist eine lineare Kombination von zwei linearen Modellen und ist somit selbst noch linear. Autoregressive Moving Average Modell der Ordnung p, qA Zeitreihenmodell, ist ein autoregressives gleitendes durchschnittliches Modell der Ordnung p, q ARMA p, q, wenn. Beginnen xt alpha1 x alpha2 x ldots wt beta1 w beta2 w ldots betaq w end. Wo ist weißes Rauschen mit E wt 0 und Varianz Sigma 2.Wenn wir den Rückwärtsschaltoperator sehen, sehen wir einen vorherigen Artikel dann können wir das oben als Funktion umschreiben Theta und phi von. Wir können einfach sehen, dass durch die Einstellung p neq 0 und q 0 wir wieder das AR p Modell Ähnlich, wenn wir p 0 und q neq 0 setzen wir wieder das MA q Modell. Eines der wichtigsten Features des ARMA-Modells Ist, dass es sparsam und redundant in seinen Parametern ist. Das heißt, ein ARMA-Modell benötigt oft weniger Parameter als ein AR - oder MA q-Modell alleine. Wenn wir die Gleichung in Bezug auf das BSO umschreiben, dann können die Theta - und Phi-Polynome Manchmal teilen sich ein gemeinsamer Faktor, was zu einem einfacheren Modell führt. Simulationen und Correlograms. Mit den autoregressiven und gleitenden Durchschnittsmodellen werden wir nun verschiedene ARMA-Serien simulieren und dann versuchen, ARMA-Modelle an diese Realisierungen anzupassen. Wir führen das aus, weil wir wollen Stellen Sie sicher, dass wir das Anpassungsverfahren verstehen, einschließlich der Berechnung von Konfidenzintervallen für die Modelle, sowie sicherstellen, dass das Verfahren tatsächlich angemessene Schätzungen für die ursprünglichen ARMA-Parameter wiederherstellt. In Teil 1 und Teil 2 haben wir die AR - und MA-Serie manuell konstruiert Indem man N Samples aus einer Normalverteilung zeichnet und dann das spezifische Zeitreihenmodell unter Verwendung von Verzögerungen dieser Samples erstellt. Jedoch gibt es einen einfacheren Weg, um AR, MA, ARMA und sogar ARIMA Daten zu simulieren, einfach durch Verwendung der Methode in R. Lassen Sie es mit dem einfachsten nicht-trivialen ARMA-Modell beginnen, nämlich dem ARMA 1,1-Modell Das ist ein autoregressives Modell der Ordnung, kombiniert mit einem gleitenden Durchschnittsmodell der Ordnung Ein solches Modell hat nur zwei Koeffizienten, Alpha und Beta, Die die ersten Verzögerungen der Zeitreihe selbst und die Schock-Weiß-Rausch-Terme darstellen. Ein solches Modell wird gegeben durch. Wir müssen die Koeffizienten vor der Simulation angeben. Setzen wir alpha 0 5 und beta -0 5. Die Ausgabe ist wie folgt. Realisierung eines ARMA 1,1 Modells mit alpha 0 5 und beta 0 5.Let s auch das Korrelogram. Korrelogramm eines ARMA 1,1 Modells mit alpha 0 5 und beta 0 5.We sehen, dass es keine gibt Signifikante Autokorrelation, die von einem ARMA 1,1-Modell zu erwarten ist. Schließlich lassen Sie versuchen, die Koeffizienten und ihre Standardfehler mit der arima-Funktion zu bestimmen. Wir können die Konfidenzintervalle für jeden Parameter mit den Standardfehlern berechnen. Das Vertrauen Intervalle enthalten die wahren Parameterwerte für beide Fälle, aber wir sollten beachten, dass die 95 Konfidenzintervalle eine sehr große Konsequenz der vernünftig großen Standardfehler sind. Lass jetzt ein ARMA 2,2 Modell versuchen Das ist ein AR 2 Modell kombiniert Mit einem MA 2 - Modell Wir müssen vier Parameter für dieses Modell alpha1, alpha2, beta1 und beta2 angeben. Nehmen wir alpha1 0 5, alpha2 -0 25 beta1 0 5 und beta2 -0 3.Die Ausgabe unseres ARMA 2,2-Modells Ist wie folgt. Realisierung eines ARMA 2,2-Modells mit alpha1 0 5, alpha2 -0 25, beta1 0 5 und beta2 -0 3.Und die entsprechende autocorelation. Correlogramm eines ARMA 2,2 Modells mit alpha1 0 5 , Alpha2 -0 25, beta1 0 5 und beta2 -0 3. Wir können nun versuchen, ein ARMA 2,2-Modell an die Daten anzupassen. Wir können auch die Konfidenzintervalle für jeden Parameter berechnen. Nichts, dass die Konfidenzintervalle für die Koeffizienten für Die gleitende Mittelkomponente beta1 und beta2 enthalten eigentlich nicht den ursprünglichen Parameterwert. Hierbei handelt es sich um die Gefahr, dass man versucht, Modelle auf Daten zu bringen, auch wenn wir die wahren Parameterwerte kennen. Für alle Zwecke müssen wir nur eine prädiktive Kraft haben Übertrifft Chance und produziert genügend Gewinn über Transaktionskosten, um auf lange Sicht rentabel zu sein. Nun, dass wir einige Beispiele für simulierte ARMA-Modelle gesehen haben, brauchen wir Mechanismus für die Auswahl der Werte von p und q bei der Anpassung an die Modelle zu echten finanziellen Data. Choosing the Best ARMA p, q Modell. Um zu bestimmen, welche Reihenfolge p, q des ARMA-Modells für eine Serie geeignet ist, müssen wir die AIC oder BIC über eine Teilmenge von Werten für p, q und dann verwenden Wenden Sie den Ljung-Box-Test an, um festzustellen, ob eine gute Passung erreicht ist, für bestimmte Werte von p, q. Um diese Methode zu zeigen, werden wir zunächst einen bestimmten ARMA p, q Prozess simulieren. Wir werden dann alle paarweisen Werte von P in und q in und berechnen die AIC Wir wählen das Modell mit dem niedrigsten AIC und führen dann einen Ljung-Box-Test auf die Residuen, um festzustellen, ob wir eine gute fit. Let s beginnen, indem Sie eine ARMA 3,2 Serie simulieren. Wir erstellen nun ein Objekt endgültig, um die beste Modell-Fit und den niedrigsten AIC-Wert zu speichern. Wir schlagen über die verschiedenen p, q-Kombinationen und verwenden das aktuelle Objekt, um die Anpassung eines ARMA i, j-Modells für die Looping-Variablen i und zu speichern J. Wenn die aktuelle AIC kleiner als jede zuvor berechnete AIC ist, setzen wir die endgültige AIC auf diesen aktuellen Wert und wählen diese Reihenfolge aus. Nach Beendigung der Schleife haben wir die Reihenfolge des ARMA-Modells und das ARIMA p, d, q passen Selbst mit der integrierten d-Komponente auf 0 gespeichert als. Lose s Ausgabe der AIC, Ordnung und ARIMA Koeffizienten. Wir können sehen, dass die ursprüngliche Reihenfolge des simulierten ARMA-Modells wiederhergestellt wurde, nämlich mit p 3 und q 2 Wir können das Corelogramm zeichnen Von den Resten des Modells zu sehen, ob sie aussehen wie eine Realisierung von diskreten weißen Rauschen DWN. Correlogram der Reste der besten passenden ARMA p, q Modell, p 3 und q 2.Das Corelogramm sieht in der Tat wie eine Realisierung von DWN Schließlich führen wir den Ljung-Box-Test für 20 Verzögerungen durch, um dies zu bestätigen. Nichts, dass der p-Wert größer als 0 05 ist, was besagt, dass die Residuen auf der 95-Ebene unabhängig sind und somit ein ARMA-3,2-Modell gut ist Modell fit. Clearly das sollte der Fall sein, da wir die Daten selbst simuliert haben. Allerdings ist dies genau das Verfahren, das wir verwenden werden, wenn wir kommen, um ARMA p, q Modelle auf den S P500 Index in den folgenden Abschnitt passen. Finanzdaten. Now Dass wir das Verfahren für die Auswahl des optimalen Zeitreihenmodells für eine simulierte Serie skizziert haben, es ist ziemlich einfach, es auf Finanzdaten anzuwenden. Für dieses Beispiel werden wir noch einmal den S P500 US Equity Index wählen Schließt die Preise mit quantmod und schafft dann die log returns stream. Let s führt die gleiche Anpassungsprozedur wie für die simulierte ARMA 3,2 Serie oben auf der Log-Returns-Serie des S P500 mit dem AIC. Das beste passende Modell hat Bestellung ARMA 3 , 3.Let s Plot die Residuen des angepassten Modells auf die S P500 log täglich Rückkehr Stream. Correlogram der Reste der besten passenden ARMA p, q Modell, p 3 und q 3, um die S P500 täglichen Log Rückgabestrom. Beachten Sie, dass es einige signifikante Gipfel gibt, vor allem bei höheren Verzögerungen Dies ist ein Hinweis auf eine schlechte Passung Lassen Sie uns einen Ljung-Box-Test durchführen, um zu sehen, ob wir statistische Beweise dafür haben. Als wir vermuteten, ist der p-Wert weniger als 0 05 Und als solche können wir nicht sagen, dass die Residuen eine Realisierung von diskreten weißen Rauschen sind. Daher gibt es eine zusätzliche Autokorrelation in den Residuen, die nicht durch das passende ARMA 3,3 Modell erklärt wird. Wie wir in dieser Artikelreihe, die wir gesehen haben, Nachweis der bedingten Heterosedastions-Volatilitäts-Clustering in der S P500-Serie, vor allem in den Perioden um 2007-2008 Wenn wir ein GARCH-Modell später in der Artikelserie verwenden, werden wir sehen, wie man diese Autokorrelationen beseitigt. In der Praxis sind ARMA-Modelle niemals im Allgemeinen gut passt Für Log-Aktien Rückkehr Wir müssen die bedingte Heterosedastizität berücksichtigen und eine Kombination aus ARIMA und GARCH verwenden Der nächste Artikel wird ARIMA betrachten und zeigen, wie sich die integrierte Komponente von dem ARMA-Modell unterscheidet, das wir in diesem Artikel berücksichtigt haben Quantitativen Handel.
Comments
Post a Comment