Bei der Berechnung eines laufenden Gleitendurchschnitts ist es sinnvoll, den Mittelwert in der mittleren Zeitperiode einzutragen. Im vorigen Beispiel haben wir den Durchschnitt der ersten 3 Zeiträume berechnet und neben der Periode 3 platziert. Wir hätten den Durchschnitt in der Mitte platzieren können Zeitintervall von drei Perioden, das heißt, neben Periode 2. Dies funktioniert gut mit ungeraden Zeitperioden, aber nicht so gut für sogar Zeitperioden. Also wo würden wir den ersten gleitenden Durchschnitt platzieren, wenn M 4 Technisch, würde der Moving Average bei t 2,5, 3,5 fallen. Um dieses Problem zu vermeiden, glätten wir die MAs unter Verwendung von M 2. So glätten wir die geglätteten Werte Wenn wir eine gerade Anzahl von Terme mitteln, müssen wir die geglätteten Werte glätten Die folgende Tabelle zeigt die Ergebnisse mit M 4.David, Ja, MapReduce ist Um auf einer großen Datenmenge zu arbeiten. Und die Idee ist, dass im Allgemeinen die Karte und reduzieren Funktionen sollte nicht kümmern, wie viele Mapper oder wie viele Reduzierer gibt es, die nur Optimierung ist. Wenn Sie sorgfältig über den Algorithmus ich gepostet denken, können Sie sehen, dass es doesn39t Angelegenheit, welche Mapper bekommt, welche Teile der Daten. Jeder Eingabesatz ist für jede reduzierte Operation verfügbar, die es benötigt. Ndash Joe K 18. September um 22:30 Im besten Fall meines Verständnisses gleitende Durchschnitt ist nicht schön Karten MapReduce-Paradigma, da seine Berechnung im Wesentlichen Schiebefenster über sortierte Daten ist, während MR Verarbeitung von nicht geschnittenen Bereichen von sortierten Daten. Lösung, die ich sehe, ist wie folgt: a) Um benutzerdefinierte Partitionierer zu implementieren, um zwei verschiedene Partitionen in zwei Durchläufen zu machen. In jedem Lauf erhalten Ihre Reduzierer verschiedene Bereiche der Daten und berechnen gleitenden Durchschnitt, wo passend, werde ich versuchen zu illustrieren: Im ersten Lauf Daten für Reduzierer sollte: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . Hier werden Sie gleitenden Durchschnitt für einige Qs cacluate. Im nächsten Lauf sollten Ihre Reduzierer Daten wie erhalten: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 Und caclulate den Rest der gleitenden Durchschnitte. Dann müssen Sie Ergebnisse zu aggregieren. Idee der benutzerdefinierten Partitionierer, dass es zwei Modi der Operation haben wird - jedes Mal in gleiche Bereiche, aber mit einigen Verschiebung. In einem Pseudocode sieht es so aus. Partition (keySHIFT) (MAXKEYnumOfPartitions) Dabei gilt: SHIFT wird aus der Konfiguration übernommen. MAXKEY-Maximalwert der Taste. Ich nehme zur Vereinfachung an, dass sie mit Null beginnen. RecordReader, IMHO ist keine Lösung, da es auf bestimmte Split beschränkt ist und kann nicht über Splits Grenze gleiten. Eine weitere Lösung wäre, um benutzerdefinierte Logik der Aufteilung der Eingangsdaten (es ist Teil der InputFormat) zu implementieren. Es kann getan werden, um 2 verschiedene Folien, ähnlich wie die Partitionierung zu tun. Beantwortet Sep 17 12 at 8: 59In meinem letzten Buch Practical Time Series Prognose: Ein praktischer Leitfaden. Ich habe ein Beispiel für die Verwendung von Microsoft Excels Moving Average Plot, um monatliche Saisonalität zu unterdrücken. Dies geschieht durch die Erstellung eines Linienplots der Serie über die Zeit und dann Add Trendline gt Moving Average (siehe meine Post über Unterdrückung Saisonalität). Der Zweck des Hinzufügens der gleitenden durchschnittlichen Trendlinie zu einem Zeitplot besteht darin, einen Trend in den Daten besser zu sehen, indem die Saisonalität unterdrückt wird. Ein gleitender Durchschnitt mit Fensterbreite w bedeutet eine Mittelung über jeden Satz von w aufeinanderfolgenden Werten. Für die Visualisierung einer Zeitreihe verwenden wir typischerweise einen zentrierten gleitenden Durchschnitt mit w season. In einem zentrierten gleitenden Durchschnitt wird der Wert des gleitenden Mittelwertes zum Zeitpunkt t (MA t) berechnet, indem das Fenster um die Zeit t zentriert wird und über die w Werte innerhalb des Fensters gemittelt wird. Wenn wir z. B. tägliche Daten haben und wir einen Wochentagwirkung vermuten, können wir sie durch einen zentrierten gleitenden Durchschnitt mit w7 unterdrücken und dann die MA-Linie plotten. Ein beobachter Teilnehmer in meinem Online-Kurs Vorhersage entdeckte, dass Excels gleitenden Durchschnitt nicht produzieren, was wed erwarten: Statt der Mittelung über ein Fenster, das um eine Zeitperiode von Interesse zentriert ist, nimmt es einfach den Durchschnitt der letzten w Monate (genannt ein Schleppen gleitender Durchschnitt). Während schleppende gleitende Mittelwerte für die Prognose nützlich sind, sind sie für die Visualisierung unterlegen, besonders wenn die Serie einen Trend aufweist. Der Grund dafür ist, dass der nachlaufende gleitende Durchschnitt hinterherhinkt. Sehen Sie sich die untenstehende Abbildung an, und Sie sehen den Unterschied zwischen Excels-Schleppendurchschnitt (schwarz) und einem zentrierten gleitenden Durchschnitt (rot). Die Tatsache, dass Excel einen nachlaufenden gleitenden Durchschnitt im Trendline-Menü erzeugt, ist ziemlich beunruhigend und irreführend. Noch beunruhigender ist die Dokumentation. Die den nachfolgenden MA, der erzeugt wird, falsch beschreibt: Wenn Period beispielsweise auf 2 gesetzt ist, wird der Durchschnitt der ersten beiden Datenpunkte als erster Punkt in der gleitenden durchschnittlichen Trendlinie verwendet. Der Durchschnitt der zweiten und dritten Datenpunkte wird als der zweite Punkt in der Trendlinie verwendet, und so weiter. Weitere Informationen zu gleitenden Durchschnitten finden Sie hier:
No comments:
Post a Comment