Średnia ruchoma

Średniej ruchomej lub średni przesuwnych , jest rodzajem statystyczna średnia użyte do analizy uporządkowanym zbiorze danych , najczęściej szeregów czasowych , usuwanie przejściowych wahań w celu podkreślenia trendów długoterminowych. Mówi się, że ta średnia porusza się, ponieważ jest stale przeliczana, używając do każdego obliczenia podzbioru elementów, w których nowy element zastępuje najstarszy lub jest dodawany do podzbioru.

Ten typ średniej jest powszechnie stosowany jako metoda wyrównywania wartości, zwłaszcza w przemyśle, handlu i kilku innych sektorach gospodarki, np. Do ustalania prognoz popytu na produkt lub usługę, do określania prognoz sprzedaży, do badania makroekonomicznego. szeregi czasowe (produkt krajowy brutto, zatrudnienie lub inne).

Matematycznie, każda średnia ruchoma jest przykładem splotu . Fizycznie, średnia ruchoma jest filtrem dolnoprzepustowym i dlatego ma głębokie połączenie z przetwarzaniem sygnału . W szczególności wykładnicza średnia ruchoma, którą omówimy później, jest bardzo klasycznym liniowym filtrem dolnoprzepustowym pierwszego rzędu.

Arytmetyczna średnia krocząca

Klasyczny punkt widzenia

Jest to średnia, która zamiast być obliczana na zbiorze n wartości próbki , jest obliczana po kolei na każdym podzbiorze N kolejnych wartości (N ≤ n ). Podzbiór używany do obliczania każdej średniej, czasami nazywany „oknem”, „przesuwa się” po zbiorze danych.

Na przykład w poniższej tabeli przedstawiono proste średnie kroczące z 3 wartości dla serii 9 pomiarów.

Środki 2 3 5 8 8 7 8 5 2

Ruchoma średnia
nic (2 + 3 + 5) / 3

3.3333

(3 + 5 + 8) / 3

5.3333

(5 + 8 + 8) / 3

7

(8 + 8 + 7) / 3

7,6666

(8 +7 + 8) / 3

7,6666

(7 + 8 + 5) / 3

6.6666

(8 + 5 + 2) / 3

5

nic

Inny przykład: w szczególnym przypadku w dziedzinie zanieczyszczenia atmosfery stosuje się „  średnią ruchomą z 8 godzin  ” stężenia zanieczyszczenia (tak jest w przypadku ozonu , jako celu jakościowego dla ochrony zdrowia ludzkiego); tę średnią można obliczyć od 0:00 do 8:00, od 1:00 do 9:00, od 2:00 do 10:00 itd. Będziemy poszukiwać w ciągu jednego dnia maksymalnej wartości średniej ruchomej, która musi być mniejsza niż dane stężenie. Zaletą ruchomej średniej jest wygładzenie wszelkich przypadkowych odchyleń.

Kolejne obliczanie średnich kroczących dla tej samej serii liczb wymaga zachowania wszystkich wartości użytych przez poprzednie średnie, aby zastąpić najstarszy termin najnowszym.

Wzór na obliczenie prostej średniej ruchomej to

Charakter filtru utworzonego przez arytmetyczną średnią ruchomą

Wyrażenie po lewej stronie, powyżej, jest niczym innym jak dyskretnym iloczynem splotu między sygnałem a funkcją bramki wysokości . Transformaty Fouriera tej funkcji jest sine kardynał . Dlatego ta średnia ma potencjalnie zakłócającą odpowiedź częstotliwościową , przy czym niektóre odchylenia są zgłaszane negatywnie, a inne pozytywnie. Można to zinterpretować jako nagłe przesunięcie fazowe z jednej skrajności w drugą w zależności od szybkości zmian danych.

Ważona średnia krocząca

Ważona średnia ruchoma to średnia ruchoma, która wykorzystuje współczynniki w celu nadania oddzielnej wagi każdej wartości używanej w obliczeniach. W przypadku ważonej średniej ruchomej, waga każdego składnika maleje liniowo, przy czym najnowszy ma wagę, a najstarszy (n- ty rozpoczynający się na końcu ) ma wagę jednostkową.

Mianownik jest liczbą trójkątną i można go bezpośrednio obliczyć jako

Podobnie jak w przypadku prostej średniej ruchomej, kolejne obliczanie ważonych średnich kroczących dla tej samej sekwencji wymaga zachowania wszystkich wartości użytych przez poprzednie średnie.

Wykładnicza średnia krocząca

Klasyczny punkt widzenia

Wykładnicza średnia krocząca wykorzystuje wagę terminów, która maleje wykładniczo . Ciężar każdej wartości uczestniczących w średnie (często określane jako obserwacji w statystykach ) jest większy współczynnik niż wartość poprzedzająca ją w serii, co daje większą wagę do najnowszych obserwacjach, bez jednak nigdy całkowicie stłumić wpływ najstarszych wartości.

Stała wygładzania kontroluje stopień zaniku wag stosowanych dla każdej obserwacji uczestniczącej w średniej. Ta stała α jest liczbą z przedziału od 0 do 1; można to wyrazić:

W przeciwieństwie do innych typów średnich kroczących, liczba okresów N nie reprezentuje liczby wartości uczestniczących w średniej; służy tylko do określenia stałej wygładzania α. Dzieje się tak, ponieważ każde ponowne obliczenie wykładniczej średniej ruchomej dodaje efekt ostatniej obserwacji bez porzucania starszej. Łączna waga N najnowszych obserwacji użytych przez wykładniczą średnią ruchomą stanowi około 86% całkowitej wagi ze wzorem (dokładność tego wzoru rośnie wraz z N). Dla N okresów odważyć 86% średniej (w szczególności wymagane gdy N jest mała), Dokładna formuła α = 1 - (1 - 0,86) 1 / N .

W najprostszej formie wykładnicza średnia ważona jest wyrażona jako funkcja tej samej średniej obliczonej w poprzednim okresie. Istnieją dwa sformułowania:

Roberts (1959): —— Hunter (1986):

Te wyrażenia można zapisać inaczej, aby podkreślić, że wykładnicza średnia krocząca ma tendencję do utrzymywania swojej poprzedniej wartości, różniąc się tylko o ułamek swojej różnicy od ostatniej obserwacji:

Roberts (1959): —— Hunter (1986):

Należy zainicjować wykładniczą średnią ruchomą; najczęściej narzucamy, ale możemy też np. przypisać prostą średnią z pierwszych 4 lub 5 obserwacji. Wpływ inicjalizacji na kolejne średnie kroczące zależy od współczynnika α; większe wartości stałej wygładzania mają tendencję do szybszego zmniejszania wpływu starszych obserwacji. Rzeczywiście, rozszerzenie postaci Robertsa przez rekurencyjne podstawianie wykładniczych średnich kroczących z poprzednich obliczeń daje nieskończoną sumę , ale ponieważ wyrażenie 1 - α jest mniejsze niż 1, stare wyrazy są coraz mniejsze i opcjonalnie można je zignorować.

Ustawiając β = (1 - α), β ∈ [0, 1] i zauważając , że otrzymujemy:

Charakter filtru, na który składa się wykładnicza średnia krocząca

Powyższe wyrażenie jest niczym innym jak dyskretnym produktem splotu między sygnałem a filtrem dolnoprzepustowym pierwszego rzędu. Rzeczywiście, pisząc w formularzu , identyfikujemy odpowiedź impulsową filtra dolnoprzepustowego pierwszego rzędu wzmocnienia i którego impuls odcięcia jest wyrażony w radianach / próbkę. jest ujemna, parametry filtru są więc całkiem pozytywne.

Aby rozważyć formy bardziej dopasowane do kontekstu, należy zauważyć, że częstotliwość odcięcia to cykle / próbka, tj . Okres odcięcia próbki. Konkretnie, gdy zmienia się dość szybko, gdy waha się w mniejszej liczbie próbek, fluktuacja występuje w, ale jest tym bardziej osłabiona, im szybciej. Dokładniej, tłumienie wynosi 20 dB / dekadę.

Dlatego wykładnicza średnia krocząca cierpi na główną wadę konwencjonalnych filtrów dolnoprzepustowych, którą jest przesunięcie fazowe danych. Powoduje to opóźnienie między ewolucją a ewolucją danych , a to opóźnienie zależy od szybkości ewolucji.

Inne rodzaje średnich

Tak jak istnieją nieskończone filtry w przetwarzaniu sygnału , tak samo istnieją niekończące się wartości średnie. W tym artykule omówiliśmy najpopularniejsze z nich i wymieniliśmy ich cechy szczególne w przestrzeni Fouriera. Zauważamy, że prowadzą do różnic fazowych, które wpływają na jakość wyników. Mogliśmy również odnieść się do kwestii spektralnych wynikających z próbkowania leżących u podstaw dyskretnych produktów splotu.

Mniej powszechna średnia ma lepsze właściwości. Jest to realizowane przez rekurencyjny filtr Gaussa . Chociaż nie ma czegoś takiego jak doskonały rekurencyjny filtr Gaussa, istnieją doskonałe przybliżenia czwartego rzędu, w których pozostają tylko błędy związane z próbkowaniem (patrz na przykład Deriche 1993). Rzeczywiście, transformata Fouriera Gaussa jest Gaussa. W związku z tym nie ma przesunięcia fazowego, w przeciwieństwie do wykładniczej średniej ruchomej, ani oscylacji, w przeciwieństwie do arytmetycznej średniej ruchomej. Ale obliczenia są cięższe (quasi-gaussowski filtr rzędu 4 wymaga około 16 operacji na wartość), a te idealne cechy występują tylko wtedy, gdy średnia jest przeprowadzana na danych znanych z góry (przesunięcie fazowe pojawia się, jeśli tylko część przyczynowa filtr jest używany).

Wreszcie, zamiast używać średniej, można użyć innego kryterium pozycji , zwykle mediany .

Uogólnienie

Średnią możemy postrzegać jako regresję wzdłuż poziomej linii. Zamiast tego możemy użyć regresji wielomianowej  : w przesuwanym oknie wykonujemy regresję wielomianową, a wartość w środku okna jest zastępowana wartością znalezionego wielomianu (wartość wygładzona). Ten rodzaj filtra jest „mniej brutalny”, a także pozwala określić pochodną wygładzonej krzywej. Jeżeli odstęp między próbkami jest stały, wygładzona wartość jest po prostu liniową kombinacją wartości zawartych w okienku, tj. Ostatecznie średnią ważoną, przy czym współczynniki ważenia nie są ani liniowe, ani wykładnicze, ale tworzą „krzywą dzwonową” symetryczną wokół środek okna.

Odpowiedzi impulsowe

Na wykresie widzimy naprzeciw odpowiedzi impulsowej dla dwóch typów średnich. Można tam odczytać wartości zastosowanej wagi, aż do symetrii (wynik Metastock v10).

Uwagi i odniesienia

  1. https://www.faq-logistique.com/Methodes-Previsions.htm
  2. (w) „  NIST / SEMATECH e-Handbook of Statistical Methods: EWMA Control Charts  ” on National Institute of Standards and Technology (dostęp 19 września 2007 )
  3. (w) „  NIST / SEMATECH e-Handbook of Statistical Methods: Single Exponential Smoothing  ” on National Institute of Standards and Technology (dostęp 19 września 2007 )

Załączniki

Powiązane artykuły

Linki zewnętrzne