Analiza wariancji



Informacje, które udało nam się zgromadzić na temat Analiza wariancji, zostały starannie sprawdzone i uporządkowane, aby były jak najbardziej przydatne. Prawdopodobnie trafiłeś tutaj, aby dowiedzieć się więcej na temat Analiza wariancji. W Internecie łatwo zgubić się w gąszczu stron, które mówią o Analiza wariancji, a jednocześnie nie podają tego, co chcemy wiedzieć o Analiza wariancji. Mamy nadzieję, że dasz nam znać w komentarzach, czy podoba Ci się to, co przeczytałeś o Analiza wariancji poniżej. Jeśli informacje o Analiza wariancji, które podajemy, nie są tym, czego szukałeś, daj nam znać, abyśmy mogli codziennie ulepszać tę stronę.

.

Analiza wariancji
Natura
Metoda statystyczna ( d )
Akronim
(nie)  ANOVA
Opisany przez

W statystykach The analiza wariancji (termin czsto skracane przez angielski termin ANOVA  : ANALIZA o f va riance ) jest zbiorem modeli statystycznych wykorzystywanych w celu sprawdzenia, czy rodki z grupy pochodz z tej samej populacji. Grupy odpowiadaj modalnociom zmiennej jakociowej (np. Zmienna: leczenie; modalnoci: program treningu sportowego , suplementy diety ; placebo ), a rednie obliczane s ze zmiennej cigej (np. Przyrost masy miniowej).

Test ten stosuje si, gdy pomiar jednego lub wicej kategoryczne zmienne objaniajce (nastpnie nazywane czynnikami zmiennoci ich róne warunki s czasami nazywane poziomy), które maj wpyw na prawie zmienn cig by wyjanione. O analizie jednoczynnikowej mówimy wtedy, gdy analiza odnosi si do modelu opisanego przez pojedynczy czynnik zmiennoci, analiz dwuczynnikow lub w inny sposób analiz wieloczynnikow.

Historia

Ronald Aylmer Fisher po raz pierwszy przedstawia termin wariancja i proponuje jego formaln analiz w artykule z 1918 roku The Correlation Between Relatives on the Supposition of Mendelian Inheritance . Jego pierwsze zastosowanie analizy wariancji zostao opublikowane w 1921 r. Analiza wariancji staa si szeroko znana po wczeniu jej do ksiki Fishera z 1925 r. Statistical Methods for Research Workers.

Zasada

Analiza wariancji umoliwia zbadanie zachowania si zmiennej ilociowej, któr naley wyjani jako funkcj jednej lub wicej zmiennych jakociowych, zwanych take nominalnymi jakociowymi. Kiedy chcemy zbada si wyjaniajc kilku zmiennych jakociowych jednoczenie, uyjemy wielokrotnej analizy wariancji ( MANOVA ). Jeli model zawiera jakociowe i cige zmienne objaniajce i chce si zbada prawa czce cige zmienne objaniajce ze zmienn ilociow, która ma by wyjaniona w odniesieniu do kadej kategorii zmiennych kategorialnych, wówczas zostanie uyta analiza kowariancji ( ANCOVA ).

Model

Pierwszym krokiem w analizie wariancji jest napisanie modelu teoretycznego zgodnie z badanym problemem. Czsto mona napisa kilka modeli tego samego problemu, zgodnie z elementami, które chce si wczy do badania.

Ogólny model jest napisany:

ze zmienn ilociow do wyjanienia, sta, zwizkiem midzy zmiennymi objaniajcymi a bdem pomiaru. Podnosi fundamentalne zaoenie, e bd jest zgodny z rozkadem normalnym .

Wyjaniajce zmienne

Istniej dwa typy zmiennych kategorialnych: z efektem losowym lub bez.

W przypadku zmiennej o staym efekcie dla kadej modalnoci istnieje odpowiednia staa warto. Jest napisany w modelu teoretycznym wielk liter:

gdzie dla i = 0, dla i = 1 itd.

Zauwa, e zmienna ilociowa zawsze bdzie równa µ powikszonej o (chocia moe przyjmowa wartoci dodatnie lub ujemne).

W przypadku zmiennej z efektem losowym zmienna wynika z zaoonego rozkadu normalnego, który jest dodawany do ustalonej wartoci. S napisane w modelu teoretycznym ma liter greck:

z i

Model oparty wycznie na zmiennych objaniajcych ze staymi efektami i efektami losowymi nazywany jest modelem mieszanym.

Podstawowe zaoenia

Ogólna forma analizy wariancji opiera si na tecie Fishera, a zatem na normalnoci rozkadów i niezalenoci prób.

  • Normalno rozkadu: zakada si, zgodnie z hipotez zerow, e próbki pochodz z tej samej populacji i maj rozkad normalny. Dlatego konieczne jest sprawdzenie normalnoci rozkadów i homoskedastycznoci (jednorodno wariancji, na przykad testami Bartletta lub Levene'a ). W przeciwnym razie moemy zastosowa nieparametryczne warianty analizy wariancji ( ANOVA Kruskala-Wallisa lub ANOVA Friedmana ).
  • Niezaleno próbek: zakada si, e kada analizowana próbka jest niezalena od innych próbek. W praktyce jest to problem, który pozwala zaoy, e próbki s niezalene. Czstym przykadem próbek zalenych jest przypadek pomiarów z powtórzeniami (kada próbka jest analizowana kilka razy). W przypadku próbek zalenych dla przypadków nieparametrycznych zostanie zastosowana analiza wariancji z powtarzanymi pomiarami lub ANOVA Friedmana .

Hipotezy do sprawdzenia

Hipoteza zerowa odpowiada przypadkowi, w którym rozkady maj ten sam rozkad normalny.

Alternatywna hipoteza gosi, e istnieje co najmniej jeden rozkad, którego rednia odbiega od innych rednich:

.

Dekompozycja wariancji

Pierwszy krok w analizie wariancji polega na wyjanieniu cakowitej wariancji na wszystkich próbach jako funkcji wariancji spowodowanej czynnikami (wariancji wyjanionej przez model), wariancji wynikajcej z interakcji midzy czynnikami i losowej reszty wariancja (wariancja niewyjaniona przez model). bdca wariancj obcion estymatorem , wykorzystujc sum kwadratów bdów ( SCE francuski, SS dla Sum Square English) do oblicze i nieobcion wariancj estymatora (znan równie jako redni kwadrat lub CM ).

Odchylenie (implikowane odchylenie od redniej) pomiaru jest rónic midzy tym pomiarem a redni:

.

Suma kwadratów odchyle SCE i estymatora oblicza si ze wzorów:

Mona zatem zapisa sum kwadratów cakowitych odchyle jako liniow kompozycj sumy kwadratów odchyle kadej zmiennej objaniajcej i sumy kwadratów odchyle dla kadej interakcji  :

Ten rozkad wariancji jest zawsze prawidowy, nawet jeli zmienne nie maj rozkadu normalnego.

Test Fishera

Z zaoenia obserwowana zmienna ma rozkad normalny . Prawo × 2 z k stopniami swobody jest zdefiniowany jako suma k normalny kwadratów zmiennych , sumy kwadratów odchyle nastpuj prawa × 2 , z liczb stopni swobody  :

Fishera jest definiowany jako stosunek dwóch prawami × 2 . W przypadku hipotezy zerowej , zwizek midzy dwoma estymatorami Bezstronna wariancja powinna by zgodna z prawem Fishera  :

Jeli warto F nie jest zgodna z tym prawem Fishera (tj. Warto jest wiksza ni próg odrzucenia), to odrzucamy hipotez zerow: dochodzimy do wniosku, e istnieje statystycznie istotna rónica midzy rozkadami. Wspóczynnik zmiennoci nie dzieli badanej populacji na identyczne grupy. Dla przypomnienia, warto progu odrzucenia jest wstpnie obliczana w tabelach referencyjnych jako funkcja ryzyka pierwszego rodzaju i dwóch stopni swobody i .

Testy post-hoc

Analiza wariancji pozwala po prostu odpowiedzie na pytanie, czy wszystkie próbki maj ten sam rozkad normalny. Jeli odrzucimy hipotez zerow, analiza ta nie pozwala nam wiedzie, które próbki odbiegaj od tego prawa.

Identyfikacja odpowiednich próbek przy uyciu rónych testów post-hoc (lub testów wielokrotnych porówna  (in) , MCP dla testu wielokrotnych porówna ). Testy te generalnie wymagaj zwikszenia ryzyka analizy (pod wzgldem ryzyka statystycznego). Jest to uogólnienie k populacji z Studenta t badania w celu porównania rednie z dwóch próbek z regulacj bdu (FDR FWER, etc.), na przykad: testy LSD FICHER'S, testy Newman -Keuls testy Tukey'a HSD Bonferroniego i Sheffé testy.

W szczególnoci we wspóczesnej biologii testy MCP pozwalaj na prawidowe uwzgldnienie ryzyka pomimo duej liczby przeprowadzanych testów (np. Do analizy biochipów).

Kiedy analizujemy kilka zmiennych objaniajcych, z których kada ma kilka modalnoci, liczba moliwych kombinacji szybko staje si bardzo dua.

Jednokierunkowa analiza wariancji

Nazywana równie jednokierunkow analiz ANOVA , jednokierunkowa analiza wariancji ma zastosowanie, gdy chcesz wzi pod uwag pojedynczy czynnik zmiennoci.

Notacja Rozwamy rozmiary I prób , wynikajce z I populacji, które przestrzegaj I normalnych praw o tej samej wariancji. Kada osoba jest napisana z i . Cakowita sia robocza to .

rednie na próbk i sum s zapisywane:

Dekompozycja wariancji

Model jest napisany:

W tych warunkach pokazujemy, e sum kwadratów odchyle (a tym samym wariancji ) mona obliczy po prostu za pomoc wzoru:

Cz cakowitej wariancji, któr mona wyjani za pomoc modelu ( zwana równie zmiennoci midzyklasow , SSB lub suma kwadratów midzy klas ) oraz cz cakowitej wariancji , której model nie moe wyjani ( zwana równie zmiennoci losow , zmienno wewntrzklasowa , szum , SSW lub suma kwadratów w klasie ) s okrelone wzorami:

Mamy nadzieję, że informacje, które zgromadziliśmy na temat Analiza wariancji, były dla Ciebie przydatne. Jeśli tak, nie zapomnij polecić nas swoim przyjaciołom i rodzinie oraz pamiętaj, że zawsze możesz się z nami skontaktować, jeśli będziesz nas potrzebować. Jeśli mimo naszych starań uznasz, że informacje podane na temat _title nie są całkowicie poprawne lub że powinniśmy coś dodać lub poprawić, będziemy wdzięczni za poinformowanie nas o tym. Dostarczanie najlepszych i najbardziej wyczerpujących informacji na temat Analiza wariancji i każdego innego tematu jest istotą tej strony internetowej; kierujemy się tym samym duchem, który inspirował twórców Encyclopedia Project, i z tego powodu mamy nadzieję, że to, co znalazłeś o Analiza wariancji na tej stronie pomogło Ci poszerzyć swoją wiedzę.

Opiniones de nuestros usuarios

Richard Maciejewski

Język wygląda na stary, ale informacje są wiarygodne i ogólnie wszystko, co napisano o Analiza wariancji, daje dużo pewności.

Bohdan Strzelecki

Bardzo ciekawy ten post o Analiza wariancji.

Dawid Wilk

Artykuł o Analiza wariancji jest kompletny i dobrze wyjaśniony. Nie dodawałbym ani nie usuwał przecinka.

Marina Stankiewicz

Uważam, że ten wpis o zmiennej Analiza wariancji jest sformułowany bardzo ciekawie, przypomina mi lata szkolne. Jakie piękne czasy, dzięki za sprowadzenie mnie do nich.