Informacje, które udało nam się zgromadzić na temat Analiza wariancji, zostały starannie sprawdzone i uporządkowane, aby były jak najbardziej przydatne. Prawdopodobnie trafiłeś tutaj, aby dowiedzieć się więcej na temat Analiza wariancji. W Internecie łatwo zgubić się w gąszczu stron, które mówią o Analiza wariancji, a jednocześnie nie podają tego, co chcemy wiedzieć o Analiza wariancji. Mamy nadzieję, że dasz nam znać w komentarzach, czy podoba Ci się to, co przeczytałeś o Analiza wariancji poniżej. Jeśli informacje o Analiza wariancji, które podajemy, nie są tym, czego szukałeś, daj nam znać, abyśmy mogli codziennie ulepszać tę stronę.
.
Natura |
Metoda statystyczna ( d )
|
---|---|
Akronim |
(nie) ANOVA
|
Opisany przez |
W statystykach The analiza wariancji (termin czsto skracane przez angielski termin ANOVA : ANALIZA o f va riance ) jest zbiorem modeli statystycznych wykorzystywanych w celu sprawdzenia, czy rodki z grupy pochodz z tej samej populacji. Grupy odpowiadaj modalnociom zmiennej jakociowej (np. Zmienna: leczenie; modalnoci: program treningu sportowego , suplementy diety ; placebo ), a rednie obliczane s ze zmiennej cigej (np. Przyrost masy miniowej).
Test ten stosuje si, gdy pomiar jednego lub wicej kategoryczne zmienne objaniajce (nastpnie nazywane czynnikami zmiennoci ich róne warunki s czasami nazywane poziomy), które maj wpyw na prawie zmienn cig by wyjanione. O analizie jednoczynnikowej mówimy wtedy, gdy analiza odnosi si do modelu opisanego przez pojedynczy czynnik zmiennoci, analiz dwuczynnikow lub w inny sposób analiz wieloczynnikow.
Ronald Aylmer Fisher po raz pierwszy przedstawia termin wariancja i proponuje jego formaln analiz w artykule z 1918 roku The Correlation Between Relatives on the Supposition of Mendelian Inheritance . Jego pierwsze zastosowanie analizy wariancji zostao opublikowane w 1921 r. Analiza wariancji staa si szeroko znana po wczeniu jej do ksiki Fishera z 1925 r. Statistical Methods for Research Workers.
Analiza wariancji umoliwia zbadanie zachowania si zmiennej ilociowej, któr naley wyjani jako funkcj jednej lub wicej zmiennych jakociowych, zwanych take nominalnymi jakociowymi. Kiedy chcemy zbada si wyjaniajc kilku zmiennych jakociowych jednoczenie, uyjemy wielokrotnej analizy wariancji ( MANOVA ). Jeli model zawiera jakociowe i cige zmienne objaniajce i chce si zbada prawa czce cige zmienne objaniajce ze zmienn ilociow, która ma by wyjaniona w odniesieniu do kadej kategorii zmiennych kategorialnych, wówczas zostanie uyta analiza kowariancji ( ANCOVA ).
Pierwszym krokiem w analizie wariancji jest napisanie modelu teoretycznego zgodnie z badanym problemem. Czsto mona napisa kilka modeli tego samego problemu, zgodnie z elementami, które chce si wczy do badania.
Ogólny model jest napisany:
ze zmienn ilociow do wyjanienia, sta, zwizkiem midzy zmiennymi objaniajcymi a bdem pomiaru. Podnosi fundamentalne zaoenie, e bd jest zgodny z rozkadem normalnym .
Istniej dwa typy zmiennych kategorialnych: z efektem losowym lub bez.
W przypadku zmiennej o staym efekcie dla kadej modalnoci istnieje odpowiednia staa warto. Jest napisany w modelu teoretycznym wielk liter:
gdzie dla i = 0, dla i = 1 itd.
Zauwa, e zmienna ilociowa zawsze bdzie równa µ powikszonej o (chocia moe przyjmowa wartoci dodatnie lub ujemne).
W przypadku zmiennej z efektem losowym zmienna wynika z zaoonego rozkadu normalnego, który jest dodawany do ustalonej wartoci. S napisane w modelu teoretycznym ma liter greck:
z i
Model oparty wycznie na zmiennych objaniajcych ze staymi efektami i efektami losowymi nazywany jest modelem mieszanym.
Ogólna forma analizy wariancji opiera si na tecie Fishera, a zatem na normalnoci rozkadów i niezalenoci prób.
Hipoteza zerowa odpowiada przypadkowi, w którym rozkady maj ten sam rozkad normalny.
Alternatywna hipoteza gosi, e istnieje co najmniej jeden rozkad, którego rednia odbiega od innych rednich:
Pierwszy krok w analizie wariancji polega na wyjanieniu cakowitej wariancji na wszystkich próbach jako funkcji wariancji spowodowanej czynnikami (wariancji wyjanionej przez model), wariancji wynikajcej z interakcji midzy czynnikami i losowej reszty wariancja (wariancja niewyjaniona przez model). bdca wariancj obcion estymatorem , wykorzystujc sum kwadratów bdów ( SCE francuski, SS dla Sum Square English) do oblicze i nieobcion wariancj estymatora (znan równie jako redni kwadrat lub CM ).
Odchylenie (implikowane odchylenie od redniej) pomiaru jest rónic midzy tym pomiarem a redni:
Suma kwadratów odchyle SCE i estymatora oblicza si ze wzorów:
Mona zatem zapisa sum kwadratów cakowitych odchyle jako liniow kompozycj sumy kwadratów odchyle kadej zmiennej objaniajcej i sumy kwadratów odchyle dla kadej interakcji :
Ten rozkad wariancji jest zawsze prawidowy, nawet jeli zmienne nie maj rozkadu normalnego.
Z zaoenia obserwowana zmienna ma rozkad normalny . Prawo × 2 z k stopniami swobody jest zdefiniowany jako suma k normalny kwadratów zmiennych , sumy kwadratów odchyle nastpuj prawa × 2 , z liczb stopni swobody :
Fishera jest definiowany jako stosunek dwóch prawami × 2 . W przypadku hipotezy zerowej , zwizek midzy dwoma estymatorami Bezstronna wariancja powinna by zgodna z prawem Fishera :
Jeli warto F nie jest zgodna z tym prawem Fishera (tj. Warto jest wiksza ni próg odrzucenia), to odrzucamy hipotez zerow: dochodzimy do wniosku, e istnieje statystycznie istotna rónica midzy rozkadami. Wspóczynnik zmiennoci nie dzieli badanej populacji na identyczne grupy. Dla przypomnienia, warto progu odrzucenia jest wstpnie obliczana w tabelach referencyjnych jako funkcja ryzyka pierwszego rodzaju i dwóch stopni swobody i .
Analiza wariancji pozwala po prostu odpowiedzie na pytanie, czy wszystkie próbki maj ten sam rozkad normalny. Jeli odrzucimy hipotez zerow, analiza ta nie pozwala nam wiedzie, które próbki odbiegaj od tego prawa.
Identyfikacja odpowiednich próbek przy uyciu rónych testów post-hoc (lub testów wielokrotnych porówna (in) , MCP dla testu wielokrotnych porówna ). Testy te generalnie wymagaj zwikszenia ryzyka analizy (pod wzgldem ryzyka statystycznego). Jest to uogólnienie k populacji z Studenta t badania w celu porównania rednie z dwóch próbek z regulacj bdu (FDR FWER, etc.), na przykad: testy LSD FICHER'S, testy Newman -Keuls testy Tukey'a HSD Bonferroniego i Sheffé testy.
W szczególnoci we wspóczesnej biologii testy MCP pozwalaj na prawidowe uwzgldnienie ryzyka pomimo duej liczby przeprowadzanych testów (np. Do analizy biochipów).
Kiedy analizujemy kilka zmiennych objaniajcych, z których kada ma kilka modalnoci, liczba moliwych kombinacji szybko staje si bardzo dua.
Nazywana równie jednokierunkow analiz ANOVA , jednokierunkowa analiza wariancji ma zastosowanie, gdy chcesz wzi pod uwag pojedynczy czynnik zmiennoci.
Notacja Rozwamy rozmiary I prób , wynikajce z I populacji, które przestrzegaj I normalnych praw o tej samej wariancji. Kada osoba jest napisana z i . Cakowita sia robocza to .
rednie na próbk i sum s zapisywane:
Model jest napisany:
W tych warunkach pokazujemy, e sum kwadratów odchyle (a tym samym wariancji ) mona obliczy po prostu za pomoc wzoru:
Cz cakowitej wariancji, któr mona wyjani za pomoc modelu ( zwana równie zmiennoci midzyklasow , SSB lub suma kwadratów midzy klas ) oraz cz cakowitej wariancji , której model nie moe wyjani ( zwana równie zmiennoci losow , zmienno wewntrzklasowa , szum , SSW lub suma kwadratów w klasie ) s okrelone wzorami:
Zawsze jest moliwe, e model nie jest poprawny i istnieje nieznany czynnik zmiennoci (lub przypuszczalny a priori bezuyteczny), który nie jest zintegrowany z modelem. Moliwe jest przeanalizowanie normalnoci rozkadu reszt w celu wyszukania tego typu uprzedze. Reszty w modelu musz mie rozkad normalny ( ). Kade znaczce odchylenie od tego normalnego prawa mona przetestowa lub zwizualizowa graficznie:
Te rozbienoci s uzyskane poprzez stosunek sumy kwadratów odchyle ponad liczb stopni swobody :
Ustawa Fishera jest zdefiniowana jako stosunek dwóch praw 2 , a zatem raport jest zgodny z Ustaw Fishera :
Uwaga Rozkad stopni swobody odpowiada rozkadowi przestrzeni wektorowej o wymiarze nm na dodatkowe i ortogonalne podprzestrzenie o odpowiednich wymiarach i
Test zgodnoci z prawem Fishera :
Okazuje si (jak wida w rozkadzie matematycznym), e oba te wyraenia s oszacowaniem rezydualnej zmiennoci, jeli czynnik A nie ma wpywu. Co wicej, kady z tych dwóch terminów jest zgodny z prawem 2 , a zatem ich stosunek jest zgodny z prawem F (zobacz dalej stopnie swobody tych praw). Podsumujmy:
Podsumowanie rzeczy w ten sposób pomaga wyjani ide, ale odwraca podejcie: w praktyce uzyskujemy warto stosunku , który porównujemy z prawem F, dajc sobie ryzyko (patrz artyku o testach i zwizanych z nimi ryzykach ). Jeli uzyskana warto jest zbyt dua, wnioskujemy, e stosunek prawdopodobnie nie jest zgodny z prawem F i e czynnik A ma wpyw. Dlatego dochodzimy do wniosku, e istnieje rónica w rodkach.
jest estymatorem przedstawionym w poprzednim akapicie (pierwsze podejcie techniczne) i estymatorem . Wyprowadzamy F Fishera, którego rozkad jest znany i zestawiony w tabeli przy nastpujcych zaoeniach:
Zgodno z tymi zaoeniami zapewnia trafno analizy testu wariancji . S one sprawdzane a posteriori rónymi metodami (testy normalnoci, wizualne badanie histogramu pozostaoci, badanie wykresu pozostaoci jako funkcji szacunków), patrz warunki stosowania poniej.
Tabela ANOVA podsumowuje niezbdne obliczenia:
ródo wariancji | Suma kwadratów odchyle |
Stopnie swobody | Zmienno | fa | warto p |
---|---|---|---|---|---|
Midzyklasowy | |||||
Wewntrzklasowe | |||||
Cakowity |
Wemy przykad, aby zilustrowa t metod. Wyobra sobie hodowc, który chce kupi nowe krowy do produkcji mleka. Ma trzy róne rasy krów, wic pojawia si pytanie, czy rasa jest wana przy jego wyborze. Ma jako informacj ras kadego ze swoich zwierzt (jest to dyskretna zmienna objaniajca lub czynnik zmiennoci , który moe przyj 3 róne wartoci) i ich dzienn produkcj mleka (jest to zmienna ciga do wyjanienia, która odpowiada objtoci mleko w litrach).
W naszym przykadzie hipoteza zerowa sprowadza si do uznania, e wszystkie krowy produkuj tak sam dzienn ilo mleka (z wyjtkiem czynnika losowego) niezalenie od rasy. Hipoteza alternatywna sprowadza si do uznania, e jedna z ras produkuje znacznie wicej lub mniej mleka ni inne.
Zaómy, e produkcje to:
Wycigi | Skaleczenie | redni | Zmienno |
---|---|---|---|
W | 4 | 20,475 | 0,443 |
b | 7 | 23.4 | 0,59333 |
VS | 5 | 31.46 | 0,178 |
Cakowity | 16 | 25,1875 | 20.90117 |
Tabela ANOVA :
ródo wariancji | Suma kwadratów odchyle |
Stopnie swobody | Zmienno | fa | warto p |
---|---|---|---|---|---|
Midzyklasowy | 307,918 | 2 | 153,959 | 357,44 | 4,338 e-12 |
Wewntrzklasowe | 5.6 | 13 | 0,431 | ||
Cakowity | 313,518 | 15 |
Nazywana równie dwukierunkow ANOVA , dwukierunkowa analiza wariancji ma zastosowanie, gdy chce si wzi pod uwag dwa czynniki zmiennoci .
Oznacza to, e pierwszy czynnik zmiennoci, który moe przyjmowa poziomy , drugi czynnik zmiennoci, który moe przyjmowa poziomy , liczba osobników na poziomie pierwszego czynnika i poziom drugiego czynnika, cakowita liczba osobników oraz liczb osób w kadej podgrupie (dla danego poziomu i i j). Zmienna do wyjanienia jest zapisywana za pomoc , i .
Zmienn do wyjanienia mona modelowa za pomoc zalenoci:
z efektem poziomu pierwszego czynnika, wpywem poziomu drugiego czynnika, efektem interakcji midzy dwoma czynnikami i bdem losowym (który nastpnie jest zgodny z rozkadem normalnym ).
Obliczenie przedstawione w przypadku jednoczynnikowym mona przeoy na przypadek dwuskadnikowy:
Udzia cakowitej wariancji wyjanionej pierwszym czynnikiem ( ), udzia cakowitej wariancji wyjanionej przez drugi czynnik ( ), interakcja midzy dwoma czynnikami ( ) i udzia cakowitej wariancji , której model nie moe wyjani ( zwane równie zmiennoci losow lub szumem ) s okrelone wzorami:
Analiza interakcji midzy czynnikami jest stosunkowo zoona. W przypadku, gdy czynniki s niezalene, interesowa mona tylko ich gówne skutki. Formua staje si wtedy:
Nasz hodowca byda mlecznego chce ulepszy swoj analiz poprzez zwikszenie zakresu swoich bada. Aby to zrobi, zawiera dane z innej farmy. Przedstawione mu liczby s nastpujce:
Dof | Suma kwadratów | Zmienno | fa | P (X> F) | |
---|---|---|---|---|---|
wycigi | 2 | 696,48 | 348,24 | 559,6811 | <2,2e-16 |
rodek | 1 | 8.46 | 8.46 | 13.6012 | 0,0009636 |
rasa: centrum | 2 | 12.23 | 6.11 | 9.8267 | 0,0005847 |
Resztki | 28 | 17.42 | 0.62 |
Moemy dalej rozoy wariancj , dodajc termin dla kadego czynnika i termin dla kadej moliwej interakcji:
z efektem j- tego czynnika i interakcji midzy j- tym i k- tym czynnikiem.
Analiza wariancji w przypadku kilku czynników zmiennoci jest stosunkowo zoona: konieczne jest zdefiniowanie poprawnego modelu teoretycznego, zbadanie interakcji midzy czynnikami, analiza kowariancji .
Dekompozycja wariancji jest zawsze poprawna, bez wzgldu na rozkad badanych zmiennych. Jednak wykonujc test Fishera zakadamy normalno tych rozkadów. Jeli rozkady nieznacznie odbiegaj od normalnoci, analiza wariancji jest wystarczajco solidna, aby mona j byo zastosowa. W przypadku, gdy rozkady odbiegaj znacznie od normalnoci, mona dokona zmiany zmiennych (na przykad biorc zmienne lub ) lub uy nieparametrycznego odpowiednika analizy wariancji.
W przeciwiestwie do tego ANOVA przyjmuje inne bardzo mocne i mniej oczywiste zaoenie. W rzeczywistoci konieczne jest, aby wariancja w rónych grupach bya taka sama. Taka jest hipoteza homoskedastycznoci . ANOVA jest na to bardzo wraliwa. Dlatego konieczne jest przetestowanie go przed kadym uyciem.
Wbrew temu, co sugeruje nazwa tej metody, nie pozwala ona na analiz wariancji wyjanianej zmiennej, ale na porównanie rednich rozkadów wyjanianej zmiennej w funkcji zmiennych objaniajcych.
Kiedy nie s przestrzegane wstpne zaoenia ANOVA ( na przykad homoskedastyczno ), czsto syszymy, e rozsdniej jest zastosowa nieparametryczny odpowiednik ANOVA: test Kruskala-Wallisa dla przypadku jednoczynnikowego lub przypadek dwuskadnikowy bez powtórze, test Friedmana. Jednak te testy nie wygldaj tak samo. Jak stwierdzono powyej, ANOVA umoliwia porównanie pomiaru jednowymiarowego midzy próbkami z dwóch lub wicej populacji statystycznych. Test Kruskala-Wallisa ma dla hipotezy zerowej jednorodno stochastyczn, tj. Kada populacja statystyczna jest równa stochastycznie (dla uproszczenia mona powiedzie losowo) kombinacji innych populacji. Ten test jest zatem zainteresowany rozkadem w przeciwiestwie do ANOVA i dlatego nie moe by uwaany za równowany w cisym tego sowa znaczeniu.
Mamy nadzieję, że informacje, które zgromadziliśmy na temat Analiza wariancji, były dla Ciebie przydatne. Jeśli tak, nie zapomnij polecić nas swoim przyjaciołom i rodzinie oraz pamiętaj, że zawsze możesz się z nami skontaktować, jeśli będziesz nas potrzebować. Jeśli mimo naszych starań uznasz, że informacje podane na temat _title nie są całkowicie poprawne lub że powinniśmy coś dodać lub poprawić, będziemy wdzięczni za poinformowanie nas o tym. Dostarczanie najlepszych i najbardziej wyczerpujących informacji na temat Analiza wariancji i każdego innego tematu jest istotą tej strony internetowej; kierujemy się tym samym duchem, który inspirował twórców Encyclopedia Project, i z tego powodu mamy nadzieję, że to, co znalazłeś o Analiza wariancji na tej stronie pomogło Ci poszerzyć swoją wiedzę.