Analiza korespondencji czynnikowej



Informacje, które udało nam się zgromadzić na temat Analiza korespondencji czynnikowej, zostały starannie sprawdzone i uporządkowane, aby były jak najbardziej przydatne. Prawdopodobnie trafiłeś tutaj, aby dowiedzieć się więcej na temat Analiza korespondencji czynnikowej. W Internecie łatwo zgubić się w gąszczu stron, które mówią o Analiza korespondencji czynnikowej, a jednocześnie nie podają tego, co chcemy wiedzieć o Analiza korespondencji czynnikowej. Mamy nadzieję, że dasz nam znać w komentarzach, czy podoba Ci się to, co przeczytałeś o Analiza korespondencji czynnikowej poniżej. Jeśli informacje o Analiza korespondencji czynnikowej, które podajemy, nie są tym, czego szukałeś, daj nam znać, abyśmy mogli codziennie ulepszać tę stronę.

.

Analiza korespondencji czynnikowej
Natura
Metoda statystyczna ( d )
Akronim
AFC
Wynalazca

Analiz czynników odpowiadajcych im (AFC) jest metod statystyki z analizy danych , który moe analizowa informacje i ustalenia danych w prostoktnej matrycy i teraz w szczególnoci w celu zbadania zwizku pomidzy dwoma zmiennych jakociowych (lub kategoryczne). Zosta opracowany w latach szedziesitych XX wieku przez Jean-Paula Benzécri i jego zespó, najpierw na wydziale nauk cisych w Rennes, a nastpnie w Jussieu w Paryu w ramach wielowymiarowego laboratorium statystycznego. Jest czci rodziny analiz czynnikowych , która czy róne metody analizy duych prostoktnych tabel danych, a wszystkie maj na celu identyfikacj i priorytetyzacj czynników skorelowanych z danymi umieszczonymi w kolumnach.

Wprowadzenie

Zarówno analiza czynnikowa korespondencji (CFA), jak i analiza gównych skadowych (PCA) s wykorzystywane do opisu i priorytetyzacji zalenoci statystycznych, które mog istnie midzy osobami umieszczonymi w wierszach i zmiennymi umieszczonymi w kolumnach w rzdzie. Prostoktna tablica danych. Kada z tych dwóch metod traktuje tabel danych jako wykres punktowy w matematycznej przestrzeni majcej tyle wymiarów, ile jest kolumn w tabeli danych; staraj si rzutowa go na osie lub paszczyzny (zwane silniami), abymy mogli wizualizowa i bada jego ksztat tak dobrze, jak to moliwe, a zatem globalnie szuka korelacji. Specyfika AFC polega na tym, e uwzgldnia on jednoczenie chmur punktów reprezentujc wiersze (osoby) i drug reprezentujc kolumny (zmienne). Oprogramowanie AFC zapewnia zatem jako dane wyjciowe jedn lub wicej figur paszczyzn silni, na których znajduj si zarówno jednostki, jak i zmienne. Na przykad udzia krzyowy na giedzie: jeli 6 inwestorów rozdzieli swoje portfele midzy 10 spóek, otrzymamy od AFC kart zawierajc 16 punktów, z których 6 reprezentuje kadego z inwestorów, a 10 pozostaych reprezentuje kad z 10 spóek. Analiza dostarcza informacji o odlegoci midzy punktami, co pozwala na poredni interpretacj procentowego udziau w kapitale firm.

Technika AFC jest stosowana gównie w przypadku duych tabel zawierajcych wszystkie porównywalne dane (w miar moliwoci wszystkie wyraone w tej samej jednostce, takiej jak waluta, wymiar, czstotliwo lub inna mierzalna wielko). Moe w szczególnoci umoliwi badanie tabel awaryjnych (lub tabel krzyowych wspówystpowania). Zatem metody silni pozwalaj na przykad na analiz zagregowanej tabeli miar, odpowiadajcej zapytaniom typu w jzyku SQL lub tabele przestawne w arkuszu kalkulacyjnym (np. Microsoft Excel lub Arkusz kalkulacyjny Google ). SELECT COUNT(*) FROM .. GROUP BY (tuple_dimensions)

Zasada

Zasada tych metod polega na rozpoczynaniu od danych a priori i opisywaniu ich poprzez analiz hierarchizacji informacji zawartych w danych. W tym celu analizy czynnikowe badaj bezwadno chmury punktów, której wspórzdne s wartociami obecnymi w wierszach tabeli danych.

Morfologia chmur i rozmieszczenie punktów na kadej z tych osi bezwadnoci umoliwiaj zatem uczynienie informacji zawartych w tabeli czytelnymi i hierarchicznymi. Matematycznie, po wyrodkowaniu i zmniejszeniu tabeli danych, do której przypisalimy system mas (na przykad sumy kracowe kadego wiersza), obliczamy powizan macierz bezwadnoci i przektujemy j (informacje o rozkadzie wzdu rónych osi s reprezentowane przez histogram wartoci wasnych). Nastpnie dokonuje si zmiany bazy zgodnie z jej wektorami wasnymi, to znaczy wedug gównych osi bezwadnoci chmury punktów. Punkty pojawiajce si na kadej linii s nastpnie rzutowane na nowe osie. Wszystkie informacje s zachowane, ale s teraz hierarchiczne, o bezwadnoci po osi bezwadnoci. Histogram wartoci wasnych umoliwia zobaczenie typu dystrybucji informacji midzy rónymi osiami i zakresu wymiaru tej osi.

Pierwsza o bezwadnoci przeciwstawia si punktom, to znaczy liniom tabeli, które maj najwiksze odlegoci lub rónice. Pierwsza warto wasna bezwadnoci (zwizana z t pierwsz osi) mierzy ilo informacji obecnych wzdu tej osi, to znaczy w tej opozycji. W ten sposób analizowane s róne osie, stopniowo odtwarzajc wszystkie dane.

Istnieje kilka metod analizy korespondencji, które róni si typem reprezentacji informacji, tj. Systemem metrycznym lub masowym, z którego korzystaj.

Analiza czynnikowa korespondencji AFC opracowana przez Jean-Paula Benzecri i jego wspópracowników wykorzystuje metryk chikwadratow  : kademu wierszowi przypisana jest masa bdca jego sum kracow, badana tabela jest tabel profili wierszy, co umoliwia reprezentuj w tej samej przestrzeni w tym samym czasie dwie chmury punktów skojarzonych z wierszami i kolumnami tabeli danych; jest ponadto bardzo przyjemnie uzupeniany przez rosnco hierarchiczne narzdzia klasyfikacyjne (CAH), które pozwalaj na dostarczenie dodatkowych wizji, w szczególnoci poprzez budowanie drzew klasyfikacyjnych dla wierszy lub kolumn.

Dla kadego punktu reprezentujcego wiersze lub kolumny tabeli danych, nowa o przy nowej osi, interesuj nas jego nowe wspórzdne, cosinus kwadratowy kta z osi (co jest równowane wspóczynnikowi korelacji), a take jako jego udzia w bezwadnoci wyjanianej przez o (tj. jego udzia w tworzeniu osi).

Naley zwróci uwag na dwa szczególne ograniczenia danych: z jednej strony tabele nie mog zawiera pustych komórek, az drugiej strony dozwolone s tylko wartoci dodatnie. Ponadto, biorc pod uwag metryk chi-kwadrat stosowan przez AFC, metoda ta kadzie wikszy nacisk na linie o wysokiej sumie kracowej. Jeli uywamy tabel ilociowych i chcemy zrównoway udzia kadego wiersza w obliczeniu bezwadnoci, musimy przeksztaci tablic, aby zapewni, e kady wiersz ma równ sum kracow. Aby to zrobi, moemy podzieli kady wiersz, dodajc do niego tabel uzupenie. Do kadej wartoci dopasowujemy podwojon warto za pomoc .

Korzystajc z AFC, równie moliwe jest analizowanie tabel zawierajcych pomiary ilociowe jako wskazania jakociowe (na przykad dane kolor), tych dwóch typów nie mona miesza. Szczególnym przypadkiem drugiej kategorii tabel s tabele rozczne; kilka zmiennych stanowi kolumny: wszystkie s podzielone na kilka modalnoci, z których jedna i tylko jedna jest prawdziwa na osob. Podczas analizy czynnikowej mona doda dodatkowe dane, to znaczy nie ingerowa w obliczenia bezwadnoci, ale rzutowa na osie.

Przykad zastosowania

Na przykad grupa wyborców zostaa poproszona o podanie swojego departamentu i swojego gosu w wyborach prezydenckich. Dogodnie jest zgrupowa te dane w tabeli awaryjnej. Zaómy, e s kandydaci i dziay:

reprezentuje liczb osób, które gosoway na kandydata i w dziale j.

Czsto wykorzystujemy czstotliwo zastpujc liczb osób.

,

Zauwaamy

,

nastpnie

,

j-ta wspórzdna i-tego rzdu profilu (odpowiednio i-ta wspórzdna j-tej kolumny profilu).

Taka tabela jest tworzona w celu zbadania zwizku midzy dwiema zmiennymi kategorialnymi: Kim s preferowani kandydaci na wydziale

Odlego 2

Badanie zwizku midzy dwiema zmiennymi jakociowymi sprowadza si do zbadania rónicy midzy obserwowanymi danymi a teoretyczn sytuacj niezalenoci. Ta teoretyczna sytuacja odpowiada tabeli:

Jeli tabela danych spenia relacj niezalenoci , wówczas wszystkie profile wierszy z jednej strony i wszystkie profile kolumn z drugiej strony s równe odpowiadajcemu profilowi przecitnemu.

Rónic w niezalenoci uwzgldnia si, biorc pod uwag ogólny termin w tabeli X:

,

Moemy sprawdzi hipotez niezalenoci za pomoc testu (wymawiane jako ki kwadrat lub ki deux)

,

Ta statystyka jest równa 0 lub bliska 0, jeli obserwowane dane weryfikuj model niezalenoci. Ale ta statystyka nie odpowiada na nastpujce pytania:

  • Wedug pudeka: jakie s najbardziej niezwyke powizania midzy modalnoci wiersza i a modalnoci kolumny j
  • Wedug wiersza: które dziay maj okrelony profil gosowania
  • Kolumnami: którzy kandydaci maj okrelony elektorat

Aby odpowiedzie na te pytania, przypominamy, e analiza gównych skadowych (PCA) moe zredukowa wymiar problemów i wybra gówne efekty. Ale dopasowana jest specjalna metryka - metryka . W tym sensie AFC mona uzna za konkretn analiz gównych skadowych, której metryka zaley tylko od profilu kolumn tabeli.

Rozwamy tabeli X , z których kada linia moe by uwaane jako punkt w przestrzeni o wymiarze J , oznaczony , w którym kady wymiar jest zwizany z nagówka tabeli X . Do linii i przypisujemy wag proporcjonaln do jej wielkoci, tj . rodek cikoci pokrywa si z pochodzeniem osiach:

Rozbudowa

Technika AFC moe by stosowana w przypadku tabel innych ni tabele awaryjne . Z drugiej strony jego uycie do tych stoów zawsze wymaga okrelonych dostosowa do rodzaju stou. Moesz uy AFC na tablicach:

  • logiczny
  • logika podziau
  • nuty intensywnoci
  • znamienity
  • zmierzenie
  • jakociowy

Podczas korzystania z AFC na penych lub rozcznych tablicach Burta , w rzeczywistoci uywana jest metoda analizy wielokrotnej korespondencji (MCA) .

Bibliografia

  • Jean-Paul Benzécri, Historia i prehistoria analizy danych. , Pary, Dunod, Pary,, 159  pkt. ( ISBN  2-04-015467-1 )
  • Analiza danych / Lekcje analizy czynnikowej i rozpoznawania wzorców i prac , Dunod 1982, ( ISBN  2-04-015515-5 )
  • Linguistics and Lexicology , Dunod, reedycja 2007, ( ISBN  2-04-010776-2 )
  • Practice of Data Analysis , Dunod, 1980, ( ISBN  2-04-015732-8 )
  • Le Roux B. i Rouanet H., Geometric Data Analysis , Kluwer Academic Publishers, Dordrecht ()

Wdroenia

Bibliografia

  1. Université Paris 13,   Statystyczna analiza danych, kurs 4, Master 2 EID   [PDF] , na https://www.lpsm.paris ,(dostp 20.11.2020 ) , s.  2
  2. Histori AFC mona znale w Benzécri 1982 , s.  107 i nastpne.
  3. Nenadic, O. and Greenacre, M. (2007) Analiza korespondencji w jzyku R, z dwu- i trójwymiarow grafik: pakiet ca , Journal of Statistical Software , 20 (3)

Zobacz te

Linki zewntrzne

  • Kurs analizy wspóczynnika korespondencji (jest to podstawowy kurs AFC dla opornych)
  • Zasada analizy czynnikowej autorstwa P r Philippe Cibois, autora Co wiem na ten temat - strona zawiera równie ankiet dotyczc wolnego oprogramowania relacjonujc Trideux
  • Przykad zastosowania: silnik kartograficzny Kartoo
  • Inny przykad: Semantic Atlases (dawna witryna Semantic Atlases at the Institute of Cognitive Sciences) (zastosowanie w jzykoznawstwie)
  • Z okazji 50 th  rocznica urodzin AFC w Rennes CARME kongresowa (Correspondances Analiza i odpowiednich metod) miaa miejsce w 2011 roku na Agrocampus Rennes. Strona tego kongresu zawiera filmy z zaproszonych konferencji.


Mamy nadzieję, że informacje, które zgromadziliśmy na temat Analiza korespondencji czynnikowej, były dla Ciebie przydatne. Jeśli tak, nie zapomnij polecić nas swoim przyjaciołom i rodzinie oraz pamiętaj, że zawsze możesz się z nami skontaktować, jeśli będziesz nas potrzebować. Jeśli mimo naszych starań uznasz, że informacje podane na temat _title nie są całkowicie poprawne lub że powinniśmy coś dodać lub poprawić, będziemy wdzięczni za poinformowanie nas o tym. Dostarczanie najlepszych i najbardziej wyczerpujących informacji na temat Analiza korespondencji czynnikowej i każdego innego tematu jest istotą tej strony internetowej; kierujemy się tym samym duchem, który inspirował twórców Encyclopedia Project, i z tego powodu mamy nadzieję, że to, co znalazłeś o Analiza korespondencji czynnikowej na tej stronie pomogło Ci poszerzyć swoją wiedzę.

Opiniones de nuestros usuarios

Izabela Matusiak

Świetny post o Analiza korespondencji czynnikowej.

Sandra Janiszewski

Wreszcie! W dzisiejszych czasach wydaje się, że jeśli nie piszą artykułów składających się z dziesięciu tysięcy słów, to nie są szczęśliwi. Panowie autorzy treści, to TAK to dobry artykuł o Analiza korespondencji czynnikowej.

Martyna Morawski

Ten wpis na Analiza korespondencji czynnikowej sprawił, że wygrałem zakład, co mniej niż uzyskanie dobrego wyniku.