Tabela awaryjna

Tabela awaryjna Obraz w Infobox.
Podklasa Tablica
Wynalazca Karl Pearson

Stół awaryjny to metoda przedstawiania danych wynikających z liczby pozwalające oszacować zależność między dwoma znakami. Polega na skrzyżowaniu dwóch znaków populacji (np. Klasy wieku i punktacji) poprzez zliczenie liczby odpowiadającej koniunkcji „znak 1” i „znak 2”.

Liczby częściowe są gromadzone w podwójnej tablicy wpisów, według wiersza dla pierwszego znaku i według kolumny według drugiego znaku: jest to „tabela kontyngentów”.

To proste narzędzie jest odpowiedzią na kluczowy problem w statystyce: wykrywanie możliwych zależności między cechami odnotowanymi na osobnikach populacji. Istnienie zależności warunkowych rzeczywiście sugeruje możliwość przechowywania wyników ankiety w bardziej skondensowany sposób.

Pojęcie tabeli przestawnej , proponowane przez arkusze kalkulacyjne , jest uogólnieniem klasycznej tabeli kontyngentów.

Termin tablica kontyngencji został wprowadzony przez brytyjskiego statystykę Karla Pearsona w eseju zatytułowanym O teorii przygodności i jej związku ze stowarzyszeniem i normalną korelacją w 1904 roku.

Przykład

Badania prowadzone są na kilku postaciach, a następnie próbują ustalić, czy istnieje między nimi jakiś związek. W tym celu badamy osoby identyfikujące kilka postaci jednocześnie.

Na przykład, czy wiek i częstotliwość zachorowań są powiązane?

Wiek / pacjent 0 razy 1 raz 2 razy 3 razy Cztery razy
20 ≤ wiek <30 lat 4 osoby 2 osoby 2 osoby 1 osoba 1 osoba
30 ≤ wiek <40 lat 4 3 3 1 1
40 ≤ wiek <50 lat 7 2 1 0 0
50 ≤ wiek <60 lat 3 2 1 1 1
wiek ≥ 60 lat 0 0 0 1 1

Zastosowanie do prawdopodobieństw warunkowych

Tabela kontyngencji prowadzi naturalnie do pojęcia warunkowego prawdopodobieństwa w dyskretnym przypadku.

W przypadku tabeli p wierszy i q kolumn, jeśli oznaczymy n ij liczbę na przecięciu i-tego wiersza (z p wierszy) i j-tej kolumny, to całkowita liczba posortowanych osób według tabeli wynosi:

Podobnie możemy obliczyć sumy według wierszy i kolumn:

Częściowa siła robocza n ij stanowi procent f ij całkowitej siły roboczej:


Na ten procent możemy spojrzeć jako na prawdopodobieństwo (ponieważ ): jest to łączne prawdopodobieństwo, że osobnik badanej populacji jednocześnie spełnia kryterium związane z wierszem i ( L i ) oraz z kolumną j ( C j ).


to prawdopodobieństwo, że dana osoba spełnia warunek L i . jest prawdopodobieństwem warunkowym: jest to prawdopodobieństwo, że dana osoba odpowie na warunek L i wiedząc, że przestrzega warunku C j .


I podobnie:


Więc mamy :


co jest formułą Bayesa .

W poprzednim przykładzie n = 42 i mamy na przykład następujące wyniki:

Uwagi i odniesienia

Uwagi

  1. Zobacz na ten temat Steffen L. Lauritzen , Lectures on Contingency Tables ,2002( przedruk  1979, 1982, 1989) ( czytaj online )
  2. Karl Pearson, „  Mathematyczny wkład w teorię ewolucji  ” , w The Internet Archive , Dulau & Co.,1904

Bibliografia

Powiązane artykuły