Twierdzenie Cochrana

W matematyce , Cochran twierdzenie dotyczy projekcję Gaussa losowego wektora na ortogonalne podzbiorów wektorów skończonych wymiarach. Ustanawia prawo i niezależność tych projekcji i ich norm euklidesowych. Twierdzenie to jest wykorzystywane w statystyce do uzasadnienia zbieżności w prawie testów statystycznych i jest kluczowym argumentem dla podstawowych wyników modelu liniowego .

Stwierdzenie twierdzenia

Ogólna wersja tego twierdzenia jest następująca:

Twierdzenie Cochrana - Niech $X$ prawo wektora losowego Gaussa (gdzie , $σ$ $> 0$ i $Id$ $n$ jest macierzą jednostkową o rozmiarze $n$ ) i $F$ $1$ $, ...,$ $F$ $m$ podprzestrzeni , ortogonalnych od dwóch do dwóch i sum . $\ mathbb {R} ^ {n}$ ${\ mathcal {N}} (\ mu, \ sigma ^ {2} {\ mathcal {Id}} _ {n})$ ${\ displaystyle \ mu \ in \ mathbb {R} ^ {n}}$ $\ mathbb {R} ^ {n}$ $\ mathbb {R} ^ {n}$

Następnie, jeśli oznaczymy dla $1 \leq i \leq m$ , $P F i$ macierz rzutu ortogonalnego na $F i$ oraz $d i$ wymiar $F i$ :

wektory losowe $P F 1 X , ..., P F m X$ są dwa na dwa niezależne i mają odpowiednie prawa ; ${\ displaystyle {\ mathcal {N}} (P_ {F_ {1}} \ mu, \ sigma ^ {2} P_ {F_ {1}}), \ ldots, {\ mathcal {N}} (P_ {F_ {m}} \ mu, \ sigma ^ {2} P_ {F_ {m}})}$
rzeczywiste zmienne losowe są niezależne dwa na dwa i mają odpowiednie rozkłady $χ$ $2$ $($ $d$ $1$ $), ...,$ $χ$ $2$ $($ $d$ $m$ $)$ . ${\ displaystyle {\ Frac {\ | P_ {F_ {1}} (X- \ mu) \ | ^ {2}} {\ sigma ^ {2}}}, \ ldots, {\ Frac {\ | P_ { F_ {m}} (X- \ mu) \ | ^ {2}} {\ sigma ^ {2}}}}$

Uproszczona, ale równoważna wersja to następująca instrukcja:

Twierdzenie Cochrana (uproszczone) - Niech $X będzie$ losowym wektorem prawa Gaussa, a $F$ wektorową podprzestrzenią wymiaru $d$ , $F$ $⊥$ jego ortogonalną i $P$ $F$ $,$ $P$ $F$ $⊥$ macierzami rzutów ortogonalnych na $F$ $,$ $F$ $⊥$ . Następnie : $\ mathbb {R} ^ {n}$ ${\ displaystyle {\ mathcal {N}} (0 _ {\ mathbb {R} ^ {n}}, \ mathcal {Id} _ {n})}$ $\ mathbb {R} ^ {n}$

wektory losowe $P F X , P F ⊥ X$ są niezależne i mają odpowiednie prawa ; ${\ displaystyle {\ mathcal {N}} (0 _ {\ mathbb {R} ^ {n}}, P_ {F}), {\ mathcal {N}} (0 _ {\ mathbb {R} ^ {n }} , P_ {F ^ {\ perp}})}$
rzeczywiste zmienne losowe $| P F X | 2 , | P F ⊥ X | 2$ są niezależne i mają odpowiednie prawa $χ 2 ( d ) , χ 2 ( n - d )$ .

Demonstracja

Możemy przejść z wersji uproszczonej do wersji ogólnej twierdzenia, stosując rekurencję na liczbie podprzestrzeni wektorowych (które ingerują w stwierdzenie) i dokonując zmiany zmiennej . Wystarczy zatem zademonstrować wersję uproszczoną. ${\ displaystyle X '= {\ frac {X- \ mu} {\ sigma}} \ sigma {\ mathcal {N}} (0 _ {\ mathbb {R} ^ {n}}, \ mathm {identyfikator} _ { nie})}$

Notujemy z . Wtedy iw konsekwencji $P$ $F$ $X$ i $P$ $F$ $⊥$ $X$ są wektorami Gaussa. Ponieważ jest po przekątnej bloków, wektory losowe $P$ $F$ $X$ i $P$ $F$ $⊥$ $X$ są niezależne i mają odpowiednie prawa i . $Y = \ lewo ({\ begin {macierz} P_ {F} X \\ P _ {{F ^ {\ perp}}} X \ end {macierz}} \ po prawej) = AX$ $A = \ lewo ({\ begin {macierz} P_ {F} \\ P _ {{F ^ {\ perp}}} \ end {macierz}} \ po prawej) \ in {\ mathcal {M}} _ {{ 2n , n}} ({\ mathbb {R}})$ ${\ displaystyle Y \ sim {\ mathcal {N}} (0 _ {\ mathbb {R} ^ {2n}}, AA ^ {t})}$ $AA ^ {t} = \ po lewej ({\ początek {matrycy} P_ {F} & 0 \\ 0 & P _ {{F ^ {\ perp}}} \ koniec {macierz}} \ po prawej)$ ${\ mathcal {N}} (0 _ {{{\ mathbb {R}} ^ {n}}}, P_ {F})$ ${\ mathcal {N}} (0 _ {{{\ mathbb {R}} ^ {n}}}, P _ {{F ^ {\ perp}}})$

Jako normę rzutowania wystarczy przyjąć $( u 1 , ..., u d )$ ortonormalną bazę $F$ i $( u d + 1 , ..., u n )$ ortonormalną bazę $F ⊥$ . Następnie

|| P_ {F} X || ^ {2} = \ suma _ {{i = 1}} ^ {d} \ langle X, u_ {i} \ rangle ^ {2} \ qquad {\ text {i} } \ qquad || P _ {{F ^ {\ perp}}} X || ^ {2} = \ suma _ {{i = d + 1}} ^ {n} \ langle X, u_ {i} \ rangle ^ {2}.

Jednak (w przypadku $U$ macierz przejścia od bazy kanonicznej do bazy $($ $u$ $1$ $, ...,$ $u$ $n$ $)$ ) (ponieważ $U$ jest ortogonalne). Zatem zmienne losowe są wyśrodkowane względem normalnych, a ponieważ macierz kowariancji jest przekątna, są one niezależne. Z definicji prawa $χ$ $2$ , $(\ langle X, u_ {i} \ rangle) _ {{1 \ leq i \ leq n}} = U ^ {t} X$ ${\ displaystyle \ sim {\ mathcal {N}} (0 _ {\ mathbb {R} ^ {n}}, U \ mathrm {Id} _ {n} U ^ {t}) = {\ mathcal {N} } (0 _ {\ mathbb {R} ^ {n}}, \ mathrm {Identyfikator} _ {n})}$ $\ langle X, u_ {i} \ rangle$

|| P_ {F} X || ^ {2} \ sim \ chi ^ {2} (d) \ qquad {\ text {et}} \ qquad || P _ {{F ^ {\ perp}}} X | | ^ {2} \ sim \ chi ^ {2} (nd)

Aplikacje

Nieobciążony estymator wariancji

Podajemy sobie próbkę $X = ( X 1 , ..., X n ) T$ o rozkładzie normalnym . Oznaczamy średnią empiryczną i nieobciążoną wariancję empiryczną Wtedy ${\ mathcal {N}} (\ mu, \ sigma ^ {2})$ $\ overline {X} _ {n} = {\ frac {1} {n}} (X_ {1} + ... + X_ {n}) = {\ frac {1} {n}} \ suma _ { {i = 1}} ^ {n} X_ {i}$ ${\ displaystyle {\ widetilde {S}} _ {n} ^ {2} = {\ frac {1} {n-1}} \ lewo ((X_ {1} - {\ overline {X}} _ {n }) ^ {2} + ... + (X_ {n} - {\ overline {X}} _ {n}) ^ {2} \ po prawej) = {\ frac {1} {n-1}} \ suma _ {i = 1} ^ {n} (X_ {i} - {\ overline {X}} _ {n}) ^ {2}.}$

{\ displaystyle {\ frac {(n-1)} {\ sigma ^ {2}}} {\ widetilde {S}} _ {n} ^ {2} = {\ frac {1} {\ sigma ^ {2 }}} \ lewo ((X_ {1} - {\ overline {X}} _ {n}) ^ {2} + ... + (X_ {n} - {\ overline {X}} _ {n} ) ^ {2} \ prawo) \ sim \ chi ^ {2} (n-1).}

Uwaga: straciliśmy jeden stopień dla prawa chi-kwadrat.

Demonstracja

Stosujemy twierdzenie Cochrana z wektorem podprzestrzeni $F = Vect (1 n )$ (gdzie $1 n$ jest wektorem kolumnowym składającym się tylko z 1) do losowego wektora $Y$ $=$ $\ mathbb {R} ^ {n}$ $1 / σ ( X 1 - μ , ..., X n - μ ) t = 1 / σ ( X - μ 1 n )$ prawa . ${\ displaystyle {\ mathcal {N}} (0 _ {\ mathbb {R} ^ {n}}, \ mathcal {Id} _ {n})}$

Macierz projekcji na $F$ to $P F = 1 n (1 t n 1 n ) -1 1 t n = 1 / nie 1 n 1 t n$ a jeden na $F ⊥$ to zatem $P F ⊥ = Id n - P F$ .
Rzut $Y$ na $F$ to

$P F Y = 1 / σ ( P F X - μ P F 1 n ) = 1 / σ (X n - μ , ... , X n - μ ) t$ .

Rzut $Y$ na wschód . ${\ styl wyświetlania F ^ {\ bot}}$ ${\ displaystyle P_ {F ^ {\ perp}} Y = Y-P_ {F} Y = {\ frac {1} {\ sigma}} (X_ {1} - {\ overline {X}} _ {n} , \ kropki, X_ {n} - {\ nadkreślenie {X}} _ {n}) ^ {t}}$

Zgodnie z twierdzeniem Cochrana . $|| P _ {{F ^ {\ perp}}} Y || ^ {2} = {\ frac {(n-1)} {\ sigma ^ {2}}} \ widetylda {S} _ {n} ^ {2} \ sim \ chi ^ {2} (n-1)$

Test chi-kwadrat

Twierdzenie Cochrana umożliwia ustalenie zbieżności w prawie niektórych testów statystycznych. Tak jest w przypadku testu odpowiedniości lub testu niezależności. Jest również używany w ramach modelu liniowego do uzyskania niezależności i faktu, że ma rozkład $χ$ $2$ $($ $n - p$ $)$ gdzie $p$ $- 1$ jest liczbą zmiennych. ${\ displaystyle {\ widehat {\ beta}}}$ ${\ displaystyle {\ widehat {\ sigma}} ^ {2}}$ ${\ displaystyle {\ frac {np} {{\ sigma} ^ {2}}} {\ widehat {\ sigma}} ^ {2}}$

Uwagi i referencje

„ Twierdzenie Cochrana i zastosowania w statystyce ” [PDF] , na perso.univ-rennes1 (dostęp 22 marca 2015 )

Zobacz również

Powiązane artykuły

Link zewnętrzny

Twierdzenie i jego zastosowania