Dvojrozmerná induktívna štatistika - nominálne premenné - nezávislé vzorky

Chi-kvadrát test nezávislosti

Pearsonov Chi-kvadrát test nezávislosti (1904) vychádza z kontingenčnej tabuľky a predstavuje rozšírenie Chi-kvadrát testu dobrej zhody. Chi-kvadrát test nezávislosti testuje nulovú hypotézu, ktorá vyjadruje nezávislosť premenných. To znamená, že poznanie hodnoty jednej premennej nijako nepomôže zlepšiť odhad hodnoty druhej premennej.

Tab. 1 Výskyt vedľajších účinkov pri aplikácií liečebných metód A, B, C

A B C Spolu
Áno 20 15 8 43
Nie 30 15 32 77
Spolu 50 30 40 120

Dokonalá nezávislosť v kontingenčnej tabuľke by bola iba vtedy, ak by sa stĺpcové profily rovnali, teda podiel (percento) výskytu vedľajších účinkov (v riadku) by bol rovnaký pri každej z troch použitých metód (v stĺpci). Pre početnosti v tab. 1 to neplatí (20/50 ≠ 15/30 ≠ 8/40). Možno dokázať, že pre kontingenčnú tabuľku s danými riadkovými a stĺpcovými početnosťami (uvedené v riadku a stĺpci "Spolu") sa stĺpcové (zároveň aj riadkové) profily budú rovnať jedine vtedy, keď pre všetky početnosti v tabuľku bude platiť: početnosť v bunke = riadková početnosť × stĺpcová početnosť / celkový počet (napr. v prvej hornej bunke by bolo 43×50/120 = 17,9). Takéto početnosti sa nazývajú očakávané početnosti, pretože ich očakávame za predpokladu dokonalej nezávislosti medzi riadkovou a stĺpcovou premennou.

Tab. 2 Očakávané početnosti vedľajších účinkov pri aplikácií liečebných metód A, B, C

A B C Spolu
Áno 17,9 10,8 14,3 43
Nie 32,1 19,2 25,7 77
Spolu 50 30 40 120

Tab. 2 vyjadruje dokonalú nezávislosť, pretože stĺpcové profily sa rovnajú (17,9/50 = 10,8/30 = 14,3/40 = 0,358 a 32,1/50 = 19,3/30 = 25,7/40 = 0,642). Zároveň sa rovnajú aj riadkové profily (17,9/43 = 32,1/77 = 0,417 10,8/43 = 19,3/77 = 0,25 a 14,3/43 = 25,7/77 = 0,333). Chi-kvadrát test overuje, či môžu byť rozdiely skutočných a očakávaných početností iba náhodné (premenné sú nezávislé), alebo sú príliš veľké na to, aby boli iba náhodné, teda sú štatisticky významné (medzi premennými existuje vzťah).

Ak je P-hodnota nižšia ako zvolená hladina významnosti (tradične 5 % = 0,05), nulová hypotéza sa zamietne. Znamená to, že zistený rozdiel je príliš veľký na to, aby mohol byť iba dôsledkom náhodného výberu, je teda štatisticky významný – medzi premennými je vzťah.

Ak je P-hodnota rovná alebo vyššia ako zvolená hladina významnosti, nulovú hypotézu nemožno zamietnuť. Znamená to, že zistený rozdiel môže byť iba dôsledkom náhodného výberu, nie je teda štatisticky významný – medzi premennými nie je vzťah.

Test možno vypočítať online. Do prvej tabuľky sa napíšu početnosti a stlačí sa "Calculate".

Chi-kvadrát test nezávislosti vyžaduje väčšie vzorky, pričom žiadna očakávaná početnosť nemá byť menšia ako 5. Výsledky Chi-kvadrát testu z tabuliek, ktoré obsahujú nulové početnosti treba brať veľmi skepticky.

Vo výnimočných prípadoch, v ktorých kontingenčná tabuľka vznikla z údajov pochádzajúcich z experimentu, ktorý fixoval všetky (riadkové aj stĺpcové) marginálne početnosti možno na analýzu použiť Fisher-Freeman-Haltonov test, ktorý predstavuje rozšírenie Fisherovho presného testu na kontingenčné tabuľky m×n. Väčšinou sú však fixované iba riadkové početnosti (v experimente sa náhodne vybraných 100 pacientov podrobí liečbe A a 100 náhodne vybraných pacientov liečbe B, následne sa porovnáva úmrtnosť v oboch skupinách). Niekedy je fixovaná iba celková početnosť (napr. náhodne sa osloví 100 respondentov a skúma sa vzťah medzi ich pohlavím a fajčením). V takýchto prípadoch je použitie Fisherovho presného testu nesprávne (vypočítaná P-hodnota je príliš vysoká).

Na určenie sily asociácie riadkovej a stĺpcovej premennej v kontingenčnej tabuľke sa používajú kontingenčné koeficienty. Za predpokladu, že vzorka bola z populácie vybraná náhodným výberom sú vypočítané koeficienty najlepšími bodovými odhadmi neznámych parametrov, pričom možno zostrojiť aj ich intervalové odhady. Testy významnosti kontingenčných koeficientov a Pearsonov Chi-kvadrát test nezávislosti sú úplne identické testy.

Príklady:
Bude výskyt vedľajších účinkov nižší pri použití novej liečebnej metódy v porovnaní so staršími metódami?
Existuje súvislosť medzi pohlavím spotrebiteľa a farbou produktu, ktorý preferuje?