Dvojrozmerná induktívna štatistika - poradová premenná a nominálna premenná - závislé vzorky

Friedmanov test

Friedmanov test (1937) sa používa na overovanie vzťahu medzi poradovou a nominálnou premennou (faktorom). Závisle vzorky najčastejšie pozostávajú z  opakovaných meraní rovnakých objektov meraných v rôznych časových okamihoch (pred liečbou, v priebehu liečby a po liečbe), prípadne za rôznych podmienok (napr. jednému pacientovi sa postupne podávajú rôzne lieky alebo respondentom sú postupne ukázané rôzne reklamy na zhodnotenie). Závislé vzorky môžu vznikať aj vytváraním randomizovaných blokov. Randomizovaný blok (tento termín ako prvý použil Fisher v roku 1926) je tvorený objektami s podobnými vlastnosťami (napr. pacientami s podobnými vlastnosťami - vekom, pohlavím, životosprávou). Postup pri experimentoch s randomizovanými blokmi má dva kroky: 1) Zoskupenie homogénnych skúmaných objektov (napr. ľudí) do blokov. 2) V rámci bloku náhodné priradenie druhu liečby. Rozdiel medzi randomizovanými blokmi a opakovanými meraniami je ten, že v prípade opakovaných meraní sa napr. liečba neaplikuje v náhodnom poradí ale vždy v rovnakom.

Výhodou závislých výberov je ľahšie zistenie významných rozdielov v porovnaní s nezávislými. Malé ale konzistentné rozdiely tak môžu byť zachytené napriek veľkým rozdielov medzi subjektami.

Friedmanov test možno použiť ak napr. chceme na vzorke pacientov postupne odskúšať účinky 3 liekov, alebo otestovať na vzorke spotrebiteľov 3 alternatívne reklamy. Skúmaná poradová premenná bude zlepšenie stavu pacienta (1-veľmi významné až 5-žiadne), resp. hodnotenie reklamy spotrebiteľom (1-vynikajúca až 5-veľmi zlá). Friedmanov test predstavuje neparametrickú alternatívu k dvojfaktorovej analýze rozptylu a je obdobu Kruskal-Wallisovho testu pre závislé vzorky. Podstata testu spočíva v porovnaní mediánov jednotlivých skupín podľa úrovne faktora (druhu lieku, resp. alternatívy reklamy). Test odpovedá na otázku, či vo vzorke zistené rozdiely môže byť iba náhodné (medzi premennými nie je vzťah), alebo sú štatisticky významné (medzi premennými je vzťah). Testuje sa nulová štatistická hypotéza o rovnosti všetkých mediánov.

Ak je P-hodnota nižšia ako zvolená hladina významnosti (tradične 5 % = 0,05), nulová hypotéza sa zamietne. Znamená to, že rozdiel medzi aspoň jednou dvojicou mediánov vypočítaných zo vzorky je príliš veľký na to, aby mohol byť iba dôsledkom náhodného výberu, je teda štatisticky významný – medzi premennými je vzťah.

Ak je P-hodnota rovná alebo vyššia ako zvolená hladina významnosti, nulovú hypotézu nemožno zamietnuť. Znamená to, že rozdiel medzi každou dvojicou mediánov vypočítaných zo vzorky môže byť iba dôsledkom náhodného výberu, nie je teda štatisticky významný – medzi premennými nie je vzťah.

Alternatívou k Friedmanovmu testu je dvojfaktorová ANOVA (jednofaktorová ANOVA pre opakované merania) počítaná z poradí. Tento postup je ekvivalentný s Iman-Davenportovým variantom Friedmanovho testu a je presnejší ako tradičná verzia Friedmanovho testu, ktorá využíva Chi-kvadrát rozdelenie.

Kendallov koeficient zhody W predstavuje mieru zhody medzi hodnotiteľmi, ktorý posudzujú rovnaké objekty (napr. spotrebitelia hodnotia alternatívne reklamy). Hodnota koeficientu sa nachádza medzi 0 a 1, pričom 1 znamená dokonalú zhodu a 0 znamená nezhodu, alebo nezávislosť vzoriek. Medzi Kendallovým koeficientom zhody W a Friedmanovou Q-štatistikou je vzťah:

W = Q / b(k−1)

Kde b je počet blokov a k počet úrovní faktora.