Dvojrozmerná deskriptívna štatistika - kategorické premenné

Na opisánie vzťahu medzi dvoma kategorickými premennými sa používajú:

a) Kontingenčná tabuľka

b) Kontingenčné koeficienty

c) Kumulatívny stĺpcový graf

d) Stĺpcový graf

e) 3-D stĺpcový graf



Kontingenčná tabuľka

Kontingenčna (krížová) tabuľka je metódou organizovania a analýzy údajov podľa skupín, kategórií alebo tried, ktorá umožňuje ich porovnávanie. Spája rozdelenie početnosti dvoch premenných a predstavuje rozšírenie jednoduchej frekvenčnej tabuľky. Číslo v bunke krížovej tabuľky predstavuje počet štatistických jednotiek, ktorých riadková premenná nadobúda hodnotu v hlavičke riadku (napr. pohlavie) a stĺpcová premenná nadobúda hodnotu v hlavičke stĺpca (napr. vzdelanie).

Tab. 1 Rozdelenie súboru podľa pohlavia a vzdelania

M
Muž 5 34 176 62
Žena 12 49 252 36

Z kontingenčnej tabuľky obsahujúcej absolútne početnosti je dosť ťažké robiť závery o vzťahu medzi premennými (v našej tabuľke to sťažuje skutočnosť, že žien je viac ako mužov). Z takejto tabuľky však možno ľahko zostrojiť tabuľku, ktorá obsahuje riadkové alebo stĺpcové percentá (profily). V našom príklade riadkové percentá (početnosť bunky delené súčet početností v riadku) znázorňujú percentuálne rozdelenie vzdelania u mužov a žien.

Tab. 2 Profil vzdelania u mužov a žien

M
Muž 1,81 12,27 63,54 22,38
Žena 3,44 14,04 72,21 10,32

Čím je rozdiel v riadkových (stĺpcových) profiloch väčší, tým je vzťah medzi premennými silnejší a naopak.

V prípade veľkých tabuliek (s väčším počtom riadkov a/alebo stĺpcov) sa vizuálna interpretácia tabuľky (riadkových alebo stĺpcových profilov) stáva nejasnou. V takýchto prípadoch sa používa prieskumná technika – korešpondenčná analýza.




Kontingenčné koeficienty

Na určenie sily asociácie riadkovej a stĺpcovej premennej v kontingenčnej tabuľke sa používajú kontingenčné koeficienty. Cramerov kontingenčný koeficient V (1946) predstavuje najvhodnejšiu mieru asociácie medzi dvoma nominálnymi premennými. Nadobúda hodnoty od 0 (žiadny vzťah) po 1 (dokonalý vzťah). Pri interpretácii kontingenčného koeficientu v psychologickom výskume možno použiť škálu, ktorú zaviedol Cohen (1988) pre korelačný koeficient. Korelácia menej ako 0,1 je triviálna, 0,1–0,3 malá, 0,3–0,5 stredná a nad 0,5 je veľká.

Často používaný Pearsonov kontingenčný koeficient má na rozdiel od Cramerovho V jednu zlú vlastnosť. Maximálna hodnota, ktorú môže koeficient nadobudnúť závisí od veľkosti tabuľky (v tabuľke 2×2 je to 0,707). Ďalšou výhodou Cramerovho V je konzistentnosť s korelačnými koeficientmi. V prípade dvojice binárnych premenných (zakódovaných pomocou 0 a 1), sa hodnoty Cramerovho V, Pearsonovho korelačného koeficientu, Kendallovho tau-bEta koeficientu (v absolútnej hodnote) vždy rovnajú.

Goodman-Kruskalova lambda predstavuje ďalšiu vhodnú mieru asociácie medzi stĺpcovou a riadkovou premennou. Lambda meria užitočnosť riadkovej (alebo stĺpcovej) premennej pri predpovedaní hodnoty druhej premennej. Lambda nadobúda hodnoty od 0 po 1. Hodnota 0 znamená, že poznanie hodnoty jednej premennej nehovorí nič o hodnote druhej premennej. Hodnota 1 znamená, že poznanie hodnoty jednej premennej umožňuje správne predpovedať hodnotu druhej premennej. Bez poznania hodnoty nezávislej premennej, hodnotu závislej premennej každého pozorovania možno najlepšie hádať ako jej najpočetnejšiu hodnotu. Potom početnosť najpočetnejšej kategórie závislej premennej bude predstavovať počet správnych odhadov. Hodnota Lambda with columns dependent (stĺpce sú závislé) rovná 0,4 znamená 40%-nú redukciu chýb pri predpovedaní hodnôt stĺpcovej premennej pomocou riadkovej premennej.




Kumulatívny stĺpcový graf

Kumulatívny stĺpcový graf predstavuje najlepší spôbob grafického znázornenia vzťahu medzi dvojicou kategorických premenných. V skutočnosti je to grafické zobrazenie riadkových alebo stĺpcových percent kontingenčnej tabuľky.

Kumulatívny stĺpcový graf

Obr. 1 Vzdelanie mužov a žien




Stĺpcový graf

Stĺpcový graf zobrazuje absolútne početnosti kontingenčnej tabuľky.

Stĺpcový graf

Obr. 2 Vzdelanie mužov a žien




3-D stĺpcový graf

3-D stĺpcový graf predstavuje alternatívu k stĺpcovému grafu. Cenou za jeho atraktívny výzor však môže byť menšia prehľadnosť.

3-D stĺpcový graf

Obr. 3 Vzdelanie mužov a žien