Jednorozmerná deskriptívna štatistika - číselná premenná

Na opis číselnej premennej sa používajú:

a) Opisné charakteristiky

b) Histogram

c) Škatuľový graf

d) Histogram doplnený o škatuľový graf



Histogram

Histogram predstavuje typ stĺpcového grafu určený na znázornenie rozdelenia intervalovej premennej. Graf na osi y zobrazuje početnosti hodnôt premennej v intervaloch jej hodnôt na osi x.

Histogram

Obr. 1 Rozdelenie veku v súbore




Škatuľový graf

Škatuľový graf (Box Plot) znázorňuje rozdelenie hodnôt premennej pomocou opisných charakteristík.

Škatuľový graf

Obr. 2 Rozdelenie veku v súbore

Horizontálna čiara predstavuje medián (50. percentil), horná hrana škatule 75. percentil a dolná hrana 25. percentil. Dĺžka obdĺžnika predstavuje medzikvartilové rozpätie (IQR), teda stredných 50 % hodnôt súboru. Význam hornej a dolnej čiarky závisí od typu škatuľového grafu. V najjednoduchšej podobe predstavuje horná čiarka maximum a dolná čiarka minimum. Horná čiarka však často znázorňuje 95. percentil a dolná čiarka 5. percentil. V najzložitejšej podobe grafu horná čiarka predstavuje 75. percentil + 1,5 × IQR (neextrémne maximum) a dolná čiarka 25. percentil − 1,5 × IQR (neextrémne minimum). Odľahlé pozorovania (outliers) ležiace mimo týchto intervalov môžu byť znázornené ako body. Škatuľový graf možno umiestniť vertikálne (obr. 2), alebo horizontálne (hodnoty premennej budú na osi x).



Histogram doplnený o škatuľový graf

Predchádzajúce dva grafy možno skombinovať do jedného, čím sa zvyšuje množstvo informácií obsiahnutých v jednom prehľadnom grafe.

Histogram doplnený o škatuľový graf

Obr. 3 Rozdelenie veku v súbore