Opisné charakteristiky

Opisná charakteristika predstavuje číslo vypočítané podľa príslušného vzorca zo štatistického súboru. Cieľom opisných charakteristík je charakterizovať súbor.

Opisné charakteristiky sa delia na tri skupiny:

a) Miery polohy

b) Miery variability

c) Miery tvaru




a) Miery polohy (Stredné hodnoty)

Aritmetický priemer (Mean)
Najznámejšou strednou hodnotou je aritmetický priemer, ktorý sa vypočíta ako súčet všetkých hodnôt vydelený ich počtom:

Aritmetický priemer



Geometrický priemer (Geometric Mean)
Geometrický priemer je vhodnejšou mierou polohy ako aritmetický priemer pre pomerovú premennú (špeciálny typ intervalovej premennej s bodom absolútnej nuly, pod ktorú hodnota premennej nemôže klesnúť - napr. hmotnosť, výška, vek) s pozitívnou šikmosťou (napr. rozdelenie príjmov obyvateľstva). Geometrický priemer sa často používa v ekonómii a biológii, keď je premenná skôr súčinom ako súčtom mnohých malých efektov (logaritmus premennej má bližšie k symetrickému normálnemu rozdeleniu ako samotná premenná). Vypočíta sa ako n-tá odmocnina súčinu všetkých hodnôt:

Geometrický priemer



Harmonický priemer (Harmonic Mean)
Harmonický priemer sa používa na výpočet priemernej rýchlosti ak sú vzdialenosti konštantné a čas premenlivý. Priemerná rýchlosť auta, ktoré prešlo vzdialenosť 50 km rýchlosťou 90 km/h a ďalších 50 km rýchlosťou 130 km/h sa rovná podielu celkovej dráhy a času: 100/(50/90+50/130)=106,4 čo je ekvivalentné harmonickému priemeru dvoch rýchlostí: 2/(1/90+1/130)=106,4. V prípade rôznych vzdialeností a rovnakých časov sa však musí použiť aritmetický priemer. Priemerná rýchlosť auta, ktoré išlo 2 hodiny rýchlosťou 90 km/h a ďalšie 2 hodiny 130 km/h sa rovná: (90+130)/2=110 km/h. Do výpočtu harmonického priemeru možno zahrnúť iba nenulové hodnoty:

Harmonický priemer



Medián (Median)
Medián Medián predstavuje strednú hodnotu súboru, ktorý je zoradený od najmenšej po najväčšiu hodnotu. V prípade párneho počtu hodnôt je medián aritmetický priemer hodnôt na miestach n/2 a n/2+1. Medián, na rozdiel od priemeru, nie je ovplyvnený extrémnymi hodnotami. Medián predstavuje najpoužívanejší kvantil. Kvantil súboru je hodnota k-tej časti, ak je súbor rozdelený na n rovnakých častí (hodnoty sú zoradené od najmenšej po najväčšiu). Okrem mediánu sa často používajú kvartily (delia súbor na 4 časti) a percentily (delia súbor na 100 častí). Medián je druhý kvartil, resp. 50. percentil.



Modus (Mode)
Modus Modus predstavuje najčastejšie sa vyskytujúcu hodnotu premennej. Rozdelenie, ktoré má iba jeden vrchol, teda jedno lokálne maximum, ktoré je zároveň globálne, sa nazýva unimodálne. Štatistické programy registrujú jeden alebo žiadny modus.




b) Miery variability

Variačné rozpätie (Range)
Najjednoduchšou mierou variability je variačné rozpätie, ktoré sa vypočíta ako rozdiel medzi najväčšou a najmenšou hodnotou súboru:

Variačné rozpätie



Medzikvartilové rozpätie (Interquartile Range)
Predstavuje rozdiel medzi tretím a prvým kvartilom (75. a 25. percentilom), čo reprezentuje oblasť stredných 50 percent hodnôt premennej. Táto miera variability nie je ovplyvnená extrémnymi hodnotami premennej.



Rozptyl (Variance)
Najpoužívanejšou mierou variability je rozptyl, ktorý sa rovná priemernému štvorcu odchýlky hodnoty od priemeru. Čím je rozptyl väčší, tým sa údaje viac odchyľujú od priemeru. Rozptyl sa vypočíta podľa vzorca:

Rozptyl



Štandardná odchýlka (Standard Deviation)
Dôsledkom nutného umocňovania je vypočítaná hodnota rozptylu v štvorcoch pôvodných jednotiek. Aby sa odstránil neblahý vplyv umocňovania, rozptyl sa odmocní, čím sa vypočíta štandardná odchýlka:

Štandardná odchýlka

Štandardná odchýlka sa dá interpretovať dvoma spôsobmi. Po prvé je to priemerný rozdiel medzi hodnotami a priemerom pri ignorovaní znamienok. Po druhé je to priemerný rozdiel medzi každými dvoma hodnotami pri ignorovaní znamienok.



Variačný koeficient (Coefficient of Variation)
Variačný koeficient predstavuje relatívnu mieru variability. Používa sa na porovnávanie variability medzi súbormi dát s odlišnými priemermi. Variačný koeficient výšky vzorky ľudí bude rovnaký bez ohľadu na to, či výšku budeme vyjadrovať v centimetroch alebo metroch. Vypočíta sa ako podiel štandardnej odchýlky a priemeru.

Variačný koeficient



Koeficient disperzie (Coefficient of Dispersion)
Koeficient disperzie predstavuje relatívnu mieru variability, ktorá je iba málo ovplyvnená extrémnymi hodnotami.

Koeficient disperzie




c) Miery tvaru

Šikmosť (Skewness)
Šikmosť meria smer a stupeň asymetrie rozdelenia premennej a vypočíta sa:

Šikmosť

Kladná hodnota (pravostranná šikmosť) znamená, že priemer je väčší ako medián, teda väčšina hodnôt je menšia ako priemer. Záporná hodnota (ľavostranná šikmosť) znamená, že medián je väčší ako priemer a teda väčšina hodnôt je väčšia ako priemer. Šikmosť rovná 0 znamená symetrické rozdelenie, teda priemer a medián sa rovnajú. Na obr. 1 až obr. 3 sú znázornené trojuholníkové rozdelenia početností s rovnakým priemerom (10), rozptylom (2) aj špicatosťou (2,4), líšiace sa iba šikmosťou. Na horizontálnej osi (x) histogramov sú hodnoty premennej a na vertikálnej osi (y) relatívne početnosti (percentá) hodnôt premennej v príslušných intervaloch na osi x.

Symetrické rozdelenie

Obr. 1 Symetrické rozdelenie


Pozitívna (pravostranná) šikmosť

Obr. 2 Rozdelenie s pozitívnou šikmosťou (0,55)


Negatívna (ľavostranná) šikmosť

Obr. 3 Rozdelenie s negatívnou šikmosťou (–0,55)



Špicatosť (Kurtosis)
Špicatosť meria hustotu chvostov rozdelenia premennej, teda charakterizuje výskyt extrémne vysokých a extrémne nízkych hodnôt. Špicatosť sa vypočíta podľa vzťahu:

Špicatosť

Špicatosť rozdelenia sa porovnáva so špicatosťou normálneho rozdelenia, ktorého špicatosť sa rovná 3. Unimodálne rozdelenia, ktorých špicatosť je väčšia, majú hustejšie chvosty (výskyt extrémnych hodnôt je častejší) ako normálne rozdelenie. Takéto rozdelenia majú vyšší vrchol. Unimodálne rozdelenia, ktorých špicatosť je menšia ako 3, majú nižšie chvosty, teda výskyt extrémnych hodnôt je menej častý ako u normálneho rozdelenia. Takéto rozdelenia sú plochejšie. Na obr. 4 až obr. 7 sú uvedené štyri symetrické rozdelenia s rovnakým priemerom (0) a rovnakým rozptylom (5/3), ktoré sa líšia iba špicatosťou.

Normálne rozdelenie

Obr. 4 Normálne rozdelenie so špicatosťou 3


Studentovo rozdelenie

Obr. 5 Studentovo rozdelenie (s piatimi stupňami voľnosti) so špicatosťou 9


Trojuholníkové rozdelenie

Obr. 6 Trojuholníkové rozdelenie so špicatosťou 2,4


Rovnomerné rozdelenie

Obr. 7 Rovnomerné rozdelenie so špicatosťou 1,8