Odhady parametrov

Opisná charakteristika vypočítaná zo základného súboru (populácie) sa nazýva parameter. Opisná charakteristika vypočítaná z výberového súboru (vzorky) sa nazýva štatistika. Parametre sa zvyčajne označujú malým gréckym písmenom a štatistiky malým latinským písmenom. Charakteristiky základného súboru (parametre) sú pevné hodnoty, štatistiky sa menia od jedného náhodného výberu k druhému. Ku každému parametru základného súboru možno nájsť príslušnú štatistiku. Štatistiky majú podobne ako základné súbory svoje rozdelenie pravdepodobnosti – sú to náhodné premenné.

Cieľom odhadov parametrov je určiť približnú hodnotu parametra základného súboru na základe výberovej štatistiky. Údaje z náhodnej vzorky možno použiť pre odhad parametra základného súboru dvoma spôsobmi:

  1. Vypočítať hodnotu výberovej štatistiky a túto považovať za odhad parametra. Takýto spôsob odhadu parametra sa nazýva bodový odhad.
  2. Určiť nielen jeden najlepší odhad, ale celý interval možných odhadov parametra základného súboru. Takýto spôsob odhadu parametra sa nazýva intervalový odhad.


1. Bodový odhad

Bodový odhad je založený na tom, že z hodnôt výberového súboru vypočítame jedno číslo - štatistiku a tú prehlásime za odhad zodpovedajúcej charakteristiky základného súboru. Tento odhad jediným číslom sa zapisuje:

est G = g

Štatistika g, ktorú použijeme na odhad parametra G musí spĺňať kritéria:

  1. Neskreslený odhad (stredná hodnota štatistiky sa rovná charakteristike)
  2. Konzistentný odhad (s rastúcim rozsahom vzorky rastie pravdepodobnosť, že štatistika g sa líši od odhadovaného parametra len minimálne)
  3. Najlepší neskreslený odhad (zo všetkých neskreslených má najmenší rozptyl, ktorý sa nazýva štandarná chyba)
  4. Postačujúci odhad (okrem použitej štatistiky g neexistuje žiadne iná štatistika, ktorá by poskytovala ďalšie doplňujúce informácie o odhadovanej charakteristike základného súboru)

Najlepším neskresleným bodovým odhadom priemeru základného súboru:

Priemer základného súboru

je výberový priemer:

Výberový priemer


Najlepším neskresleným bodovým odhadom rozptylu základného súboru:

Rozptyl základného súboru

je výberový rozptyl:

Výberový rozptyl

Čitateľa (sumu štvorcov) delíme (n–1) namiesto n, pretože neznámy priemer základného súboru (µ) nahrádzame jeho odhadom – výberovým priemerom (výberový priemer), čím strácame jeden stupeň voľnosti (súčet odchýlok od priemeru sa musí rovnať nule). Počet stupňov voľnosti (v našom prípade n−1) je matematické obmedzenie, ktoré musíme zohľadniť pri odhade jedného parametra (v našom prípade σ2) pomocou odhadu iného, resp. iných parametrov (v našom prípade µ). Tento princíp sa uplatňuje všeobecne, pričom použitie odhadu namiesto parametra spôsobuje stratu jedného stupňa voľnosti pre každý odhadnutý parameter.


Najlepším neskresleným bodovým odhadom podielu základného súboru:

Podiel základného súboru

je výberový podiel:

Výberový podiel



2. Intervalový odhad

Intervalový odhad je reprezentovaný intervalom (Gd, Gh), ktorý s danou pravdepodobnosťou bude obsahovať skutočnú hodnotu odhadovanej charakteristiky základného súboru. Táto pravdepodobnosť sa nazýva spoľahlivosť odhadu a označuje sa 1−α. Interval, ktorého dolná a horná hranica je Gd, resp. Gh (pričom Gd < Gh), sa nazýva 100(1−α)%-ný interval spoľahlivosti charakteristiky G, čo sa zapisuje:

P(Gd, Gh) = 1−α

Intervaly spoľahlivosti nemusia byť vždy dvojstranné ale môžu byť aj jednostranné. Pri jednostranných intervaloch je zadaná buď iba horná hranica (pravostranný), alebo iba dolná hranica (ľavostranný). Jednostranné intervaly treba používať s opatrnosťou.

Šírka intervalu spoľahlivosti (teda chyba odhadu) sa zmenšuje s rastúcou veľkosťou vzorky a klesajúcou hladinou spoľahlivosti. Takisto variabilita základného súboru ovplyvňuje šírku intervalu (vyššia variabilita znamená širší interval, teda menšiu presnosť).