Úlohou induktívnej štatistiky je na základe informácií získaných z náhodných vzoriek robiť závery o celých základných súboroch z ktorých vzorky pochádzajú. Základný súbor (populácia) je množina štatistických jednotiek, na ktoré majú byť závery zovšeobecnené. Výberový súbor (vzorka) je množina štatistických jednotiek vybraných z populácie, pre ktoré máme k dispozícii údaje. Populáciu v prípade predvolebného prieskumu v SR predstavuje 4 mil. oprávnených voličov, vzorku 2 000 respondentov. Populácia musí byť presne časovo, priestorovo a vecne definovaná a to ešte pred výberom vzorky. Zovšeobecňovanie výsledkov nad rámec populácie predstavuje bežnú chybu.
Základným predpokladom použitia akejkoľvek induktívnej štatistickej metódy je náhodný výber, teda výber, ktorý spĺňa dve základné vlastnosti:
1. Pravdepodobnosť zaradenia do vzorky je pre všetky štatistické jednotky nenulová.
2. Štatistické jednotky sú do vzorky vyberané nezávisle jedna od druhej.
Klasické induktívne štatistické metódy (napr. t-test, ANOVA, Chi-kvadrát test) vyžadujú jednoduchý náhodný výber, pri ktorom každá jednotka základného súboru má rovnakú pravdepodobnosť stať sa prvkom výberového súboru. Takisto sa predpokladá, že vzorka predstavuje malú časť veľkého základného súboru (teoreticky má byť nekonečne veľký, prakticky stačí viac ako 1 000 štatistických jednotiek). V prípade použitia iných foriem náhodného výberu ako je jednoduchý náhodný výber a/alebo malého základného súboru alebo vzorky predstavujúcej viac ako 5 % populácie, je nutná korekcia štandardných chýb.
Použitie induktívnej štatistiky na vzorkách, ktoré neboli získané náhodným výberom (napr. kvótne výbery) a pre cenzusy (vyšetrovania celých základných súborov) je nesprávne. V prípade cenzusu každý zistený vzťah, akokoľvek malý, predstavuje skutočný, teda významný vzťah. Zovšeobecňovanie záverov z nenáhodných výberov je nemožné. Nenáhodné vzorky možno skúmať metódami deskriptívnej štatistiky vrátane viacrozmerných prieskumných techník.
Induktívna štatistika rieši dva typy úloh:
1. Odhady parametrov.
2. Testy štatistických hypotéz.
Koľko premenných chcete skúmať súčasne?
(Čo sú to premenné?)
Príklad: Možno na základe 30 meraní tvrdiť, že priemerný čas vybavenia zákazky (X) je menej ako 4 dni?
b) Dve premenné
Príklad: Súvisí predaj výrobku (Y) a objem výdavkov na reklamu (X)?
Príklad: Existuje vzťah medzi dosiahnutým obratom obchodných zástupcov (Y) a ich vzdelaním (X1), vekom (X2) a pohlavím (X3)?