Pearsonov Chi-kvadrát test nezávislosti z roku 1904 aj Fisherov presný test z roku 1934 vychádzajú z kontingenčnej tabuľky 2×2. Číslo v bunke krížovej tabuľky (25) predstavuje počet štatistických jednotiek, ktorých jedna premenná nadobúda hodnotu v hlavičke príslušného riadku (Odpoveď = Nie) a druhá premenná nadobúda hodnotu v hlavičke stĺpca (Pohlavie = Muž).
| Muži | Ženy | |
| Nie | 25 | 40 |
| Áno | 25 | 10 |
Testy overujú nulovú hypotézu ktorá tvrdí, že dva podiely sú rovnaké, teda premenné sú nezávislé. Podiely stĺpcov v uvedenom príklade vyjadrujú podiel negatívnych odpovedí u mužov: 25/(25+25) = 0,5 a u žien: 40/(40+10) = 0,8. P-hodnota testov vyjadruje pravdepodobnosť, že za predpokladu rovnosti podielov základných súborov vyberieme náhodné vzorky, ktorých absolútna hodnota rozdielu podielov je rovná alebo väčšia ako nami zistená ( |0,5−0,8| = 0,3 ). Ak je P-hodnota malá (najčastejšie menej ako 0,05), nulovú hypotézu zamietneme a premenné považujeme za štatisticky závislé.
V praxi sa Fisherov test, najmä vďaka dojmu, že ako "presný" je najlepší, používa väčšinou nesprávne. Fisherov test, je totiž postavený na predpoklade, že všetky marginálne početnosti (súčty riadkov/stĺpcov) v kontingenčnej tabuľke sú fixné a teda rozdelenie početnosti v tabuľke je hypergeometrické. Tento predpoklad je splnený len u veľmi zriedkavých experimentov (príkladom je Fisherov čajový experiment). Väčšinou sú fixované iba riadkové početnosti (v experimente sa náhodne vybraných 100 pacientov podrobí liečbe A a 100 náhodne vybraných pacientov liečbe B, následne sa porovnáva úmrtnosť v oboch skupinách). Niekedy je fixovaná iba celková početnosť (napr. náhodne sa osloví 100 respondentov a skúma sa vzťah medzi ich pohlavím a fajčením).
Výbornou aproximáciou Fisherovho presného testu (ktorý sa tažko počíta), je Yatesov korigovaný Chi-kvadrát test.
Jeden z najvýznamnejších štatistikov súčasnosti d'Agostino v roku 1988 ukázal, že všeobecne najlepším testom na porovnávanie podielov dvoch základných súborov aj pri malých vzorkách je Studentov nepárový t-test. A to aj napriek tomu, že binárna premenná (kódovaná 0/1) nemôže mať ani približne normálne rozdelenie pravdepodobnosti.
Fisherov test možno vypočítať online. Do tabuľky sa napíšu početnosti, stlačí sa Calculate a použije sa obojstranná P-hodnota (both tails). Pre veľké vzorky (výsledok NaN), možno použiť Yatesov korigovaný Chi-kvadrát test.
Viac informácií ako samotný test poskytuje intervalový odhad rozdielu podielov, pretože určuje hranice, v ktorých sa s danou spoľahlivosťou (pravdepodobnosťou najčastejšie 95 %) nachádza rozdiel podielov základných súborov z ktorých vzorky pochádzajú.
Ako mieru asociácie medzi dvoma binárnymi premennými možno použiť: Phi, Cramerov V kontingenčný koeficient, Eta koeficient, Pearsonov, Spearmanov a Kendallov tau-b korelačný koeficient. Všetky miery nadobúdajú v prípade binárnych premenných rovnaké absolútne hodnoty od 0 (žiadny vzťah) po 1 (dokonalý vzťah). Pri interpretácii kontingenčného koeficientu v psychologickom výskume možno použiť škálu, ktorú zaviedol Cohen (1988) pre korelačný koeficient. Korelácia menej ako 0,1 je triviálna, 0,1–0,3 malá, 0,3–0,5 stredná a nad 0,5 je veľká.
Štvorec (druhá mocnina) korelačného koeficientu sa nazýva koeficient determinácie a vyjadruje podiel spoločnej variability medzi dvoma premennými.
Príklady:
Onkológ potrebuje porovnať efektívnosť dvoch liečebných metód. Vzorku pacientov náhodne rozdelí na dve skupiny. Jednu skupinu podrobí liečbe A a druhú liečbe B. Po čase zistí podiel vyliečených pacientov v oboch skupinách. Test odpovie na otázku, či môže byť zistený rozdiel v podieloch vyliečených pacientov iba náhodný alebo je štatisticky významný, teda jedna liečebná metóda je účinnejšia ako druhá.
Na základe vzorky zákazníkov treba určiť, či existuje rozdiel vo vnímaní spokojnosti so službami firmy medzi mužmi a ženami.