Cochranov Q test (1950) sa používa v prípade viacerých závislých vzoriek binárnej premennej. Testuje, či závislé vzorky majú štatisticky významne odlišné priemery binárnej premennej (teda podiely, percentá). Test predstavuje rozšírenie McNemarovho testu na viac ako dve závislé vzorky. Cochranov Q test je v podstate alternatívou jednofaktorovej analýzy rozptylu pre opakované merania pre závislú binárnu premennú. Test možno použiť aj na testovanie zmien podielov v odlišných časových okamihoch v rovnakej vzorke. Q test sa typicky používa na porovnanie zložitosti otázok dotazníka, ktoré môžu byť zodpovedané buď správne alebo nesprávne. Ak je Q test významný (P < 0,05), znamená to, že otázky sú rôzne náročné, pretože percentá správne zodpovedaných otázok sa štatisticky významne líšia.
Stuart-Maxwellov test (Stuart, 1955; Maxwell, 1970) sa používa na testovanie rozdielov hodnotení dvoch hodnotiteľov (alebo nominálnej premennej pri párových odpovediach). Test sa používa na analýzu zhody medzi hodnotiteľmi, diagnostickými testami, pozorovateľmi, sudcami alebo expertmi. Test vychádza z kontingenčnej tabuľky n×n.
Tab. 1 Hodnotenie hodnotiteľom 1 (riadky) a hodnotiteľom 2 (stĺpce)
| A | B | C | D | Spolu | |
| A | 8 | 5 | 1 | 0 | 14 |
| B | 3 | 6 | 3 | 2 | 14 |
| C | 2 | 4 | 5 | 1 | 12 |
| D | 0 | 1 | 2 | 7 | 10 |
| Spolu | 13 | 16 | 11 | 10 | 50 |
Čísla na diagonále (8, 6, 5, 7) predstavujú počty prípadov, keď sa obaja hodnotitelia zhodli. Podiel súčtu diagonálnych prvkov a celkového počtu (50) sa nazýva podiel celkovej zhody. Políčka mimo diagonály predstavujú prípady, keď sa nezhodli (napr. 5 prípadov keď hodnotiteľ 1 určil A a hodnotiteľ 2 určil B). Test overuje marginálnu homogenitu, tzn. či obaja hodnotitelia používajú jednotlivé kategórie rovnako často. Marginálna homogenita znamená, že súčty riadkov sa rovnajú príslušným súčtom stĺpcov (v našej tabuľke 14 a 13, 14 a 16, 12 a 11, 10 a 10). Test odpovie napr. na otázku, či môžu byť rozdiely pri stanovovaní diagnóz zistené vo vzorke iba náhodné, alebo sú štatisticky významné. Štatisticky významná Stuart-Maxwellová štatistika (P < 0,05) znamená, že hodnotitelia systematicky nesúhlasia aspoň v jednej kategórií. V prípade tabuľky 2×2, je výsledok testu identický s McNemarovým testom.
McNemarov test (1947) sa tradične používal na porovnávanie párových podielov. V súčasnosti sa uprednostňuje presná alternatíva podľa Liddella (1983). McNemarov test zovšeobecnený na analýzu nominálnej premennej sa nazýva test symetrie. Používa sa pri analýze zhody dvoch hodnotiteľov, ktorý nezávisle od seba hodnotia rovnaké objekty. Štatisticky významný výsledok testu (P < 0,05) znamená nerovnomerné rozloženia nezhody medzi jednotlivými kategóriami (hodnotitelia sa nezhodujú v niektorých kategóriách viac ako v iných). V prípade porovnávania dvoch kategórií (napr. vyhovel / nevyhovel na skúške) sú výsledky McNemarovmu a Maxwellovho testu identické. V takýchto situáciách však treba použiť Liddelov presný test.
Cohenovo Kapa z roku 1960 predstavuje veľmi kontroverznú mieru asociácie medzi dvomi nominálnymi meraniami rovnakých objektov. Kapa najčastejšie predstavuje mieru zhody dvoch hodnotiteľov pri zaraďovaní objektov do kategórií. Test možno použiť napr. na overenie zhody dvoch lekárov pri určovaní diagnózy. Obaja nezávisle na sebe s rovnakými dostupnými informáciami určia diagnózy pacientov vo vzorke. Kapa testuje, či početnosti na diagonále sú významne veľké.
Sila zhody meraná pomocou Kapa podľa Landisa a Kocha (1977)
| Kapa | Sila zhody |
|---|---|
| – 0,2 | Nízka |
| 0,2 – 0,4 | Mierna |
| 0,4 – 0,6 | Stredná |
| 0,6 – 0,8 | Dobrá |
| 0,8 – 1 | Veľmi dobrá |
Štatisticky významná hodnota Kapa (P < 0,05) znamená zamietnutie nulovej hypotézy, ktorá vyjadruje nezávislosť hodnotení (κ=0). Znamená to, že zhoda zistená vo vzorke je príliš veľká na to, aby ju bolo možné pripísať iba náhode (problém je v tom, že hodnotitelia sú závislí, pretože hodnotia tie isté objekty hoci nezávisle jeden na druhom). Aby bol test významnosti Kapa použiteľný, vzorky nesmú byť príliš malé. Hodnoty Kapa z rozdielnych štúdií nemožno spoľahlivo porovnávať, pretože Kapa je citlivé na zastúpenosť jednotlivých kategórií. Napr. ak je jedna kategória viac zastúpená v jednej štúdii ako v druhej, potom Kapa môže indikovať rozdiel v zhode hodnotiteľov, ktorý však nie je zapríčinený samotnými hodnotiteľmi.