Analýza závislej intervalovej premennej Y na nezávislých premenných X

Analýza kovariancie (ANCOVA)

ANCOVA (ANalysis of COVAriance) spája prvky analýzy rozptylu (ANOVA) a viacnásobnej regresie. Do modelu ANOVA, ktorý skúma vzťah medzi intervalovou premennou a nominálnymi faktormi, sa pridá jeden alebo viac intervalových faktorov. Model jednofaktorovej analýzy rozptylu možno zapísať:

Yij = µi + eij

kde:
Yijj-te pozorovanie v i-tej skupine
µi – priemer i-tej skupiny
eij – príspevok j-teho pozorovania v i-tej skupine (chyba)

Ak intervalová premenná X (covariate) s hodnotami Xij má lineárny vzťah k premennej Y a regresný koeficient β medzi Y a X je rovnaký vo všetkých skupinách (regresné priamky majú rovnaký sklon), potom model ANCOVA má tvar:

Yij = µi + β(Xij−X) + e'ij

kde X je priemer premennej X. Ak je vzťah medzi X a Y významný, potom e'ij < eij, teda model ANCOVA vysvetľuje viac variability premennej Y ako model ANOVA. Ak vzťah medzi X a Y nie je významný, ANCOVA nemožno použiť. ANCOVA testuje či upravené priemery skupín sú rozdielne. Priemery sú upravené tak ako keby vo všetkých skupinách bola rovnaká (priemerná) hodnota intervalového faktora.

Predpoklady

ANCOVA si kladie rovnaké požiadavky ako ANOVAviacnásobná regresia. Tradičná ANCOVA okrem toho predpokladá, že regresný koeficient β je rovnaký vo všetkých skupinách, teda neexistuje interakcia intervalového a nominálneho faktora. Jednoduchý spôsob overenia tejto podmienky je použitie X-Y grafu. Na vertikálnu os y sa nanesie premenná Y, na horizontálnu os x premenná X, pričom pre rôzne skupiny sa použije rozdielna farba. Ak majú jednotlivé farebné priamky približne rovnaký sklon, podmienka je splnená. Formálny spôsob overenia podmienky rovnosti regresných koeficientov poskytuje model homogenity koeficientov (Homogeneity of Slopes), v ktorom je interakcia medzi nominálnym a intervalovým faktorom zabudovaná priamo v modely. V prípade, že je táto interakcia nevýznamná, treba použiť tradičnú ANCOVA. Ak je však interakcia významná (podmienka tradičnej ANCOVA je porušená), treba použiť model samostatných koeficientov (Separate Slopes), ktorý obsahuje nominálny faktor a intervalový faktor vnorený (nested) do nominálneho faktora.

Ak medzi intervalovým faktorom a závislou premennou Y je nelineárny vzťah, ktorý nemožno linearizovať pomocou transformácie (najčastejšie logaritmovanie), možno intervalovú premennú rozdeliť do kategórii (napr. vek do 20 rokov, od 20 do 30, atď.) a takto získaný faktor doplniť do ANOVA.

MANCOVA je rozšírenie ANCOVA na dve a viac závislých premenných Y.

Príklad: Existuje vzťah medzi dosiahnutým obratom obchodných zástupcov (Y) a ich vzdelaním (X1) a pohlavím (X2), pričom sa kontroluje vplyv veku (X)?