Faktorová analýza

Faktorovú analýzu (FA) vynašiel v roku 1904 Spearman. FA je prieskumná technika, ktorá hľadá hypotetické, nepozorovateľné, latentné premenné (spoločné faktory) z ktorých boli pozorované premenné vygenerované. FA redukuje veľké množstvo pôvodných premenných ako napr. postojových výrokov na menší počet faktorov. Každý faktor pozostáva zo skupiny súvisiacich výrokov, ktoré formujú viacrozmernosť postoja. V prieskume hodnotenia televíznych programov, 750 respondentov použilo 58 hodnotiacich výrokov na popísanie 61 rozdielnych programov. FA redukovala 58 výrokov na 9 faktorov. Jeden z faktorov sa nazýval "informácia" a obsahoval postojové výroky o stupni vedeckosti programu, či prinútil divákov myslieť, či obsahoval vzdelávacie prvky alebo mal iba zabaviť. 58 možných výrokov k televíznemu programu bolo redukovaných na 9 základných dimenzií, využitím ktorých možno ohodnotiť každý program.

FA predpokladá, že hodnota každej pozorovanej premennej sa rovná lineárnej kombinácii (váženému priemeru) spoločných faktorov, ktoré prispievajú k variabilite aspoň dvoch pozorovaných premenných a unikátneho faktora, ktorý prispieva k variabilite iba danej jednej pozorovanej premennej. Pre unikátne faktory, ktorých je toľko, koľko je pozorovaných premenných platia dva kritické predpoklady: 1) Unikátne faktory sú medzi sebou nekorelované 2) Unikátne faktory sú nekorelované so spoločnými faktormi. FA vychádza z korelačnej matice, ktorá obsahuje hodnoty korelačných koeficientov každej dvojice pozorovaných premenných. Túto korelačnú maticu rozkladá na dve matice: spoločnú časť (Rc) a unikátnu časť (Ru), ktoré zodpovedajú spoločným a unikátnym faktorom. FA odhaduje a modeluje maticu Rc.

Úlohou analytika, ktorá si vyžaduje šikovnosť je určenie vhodného počtu faktorov. Na jednej strane čím je faktorov viac, tým je vysvetlená väčšia časť variability pôvodných premenných. Na druhej strane čím je počet faktorov menší, tým sa ľahšie interpretujú. Výskumník musí nájsť kompromis medzi týmito dvoma protikladmi. Faktory možno extrahovať viacerými metódami (Analýza hlavných komponentov sa často pokladá za jednu z metód FA). Aj preto FA neposkytuje jediné riešenie. Dvaja výskumníci môžu nájsť rozdielne faktory, ktoré sa interpretujú odlišne a pritom vyhovujú pôvodným údajom.

Interpretácia zistených faktorov pozostáva v posúdení (veľkostí a znamienok) korelácií medzi jednotlivými faktormi a originálnymi premennými. Vo FA sa korelácie medzi premennými a faktormi nazývajú factor loadings, teda faktorové nabitie. Faktory po extrakcii (slabo) korelujú s väčším počtom pôvodných premenných, čo prakticky znemožňuje ich interpretáciu. Tento problém sa rieši rotáciou. Rotácia je aplikáciou lineárnej transformácie na faktory s cieľom uľahčiť interpretáciu faktorov. FA nachádza dimenzie (súradnice) v podpriestore priestoru definovanom originálnymi premennými. Tieto súradnice sú reprezentované osami, ktoré sú vzájomne nezávislé. Ak napr. analyzujeme tri premenné, tieto sú reprezentované 3-D priestorom, v ktorom každá premenná predstavuje jednu os. Ak všetky objekty ležia blízko roviny (2-D priestor), FA odhalí dva faktory. Osi tejto roviny možno rotovať v priestore pri zachovaní 90-stupňového uhla medzi nimi tak, že sa relatívna poloha objektov v rovine nezmení. Cieľom rotácie je zmeniť korelácie (súradnice) medzi faktormi a originálnymi premennými tak, aby sa každá korelácia buď zvýšila alebo znížila. Výsledkom je, že každý faktor vysoko koreluje s malým počtom pôvodných premenných, čo umožňuje interpretáciu faktorov. Existuje niekoľko rotačných techník, ktoré sú zo štatistického pohľadu rovnako dobré. Použiť teda treba ten spôsob, ktorý poskytuje najjednoduchšie interpretovateľné výsledky. Najbežnejšou rotačnou metódou je VARIMAX (rozptyl maximalizujúca rotácia). VARIMAX minimalizuje počet premenných, ktoré vysoko korelujú s jednotlivými faktormi. QUARTIMAX je rotačná metóda, ktorá minimalizuje počet faktorov potrebných na vysvetlenie každej premennej. EQUAMAX je rotačnou metódou, ktorá kombinuje VARIMAX a QUARTIMAX. EQUAMAX minimalizuje počet premenných vysokokorelovaných s jedným faktorom a počet faktorov potrebných na vysvetlenie premennej. Faktory po extrakcii sú vždy vzájomne nezávislé. Ak sú faktory následne rotované pomocou ortogonálnych transformácií (ako tri hore uvedené), zostávajú nezávislé aj po rotácií. Okrem rotácií, ktoré produkujú ortogonálne faktory existujú rotácie, ktoré produkujú korelované faktory. Takéto rotácie sa nazývajú nepriame (Oblique).

Častou chybou je aplikácia FA bez predchádzajúceho posúdenia korelačnej matice (hodnôt korelačných koeficientov). V prípade, že sú korelácie veľmi malé, nemá zmysel zaoberať sa FA (vysvetľovať neexistujúce korelácie). Okrem nevyhnutného posúdenia korelačnej matice (mala by obsahovať vysoké korelácie, či už pozitívne alebo negatívne) je vhodné vypočítať Gleason-Staelinovu mieru redundancie (nadbytočnosti) Phi, ktorá meria silu vzájomných vzťahov medzi premennými. Interpretuje sa podobne ako korelačný koeficient: 0=žiadna korelácia medzi premennými, 1=dokonalá korelácia medzi premennými. Phi koeficient je obzvlášť vhodný na porovnávanie dvoch alebo viacerých skupín údajov. V prípade, že korelačná matica je vypočítaná z náhodnej vzorky, možno použiť Bartlettov test sféricity (guľatosti) z roku 1950. Test overuje nulovú hypotézu, že populačná korelačná matica je jednotková matica (na diagonále sú jednotky, pretože korelácia premennej so sebou samou je rovná jednej a mimo diagonály sú samé nuly). Ak je vypočítaná P-hodnota väčšia ako napr. 0,05, nulovú hypotézu nemožno zamietnuť a FA nie je správne na takýchto údajoch robiť. Test však možno použiť iba v prípade veľkých náhodných vzoriek (n > 150).

FA vychádza najčastejšie z korelačnej matice. Tento postup je výhodný z dvoch dôvodov. 1) FA možno realizovať na premenných, ktoré sú merané na rôznych škálach (napr. jedna od 1 do 10, druhá od 0 do 100 a pod.). 2) FA vychádzajúca z korelačnej matice nevyžaduje úplné "surové" údaje, vystačí si iba s korelačnými koeficientmi. FA môže však vychádzať aj z variančno-kovariančnej matice. Takýto postup je vhodný vtedy, keď sa aplikuje FA na viacero skupín, v rámci ktorých jednotlivé premenné majú rôzny rozptyl.

Predpoklady

  1. pozorovania sú nezávislé (opakované merania napr. tých istých ľudí sú neprípustné)
  2. intervalové premenné
  3. bivariačné normálne rozdelenie každej dvojice premenných

Na analýzu poradových premenných sa používa Multidimenzionálne škálovanie. Technikou príbuznou FA je Analýza hlavných komponentov.

Príklad: Respondentom bol predložený zoznam 171 bipolárnych adjektív vyjadrujúcich ľudské vlastnosti (napr.: otvorený-uzavretý). Respondenti na sedembodovej stupnici od −3 do +3 označili u všetkých 171 adjektív ako ktorá vlastnosť vystihuje ich osobnosť. FA extrahuje z 171 vlastností 5 základných dimenzií osobnosti.