Analýza hlavných komponentov (Principal Components Analysis - vytvorená v roku 1901 Pearsonom) je analytický nástroj, ktorý sa zvyčajne používa na redukciu rozmernosti (počtu premenných) veľkého počtu vzájomne súvisiacich premenných na hlavné komponenty, pri čo najmenšej strate informácií (variability). PCA vypočíta súbor vzájomne nezávislých premenných (hlavných komponentov), ktoré sú lineárnou kombináciou (váženým priemerom) originálnych premenných. Prvý hlavný komponent vysvetľuje najväčšiu časť variability premenných, druhý komponent vysvetľuje druhú najväčšiu časť variability, atď. až kým je vysvetlená všetka variabilita. Komponenty sú vzájomne nezávislé a niekoľko z nich často vysvetľuje okolo 80 % variability. Tieto sa potom skúmajú, graficky znázornia, prípadne použijú ako vstupy do lineárnej regresie, diskriminačnej analýzy alebo zhlukovej analýzy. PCA na rozdiel od príbuznej faktorovej analýzy (FA) prinesie vždy rovnaké výsledky.
FA aj PCA sa snažia zredukovať rozmernosť skupiny údajov. Hlavný rozdiel medzi FA a PCA je ten, že PCA vysvetľuje všetku variabilitu medzi originálnymi premennými (vyjadrenú v korelačnej matici) a FA iba variabilitu, ktorú majú premenné spoločnú. Cieľom PCA (Rao 1964) je odvodenie malého množstva lineárnych kombinácií (hlavných komponentov) z množiny premenných pri zachovaní čo najviac informácií obsiahnutých v pôvodných premenných. Cieľom FA (Mulaik 1972) je vysvetliť korelácie alebo kovariancie medzi premennými pomocou malého množstva nepozorovateľných, latentných premenných. Latentné premenné nemožno všeobecne vypočítať ako lineárnu kombináciu originálnych premenných. FA predpokladá lineárne vzťahy medzi premennými nebyť nekorelovanej náhodnej chyby (unikátnej variability) v každej premennej, pričom lineárne vzťahy aj množstvo unikátnej variability možno odhadnúť.