Kanonická korelácia skúma lineárnu závislosť medzi dvomi skupinami intervalových premenných. Predstavuje rozšírenie korelačnej analýzy na viac premenných. Kanonická korelácia nájde vážený priemer premenných jednej skupiny a porovná (koreluje) s váženým priemerom premenných v druhej skupine. Terminológia kanonickej korelácie rozlišuje medzi pôvodnými premennými (Variables) a kanonickými premennými – koreňmi (Variates – Roots), ktoré sú váženým priemerom pôvodných premenných. Váhy sú zvolené tak, aby sa korelácia medzi týmito dvoma koreňmi maximalizovala. Táto korelácia sa nazýva prvý kanonický korelačný koeficient. V ďalšom kroku sa vytvorí ďalšia dvojica vážených priemerov, ktorá je nezávislá od prvej dvojice a vypočíta sa ich korelácia. Táto korelácia sa nazýva druhý kanonický korelačný koeficient. Tento proces pokračuje až kým sa počet kanonických korelácií rovná počtu premenných v menšej skupine. Korelácie medzi nasledujúcimi kanonickými premennými sú menšie a menšie. Preto ako celkový index kanonickej korelácie medzi dvoma skupinami premenných sa najčastejšie používa najväčšia korelácia, čiže prvý kanonický korelačný koeficient. V praxi sa často interpretuje iba prvý kanonický korelačný koeficient.
Korene, ktoré sú štatistiky významné sa následne interpretujú. Keďže každý koreň predstavuje vážený priemer pôvodných premenných, interpretuje sa pomocou týchto váh. Aby bolo možné porovnávať váhy medzi premennými, ktoré sú merané v rôznych jednotkách, používajú sa váhy pre štandardizované premenné (od pôvodných premenných sa odpočíta ich priemer a vydelí ich štandardnou odchýlkou). Potom platí, že premenná, ktorej je pridelená absolútne väčšia váha, má väčší podiel na formovaní príslušného koreňa.
Kanonický korelačný koeficient sa interpretuje podobne ako Pearsonov korelačný koeficient. Druhá mocnina kanonického korelačného koeficientu sa nazýva vlastné číslo (Eigenvalue) a vyjadruje časť variability, ktorú majú príslušné dva korene spoločnú. Nehovorí však nič o tom, koľko variability pôvodných premenných vysvetľujú ich korene. To sa zistí posúdením korelácií (vo faktorovej analýze sa nazývajú factor loadings) medzi pôvodnými premennými a ich koreňmi. Súčet druhých mocnín korelácií medzi premennými skupiny a ich príslušným koreňom po vydelení počtom premenných, ktoré tvoria daný koreň, predstavuje vysvetlenú variabilitu (Variance Extracted), ktorú možno interpretovať ako priemerný podiel (percento) variability premenných, ktorú vysvetľuje ich koreň. Po vynásobení tohto podielu druhou mocninou príslušného kanonického korelačného koeficientu (eigenvalue) dostávame priemerný podiel variability premenných danej skupiny, ktorá je vysvetlená premennými v druhej skupine. Toto percento sa nazýva nadbytočnosť (Redundancy).
Diskriminačná analýza a MANOVA sú špeciálnymi prípadmi kanonickej korelácie, ktorá je zase špeciálnym prípadom všeobecného lineárneho modelu.
Predpoklady
Príklady: Marketingový výskumník chce zistiť aký je vzťah medzi vnímaním produktu zákazníkom a jeho spoločenským postavením. Zákazník hodnotí na produkte jeho dizajn, úžitkové vlastnosti, cenu a pod. na stupniciach od 0 (najhoršie) do 100 (najlepšie). Spoločenské postavenie zákazníka sa určuje pomocou jeho mesačného príjmu, celkového majetku a pod.
Psychológ chce vypočítať vzťah medzi troma mierami schopnosti učiť sa a piatimi mierami úspechu v škole.
Medik chce študovať vzťah medzi rôznymi rizikovými faktormi a skupinou symptómov.