Angenommen, ich habe einen Datensatz mit drei Variablen, Calcium, Eisen und Uran.
Angenommen, ich führe PCA aus und erhalte die folgenden Hauptkomponenten:
$$ \ begin {array} {} cccc &PC_1&PC_2&PC_3 \\ Calcium&0.6729&0.1021&-0,6771 \\ Iron&0.5331&0.2554&0.5402 \\ Uranium&0.1123&-0.8007&-0,0432 \ end {array} $$
Der erste PC zeigt, dass Calcium die größte Bedeutung hat und Eisen die zweithöchste Korrelation. Der zweite PC zeigt, dass Uran die größte Korrelation aufweist. Aber der dritte PC bezeichnet dann wieder Calcium als am stärksten korrelierend mit der Antwort, dann Eisen als zweites.
Meine Hauptfrage ist, wie ein solches PCA-Ergebnis interpretiert werden kann. Es macht keinen Sinn zu sagen, dass Calcium die erklärendste Variable der Varianz ist, wobei as sowie die dritthäufigste erklärende Variable für die Varianz sind.