200px-SPSS_logo.svg

Η ανάλυση παραγόντων είναι ουσιαστικά μία τεχνική μείωσης δεδομένων (data reduction technique).  

 Απώτερος στόχος της επιβεβαιωτικής ανάλυσης παραγόντων είναι η αναζήτηση μιας ουσιωδέστερης περιγραφής και ερμηνείας της σχέσης μιας ομάδας μεταβλητών με όσο το δυνατόν ‘οικονομικότερο’, οργανωμένο και απλοποιημένο τρόπο.  

 Με βάση μια μήτρα συσχέτισης (correlationmatrix) που περιλαμβάνει τις συσχετίσεις μεταξύ των μεταβλητών, τα δεδομένα ομαδοποιούνται σε παράγοντες (factors), οι οποίοι μπορούν  να χρησιμοποιηθούν για την ερμηνεία της σχέσης μεταξύ των δεδομένων.

 Η επιλογή του αριθμού των παραγόντων που περιγράφουν καλύτερα τη σχέση των μεταβλητών, καθώς και η ερμηνεία του νοήματος τους χαρακτηρίζονται από υποκειμενικότητα.

 Η επιβεβαιωτική ανάλυση παραγότων (ConfirmatoryFactorAnalysis), η οποία διεξάγεται με προγράμματα όπως το LISREL, επιπρόσθετα στοχεύει στο να ελέγξει την επάρκεια μιας θεωρητικής πρόβλεψης σχετικά με τον αριθμό των παραγόντων που βρίσκονται πίσω από ένα σύνολο μεταβλητών, και να να υποστηρίξει προβλέψεις σχετικά με το ποιές μεταβλητές ‘προκαλούνται’ από ποιούς παράγοντες (causation).

 

Βασικές Προϋποθέσεις

 

  1. οι μεταβλητές να είναι συνεχείς.
  1. οι μεταβλητές θα πρέπει να μπορούν να συσχετισθούν (να συσχετίζονται) μεταξύ τους. Αν οι μεταβλητές Α και το Β συχετίζονται, τότε:

 Η Α προκαλεί τη Β, ή η Β προκαλεί την Α, ή και οι δύο μεταβλητές προκαλούνται από μία τρίτη, λανθάνουσα μεταβλητή.

  1. υποκείμενες, λανθάνουσες μεταβλητές, ή αλλιώς υποκείμενοι παράγοντες (underlyinglatentfactors) μπορούν να χρησιμοποιηθούν για να εξηγήσουν περισσότερο περίπλοκα φαινόμενα. Οι παρατηρούμενες συσχετίσεις μεταξύ των μεταβλητών προκύπτουν από τους κοινούς υποκείμενους παράγοντες.
  1. οι μεταβλητές θα πρέπει να καλύπτουν ικανοποιητικά το υπό μελέτη πεδίο έρευνας (πχ διάσταση προσωπικότητας). Αν δεν έχουν μετρηθεί επαρκώς οι διαστάσεις αυτές είναι δυσκολότερο (έως αδύνατον)  να αποκαλυφθούν πιθανοί γενεσιουργοί παράγοντες. 
  1. ο αριθμός των μεταβλητών θα πρέπει να είναι αρκετά μεγάλος ώστε να περιλαμβάνονται τουλάχιστον 3 μεταβλητές σε κάθε παράγοντα (άλλοι προτείνουν και 6 μεταβλητές ανά παράγοντα).
  1. το μέγεθος του δείγματος θα πρέπει να είναι τουλάχιστον ίσο το τριπλάσιο του αριθμού των μεταβλητών. Ιδανικά το δείγμα θα πρέπει να περιλαμβάνει περισσότερα από 100 άτομα. Δείγμα >200 θεωρείται ικανοποιητικό.

 

Στάδια της Ανάλυσης Παραγόντων

  1. υπολογισμός της μήτρας συσχέτισης (correlationmatrixcomputation)
  2. εξαγωγή παραγόντων (factor extraction)
  3. περιστροφή παραγόντων (factorrotation) για να επιτευχθεί απλή δομή (simplestructure)
  4. ερμηνεία
  5. επιβεβαίωση (με συλλογή επιπλέον δεδομένων, με πραγματοποίηση διαφορετικών μορφών ανάλυσης παραγόντων, ή με τη διεξαγωγή επιβεβαιωτικής ανάλυσης παραγόντων σε καινούρια δεδομένα)

Εξαγωγή Παραγόντων (FactorExtraction)

Για κάθε μεταβλητή υπολογίζεται ένας δείκτης της σχέσης της μεταβλητής με τον κάθε παράγοντα (παρόμοιος αλλά όχι ακριβώς ίδιος με το γνωστό συντελεστή συσχέτισης). Οι δείκτες αυτοί (αν υψωθούν στο τετράγωνο) δείχνουν την διακύμανση που μοιράζεται η κάθε μεταβλητή με τον κάθε παράγοντα, και ονομάζονται structuralcoefficientsή factorloadings. Ικανοποιητικά loadings θεωρούνται αυτά που είναι μεγαλύτερα του 0.4.

Σε ένα σετ μεταβλητών η κάθε μεταβλητή θεωρείται ότι προκύπτει από τον γραμμικό συνδιασμό κάποιων μη παρατηρήσιμων κοινών παραγόντων (communality) και κάποιου παράγοντα που αφορά μόνο τη μεταβλητή (uniqueness) (variablex = communality + uniqueness).

Όταν επιλέξουμε να συμπεριλάβουμε στην ανάλυση και την μοναδική διακύμανση και τη διακύμανση σφάλματος (uniqueanderrorvariance), τότε διεξάγουμε ανάλυση κύριων συνιστωσών (principalcomponentsanalysis). Όταν χρησιμοποιούμε μόνο την κοινή διακύμανση τότε διεξάγουμε πραγματική ανάλυση παραγόντων (factoranalysis).  

Υπάρχουν πολλές μέθοδοι εξαγωγής παραγόντων, πχ PrincipalComponentsAnalysis, PrincipalAxisFactoring, MaximumLikelihood, AlphaFactoring, ImageFactoring, κλπ. Η πιό ισχυρή και ευρύτερα χρησιμοποιούμενη είναι η ανάλυση κύριων συνιστωσών.

Κριτήρια εξαγωγής παραγόντων:

  1. EigenValues (χαρακτηριστικές ρίζες)  > 1 (Kaiserscriterion, ή Kaiser-Guttmanrule).

Eigenanalysis: με βάση τη μήτρα συσχέτισης, το πρόγραμμα ανιχνεύει ομαδοποιήσεις στη διακύμανση (‘κομμάτια διακύμανσης’) τα οποία υποδεικνύουν την ξεχωριστή διακύμανση του κάθε παράγοντα. Τα Eigenvalues αποτελούν μία ένδειξη της διακύμανσης στο correlationmatrixπου ερμηνεύεται από τον κάθε παράγοντα.Αρχικά το πρόγραμμα εξάγει τόσους παράγοντες όσες και οι μεταβλητές. Κάθε μεταβλητή συνεισφέρει διακύμανση μιας μονάδας, οπότε δεν έχει νόημα να εξαγχθεί ένας παράγοντας που εξηγεί λιγότερη διακύμανση από αυτή που εξηγεί μία μόνο μεταβλητή. Οι παράγοντες με Eigenvalues> 1 θεωρούνται ως ξεχωριστοί, ισχυροί παράγοντες με κάποιο ερμηνευτικό νόημα.

  1. Έλεγχος του screeplotτων eigenvalues (γράφημα χαρακτηριστικών ριζών ως προς των αριθμό των παραγόντων). Επιλέγουμε τους παράγοντες που φαίνονται στο γράφημα πριν αυτό γίνει επίπεδο.
  1. Αν έχουμε μία θεωρητική υπόθεση σχετικά με τον αριθμό των παραγόντων που αναμένουμε, επιλέγουμε αυτό τον αριθμό για την εξαγωγή παραγόντων (κατά μία έννοια αποτελεί μία αδύναμη μορφή confirmatoryfactoranalysis). 

 

Περιστροφή (Factor Rotation)

Απλή Δομή (Simple structure)

Η περιστροφή των παραγόντων που έχουν εξαχθεί αποσκοπεί στην καλύτερη ανίχνευση των παραγόντων που μπορούν να περιγράψουν τα δεδομένα μας και την επίτευξη της απλής, ξεκάθαρης δομής τους. Έτσι διευκολύνεται και η ερμηνεία τους.

Συνοπτικά, με τον όρο απλή δομή εννοούμε:

- να υπάρχουν ξεκάθαρα loadings (structuralcoefficients) στους παράγοντες. 

- η κάθε μεταβλητή να έχει υψηλά loadings σε ένα μόνο παράγοντα και χαμηλά (< .3) στους υπόλοιπους παράγοντες.

- τα αποτελέσματα σχετικά με τον αριθμό και τη δομή των παραγόντων σχετικά με το υπό μελέτη θέμα να εμφανίζονται σταθερά σε παρόμοιες έρευνες.

Κύριες μέθοδοι περιστροφής:

  1. Varimaxrotation (orthogonal solution).

Προϋποθέτει ότι δεν υπάρχει συσχέτιση μεταξύ των παραγόντων (και συνεπώς αυτοί δεν μοιράζονται κοινή διακύμανση). Επιλέγουμε τη μέθοδο αυτή μόνο όταν είμαστε βέβαιοι (από τη θεωρία μας) ότι οι παράγοντες δεν συσχετίζονται. Τυχόν παράβλεψη της συσχέτισης θα έχει ως αποτέλεσμα την εσφαλμένη ερμηνεία των δεδομένων μας.

  1. Oblique rotation (non-orthogonal, oblique solution).  

Επιτρέπει τους παράγοντες να συσχετίζονται. Στην ψυχολογία συνήθως επιλέγουμε αυτή τη μέθοδο περιστροφής, καθώς συνήθως αναμένουμε τους παράγοντες που θα προκύψουν να παρουσιάζουν κάποιο βαθμό συσχέτισης.

 

 Ερμηνεία

Τέλος, πρέπει να ερμηνεύσουμε το νόημα των παραγόντων (να τους περιγράψουμε και να τους ονομάσουμε), με βάση τις μεταβλητές που έχουν σημαντικά loadings (> .4) σε αυτούς. Οι μεταβλητές με τα υψηλότερα loadings έχουν μεγαλύτερη σχέση με τον παράγοντα και λογικά ξεκινάμε από αυτές για την ερμηνεία του παράγοντα. 

Εάν έχουμε επιλέξει την περιστροφή ‘Oblique’ ελέγχουμε τον πίνακα ‘patternmatrix’ (περιλαμβάνει τα uniqueloadings, τη συμμετοχή του παράγοντα στη διακύμανση της μεταβλητής). Εάν έχουμε επιλέξει την Varimaxπεριστροφή ελέγχουμε τον πίνακα ‘rotatedcomponentmatrix’.

Αν έχουμε επιτύχει απλή δομή (simplestructure), θα πρέπει να υπάρχουν λίγες έως καμία μεταβλητές με υψηλά loadings σε περισσότερους από έναν παράγοντα. Η ξεκάθαρη δομή των παραγόντων διευκολύνει την ερμηνεία τους.

 

Πιθανά Προβλήματα

  1. η αποτυχία να πετύχουμε απλή δομή (simplestructure).
  2. χρήση μη κατάλληλων ή/και μικρών δειγμάτων
  3. τα δεδομένα δεν είναι απαραίτητο να ακολουθούν την κανονική κατανομή, αλλά όταν την ακολουθούν τα αποτελέσματα είναι καλύτερα.
  4. οι συμμετέχοντες με ακραίες τιμές θα πρέπει να αποκλείονται, καθώς οι τιμές τους ασκούν μεγάλη επίδραση στους συντελεστές συσχέτισης.
  5. πολύ αδύναμες, μη γραμμικές συσχετίσεις. Ουσιαστικά δεν έχει νόημα να κάνουμε ανάλυση παραγόντων σε δεδομένα που δεν παρουσιάζουν συσχετίσεις μεγαλύτερες του .3. Αλλά και μεταβλητές που συσχετίζονται τέλεια μεταξύ τους θα πρέπει να αποκλείονται από την ανάλυση.
  6. οι μεταβλητές δεν θα πρέπει να προκύπτουν από το μαθηματικό υπολογισμό άλλων μεταβλητών.  
  7. η προσπάθεια να ερμηνεύσουμε έναν παράγοντα που περιλαμβάνει μόνο μία ή δύο μεταβλητές (εκτός αν υπάρχει ξεκάθαρη θεωρητική ερμηνεία).
  8. η υπερβολική πίεση για να ‘ταιριάξουμε’ στα δεδομένα τους παράγοντες που έχουμε υποθέσει αρχικά ότι υπάρχουν.
  9. σύγχιση μεταξύ διερευνητικής και επιβεβαιωτικής ανάλυσης παραγόντων. Κάποιες φορές η επιβεβαιωτική ανάλυση παραγόντων δεν ‘επιβεβαιώνει’ τα ευρήματα της διερευνητικής ανάλυσης.

 

Συμβουλές Aναφοράς Aποτελεσμάτων

  1. Τα δεδομένα του πίνακα patternmatrixαναφέρονται ως ‘structuralcoefficients’ και όχι ως ‘loadings’.
  2. αναφέρουμε τον πλήρη πίνακα των ‘structuralcoefficients’, και όχι μόνο τις υψηλές τιμές.
  3. αναφέρουμε την μέθοδο που χρησιμοποιήσαμε για την εξαγωγή παραγόντων (extractionmethod, πχ. Principalcomponents, principleaxisfactoring, etc). Αναφέρουμε επίσης και τη μέθοδο περιστροφής που χρησιμοποιήσαμε (factorrotation, πχ. Varimax, Oblimin με KaiserNormalization) και τον τρόπο εξαγωγής παραγόντων (πχ. Kaisercriterion, επιλογή αριθμού παραγόντων κλπ).   
  4. ονομάζουμε τους παράγοντες με λατινικούς χαρακτήρες (πχ. Παράγοντας Ι, Παράγοντας ΙΙ κλπ).     
  5. αναφέρουμε τους συντελεστές συνήθως με δύο δεκαδικά ψηφία.