Frage:
Gibt an, ob EFA oder PCA zur Beurteilung der Dimensionalität einer Reihe von Likert-Elementen verwendet werden soll
giovanna
2011-06-08 17:57:46 UTC
view on stackexchange narkive permalink

Dies folgt aus meiner vorherigen Frage zur Bewertung der Zuverlässigkeit.

Ich habe einen Fragebogen (sechs 5-Punkte-Likert-Elemente) entworfen, um die Einstellung einer Gruppe von Benutzern zu bewerten Ein Produkt. Ich möchte die Zuverlässigkeit des Fragebogens schätzen, zum Beispiel die Berechnung von Cronbachs Alpha oder Lambda6. Also muss ich die Dimensionalität meiner Skala überprüfen. Ich habe gesehen, dass einige Leute PCA verwenden, um die Anzahl der Dimensionen herauszufinden (z. B. die Hauptkomponenten), andere bevorzugen die Verwendung von EFA.

  • Welcher Ansatz ist am besten geeignet?
  • Wenn ich mehr als eine Hauptkomponente oder mehr als einen latenten Faktor finde, bedeutet dies, dass ich mehr als einen messe Konstrukt oder mehrere Aspekte desselben Konstrukts?
Wie viele Fächer sind verfügbar? Haben Sie Decken- / Bodeneffekte auf Ihre Artikel beobachtet (Verteilung der Antworten in Richtung hoher oder niedriger Werte verschoben) oder mögliche inkonsistente Antworten?
Drei antworten:
#1
+11
Jeromy Anglim
2011-09-29 11:16:26 UTC
view on stackexchange narkive permalink

EFA versus PCA

In einer vorherigen Frage zu den Unterschieden zwischen EFA und PCA stelle ich fest:

  • Die Analyse der Hauptkomponenten umfasst das Extrahieren lineare Zusammensetzungen beobachteter Variablen.
  • Die Faktorenanalyse basiert auf einem formalen Modell, das beobachtete Variablen aus theoretischen latenten Faktoren vorhersagt.

Ich finde das typischerweise im Kontext der Entwicklung psychologischer Faktoren Eine Skalenfaktoranalyse ist theoretisch angemessener. Es wird häufig angenommen, dass latente Faktoren die beobachteten Variablen verursachen.

Beurteilung der Skalendimensionalität

Die Bestimmung der Dimensionalität, die einer Reihe von Likert-Elementen zugrunde liegt, ist nicht nur eine Frage von EFA gegenüber PCA. Es gibt mehrere Techniken. William Revelle hat eine Software in R zum Implementieren mehrerer Techniken ( siehe diese Diskussion).

Im Allgemeinen gibt es selten eine endgültige Antwort darauf, wie viele Faktoren zum Modellieren einer Menge erforderlich sind von Gegenständen. Wenn Sie mehr Faktoren extrahieren, können Sie mehr Varianz in den Elementen erklären. Natürlich könnten Sie zufällig eine gewisse Varianz erklären, so dass einige Ansätze versuchen, den Zufall auszuschließen (z. B. den parallelen Test). Selbst bei sehr großen Stichproben, bei denen der Zufall weniger eine Erklärung darstellt, würde ich erwarten, dass systematische, aber kleine Varianzsteigerungen durch das Extrahieren von mehr Faktoren erklärt werden. Sie bleiben also bei der Frage, wie viel Varianz durch den ersten Faktor im Verhältnis zu anderen erklärt werden muss, um zu dem Schluss zu kommen, dass die Skala für Ihren Zweck ausreichend eindimensional ist. Solche Probleme hängen eng mit der Anwendung und allgemeineren Fragen der Gültigkeit zusammen.

Der folgende Artikel ist möglicherweise hilfreich, um Definitionen und Ansätze zur Quantifizierung der Eindimensionalität ausführlicher zu diskutieren:

Hattie J. (1985). Überprüfung der Methodik: Bewertung der Eindimensionalität von Tests und Elementen. Angewandte psychologische Messung , 9 (2): 139.

Hier ist eine Webpräsentation, in der einige verschiedene Entscheidungsregeln zur Definition der Eindimensionalität

untersucht werden
#2
+7
richiemorrisroe
2011-09-29 14:31:39 UTC
view on stackexchange narkive permalink

Erstens geben weder PCA noch EFA eine Schätzung der Dimension der Skala. Sie sind beide im Wesentlichen Datenreduktionstechniken. Abgesehen davon ist EFA wahrscheinlich besser für diesen Zweck, da es Ihnen sagt, wie viel der Varianz in jeder Frage im Modell (der Kommunalität) berücksichtigt wird.

Um die Dimension abzuschätzen, müssen Sie eine andere Technik verwenden. Die besten sind in der Regel die parallele Analyse, das minimale durchschnittliche Teilkriterium und die Untersuchung des Geröllplots. Die Eigenwerte größer als eins sind in dieser Situation in der Regel nicht gut.

Wenn Sie über eine große Datenmenge verfügen, würde ich vorschlagen, dass Sie 2/3 davon verwenden und Modelle erstellen. Passen Sie dann die von Ihnen entwickelten Modelle an das letzte Drittel Ihrer Daten an. Dies verringert die Wahrscheinlichkeit, dass Sie Ihre Daten überanpassen (d. H. Modellierungsrauschen). Dies ist eine Form der Kreuzvalidierung und äußerst wichtig, wenn Techniken wie Faktoranalyse und Hauptkomponentenanalyse verwendet werden, da im Rahmen des Prozesses viele subjektive Entscheidungen (Faktoren, Rotationen usw.) getroffen werden müssen.

A user has suggested making an edit to the second paragraph to indicate that dimension isn't "determined" but is estimated: the "best" value for it (in some sense) is found. I think the suggestion has merit but did not feel comfortable approving that change because your opinion on that matter is not made completely clear here. Perhaps, to resolve this issue, you might care to clarify this point?
@whuber - hat meinen zweiten Absatz geändert, es war ein schlecht gewähltes Wort.
#3
+4
Peter Flom
2011-09-29 15:42:47 UTC
view on stackexchange narkive permalink

Zwei Dinge, die bisher nicht erwähnt wurden: Erstens: Mit nur 6 Elementen wird es Ihnen schwer fallen, viele Dimensionen zu finden. Zweitens: Wenn Sie EFA durchführen, anstatt sich Geröllkurven oder Eigenwerte oder einen anderen numerischen Test anzusehen, untersuchen Sie mehrere Lösungen und finden Sie heraus, welche sinnvoll sind. Idealerweise können Sie @richiemorrisroe folgen und ein Trainings- und Testmuster erhalten, insbesondere mit so wenigen Elementen.

i agree with the see what makes sense approach, but I (at least) find that the numeric tests can indicate a range of possible solutions to examine, which can then be tested by both numerical means and their consistency with the measure and the aims of the study.
I agree. But I find many people seem to want the numerical tests to "answer" the question rather than provide a range of possibilities


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...