Frage:
Faktorabhängige Korrelation
Dave
2011-05-26 07:40:03 UTC
view on stackexchange narkive permalink

Wenn ich eine Reihe von Messungen durchführe und die Korrelation der Variablen $ A $ mit der Variablen $ B $ teste und eine signifikante Korrelation erhalte, ist dies für mich sinnvoll. Was aber, wenn eine weitere Analyse ergibt, dass von diesen Faktoren nur eine signifikante positive Korrelation innerhalb einer Gruppe besteht und diese Gruppe überrepräsentiert ist? Ist die globale Korrelation noch gültig oder handelt es sich bei detaillierterer Betrachtung um einen Stichproben-Bias-Effekt?

Hier einige Diagramme zur Erläuterung:

Die globale Korrelation

global correlation

Die Gruppe trennte die Korrelationen

grouping separated correlation

Nur ein kleiner Kommentar: Es sieht so aus, als ob die Gesamtkorrelation teilweise durch die Tatsache erklärt werden könnte, dass Einheiten, die zu Gruppe A gehören, alle niedrigere Werte haben, während die Berücksichtigung von "Wert B" allein nicht dazu beiträgt, die drei Gruppen zu trennen.
Ich denke, wenn Sie uns mehr Inhalte geben (d. H. Was bedeuten die Gruppen), erhalten Sie bessere Ratschläge, was zu tun ist.
Drei antworten:
#1
+8
JMS
2011-05-26 10:12:45 UTC
view on stackexchange narkive permalink

Kennen Sie das Paradoxon von Simpson? Dies scheint das zu sein, was Sie hier beobachten.

Bearbeiten: Ich habe Ihre Frage nicht beantwortet :) Was genau Sie tun sollten, ist bis zu einem gewissen Grad kontextabhängig (Sind die Gruppen sinnvoll? Stellt dies dar? ein Problem im Studiendesign? etc). Zumindest sollten Sie beide Ergebnisse IMO melden.

#2
+7
Henrik
2011-05-26 18:45:17 UTC
view on stackexchange narkive permalink

Ich stimme dem JMS-Rat zu, dass die Antwort vollständig kontextabhängig ist.

Aber was Sie betrachten, kann auch als Moderationseffekt angesehen werden.

In der Statistik tritt eine Moderation auf, wenn die Beziehung zwischen zwei Variablen von einer dritten Variablen abhängt.

(zitiert aus wikipedia)

Eine Moderation ist statistisch signifikant, wenn in einer multiplen Regression die Interaktion des Prädiktors mit der dritten Variablen analysiert wird ist signifikant.

#3
+5
rolando2
2011-05-27 02:28:02 UTC
view on stackexchange narkive permalink

Die vorherigen Kommentare sind alle gut, aber mit Gruppenstichprobengrößen von 5, 7 und 11 würde ich keiner ihrer Korrelationen vertrauen, soweit ich sie werfen könnte. Sie müssen dem gesamten r ebenfalls ein breites Konfidenzintervall geben. Übrigens Gute Arbeit in der Grafik.

+1, guter Punkt. Ich habe es als Beispiel genommen, nicht die tatsächlichen Daten, aber das OP noch einmal zu lesen, hat das sicherlich nicht gesagt.


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...