Frage:
Wie viele zufällige Effekte sind in lmer anzugeben?
Jeff
2014-10-27 01:19:02 UTC
view on stackexchange narkive permalink

Ich habe ein computergestütztes Experiment durchgeführt, bei dem es zwei subjektinterne Faktoren gab, A und B. Alle Teilnehmer erhielten mehrere Versuche in jeder A * B-Zelle. Es gab auch einen zwischen dem Subjektfaktor C.

Ich versuche, die Antwortzeit vorherzusagen, also habe ich anfangs Folgendes getan:

  > lmer (rt ~ A * B *) C + (1 | subj)  

, aber mir wurde gesagt, ich sollte auch zufällige Effektinteraktionen angeben, z. B.:

  > lmer (rt ~ A * B. * C + (1 | subj) + (1 | A: subj) + (1 | B: subj)  

In diesem Fall sollte ich nicht auch die Drei-Wege-Interaktion angeben zB:

  > lmer (rt ~ A * B * C + (1 | subj) + (1 | A: subj) + (1 | A: B: subj)  

Ich verstehe das erste Modell, aber bei den beiden anderen bin ich mir nicht ganz sicher - obwohl sie alle unterschiedliche Ergebnisse liefern. Kann jemand klären, was diese Modelle tun und welches am besten geeignet ist?

(1 | A: subj) ist: ein zufälliger Achsenabschnitt für in A verschachteltes Subjekt, aber ich bin mir nicht ganz sicher, ob es das ist, woran Sie interessiert waren.Überprüfen Sie die Dokumentation: http://cran.r-project.org/web/packages/lme4/vignettes/lmer.pdf
@Tim Ich weiß es nicht.Was ist typisch und gibt es eine grafische Darstellung der Vorgänge in diesen Modellen?Im Wesentlichen bin ich daran interessiert, Abweichungen aufgrund individueller Unterschiede auszugleichen, da ich nur an den Auswirkungen der festen Faktoren interessiert bin.
Es ist wahrscheinlich am besten, wenn Sie mehr über gemischte Modelle lesen, z. http://www.amazon.com/Mixed-Effects-Models-S-PLUS-Statistics-Computing/dp/1441903178, http://www.stat.columbia.edu/~gelman/arm/ oder http://www.amazon.co.uk/Multilevel-Analysis-Applications-Quantitative-Methodology/dp/080583219X, In der lme4-Vignette finden Sie weitere Informationen zum Definieren von Formeln für lmer.
Zwei antworten:
pedmiston
2014-11-01 20:26:24 UTC
view on stackexchange narkive permalink

Wenn Sie zufällige Effekte in einem lme4 :: lmer -Modell angeben, werden die Zufallsfaktoren links von der Pipe und die Nichtunabhängigkeitsgruppierungsvariablen rechts angezeigt, sodass das vollständig angegebene Modell in angezeigt wird Ihre Frage wäre sehr wahrscheinlich:

  lmer (rt ~ A * B * C + (A * B | subj))  

Ich habe einige Zeit gebraucht Untersuchen Sie den Unterschied zwischen einem zufälligen Effekt auf der linken Seite der Pipe und einem zufälligen Effekt auf der rechten Seite der Pipe, der jedoch für sich genommen einen besseren Beitrag liefert als als Antwort auf Ihre spezielle Frage.

RPubs doc

Hauptcode

Der auffälligste Unterschied zwischen den folgenden beiden Modellen ...

  lmer (rt ~ A + (1 | subj / A)) lmer (rt ~ A + (A | subj))  

... ist, dass letzterer einen zufälligen Korrelationsparameter schätzt zwischen zufälligen Abschnitten und zufälligen Steigungen. Wenn Sie diesen zufälligen Korrelationsparameter entfernen ...

  lmer (rt ~ A + (1 | subj / A)) lmer (rt ~ A + (1 | subj) + (0 + A |) subj))  

... die beiden Modelle liefern genau die gleichen festen Effekte (Parameterschätzungen und damit verbundene Fehler), obwohl ich vermuten würde, dass die Ähnlichkeit vom jeweiligen Design der Studie abhängt.

Danke, das war sehr hilfreich und ich schätze Ihre Gründlichkeit!Ihr zweites Modell unterscheidet sich jedoch von meinem, da Sie den Interaktionsterm nur als zufälligen Effekt einfügen: "(1 | subj: A)" anstelle von "(1 | subj) + (1 | subj: A)" (oder gleichwertig)`(1 | subj / A)`. Von den drei von Ihnen angegebenen Modellen habe ich das Gefühl, das erste und dritte Modell zu verstehen, aber ich habe immer noch Probleme, das zweite Modell zu visualisieren.
@Jeff - Spitze genommen.Ich habe meine Antwort bearbeitet, um zu bestätigen, dass ich nicht perfekt zu Ihrer Situation passte.Entschuldigung, ich habe hier keine verschachtelten zufälligen Effekte behandelt.
Ich hoffe, ein Statistiker kann dies abwägen, aber ich glaube, ein verschachteltes Modell "(1 | subj / A)" ist von einem Modell ohne zufälligen Korrelationsparameter "(1 | subj) + (0 + A | subj) kaum zu unterscheiden.`.Zumindest führt das Anpassen dieser beiden Modelle an den obigen "Beispiel" -Datensatz zu identischen Fehlern bei den festen Effekten.Aber ich bin mir immer noch nicht sicher, warum Sie das Thema in einem interessanten Faktor verschachteln möchten.
Ich nehme an, die Logik ist, dass "(1 | subj)" die Tatsache erklärt, dass der Mittelwert jedes Subjekts vom großen Mittelwert abweicht, und "(1 | subj: A)" die Tatsache erklärt, dass die Wirkung von A je nach Subjekt unterschiedlich ist.Das klingt sehr nach einer zufälligen Steigung.FWIW, ich habe versucht, "(1 | subj) + (1 | A: subj) + (1 | B: subj)" in meinem Modell durch "(1 | subj) + (0 + A | subj) + (0+" zu ersetzenB | subj) `und bekam auch sehr ähnliche Ergebnisse für meinen Datensatz.
themeo
2014-11-02 03:38:04 UTC
view on stackexchange narkive permalink

In Bezug auf die Frage, welches Modell am besten geeignet ist, lerne ich dies immer noch für mich selbst, aber ich kann ein ausgezeichnetes Papier zu diesem Thema empfehlen:

Barr, DJ, Levy R. ., Scheepers C., Tily HJ. (2013) Struktur zufälliger Effekte für das Testen bestätigender Hypothesen: Halten Sie sie maximal, Journal of Memory and Language 68 (2013) 255–278

Wie der Titel andeutet, sollten Sie dies unter dem Strich immer tun Versuchen Sie, die maximale Struktur für zufällige Effekte einzubeziehen, da nur dies garantiert, dass Sie den Fehler vom Typ I nicht aufblähen (es ist auch ein hervorragendes Tutorial darüber, was zufällige Abschnitte und Steigungen im Regressionsmodell bewirken).

Manchmal können komplexe Strukturen mit zufälligen Effekten zu Problemen bei der Modellkonvergenz führen. Aus diesem Grund schlagen einige Forscher einen etwas weniger radikalen Ansatz vor und schlagen vor, die maximale Datenstruktur beizubehalten, die durch Daten gerechtfertigt ist (dh Sie testen, ob die zufälligen Effekte die Modellanpassung verbessern, indem Sie anova () verwenden und sie auf signifikant reduzieren nur zufällige Effekte). Florian Jaeger behandelt dieses Problem in seinem ausgezeichneten Blog:

http://hlplab.wordpress.com/2009/05/14/random-effect-structure/ http : //hlplab.wordpress.com/2011/06/25/more-on-random-slopes/

Barr et al.Papier ist kein Allheilmittel.Man muss ein bisschen pragmatisch sein, um festzustellen, welchen Grad an Modellkomplexität Ihre Daten unterstützen.Es wird nicht garantiert, dass überparametrisierte Modelle ein Optimum erreichen, und infolgedessen wird das nachfolgende (rückwärts) Modellauswahlverfahren (wie das erwähnte "anova ()") ungültig.


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...