Frage:
Wie teste ich Gruppenunterschiede an einer Fünf-Punkte-Variablen?
John
2010-09-01 01:57:51 UTC
view on stackexchange narkive permalink

Ich habe eine Reihe von Beobachtungen, die in Behälter fallen (oder "Punkte"); Das heißt, die Daten können 0, 1, 2, 3 oder 4 sein. Es gibt zwei Gruppen solcher Daten, Kontrolle und Behandlung. Ich kenne die Anzahl der Personen mit jeder Punktzahl für jede Gruppe.

Wie lässt sich am besten feststellen, ob diese Gruppen unterschiedlich sind oder nicht?

Ein Kollege schlug vor, die Daten nur als einzelne Datenpunkte mit den angegebenen Daten anzuordnen Punktzahl und Durchführung der Analyse für diese beiden Datenspalten. Da es zehn Personen pro Gruppe gibt, ist dies nicht schwierig, aber ich glaube nicht, dass ich eine gültige Antwort bekomme.

Drei antworten:
chl
2010-09-01 02:49:30 UTC
view on stackexchange narkive permalink

Was Sie suchen, scheint ein Test zum Vergleichen zweier Gruppen zu sein, bei denen Beobachtungen eine Art Ordnungsdaten sind. In diesem Fall würde ich vorschlagen, einen Trendtest durchzuführen, um festzustellen, ob es Unterschiede zwischen der CTL- und der TRT-Gruppe gibt.

Die Verwendung eines T-Tests würde nicht die Tatsache anerkennen, dass Ihre Daten diskret sind, und die Gaußsche Annahme kann ernsthaft verletzt werden, wenn die Punkteverteilung nicht symmetrisch ist, wie dies häufig bei Likert-Punkten der Fall ist (wie z. B. solchen) Sie scheinen zu berichten). Sie wissen nicht, ob diese Daten aus einer Fall-Kontroll-Studie stammen oder nicht, aber Sie können auch eine rangbasierte Methode anwenden, wie von @propfol vorgeschlagen: Wenn es sich nicht um ein übereinstimmendes Design handelt, den Wilcoxon-Mann-Whitney-Test ( wilcox.test () in R) ist in Ordnung und fragen Sie nach einem genauen p-Wert, obwohl bei gebundenen Beobachtungen möglicherweise Probleme auftreten. Die Effizienz des WMW-Tests beträgt $ 3 / \ pi $ in Bezug auf den t-Test, wenn die Normalität gilt, aber ansonsten könnte es sogar besser sein, wie ich mich zu erinnern scheine.

Angesichts Ihrer Stichprobengröße können Sie dies auch tun Erwägen Sie die Anwendung eines Permutationstests (siehe die Pakete perm oder coin R).

Überprüfen Sie auch die zugehörigen Fragen:

Mit nur 10 Beobachtungen in jeder Gruppe ist es sehr unwahrscheinlich, dass eine ordinale logistische Regression passt, geschweige denn korrekte Schätzungen der Varianzen. Ich würde den Permutationstest vorschlagen.
@Joris Guter Punkt! Ich habe das Problem mit der Stichprobengröße vergessen, als ich meine Antwort zum ersten Mal schrieb. Der GLM würde sicherlich schlechte Schätzungen liefern ... Der Re-Randomisierungstest sollte besser sein, Sie haben Recht. Vielen Dank!
pmgjones
2010-09-01 02:33:25 UTC
view on stackexchange narkive permalink

Drei Dinge fallen mir ein:

  1. Kontingenztabellenanalyse unter Verwendung des exakten Fisher-Tests oder des Chi-Quadrats (aber nur, dass irgendwo in der Tabelle ein signifikanter Unterschied besteht. Sie müssen Ihre Daten visualisieren oder Post-hoc-Tests durchführen, um festzustellen, wo dieser Unterschied liegt.) Nicht meine bevorzugte Lösung.
  2. Eine nicht parametrische Methode wie der Mann Whitney-Test. Dadurch werden alle Ihre Punkte in jeder Gruppe eingestuft. Eine gute Methode, die jedoch möglicherweise zu schwach ist.
  3. Eine parametrische Methode (z. B. ein t-Test). Nachteil ist, dass die Annahmen dieser Methode verletzt werden können, insbesondere bei einer so kleinen Stichprobe. Außerdem ist der Unterschied zwischen 0 und 1 wahrscheinlich nicht der gleiche (je nachdem, was Sie messen) wie der Unterschied zwischen 3 und 4. Die gute Nachricht ist, dass der t-Test relativ robust gegenüber den Annahmen ist, die Sie annehmen sollen Stellen Sie sicher, dass sie wahr sind, bevor Sie den Test verwenden. Wie gesagt, die Stichprobengröße ist jedoch ziemlich klein.
  4. ol>

    Die beste Wahl ist möglicherweise der Mann-Whitney-Test.

Vielen Dank dafür. Ich dachte an den Mann-Whitney-Test, aber viele (die meisten?) Der Werte führen zu Bindungen. Wird dies nicht die Leistung der Analyse verringern?
Ja, natürlich wird es; Da Sie jedoch mit 10 Beobachtungen pro Gruppe arbeiten, sollten Sie von dieser Einstellung nicht viel erwarten. Überzeugen Sie sich selbst unter http://statpages.org/#Power
@John: Ich vermute, dass der von mir vorgeschlagene KS-Test leistungsfähiger ist als Mann-Whitney, da er verschiedene Alternativen erkennen kann, die M-W nicht erkennen kann (z. B. eine Änderung der Streuung), und ansonsten eine mathematisch ähnliche Berechnung durchführt. Es ist schwierig, dies allgemein zu untersuchen - in Ihrem Fall haben die Ergebnisse jeder Gruppe vier Freiheitsgrade, sodass acht Dimensionen von Unterschieden untersucht werden müssen -, aber wenn Sie genauer wissen könnten, wie die beiden Gruppen genau aussehen könnten unterscheiden (was für die Wissenschaft und nicht für die Statistik von Bedeutung ist), hätten Sie eine bessere Grundlage für die Auswahl eines Tests.
whuber
2010-09-01 05:27:21 UTC
view on stackexchange narkive permalink

Diese Frage ist etwas ungewöhnlich, da die Art von "anders" nicht spezifiziert ist. Diese Antwort wurde im Sinne des Versuchs formuliert, so viele Arten von Unterschieden wie möglich zu erkennen, nicht nur Ortsänderungen ("Trend").

Ein Ansatz, der möglicherweise mehr Macht als die meisten anderen hat und gleichzeitig agnostisch bleibt Ein Kolmogorov-Smirnov-Test über die relativen Größen, die von den fünf Gruppen dargestellt werden (z. B. unter Verwendung eines multinomialen Modells), wobei die Reihenfolge der Gruppen beibehalten wird: Verwenden Sie als Teststatistik die Größe der größten Abweichung zwischen den beiden empirischen cdfs. Dies ist einfach und schnell zu berechnen, und es wäre auch einfach, einen p-Wert durch Zusammenführen der beiden Ergebnissätze zu booten.

Lassen Sie insbesondere die Anzahl in bin $ j $ für die Gruppe $ i $ sein $ k_ {ij} $. Dann ist das empirische cdf für die Gruppe $ i $ im Wesentlichen der Vektor $ \ left (0 = m_ {i0}, m_ {i1}, \ ldots, m_ {i5} = n_i \ right) / n_i $ wobei $ m_ {i, j} = m_ {i-1, j} + k_ {ij}, 1 \ le i \ le 5 $. Die Teststatistik ist die Supernorm der Differenz dieser beiden Vektoren.

Kritische Werte ($ \ alpha = 0,05 $) bei zwei Gruppen von zehn Personen liegen bei 0,2 - 0,4, wobei die höheren Werte höher sind Werte, die auftreten, wenn die 20 Werte gleichmäßig zwischen den beiden Extremen verteilt sind.

Vielen Dank an alle. Ich ging zurück und versuchte es mit dem Mann-Whitney-Test, wobei ich die Punktzahl jedes Einzelnen als Spalte auflistete. (FWIW, ich verwende GraphPad Prism für die Analyse.) Die Ergebnisse erscheinen vernünftig, wenn man bedenkt, was wir bereits über die Biologie wissen. Vielen Dank für Ihre Hilfe.
Mann-Whitney kann eine gute Wahl sein, aber beachten Sie, dass es einige spezifische Annahmen über die Beziehungen zwischen den beiden Gruppen macht. Es ist gut, wenn die Ergebnisse vernünftig erscheinen, aber das kann nicht der einzige Grund sein, einen statistischen Test durchzuführen: Dies würde zu einem zirkulären Argument führen ("Wir haben diesen Test gewählt, weil er vernünftige Antworten liefert; unsere Antworten sind signifikant, weil dieser Test dies sagt." "). Stellen Sie mindestens sicher, dass alle Daten so grafisch dargestellt werden, dass ein visueller Vergleich der Gruppen möglich ist.


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 2.0-Lizenz, unter der er vertrieben wird.
Loading...