Können Sie Statistiken mit 4 Datenpunkten erstellen?

iliasfl

2014-01-24 05:55:37 UTC

view on stackexchange narkive permalink

Ich war gerade an einem Q / A beteiligt, bei dem ein armer Kerl aufgefordert wurde, einen statistischen Test durchzuführen, um zu beweisen , dass Algorithmus A besser ist als zwei andere Algorithmen. Er hat jedoch nur 4 Datenpunkte. Ist es wirklich sinnvoll, einen statistischen Test mit 4 Punkten durchzuführen? Wo ist die Grenze? Zu drei?

Zur Verdeutlichung verstehe ich, dass 12 Zahlen gemeldet werden, aber für mich sieht es eher nach 4 dreidimensionalen Datenpunkten oder 3 vierdimensionalen Datenpunkten aus.

In ihren Antworten führen die Autoren einige Annahmen über die Unterstreichungsverteilungen ein, um die Anzahl der Datenpunkte künstlich zu erhöhen und dabei Mittelwerte von vier Zahlen zu berechnen. oder führen Sie T-Tests an Algorithmuspaaren durch (Vergleich von insgesamt 8 Zahlen für jedes Paar) und treffen Sie erneut unbegründete Annahmen über die Unterstreichungsverteilung.

Wie zuverlässig ist dieser Prozess, wenn Sie die Unterstreichungsverteilung nicht kennen und weil Sie nicht über genügend Daten verfügen, können Sie nicht hoffen, sie ableiten / validieren zu können? Ist es nicht fairer zu sagen, dass Sie mit so wenigen Daten nicht viel anfangen können?

Zu Ihrer Information, obwohl Ihre Frage für sich allein stehen könnte, habe ich mir den von Ihnen angegebenen Link angesehen und es sieht nicht so aus, als hätte die Person nur 3 Datenpunkte ...

Danke, in der Tat sind es 4 Datensätze, nicht 3. Ich denke, es ändert sich nicht viel an der Frage ...

4 Datensätze gemittelt über, für jeden Algorithmus = mindestens 12 Datenpunkte ... er hat mindestens 4 Datenpunkte pro Gruppe mit 3 Gruppen.

Es ist eine Frage der Sichtweise. Entweder 4 dreidimensionale Datenpunkte oder 3 vierdimensionale Datenpunkte.

Er hat keine 4 Datenpunkte, er hat 12. Und die Frage hat Antworten auf den Link. Was ist neu an Ihrer Frage? Wenn nichts, dann denke ich, dass dies geschlossen werden sollte.

Ich habe gerade die Antwort von Greg gesehen. Grundsätzlich werden einige Annahmen über die Unterstreichungsverteilungen eingeführt, um die Anzahl der Datenpunkte künstlich zu erhöhen und dabei Mittelwerte aus 4 reellen Zahlen usw. zu berechnen. In Marcs Antwort verwendet jeder t-Test 8 Zahlen, nicht 12, und wiederum Annahmen über die Unterstreichung Verteilung. Für mich steht meine Frage, vielleicht ist die Antwort, dass 8 oder 12 Datenpunkte mehr als genug sind.

Sie können sicherlich einen T-Test mit 2 4er-Gruppen durchführen.

In der Tat zeigt eine meiner Antworten hier ein Beispiel, in dem ein T-Test durchgeführt wird, bei dem 3 Beobachtungen im Vergleich zu einer einzelnen Beobachtung vorliegen, und das uns klar nahe legt, dass es durchaus möglich ist, einen T-Test mit zwei Stichproben mit 3 Beobachtungen durchzuführen * total * (Reduzierung der Stichprobengröße in der größeren Gruppe um 1). In der Tat habe ich einen Test mit einer Stichprobe mit einer einzigen Beobachtung gesehen. Die Titelfrage hat also eine triviale Antwort ("Ja, offensichtlich"). In winzigen Stichproben (i) verlassen Sie sich tendenziell stärker auf die Annahmen, und (ii) die Leistung ist sehr gering, sodass Sie entweder große Effekte oder sehr kleine Abweichungen benötigen.

Hier ist [der Beitrag, den ich erwähnt habe] (http://stats.stackexchange.com/questions/44475/is-there-a-statistical-test-to-compare-two-samples-of-size-1-and-3/) )

Danke für deine Kommentare. Ich werde durch den Ausdruck "stärker auf die Annahmen angewiesen" abgedeckt, der uns in der realen Welt dazu bringt, wie Sie diese Annahmen validieren können, was uns zu meiner ursprünglichen Frage zurückbringt. Ich habe das Ganze nicht überprüft, aber dieser Typ hat einen p-Wert von 0,97 bekommen ... Wie auch immer, ich bin mir nicht sicher über die Abstimmungen meiner Frage. Ich wollte niemanden beleidigen, danke.

Sie können einen Test auf Ehrlichkeit mit * einem * Wert (und bescheidenen, realistischen Annahmen) durchführen: http://stats.stackexchange.com/a/1836. Übrigens sollen Downvotes nicht Beleidigung oder Ärger widerspiegeln, sondern vielmehr (wie der Hovertext anzeigt) anzeigen, dass eine Frage schlecht gestellt oder schlecht recherchiert ist. Ich denke, hier gibt es eine anständige Frage, aber so wie es aussieht, müssen die Leser die Kommentare durchgehen, um zu verstehen, was Sie fragen: Könnten Sie sie bitte bearbeiten? Beachten Sie auch, dass der letzte Absatz als falsch platzierte Beschimpfung (die es ist) wahrgenommen werden kann und gelöscht werden sollte.

Danke für den Hinweis. Ich habe einige umfangreiche Änderungen basierend auf den Kommentaren hier vorgenommen und die Stimmung entfernt.