In Ihrer Frage werden sehr viele Fragen aufgeworfen, daher werde ich versuchen, Antworten auf alle von Ihnen aufgeworfenen Fragen zu geben. Um einige dieser Probleme klar zu formulieren, ist es wichtig, zu Beginn festzustellen, dass ein p-Wert ein kontinuierliches Maß für Beweise gegen die Nullhypothese ist (zugunsten der angegebenen Alternative), aber wenn wir Vergleichen Sie es mit einem festgelegten Signifikanzniveau, um eine Schlussfolgerung aus der "statistischen Signifikanz" zu ziehen. Wir unterteilen dieses kontinuierliche Beweismaß in ein binäres Maß
.
Es macht keinen Sinn, den Leuten zu sagen, dass das Ergebnis in einer Stichprobe von 71 nicht signifikant ist, aber es ist in einer Stichprobe von 77 signifikant.
Sie müssen entscheiden, welches dieser beiden Beispiele tatsächlich das richtige ist - d. h., es ist angemessen, sechs Datenpunkte aus Ihren Daten zu entfernen. Aus Gründen, die auf dieser Site häufig erläutert wurden (z. B. hier und hier), ist es eine schlechte Idee, "Ausreißer" zu entfernen, die nicht auf eine falsche Aufzeichnung von Beobachtungen zurückzuführen sind. Wenn Sie also keinen Grund zu der Annahme haben, dass dies der Fall ist, ist es wahrscheinlich angebracht, alle 77 Datenpunkte zu verwenden. In diesem Fall ist es nicht sinnvoll, etwas über die von Kirschen gepflückte Teilstichprobe von 71 Daten zu sagen Punkte.
Beachten Sie hier, dass das Problem nichts mit dem Problem der statistischen Signifikanz zu tun hat. Es ist durchaus sinnvoll, dass das Ergebnis verschiedener Hypothesentests (z. B. der gleiche Test mit verschiedenen Daten) unterschiedlich sein kann. Daher gibt es keinen Grund, es als problematisch anzusehen, dass es in einem Fall statistisch signifikante Beweise für die alternative Hypothese gibt. aber nicht in der anderen. Dies ist eine natürliche Folge eines binären Ergebnisses, das durch Zeichnen einer Linie von "Signifikanz" in einem kontinuierlichen Beweismaß erhalten wird.
Bei der Interpretation eines Trends ist es wichtig, die Ergebnisse mit den Ergebnissen in der Literatur zu verknüpfen. Obwohl wir hier einen schwachen Trend finden, stimmt dieser Trend mit zahlreichen Studien in der Literatur überein, die signifikante Korrelationen in diesen beiden Variablen finden.
Wenn Sie dies tun möchten, sollten Sie eine Metaanalyse durchführen, um alle Daten in der Literatur zu berücksichtigen. Die bloße Tatsache, dass es andere Literatur mit anderen Daten / Beweisen gibt, ist keine Rechtfertigung dafür, die Daten in diesem Dokument anders zu behandeln, als Sie es sonst tun würden. Führen Sie Ihre Datenanalyse anhand der Daten in Ihrem eigenen Papier durch. Wenn Sie befürchten, dass Ihr eigenes Ergebnis eine Abweichung von der Literatur ist, beachten Sie diese anderen Beweise. Sie können dann entweder eine ordnungsgemäße Metaanalyse durchführen, bei der alle Daten (Ihre und die andere Literatur) berücksichtigt werden, oder Sie können Ihren Leser zumindest auf den Umfang der verfügbaren Daten aufmerksam machen.
Hier ist die Antwort meines Vorgesetzten: Ich würde anders argumentieren: Wenn es in der Stichprobe von 71 nicht mehr signifikant ist, ist es zu schwach, um gemeldet zu werden. Wenn es ein starkes Signal gibt, sehen wir es auch in der kleineren Stichprobe. Soll ich dieses "nicht signifikante" Ergebnis nicht melden?
Die Entscheidung, keine Daten zu melden , weil sich die statistischen Ergebnisse von anderer Literatur unterscheiden, ist eine terrible, schreckliche, statistisch bankrotte -Praxis. In der statistischen Theorie gibt es eine Menge Literatur, die vor dem Problem der Publikationsverzerrung warnt, das auftritt, wenn Forscher zulassen, dass das Ergebnis ihrer statistischen Tests ihre Entscheidung beeinflusst, ihre Daten zu melden / zu veröffentlichen. In der Tat ist die Publikationsverzerrung aufgrund von Publikationsentscheidungen, die auf der Grundlage von p-Werten getroffen werden, der Fluch der wissenschaftlichen Literatur. Es ist wahrscheinlich eines der größten Probleme in der wissenschaftlichen und akademischen Praxis.
Unabhängig davon, wie "schwach" die Beweise für die alternative Hypothese sind, enthalten die von Ihnen gesammelten Daten Informationen, die gemeldet / veröffentlicht werden sollten.Es fügt der Literatur 77 Datenpunkte hinzu, für was auch immer das wert ist.Sie sollten Ihre Daten und den p-Wert für Ihren Test angeben.Wenn dies keinen statistisch signifikanten Beweis für den untersuchten Effekt darstellt, dann sei es so.