Frage:
Nichtübereinstimmung zwischen dem p-Wert und dem Konfidenzintervall in einem Binomialtest
AnkeS
2015-09-18 06:10:23 UTC
view on stackexchange narkive permalink

Dies ist eine Frage zum Binomialtest in R.

Was passiert, wenn ich einen p-Wert < 0,05 erhalte, der mich im Allgemeinen veranlassen würde, die Nullhypothese abzulehnen, dass der Populationswert gleich ist ein bestimmter Anteil (in diesem Fall 0,75), aber der zu testende hypothetische Anteil (dh die Nullhypothese) liegt immer noch innerhalb des 95% -Konfidenzintervalls?

lehne ich die Hypothese gleicher Anteile immer noch ab?

Hier ist ein Beispiel für einen R-Code:

  x <-31 n <-50binom.test (x, n, p = 0,75) # p-Wert = 0,04812 # 95 Prozentuales Konfidenzintervall: # 0.4717492 0.7534989  
Ein kürzlich stark verwandter Thread mit guter Diskussion: http://stats.stackexchange.com/questions/169141.
Siehe auch die Antwort von Glen_b im doppelten Thread: http://stats.stackexchange.com/questions/254996.
Vier antworten:
Karl Ove Hufthammer
2015-09-19 01:05:52 UTC
view on stackexchange narkive permalink

Während das von binom.test () bereitgestellte Test- und Konfidenzintervall beide genau sind, basiert das Konfidenzintervall leider nicht auf Invertierung den Test, so können sie zu inkonsistenten Ergebnissen führen. Siehe das Papier

Fay, M.P. (2010). Zweiseitige exakte Tests und übereinstimmende Konfidenzintervalle für diskrete Daten. R Journal, Band 2, Nr. 1, Seiten 53–58.

Weitere Informationen. Glücklicherweise gibt es ein R-Paket des Autors des obigen Papiers, das (drei verschiedene Paare) konsistenter Tests und Konfidenzintervalle bietet. Auf Ihre Daten angewendet, werden die Ergebnisse [leicht bearbeitet, um nur die relevanten Informationen anzuzeigen]:

  >-Bibliothek (genau) > binom.exact (31, 50, p = 0,75, tsmethod = "zentral") Exakter zweiseitiger Binomialtest (zentrale Methode) p-Wert = 0,0574795 Prozent Konfidenzintervall: 0,4717492 0,7534989> binom.exact (31, 50, p = 0,75, tsmethod = "minlike") Exakter zweiseitiger Binomialtest (Summe der Minimum-Likelihood-Methode) p-Wert = 0,0481295 Prozent Konfidenzintervall: 0,4799 0,7463> binom.exact (31, 50, p = 0,75, tsmethod = "blaker") Exakter zweiseitiger Binomialtest (Blaker-Methode) p-Wert = 0,0481295 Prozent Konfidenzintervall: 0,4797 0,7463  

Informationen zu den Vor- und Nachteilen der drei verschiedenen Testreihen und Konfidenzintervalle finden Sie im obigen Dokument.

user75138
2015-09-18 08:31:31 UTC
view on stackexchange narkive permalink

Das Problem bei Tests des Binomialanteils besteht darin, dass die verwendeten Tests im Allgemeinen ungefähr sind (da der genaue "Clopper-Pearson" -Test lächerlich konservativ ist). Daher ist nicht klar, dass das Verfahren zum Abrufen des CI das gleiche ist wie das zum Testen der Hypothese. Theoretisch sollte jeder Ansatz zu derselben Schlussfolgerung führen, wenn Sie nur einen CI und einen Test verwenden.

Sie haben einen Grenzfall. Beide Statistiken sagen Ihnen, dass Ihre Beobachtung unter der Nullhypothese nicht allzu häufig ist. Denken Sie daran: Es gibt nichts Besonderes an 5% Bedeutung ... es ist ein kulturelles Artefakt von Ronald Fisher in den 1930er Jahren. Es ist eine Richtlinie.

Für das, was es wert ist, würde ich schließen, dass es unwahrscheinlich ist, dass die wahre Erfolgswahrscheinlichkeit so hoch wie 0,75 ist.

Per @John

In einer strengen Situation, in der Hypothesen getestet werden, bleiben Sie bei 0,05, sodass Sie die Nullhypothese unter diesen Kriterien ablehnen würden. Allerdings würde ich noch nicht ganz zur Presse laufen; -) ... Hypothesentests können wirklich jede Nuance der Folgerung zerstören.

Die Art und Weise, wie der Fragesteller sein Ergebnis meldet, kann er mit 0,75 nicht ablehnen.Es ist im CI enthalten und ihr Cutoff beträgt nicht mehr 0,05, um das Alpha des gleichen beizubehalten.Obwohl 0,05 ein kulturelles Artefakt sein kann, können Sie es später nicht mehr ändern.Der Fragesteller hielt es eindeutig für wichtig, zwei Tests durchzuführen, und hat nun beide ruiniert.Sie benötigen viel mehr Informationen zu dieser Frage, um eine Ablehnungsempfehlung abzugeben.
@John wo habe ich gesagt, etwas abzulehnen?Ich machte eine allgemeine Aussage über Beweise.In beiden Fällen ist 0,75 ein Randfall in Bezug auf die Wahrscheinlichkeit.Mach damit, was du willst.Meine Aussage über 5% war, dem OP zu helfen, sich von den albernen kategorialen Aussagen zu lösen, die Hypothesentests erlauben, insbesondere wenn das formale Ergebnis fast nicht eindeutig ist.
Ihr letzter Satz ist Ablehnung 0,75.Daran testet er.Ihr Ziel, ihnen zu helfen, von dummen Hypothesen-Testaussagen wegzukommen, ist nobel, aber Ihr letzter Satz ist genau das.
@John Ich habe nicht abgelehnt gesagt, ich sagte, es scheint unwahrscheinlich.Ganz andere Sache.Die Testergebnisse sind schwach.
OK, das ist fair.Aber angesichts dieser Frage wäre die Antwort vielleicht besser, wenn klargestellt würde, dass für jemanden, der nur nach Tests fragt.
@John Ok, fair genug.Ich werde die Chance ändern, dass auch OP davon profitieren würde (obwohl sie diese Antwort ohnehin schon akzeptiert haben).
Das stimmt, aber sie könnten es haben, weil sie Ihren letzten Satz als genau das interpretiert haben, was sie hören wollten, eine Ablehnung von 0,75.Und selbst wenn sie es nicht taten, ist es sehr wahrscheinlich, dass angesichts der NHST-Ausbildung jemand mitkommt und genau das tut.
@John Ja, darüber war ich nach Ihrem Kommentar besorgt.Ihr p-Wert liegt unter ihrem Grenzwert, daher würden sie in diesem Fall ablehnen.
John
2015-09-18 19:56:12 UTC
view on stackexchange narkive permalink

Dies ist offensichtlich ein Grenzfall und das CI und die Testergebnisse werden nicht genau auf die gleiche Weise abgeleitet (das CI ist keine Inversion des Tests). Möglicherweise möchten Sie binomiale CIs nachschlagen und feststellen, dass es viele Möglichkeiten gibt, sie alle mit Vor- und Nachteilen zu berechnen. Aber nichts davon kommt zu Ihrer zentralen Frage, ob Sie die 0,75-Hypothese hier ablehnen sollten.

Außerdem behandeln Sie Ihren p-Wert und Ihre CIs beide als Tests. Da Sie dies getan haben, können Sie 0,75 nicht ablehnen, da Sie jetzt zwei Tests haben und diese Alpha-Korrekturen hätten durchführen sollen. Das CI sollte als etwas anderes behandelt werden, aber Sie haben in Ihrer Frage klar vermittelt, dass Sie es als Test betrachten. Vorausgesetzt, Sie können jetzt auswählen, welcher Test für Sie Alpha nicht 0,05 ist.

Treten Sie für einen Moment vom Test zurück.

Sie müssen über Ihre Zahlen nachdenken. Aus irgendeinem Grund haben Sie genau 0,75 als Ablehnungsbetrag ausgewählt. Was wäre, wenn Sie ein enormes N hätten und 0,74 hätten und es sowohl im CI als auch im Test ablehnen könnten? Würden Sie zu dem gleichen Schluss kommen, den Sie mit der 0,62 haben würden, die Sie gerade haben? Gibt es einen Bereich nahe 0,75, der in Ihrer Arbeit ungefähr 0,75 entspricht, oder ist genau 0,75 sehr kritisch? Wenn es einen Bereich gibt, wie viel davon wird von Ihrem CI erfasst? Wie glaubwürdig ist dann Ihre Testabweisung? Und was ist mit der Reichweite des CI, das Sie haben? Es ist ungefähr 0,25 und das ist ziemlich viel von den möglichen Proportionen. Denken Sie, Sie können viel darüber sagen, was der wahre Anteil wirklich ist? Es könnte ein Wert sein, der wirklich nahe bei 0,75 liegt, oder es könnte nahe bei 0,50 liegen. Wie stark möchten Sie mit Ihren Daten eine Aussage treffen? Sind Werte über 0,75 genauso wichtig wie Werte unter 0,75? War 0,75 eine Untergrenze, die Sie getestet haben? In diesem Fall kann die Schlussfolgerung anders sein.

Das sind also viele Fragen, aber ich habe sie dort veröffentlicht, um einen Punkt zu verdeutlichen. Das einfache Ablehnen der Null wird mit diesen Daten ein ziemlich sinnloses Unterfangen sein. Angenommen, Sie können einen Fall vorbringen, um ihn abzulehnen. Was können Sie sonst noch sagen? Ist es wirklich nützlich, den Leuten zu sagen, dass der wahre Wert nicht 0,75 ist, aber 0,74 sein könnte?

Sammeln Sie mehr Daten.

Richard Ian Carpenter
2015-09-18 07:55:34 UTC
view on stackexchange narkive permalink

Ich beantworte zum ersten Mal eine Frage, daher hoffe ich, dass ich tatsächlich eine nützliche Antwort gebe.

Wenn Sie dies in R ausführen:

  x <- 31n <- 50p <- 0.75binom.test (x, n, p = p)  

... gibt die folgenden Ergebnisse zurück:

  Genaue binomiale Testdaten: x und Anzahl der Erfolge = 31, Anzahl der Versuche = 50, p-Wert = 0,04812 Alternative Hypothese: Die wahre Erfolgswahrscheinlichkeit entspricht nicht 0,7595 Prozent Konfidenzintervall: 0,4717492 0,7534989 Beispielschätzungen: Erfolgswahrscheinlichkeit 0,62  

Der p-Wert von 0,4812 sagt Ihnen, dass das Testen auf eine Erfolgswahrscheinlichkeit von 0,75 (75%) 31 "erfolgreiche" Ergebnisse aus 50 Versuchen eines binären Ereignisses ergibt (0, 1) - dh: eine Münze werfen und 31 von 50 Köpfen hochheben - liegt genau innerhalb des 95% -Konfidenzintervalls, das eine Reihe von Erfolgswahrscheinlichkeiten darstellt.

Daher können Sie die Nullhypothese, dass die Erfolgswahrscheinlichkeit 75% beträgt, vorsichtig akzeptieren. (Die alternative Hypothese lautet, dass die Erfolgswahrscheinlichkeit nicht 75% beträgt.)

Die berechnete Erfolgswahrscheinlichkeit wird am Ende der Ausgabe angegeben: 0,62 oder 62% Erfolgschance. Dies ist nicht mehr als 31/50.

Ich wäre ebenso vorsichtig, wenn ich sagen würde, dass ich die Null akzeptiere.
So wahr wie vorsichtig abzulehnen.
Mein Punkt war lediglich, die Null in einem frequentistischen Rahmen zu akzeptieren (genau genommen können wir sie einfach ablehnen) und nicht, wie die vorliegenden Ergebnisse zu interpretieren sind.Mit anderen Worten, dies war nur eine allgemeine Bemerkung.


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...