Frage:
Was ist der erwartete Mindestwert, der aus einer gleichmäßigen Verteilung zwischen 0 und 1 nach n Versuchen gezogen wird?
Bryce Thomas
2010-08-11 18:38:20 UTC
view on stackexchange narkive permalink

Angenommen, Sie zeichnen eine gleichmäßig verteilte Zufallszahl zwischen 0 und 1 n Mal. Wie würde man vorgehen, um die erwartete minimale Anzahl zu berechnen, die nach n Versuchen gezogen wurde?

Wie würde man außerdem ein Konfidenzintervall berechnen, um anzugeben, dass die gezeichnete Mindestanzahl im Intervall [a, b] mit m% Konfidenz liegt?

Drei antworten:
user28
2010-08-11 18:53:57 UTC
view on stackexchange narkive permalink

Sie suchen nach Bestellstatistiken. Das Wiki zeigt an, dass die Verteilung der Mindestziehung aus einer gleichmäßigen Verteilung zwischen 0 und 1 nach $ n $ -Versuchen eine Beta-Verteilung ist (ich habe sie nicht auf Richtigkeit überprüft, was Sie wahrscheinlich tun sollten.). Insbesondere sei $ U _ {(1)} $ die Mindestbestellungsstatistik. Dann:

$ U _ {(1)} \ sim B (1, n) $

Daher ist der Mittelwert $ \ frac {1} {1 + n} $. Sie können die Beta-Distribution verwenden, um $ a $ und $ b $ so zu identifizieren, dass

$ Prob (a \ le U _ {(1)} \ le b) = 0,95 $.

Übrigens ist die Verwendung des Begriffs Konfidenzintervall in diesem Zusammenhang nicht angemessen, da Sie keine Inferenz durchführen.

Update

Es ist nicht einfach, $ a $ und $ b $ so zu berechnen, dass $ Prob (a \ le U _ {(1)} \ le b) = 0,95 $ ist. Es gibt verschiedene Möglichkeiten, wie Sie $ a $ und $ b $ berechnen können. Ein Ansatz besteht darin, das Intervall um den Mittelwert zu zentrieren. Bei diesem Ansatz würden Sie Folgendes festlegen:

$ a = \ mu - \ delta $ und

$ b = \ mu + \ delta $

wobei

$ \ mu = \ frac {1} {1 + n} $.

Sie würden dann $ \ delta $ so berechnen, dass die erforderliche Wahrscheinlichkeit 0,95 beträgt. Beachten Sie, dass Sie bei diesem Ansatz möglicherweise kein symmetrisches Intervall um den Mittelwert für hohe $ n $ identifizieren können, aber dies ist nur meine Vermutung.

csgillespie
2010-08-11 20:16:56 UTC
view on stackexchange narkive permalink

Wie Srikant vorschlägt, müssen Sie sich die Bestellstatistik ansehen.

Um Srikants Antwort zu ergänzen, können Sie diesen Vorgang einfach in R:

  n = 10N = 1000; sims = numerisch (N) für (i in 1: N) sims [i] = min (runif (n)) hist (sims, freq = FALSE) x = seq (0, 1,0.01) Zeilen (x, dbeta (x, 1, n), col = 2)  

Um

Alternativtext http: // zu erhalten img441.imageshack.us/img441/6826/tmpe.jpg


Leichter Exkurs

Diese Frage bezieht sich auf eine von meinen Lieblingsstatistikproblemen das deutsche Panzerproblem. Dieses Problem betrifft das Maximum gleichmäßiger Verteilungen und kann wie folgt zusammengefasst werden:

Angenommen, man ist ein alliierter Intelligenzanalytiker während des Zweiten Weltkriegs und hat einige Seriennummern von erbeuteten deutschen Panzern. Nehmen wir weiter an, dass die Panzer fortlaufend von 1 bis N nummeriert sind. Wie schätzt man die Gesamtzahl der Panzer?

Entnommen aus Wikipedia

Weitere Informationen finden Sie auf der Wikipedia-Seite .

shabbychef
2010-08-12 00:52:30 UTC
view on stackexchange narkive permalink

Nach @Srikant kann man die CDF der Beta-Verteilung berechnen und Bedingungen für $ a, b $ finden, so dass das Intervall $ [a, b] $ das Minimum von $ n $ Draws einer Uniform mit 95 enthält % Wahrscheinlichkeit. Die Bedingung ist: $ (1-a) ^ n - (1-b) ^ n = 0,95 $. Eine attraktive Wahl wäre dann das Intervall $ [0,1 - 0,05 ^ {1 / n}] $. Dies ist auch das kleinste Intervall mit der gewünschten Eigenschaft.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 2.0-Lizenz, unter der er vertrieben wird.
Loading...