Dies ist aus Efron und Tibshiranis Eine Einführung in den Bootstrap (erster Satz von Kapitel 2):
------------------------------------------------------------------ Der Bootstrap ist eine computergestützte Methode zum Zuweisen von Kennzahlen von
Genauigkeit bei statistischen Schätzungen.
Dies legt nahe, dass wir in gewisser Weise die korrekte Stichprobengröße $ n $ berücksichtigen sollten:
T Die Genauigkeit der statistischen Schätzungen hängt von der Stichprobengröße ab, und Ihre statistische Schätzung wird aus einer Stichprobe von Größe $ n $.
Wie man den Standardfehler des Mittelwerts mit dem Bootstrap schätzt und wie man sich etwas vormacht, wenn man Bootstrap-Beispiele mit einer anderen Größe als $ n $ zeichnet.
Ob Wir verstehen das Verhalten des Mittelwerts sehr gut. Wie Sie sich zweifellos vom Intro bis zur Statistik erinnern werden, hängt der Standardfehler des Mittelwerts auf folgende Weise von der Stichprobengröße $ n $ ab: $ SEM = s / \ sqrt {n} $, wobei $ s ^ 2 $ ist die Stichprobenvarianz.
Bootstrap-Prinzip besteht darin, dass sich ein Bootstrap-Beispiel auf Ihr Beispiel bezieht, während sich Ihr Beispiel auf die Grundgesamtheit bezieht. Mit anderen Worten, Sie gehen davon aus, dass Ihre Stichprobe eine ziemlich gute Annäherung an die Grundgesamtheit darstellt und dass Sie sie als Proxy verwenden können. Sei $ x ^ {* b} $ das $ b $ -th Bootstrap-Beispiel und sei $ \ hat \ mu ^ * _ b $ der Mittelwert dieses Bootstrap-Beispiels. Die Bootstrap-Schätzung des Standardfehlers lautet:
die Bootstrap-Schätzung des Standardfehlers einfach die Standardabweichung der Bootstrap-Statistik ist. Sie verwenden den Spread in den Bootstrap-Mitteln, um etwas über die Genauigkeit des Stichprobenmittelwerts zu sagen.
Jetzt booten wir, also behandeln wir die ursprüngliche Stichprobe als Population: Es handelt sich um eine diskrete Verteilung mit der Masse $ 1 / n $ an jedem Datenpunkt $ x_i $. Wir können so viele Proben daraus ziehen, wie wir wollen, und im Prinzip können wir sie so groß oder klein machen, wie wir wollen. Wenn wir ein Bootstrap-Beispiel mit einer Größe von $ n ^ * $ zeichnen und dessen Mittelwert $ \ hat \ mu ^ * $ schätzen, wissen wir, dass $ \ hat \ mu ^ * \ sim N (\ hat \ mu, s / \ sqrt { n ^ *}) $. For $ n ^ * = n $ ist die Standardabweichung Ihres Bootstrap-Mittelwerts genau die vom zentralen Grenzwert diktierte $ SEM $ für die ursprüngliche Stichprobe. Dies gilt nicht für andere $ n ^ * $.
Beispiel Wenn in diesem Beispiel $ n ^ * = n $ ist, ist die Stichprobe-Standardabweichung von $ \ {\ hat \ mu ^ * _ b \} $ eine gute Darstellung des korrekten Standardfehlers des Mittelwerts. Wenn Sie größere Bootstrap-Stichproben zeichnen, erhalten Sie wirklich gute Schätzungen des Stichprobenmittelwerts, aber their-Spread bezieht sich nicht mehr direkt auf den Standardfehler, den Sie versuchen, zu schätzen, da Sie deren Verteilung beliebig eng machen können.