Frage:
Was ist der Unterschied zwischen empirischer Varianz und Varianz?
Zia
2011-06-01 14:24:43 UTC
view on stackexchange narkive permalink

Soweit ich weiß, wird die Varianz berechnet als

$$ \ text {Varianz} = \ frac {(x- \ text {mean}) ^ 2} {n} $$

while

$$ \ text {Empirische Varianz} = \ frac {(x- \ text {mean}) ^ 2} {n (n-1)} $$

Ist es richtig? Oder gibt es eine andere Definition? Bitte erläutern Sie dies anhand eines Beispiels oder einer Referenz zum Lesen dieses Themas

Ich habe Latex verwendet, um die Darstellung Ihrer Frage zu ändern. Wenn dies nicht Ihre Absicht ist, lassen Sie es mich wissen
Einer antworten:
#1
+17
Henry
2011-06-01 14:46:10 UTC
view on stackexchange narkive permalink

In Ihrem Ausdruck für die Varianz müssen Sie eine Summe (oder ein Integral) über die Grundgesamtheit

$$ \ text {Varianz} = \ frac {\ sum_i nehmen (x_i- \ text {mean}) ^ 2} {n} $$

Wenn Ihre Daten eine Stichprobe aus der Population sind, gibt Ihnen dieser Ausdruck eine voreingenommene Schätzung der Populationsvarianz. Eine unvoreingenommene Schätzung wäre wie folgt (beachten Sie die Änderung des Nenners gegenüber Ihrem Ausdruck), die häufig als Stichprobenvarianz

$$ \ text {Stichprobenvarianz} = \ frac {\ sum_i (x_i- \ text) bezeichnet wird {mean}) ^ 2} {n-1} $$

Wenn Sie andererseits versucht haben, die Varianz des Stichprobenmittelwerts abzuschätzen, haben Sie möglicherweise eine kleinere Zahl, die näher an Ihrem Ausdruck liegt . Die Quadratwurzel davon wird als Standardfehler des Mittelwerts bezeichnet, und eine vernünftige Schätzung lautet

$$ \ text {Standardfehler} = \ sqrt {\ frac {\ sum_i ( x_i- \ text {mean}) ^ 2} {n (n-1)}} $$

Unter http://en.wikipedia.org/wiki/Bias_of_an_estimator#Sample_variance finden Sie eine Erklärung, warum die Varianz $ 1 / n \ sum_ {i} (x_ {i} - \ bar {x}) ^ 2 $ ein voreingenommener Schätzer ist. und http://vdov.net/~acosta/content/mle-normal/ für eine Erklärung, warum es der Maximum-Likelihood-Schätzer für normale Variablen ist.
Können Sie klarstellen, welche als "empirische Varianz" bezeichnet wird?
@GuillaumeChérel - Ich habe das Wort "empirisch" nicht verwendet, da der Punkt, den ich ansprechen wollte, die Schlüsselfrage ist, zwischen der Schätzung der Varianz (oder Standardabweichung) der Population und der Schätzung der Fehlerverteilung bei der Schätzung des Mittelwerts zu unterscheiden.Andere nennen jede Schätzung von Parametern aus Beobachtungen als * empirisch *
Aha.In der Tat ist das Wort * empirisch * vage, und genau das ist mein Problem: Ich bin beim Lesen eines Artikels mit einem Algorithmus, den ich implementieren möchte, auf den Begriff * empirische Varianz * gestoßen.Ich kann keinen Hinweis darauf finden, ob ich die Summe der quadratischen Differenzen durch $ n $ oder $ n - 1 $ teilen soll.Also nahm ich an, dass Leute, die den Begriff * empirisch * verwendeten, sich implizit auf das eine oder andere bezogen.Irgendeine Idee?
Nur eine Vermutung, aber sie können "Stichprobenvarianz" bedeuten und sie können sich bei der Berechnung eher durch $ n-1 $ teilen


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...