Angenommen, $ X $ ist verteilt $ N (\ mu, \ sigma ^ 2) $ wobei $ \ mu \ neq 0 $.
Kann ich mit der Delta-Methode sagen, dass $ log (X) $ ~ $ N (log (\ mu), \ sigma ^ 2 / \ mu ^ 2) $?
Angenommen, $ X $ ist verteilt $ N (\ mu, \ sigma ^ 2) $ wobei $ \ mu \ neq 0 $.
Kann ich mit der Delta-Methode sagen, dass $ log (X) $ ~ $ N (log (\ mu), \ sigma ^ 2 / \ mu ^ 2) $?
Dies ist nicht der Fall.
Damit $ \ log (X) $ normal ist, muss $ X $ lognormal sein.
(Beachten Sie: wenn $ Z = \ log ( X) $ ist normal, dann ist $ X = \ exp (Z) $ ... und wenn Sie eine normale Zufallsvariable potenzieren, wird das, was Sie erhalten, als logarithmische Zufallsvariable bezeichnet.)
Allgemeiner genommen Protokolle "ziehen" extremere Werte rechts (hohe Werte) relativ zum Median ein, während Werte ganz links (niedrige Werte) dazu neigen, nach hinten gestreckt zu werden. Wenn es also vor dem Erstellen von Protokollen symmetrisch ist, bleibt es danach relativ schief. Dies ist eine einfache Folge der Form der Funktion $ \ log (x) $:
(die Linie tangiert die Kurve. Im Allgemeinen nicht Wenn Sie sich nicht unbedingt dem Ursprung nähern, ist dies in diesem Fall nur ein Artefakt des bestimmten Werts von $ m $.
Werte, die sehr nahe am Median liegen (angezeigt durch ein $ m $ im Diagramm), werden auftreten eine annähernd lineare Neuskalierung (die gestrichelte blaue Linie). Werte weit über $ m $ werden relativ zu der von den Mittelwerten erlebten Neuskalierung in Richtung $ m $ zurückgezogen, während Werte weit unter $ m $ im Verhältnis zu dieser linearen Neuskalierung weiter von $ m $ entfernt werden. P. >
Infolgedessen sind Werte in gleichem Abstand, $ d $ über und unter $ m $ vor der Transformation, danach nicht mehr gleich weit davon entfernt - der oben transformierte Wert liegt näher an $ \ log (m) $ als der transformierte Wert darunter wird sein. Dies würde für jeden Wert von $ d $ passieren.
Symmetrisch $ X $ impliziert also asymmetrisch $ \ log (X) $.
Sprechen wir jetzt nicht über Normalität, sondern über ungefähre Normalität. (Nehmen wir der Einfachheit halber an, dass die Verteilung so ist, dass die Werte im Wesentlichen immer positiv sind - dh wenn die ursprünglichen Werte normal waren, ist die Wahrscheinlichkeit eines negativen Werts extrem gering.)
Es gibt einen Situation, in der annähernd normale Werte nach der Transformation immer noch annähernd normal sind.
In diesem Fall ist die Standardabweichung im Vergleich zum Mittelwert (niedriger Variationskoeffizient) sehr klein.
Wenn Sie sich das obige Diagramm ansehen, betrachten Sie Werte auf der x-Achse in einem sehr schmalen Band um $ m $. Der Einzieh- / Ausdehnungseffekt ist minimal (die schwarze Kurve kann nicht weit von der blauen Tangentenlinie entfernt werden), sodass die Form immer noch normal aussieht.
Hier ein Beispiel: Das obere Diagramm ist ein Satz von ungefähr normalen Daten (das QQ-Diagramm zeigt eine ziemlich gerade Linie), und sein Protokoll ist ebenfalls ungefähr normal (das QQ-Diagramm zeigt immer noch eine ziemlich gerade Linie). Das liegt daran, dass der Variationskoeffizient der ursprünglichen Werte ziemlich klein war (irgendwo um 0,2, glaube ich) - die nichtlineare Transformation war im engen Wertebereich um die Mitte immer noch nahezu linear .
In dieser Situation ist die Delta-Methode in der Tat nützlich, um ungefähre Werte für den Mittelwert und die Varianz der logarithmischen Werte anzugeben, obwohl dies nicht die Verteilung der Werte wäre Protokoll einer genau normalen Zufallsvariablen.
Nein. $ X $ kann negativ sein. Daher gibt $ \ log (X) $ keine reelle Zahl mit positiver Wahrscheinlichkeit zurück. Die Normalverteilung wird nur auf der realen Linie definiert. QED.
Nein. Gegenbeispiel: $ x \ sim \ mathcal {N} (- 1,1) $
Wenn $ X $ span> normal verteilt ist, kann $ \ log (X) $ span> auch normal sein verteilt?
Andere Antworten haben angegeben, dass dies nicht möglich ist. In der Tat ist theoretisch nicht möglich. Wenn $ X $ span> normal verteilt ist, kann $ X $ span> negative Werte haben und $ \ log (X) $ span> existiert nicht für negative Eingaben.
In in Practice kann es sich jedoch um eine Verteilung handeln, die nur annähernd normal verteilt ist und eine Domäne $ X>0 $ span> hat. Für eine solche Verteilung könnte es immer noch interessant sein, sich vorzustellen, was passieren wird, wenn wir die Transformation $ \ log (X) $ span>.
nehmenDie Delta-Methode approximiert die Transformation $ \ log (X) $ span> durch Linearisierung. Diese Annäherung funktioniert gut, wenn die Differenz um den Mittelwert (den Punkt, an dem Sie linearisieren) nicht zu groß ist.
Das folgende Bild zeigt die Transformation für verschiedene Variationskoeffizienten von $ X $ span> (siehe ähnliche Bilder hier).
Sie können sehen, dass das Bild links einer linearen Transformation nicht so nahe kommt, und das resultierende Histogramm von $ Y = \ log (X) $ span> wird gezeichnet im Rand ähnelt nicht so sehr einer Normalverteilung und ist schief. Das Bild rechts ist jedoch näher an einer linearen Transformation und die transformierte Variable ähnelt einigermaßen einer Normalverteilung.
Die Werte von $ \ mu $ span> und $ \ sigma $ span> im letzten / rechten Bild werden angezeigt dass die Delta-Methode für diesen Fall funktioniert:
> ymean
[1] 2.995604
> log (xmean)
[1] 2.995921
>
> ysig
[1] 0,02521176
> xsig / 20
[1] 0,02519255
>
Die Delta-Methode ist weniger genau, wenn der $ \ sigma / \ mu $ span> größer ist, da die Approximation mit Linearisierung weniger genau ist.
Das Bild unten zeigt dies. Es zeigt Simulationen von 10.000 Punkten für $ Y = \ log (X) $ span>, wobei $ X \ sim N (\ mu_X =) 1, \ sigma_X = CV) $ span> wobei $ CV $ span> variiert wurde (Werte $ X<0 $ span> wurden entfernt).
Die rot gestrichelte Kurve zeigt, dass der Mittelwert von $ Y = \ log (X) $ span> durch Invertieren der Formel für den Mittelwert eines log- annähernd angenähert werden kann. normalverteilte Variable.
Wenn $ Y = \ exp (X) $ span> oder $ X = \ log (Y) $ span>, wobei $ X \ sim N (\ mu_X, \ sigma_X ^ 2) $ span> dann $ \ mu_Y = \ exp (\ mu_X + 0.5 \ sigma_X ^ 2) $ span> und der inverse $ \ mu_X \ approx \ log (\ mu_Y) -0.5 \ sigma_X ^ 2 $ .
Dasselbe könnten wir auch für die Beziehung für die Varianz einer logarithmischen Normalverteilung tun, aber das ist ein etwas umständlicher Ausdruck, also vereinfachen wir die Dinge ein wenig und füllen die Delta-Näherung $ \ sigma_X \ approx \ sigma_Y / \ mu_Y $ span>.
Also haben wir
$$ \ mu_X \ approx \ log (\ mu_Y) -0,5 \ sigma_Y ^ 2 / \ mu_Y ^ 2 $$ span>
Dies ist die rote Kurve im obigen Diagramm und sie scheint gut mit den Daten übereinzustimmen.
In dieser Frage:
Monte-Carlo-Ergebnisse werden durch mehr Stichproben verzerrt
Man befasst sich mit einem Logarithmus von $ X $ span>, wobei es sich um den Prozentsatz der monatlichen Rendite einer Investition handelt.Der Mittelwert ist 1,01 und der sd = 0,04, so dass der Variationskoeffizient sehr klein ist
In dieser Frage funktioniert die Delta-Methode, die genauere Methode jedoch noch besser.
Wenn $ X $ span> normal verteilt ist, kann $ log (X) $ span> auch normal verteilt werden?
Ja.Es ist möglich.Und tatsächlich ist es genau dann wahr, wenn $ X \ sim \ mathcal {N} (\ mu, 0) $ span> mit $ \ mu > 0 $ span>, in diesem Fall $ log (X) \ sim \ mathcal {N} (log (\ mu), 0) $ span>.
Hinweis: "Can" unterscheidet sich von "must".