Frage:
Wenn $ X $ normal verteilt ist, kann $ \ log (X) $ auch normal verteilt werden?
JCWong
2014-04-09 01:54:45 UTC
view on stackexchange narkive permalink

Angenommen, $ X $ ist verteilt $ N (\ mu, \ sigma ^ 2) $ wobei $ \ mu \ neq 0 $.
Kann ich mit der Delta-Methode sagen, dass $ log (X) $ ~ $ N (log (\ mu), \ sigma ^ 2 / \ mu ^ 2) $?

Was ist, wenn $ \ mu $ negativ ist? Ist $ \ log (\ mu) $ immer noch als reelle Zahl definiert?
Selbst wenn $ \ mu / \ sigma $ riesig ist, so dass wir (wohl) die Wahrscheinlichkeit eines negativen Wertes vernachlässigen könnten, sind die Erwartungen falsch: $ X = \ exp (\ log (X)) $ hätte einen Mittelwert von $ \ exp (\ log (\ mu) + \ sigma ^ 2 / (2 \ mu ^ 2)), $ was streng größer als $ \ mu $ ist. Es ist * wahr *, dass logarithmische Normalverteilungen mit sehr kleinen geometrischen Standardabweichungen ungefähr normal sind, vorausgesetzt, die Parameter werden entsprechend ausgewählt.
Fünf antworten:
Glen_b
2014-04-09 04:13:00 UTC
view on stackexchange narkive permalink

Dies ist nicht der Fall.

Damit $ \ log (X) $ normal ist, muss $ X $ lognormal sein.

(Beachten Sie: wenn $ Z = \ log ( X) $ ist normal, dann ist $ X = \ exp (Z) $ ... und wenn Sie eine normale Zufallsvariable potenzieren, wird das, was Sie erhalten, als logarithmische Zufallsvariable bezeichnet.)

Allgemeiner genommen Protokolle "ziehen" extremere Werte rechts (hohe Werte) relativ zum Median ein, während Werte ganz links (niedrige Werte) dazu neigen, nach hinten gestreckt zu werden. Wenn es also vor dem Erstellen von Protokollen symmetrisch ist, bleibt es danach relativ schief. Dies ist eine einfache Folge der Form der Funktion $ \ log (x) $:

enter image description here

(die Linie tangiert die Kurve. Im Allgemeinen nicht Wenn Sie sich nicht unbedingt dem Ursprung nähern, ist dies in diesem Fall nur ein Artefakt des bestimmten Werts von $ m $.

Werte, die sehr nahe am Median liegen (angezeigt durch ein $ m $ im Diagramm), werden auftreten eine annähernd lineare Neuskalierung (die gestrichelte blaue Linie). Werte weit über $ m $ werden relativ zu der von den Mittelwerten erlebten Neuskalierung in Richtung $ m $ zurückgezogen, während Werte weit unter $ m $ im Verhältnis zu dieser linearen Neuskalierung weiter von $ m $ entfernt werden. P. >

Infolgedessen sind Werte in gleichem Abstand, $ d $ über und unter $ m $ vor der Transformation, danach nicht mehr gleich weit davon entfernt - der oben transformierte Wert liegt näher an $ \ log (m) $ als der transformierte Wert darunter wird sein. Dies würde für jeden Wert von $ d $ passieren.

Symmetrisch $ X $ impliziert also asymmetrisch $ \ log (X) $.


Sprechen wir jetzt nicht über Normalität, sondern über ungefähre Normalität. (Nehmen wir der Einfachheit halber an, dass die Verteilung so ist, dass die Werte im Wesentlichen immer positiv sind - dh wenn die ursprünglichen Werte normal waren, ist die Wahrscheinlichkeit eines negativen Werts extrem gering.)

Es gibt einen Situation, in der annähernd normale Werte nach der Transformation immer noch annähernd normal sind.

In diesem Fall ist die Standardabweichung im Vergleich zum Mittelwert (niedriger Variationskoeffizient) sehr klein.

Wenn Sie sich das obige Diagramm ansehen, betrachten Sie Werte auf der x-Achse in einem sehr schmalen Band um $ m $. Der Einzieh- / Ausdehnungseffekt ist minimal (die schwarze Kurve kann nicht weit von der blauen Tangentenlinie entfernt werden), sodass die Form immer noch normal aussieht.

Hier ein Beispiel: Das obere Diagramm ist ein Satz von ungefähr normalen Daten (das QQ-Diagramm zeigt eine ziemlich gerade Linie), und sein Protokoll ist ebenfalls ungefähr normal (das QQ-Diagramm zeigt immer noch eine ziemlich gerade Linie). Das liegt daran, dass der Variationskoeffizient der ursprünglichen Werte ziemlich klein war (irgendwo um 0,2, glaube ich) - die nichtlineare Transformation war im engen Wertebereich um die Mitte immer noch nahezu linear .

enter image description here

In dieser Situation ist die Delta-Methode in der Tat nützlich, um ungefähre Werte für den Mittelwert und die Varianz der logarithmischen Werte anzugeben, obwohl dies nicht die Verteilung der Werte wäre Protokoll einer genau normalen Zufallsvariablen.

Sycorax
2014-04-09 02:07:41 UTC
view on stackexchange narkive permalink

Nein. $ X $ kann negativ sein. Daher gibt $ \ log (X) $ keine reelle Zahl mit positiver Wahrscheinlichkeit zurück. Die Normalverteilung wird nur auf der realen Linie definiert. QED.

Aksakal
2014-04-09 01:55:58 UTC
view on stackexchange narkive permalink

Nein. Gegenbeispiel: $ x \ sim \ mathcal {N} (- 1,1) $

Die Frage war, ob $ \ log (X) $ normal verteilt werden kann, wenn $ X $ normal verteilt ist.Dieses Beispiel beweist nicht, dass diese Aussage falsch ist, es ist also kein Gegenbeispiel.Sie müssen zeigen, dass es unmöglich ist, dass $ \ log (X) $ normal ist, wenn $ X $ normal ist (was offensichtlich der Fall ist; siehe z. B. die Antwort von Sycorax).
Sextus Empiricus
2020-08-04 16:04:13 UTC
view on stackexchange narkive permalink

Wenn $ X $ span> normal verteilt ist, kann $ \ log (X) $ span> auch normal sein verteilt?

Theoretisch: Nein

Andere Antworten haben angegeben, dass dies nicht möglich ist. In der Tat ist theoretisch nicht möglich. Wenn $ X $ span> normal verteilt ist, kann $ X $ span> negative Werte haben und $ \ log (X) $ span> existiert nicht für negative Eingaben.

In der Praxis: Ja

In in Practice kann es sich jedoch um eine Verteilung handeln, die nur annähernd normal verteilt ist und eine Domäne $ X>0 $ span> hat. Für eine solche Verteilung könnte es immer noch interessant sein, sich vorzustellen, was passieren wird, wenn wir die Transformation $ \ log (X) $ span>.

nehmen

Die Delta-Methode

Die Delta-Methode approximiert die Transformation $ \ log (X) $ span> durch Linearisierung. Diese Annäherung funktioniert gut, wenn die Differenz um den Mittelwert (den Punkt, an dem Sie linearisieren) nicht zu groß ist.

Das folgende Bild zeigt die Transformation für verschiedene Variationskoeffizienten von $ X $ span> (siehe ähnliche Bilder hier).

Sie können sehen, dass das Bild links einer linearen Transformation nicht so nahe kommt, und das resultierende Histogramm von $ Y = \ log (X) $ span> wird gezeichnet im Rand ähnelt nicht so sehr einer Normalverteilung und ist schief. Das Bild rechts ist jedoch näher an einer linearen Transformation und die transformierte Variable ähnelt einigermaßen einer Normalverteilung.

linearization, Delta method, with different scales

Die Werte von $ \ mu $ span> und $ \ sigma $ span> im letzten / rechten Bild werden angezeigt dass die Delta-Methode für diesen Fall funktioniert:

  > ymean
[1] 2.995604
> log (xmean)
[1] 2.995921
>
> ysig
[1] 0,02521176
> xsig / 20
[1] 0,02519255
>
 

Genauer als die Delta-Methode

Die Delta-Methode ist weniger genau, wenn der $ \ sigma / \ mu $ span> größer ist, da die Approximation mit Linearisierung weniger genau ist.

Das Bild unten zeigt dies. Es zeigt Simulationen von 10.000 Punkten für $ Y = \ log (X) $ span>, wobei $ X \ sim N (\ mu_X =) 1, \ sigma_X = CV) $ span> wobei $ CV $ span> variiert wurde (Werte $ X<0 $ span> wurden entfernt).

simulations with varying CV

Die rot gestrichelte Kurve zeigt, dass der Mittelwert von $ Y = \ log (X) $ span> durch Invertieren der Formel für den Mittelwert eines log- annähernd angenähert werden kann. normalverteilte Variable.

  • Wenn $ Y = \ exp (X) $ span> oder $ X = \ log (Y) $ span>, wobei $ X \ sim N (\ mu_X, \ sigma_X ^ 2) $ span> dann $ \ mu_Y = \ exp (\ mu_X + 0.5 \ sigma_X ^ 2) $ span> und der inverse $ \ mu_X \ approx \ log (\ mu_Y) -0.5 \ sigma_X ^ 2 $ .

  • Dasselbe könnten wir auch für die Beziehung für die Varianz einer logarithmischen Normalverteilung tun, aber das ist ein etwas umständlicher Ausdruck, also vereinfachen wir die Dinge ein wenig und füllen die Delta-Näherung $ \ sigma_X \ approx \ sigma_Y / \ mu_Y $ span>.

  • Also haben wir

    $$ \ mu_X \ approx \ log (\ mu_Y) -0,5 \ sigma_Y ^ 2 / \ mu_Y ^ 2 $$ span>

    Dies ist die rote Kurve im obigen Diagramm und sie scheint gut mit den Daten übereinzustimmen.

    Praktische Anwendung:

    In dieser Frage:

    Monte-Carlo-Ergebnisse werden durch mehr Stichproben verzerrt

    Man befasst sich mit einem Logarithmus von $ X $ span>, wobei es sich um den Prozentsatz der monatlichen Rendite einer Investition handelt.Der Mittelwert ist 1,01 und der sd = 0,04, so dass der Variationskoeffizient sehr klein ist

    In dieser Frage funktioniert die Delta-Methode, die genauere Methode jedoch noch besser.

    Mark L. Stone
    2018-07-14 07:18:33 UTC
    view on stackexchange narkive permalink

    Wenn $ X $ span> normal verteilt ist, kann $ log (X) $ span> auch normal verteilt werden?

    Ja.Es ist möglich.Und tatsächlich ist es genau dann wahr, wenn $ X \ sim \ mathcal {N} (\ mu, 0) $ span> mit $ \ mu > 0 $ span>, in diesem Fall $ log (X) \ sim \ mathcal {N} (log (\ mu), 0) $ span>.

    Hinweis: "Can" unterscheidet sich von "must".

    Ich wusste nicht, dass normalverteilte Variablen unendliche oder undefinierte Werte (z. B. $ \ log (x) $, wenn $ x \ leq 0 $) mit einer Wahrscheinlichkeit ungleich Null annehmen können.
    @Do Monica nicht wieder einsetzen Vielen Dank für Ihren Kommentar.Ich habe gerade meine Antwort bearbeitet, um $ \ mu> 0 $ anzugeben, anstatt mein ursprünglich angegebenes $ \ mu \ ge 0 $
    Unabhängig vom Wert von $ \ mu $ ist $ P (X \ leq 0)> 0 $.
    @Do Monica nicht wiederherstellen Nein, ich habe Varianz = 0 angegeben, das ist der Schlüssel zu meiner Antwort.Das ist normal.
    Vielen Dank an alle, die eine RICHTIGE und erklärte Antwort abgelehnt haben.
    Ist der Varianzparameter in einem normalen nicht streng positiv?
    @Dimitriy V. Masterov Nicht unbedingt.Eine normale Zufallsvariable mit einer Varianz von Null ist eine singulär kontinuierliche normale Zufallsvariable, was bedeutet, dass sie in einem Raum mit niedrigeren Dimensionen unterstützt wird.in diesem Fall 0D als der Raum 1D, in dem er definiert ist.Es ist dasselbe wie eine Dirac-Delta-Verteilung. Die Menschen sind eher mit singulär kontinuierlicher multivariater Normalität vertraut, dh mit multivariater Normalen mit singulärer Kovarianzmatrix.1D Normal mit null Varianz hat singuläre Kovarianzmatrix https://stats.stackexchange.com/questions/157834 / Beispiel einer singulär-kontinuierlichen Zufallsvariablen / 157841 # 157841
    @Do Monica nicht wieder einsetzen Bitte beachten Sie meinen vorhergehenden Kommentar.
    Ich habe Ihre Antwort nicht abgelehnt, aber ich denke, dass es umstritten ist, eine entartete Zufallsvariable "normalverteilt mit einer Varianz von Null" zu nennen, und auf jeden Fall den Punkt der Frage völlig zu verfehlen scheint.


    Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
    Loading...