Frage:
Wie groß ist die Wahrscheinlichkeit, dass die Zufallsvariable $ x_1 $ das Maximum des Zufallsvektors $ X = (x_i) $ aus einer multivariaten Normalverteilung ist?
gregor
2010-11-02 18:57:43 UTC
view on stackexchange narkive permalink

Bei einer $ n $ -dimensionalen multivariaten Normalverteilung $ X = (x_i) \ sim \ mathcal {N} (\ mu, \ Sigma) $ mit dem Mittelwert $ \ mu $ und der Kovarianzmatrix $ \ Sigma $, was ist das? die Wahrscheinlichkeit, dass $ \ forall j \ in {1, \ ldots, n}: x_1 \ geq x_j $?

@gregor Was ist "l" in diesem Problem? Ist es fest (aber willkürlich) oder etwas anderes?
@gregor interessieren Sie sich für einen bestimmten Wert für $ \ Sigma $? Müssen Sie eine Grenze berechnen, wenn die Dimension groß ist? Müssen Sie Dinge simulieren?
@GJ Kerns: l ist fest, aber willkürlich, Frage aktualisiert
@girard: Ich interessiere mich am meisten für einen analytischen Ansatz. $ \ Sigma $ kann beliebig sein. Die Abmessung kann klein sein.
Ohne Verlust der Allgemeinheit können Sie l = 1 nehmen.
@whuber: wahr, Frage aktualisiert
@gregor Wenn Sie nicht an einem analytischen Ansatz interessiert sind, sollte es notwendig sein, $ \ Sigma $ und $ \ mu $ zu reparieren.
Drei antworten:
#1
+10
user1108
2010-11-03 21:51:14 UTC
view on stackexchange narkive permalink

Die Frage liest sich für mich so, als hätte das OP gefragt, wann $ U = (X, Y, Z) ^ {\ mathrm {T}} $ gemeinsam normal sind. Wie hoch ist dann die Wahrscheinlichkeit $ P (X \ geq Y \ mbox)? {und} X \ geq Z) $?

Für diese Frage könnten wir uns die gemeinsame Verteilung von $ AU $ ansehen, wobei $ A $ wie $$ A = \ left [\ begin {array} {aussieht. ccc} 1 & -1 & 0 \ newline1 & 0 & -1 \ end {array} \ right] $$ Natürlich ist $ AU $ auch gemeinsam normal mit Mittelwert $ A \ mu $ und Varianz-Kovarianz $ A \ Sigma A ^ {\ mathrm {T}} $ und die gewünschte Wahrscheinlichkeit ist $ P (AU> \ mathbf {0} _ {n-1}) $. Wir könnten dies in R mit so etwas wie

  set.seed (1) Mu <c (1,2,3) Bibliothek (MCMCpack) S <wish (3, diag (3) erhalten )) # var-cov matrixA erhalten <-Matrix (c (1, -1,0, 1,0, -1), nrow = 2, byrow = TRUE) newMu <- as.vector (A% *% Mu) newS <- A% *% S% *% t (A) Bibliothek (mvtnorm) pmvnorm (niedriger = c (0,0), Mittelwert = newMu, Sigma = newS)  

welche ist ungefähr 0.1446487 auf meinem System. Wenn eine Person etwas über die Matrix $ \ Sigma $ wusste, kann sie möglicherweise sogar etwas aufschreiben, das wie eine Formel aussieht (ich habe es jedoch nicht versucht).

+1 Sehr schön! Dieses Problem * musste * eine numerische Integration erfordern (mit Ausnahme von Sonderfällen, bei denen alle Mittel gleich sind), daher sind sowohl die Verfügbarkeit dieses Pakets als auch die Verringerung der Dimensionalität nützliche Beiträge. Übrigens können Sie zur Kontrolle P (Y> X und Y> Z) = 0,3200386 und P (Z> X und Z> Y) = 0,5353126 berechnen; Die drei Ergebnisse summieren sich auf 0,9999999, was ziemlich nahe an 1 liegt.
@whuber Danke. Vielen Dank auch, dass Sie P (Y> X und Y> Z) und P (Z> X und Z> Y) durchgearbeitet haben. das ist mir nicht eingefallen.
#2
+3
robin girard
2010-11-02 20:22:27 UTC
view on stackexchange narkive permalink

Antwort aktualisiert dank Anmerkungen von Whuber und Srikant

Satz Sei C = [C_1; C_2] ein 2 * n Matrix, $ X ^ 0 = (X ^ 0_i) \ sim \ mathcal {N} (0, \ Sigma) $ $ \ mathbb {R} ^ n $ bewertet. Sei $ \ Sigma ^ Y = ^ tC \ Sigma C = (\ sigma ^ Y_ {ij}) $. Dann ist für $ u_1 u_2 \ in \ mathbb {R} $

$ P (^ tC_1X ^ 0 \ geq u_1 \ text {und} ^ tC_2X ^ 0 \ geq u_2) = \ mathbb {E. } \ left [\ bar {\ Phi} \ left (\ frac {u_2- \ frac {\ sigma ^ Y_ {21}} {\ sigma ^ Y_ {11}} ^ tC_1X ^ 0} {\ sqrt {\ sigma ^ Y_ {22} - \ frac {\ sigma ^ Y_ {21} \ sigma ^ Y_ {12}} {\ sigma ^ Y_ {11}}}} \ right) 1_ {^ tC_1X ^ 0 \ geq u_1} \ right] $

wobei $ \ bar {\ Phi} = P (\ mathcal {N} (0,1)> z) $

Antwort auf die Frage, wenn die Dimension 3

ist Angenommen, $ i = 1 $, $ \ Sigma = (\ sigma_ {ij}) $. Die Wahrscheinlichkeit $ P (X_1> X_2 \ text {und} X_1> X_3) $ wird unter Verwendung des vorhergehenden Satzes mit $ X ^ 0 = X- \ mu $, $ C_1 = (1, -1,0) $, $ erhalten C_2 = (1,0, -1) $, $ u_1 = \ mu_2- \ mu1 $ und $ u_2 = \ mu_3- \ mu1 $. Dies ergibt

$ \ sigma ^ Y_ {11} = \ sigma_ {11} + \ sigma_ {22} -2 \ sigma_ {12} $

$ \ sigma ^ Y_ { 22} = \ sigma_ {11} + \ sigma_ {33} -2 \ sigma_ {13} $

$ \ sigma ^ Y_ {12} = \ sigma_ {11} +2 \ sigma_ {23} - \ sigma_ {31} - \ sigma_ {21} $

Beweis des Satzes

Nehmen Sie $ c \ in \ mathbb {R} ^ n an $ und $ \ Sigma $ haben den vollen Rang. Es ist leicht zu zeigen, dass für jedes $ u \ in \ mathbb {R} $$$ P (^ tcX ^ 0> u) = \ bar {\ Phi} \ left (\ frac {u} {\ | \ Sigma ^ {1/2} c \ | _2} \ right) $$

Bezeichnen wir $ Y_1 = ^ tC_1X ^ 0, Y_2 = ^ tC_2X ^ 0 $. Nach dem Korrelationssatz ist $ Y_2 | Y_1 $ Gauß mit dem Mittelwert $ \ frac {, da $ Y = (Y_1, Y_2) $ in $ \ mathbb {R} ^ 2 $ mit Kovarianz $ \ Sigma ^ Y $ zentriert ist \ sigma ^ Y_ {21}} {\ sigma ^ Y_ {11}} Y_1 $ und Varianz $ \ sigma ^ Y_ {22} - \ frac {\ sigma ^ Y_ {21}} {\ sigma ^ Y_ {11}} \ sigma ^ Y_ {12} $.

Dies mit $ P (Y_1> u_1 \ text {und} Y_2> u_2) = \ mathbb {E} \ left [\ mathbb {E} [1_ {Y_2 \ geq u_2} | Y_1] 1_ {Y_1 \ geq u_1} \ right] $ ergibt das gewünschte Ergebnis.

So erweitern Sie den Satz

Wenn wir das anfängliche Problem mit einer Dimension größer als $ 3 $ lösen möchten, müssen wir berechnen $ P (\ forall j \; ^ tc_jX ^ 0 \ geq u_j) $ (für gut gewähltes $ u_j $). Setzen Sie $ Y = (Y_1, \ dots, Y_n) $ mit $ Y_j = ^ tc_jX $ zentrierten $ \ mathbb {R} $ -bewerteten Gaußschen.
Sie können den Korrelationssatz iterativ verwenden, um die Verteilung von $ Y_1 | abzuleiten Y_ {2: n} $, $ Y_2 | Y_ {3: n} $ ..... Dies kann so etwas wie eine rekursive Formulierung der Lösung des Satzes ergeben, wenn C $ p * n $ ist (rekursiv auf $ p) $).

Ihre Antwort gibt jedoch die Wahrscheinlichkeit an, dass $ P (X_i> = X_j) $ für einen bestimmten Wert von $ j $ gilt. Die Möglichkeit, dass $ X_i
Meine Intuition ist fehlerhaft! Es kann nicht $ \ frac {1} {p} $ sein. Eine einfache Simulation zeigt etwas anderes.
@Srikant oups ... Ich habe die Antwort aktualisiert ... aber ich werde nicht weiter als n = 2 gehen (die Idee ist hier, aber es gibt zu viel Berechnung für mich :))
Dies ist ein guter Versuch, aber leider ist Teil 2 falsch (auch nach der Interpretation von \ Phi als Gaußsche Wahrscheinlichkeit im * oberen * Schwanz): Die richtige Antwort muss ein * Integral * der Gaußschen CDF beinhalten, nicht das Produkt von zwei von sie (wie die iterierte Erwartung anzeigt). Alternativ können Sie überlegen, was passiert, wenn beide Varianzen 1 sind, der Korrelationskoeffizient sich 1 nähert und u1 = u2: die gemeinsame Wahrscheinlichkeit, dass X1> u1 und X2> u2 gegen Pr [X1> u1] konvergieren sollten (aufgrund einer nahezu perfekten Korrelation) Im Gegenteil, der erste Faktor auf der rechten Seite geht auf Null.
@whuber Ich sollte heute nicht versuchen, etwas anderes zu schreiben, zu vielen Fehlern in ein paar Stunden;) ... trotzdem habe ich die Antwort aktualisiert, aber sie ist nicht mehr freundlich ... vielleicht gibt es eine Möglichkeit, die Berechnung im Besonderen durchzuführen Fall der Frage!
@robin Vielen Dank! Dies ist eine schwierige Berechnung, bei der Sie hervorragende Fortschritte erzielt haben. (Ich habe es bereits positiv bewertet, so dass ich es leider nicht wieder tun kann ...)
#3
+3
Simon Byrne
2010-11-03 13:29:09 UTC
view on stackexchange narkive permalink

Ich habe die Frage interpretiert, um die Verteilung des maximalen Elements einer multivariaten Normalen zu stellen. In diesem Fall kann die CDF aus der CDF einer multivariaten Normalen berechnet werden. Dies hat normalerweise keine gute Lösung (selbst in Bezug auf die univariate normale CDF), kann jedoch numerisch ausgewertet werden. In R:

  Bibliothek (mvtnorm) # gegeben xl, mu und sigmapmvnorm (obere = rep (xl, Länge (mu)), Mittelwert = mu, Sigma = Sigma)  

Beim erneuten Lesen der Frage scheint jedoch die Wahrscheinlichkeit zu fragen, dass ein bestimmtes Element des Vektors maximal ist. In diesem Fall würde ich G. Jay Kerns zustimmen.

Ich denke, die Frage ist nicht vollständig spezifiziert und daher ist es schwierig, genau zu sagen, was das OP bedeutete, ohne ihn direkt zu fragen. Anstatt eine Lösung für ein hypothetisches Problem zu entwerfen, hätte ich vielleicht um Klarstellung bitten sollen. Warum nicht jetzt? :-)


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 2.0-Lizenz, unter der er vertrieben wird.
Loading...