Was ist der Vorteil von Wichtigkeitsstichproben?

Frage:

Was ist der Vorteil von Wichtigkeitsstichproben?

buffalo8

2019-12-16 02:54:15 UTC

view on stackexchange narkive permalink

Hier ist ein schönes Beispiel für wichtige Stichproben:

  %% wahre Wahrscheinlichkeitsverteilung
true_func = @ (x) betapdf (x, 1 + 1,1 + 10);

%% Führen Sie eine Stichprobenerhebung durch
N = 10 ^ 6;
% einheitliche Angebotsverteilung
x_samples = rand (N, 1);
Vorschlag = 1 / N;
% bewerten für jede Probe
target = true_func (x_samples);
% Wichtigkeitsgewicht berechnen
w = Ziel ./ Vorschlag;
w = w ./ Summe (w);
% Resample mit Ersatz, je nach Wichtigkeitsgewicht
Samples = Randsample (x_samples, N, true, w);

%% Handlung
Nebenhandlung (1,2,1)
x = Linspace (0,1,1000);
plot (x, true_func (x))
Achsenquadrat

Nebenhandlung (1,2,2)
hist (Proben, 1000)
Titel ('Wichtigkeitsstichprobe')
Achsenquadrat

Ergebnis:

Ich verstehe es nicht.Wenn ich bereits weiß, wie das Ziel-PDF aussieht, kann ich dies einfach tun:

  plot (true_func (linspace (0,1, N)));

Ich muss keine Wichtigkeitsabtastung durchführen, ich bewerte einfach das Ziel-PDF in einem linearen Raum Ihrer Wahl.

Beantwortet das deine Frage?[Warum ist es notwendig, aus der posterioren Verteilung zu probieren, wenn wir die posteriore Verteilung bereits kennen?] (Https://stats.stackexchange.com/questions/307882/why-is-it-necessary-to-sample-from-the-Posterior-Verteilung-wenn-wir-bereits-wissen)

Drei antworten:

gunes

2019-12-16 03:03:02 UTC

view on stackexchange narkive permalink

Bedeutung resampling dient nicht zum Plotten des PDF.Es dient zum Abtasten dieses PDF.Selbst wenn Sie die Formel des Ziel-PDF kennen, ist es manchmal schwierig, daraus ein Beispiel zu erstellen.Eine typische Methode ist beispielsweise die inverse Transformationsmethode, bei der Sie in der Lage sein müssen, die Inverse der CDF analytisch zu berechnen.Ein typisches Beispiel, bei dem dies nicht möglich ist, ist die Normalverteilung, bei der andere Methoden wie Box-Müller zum Abtasten verwendet werden.

Ich verstehe nicht, warum es schwierig sein kann, aus einem mir bekannten PDF zu probieren.Können Sie das näher erläutern?In meinem obigen Beispiel habe ich im Wesentlichen eine Stichprobe aus dem PDF erstellt, indem ich einfach true_func (linspace (0,1, N)) geschrieben habe.Zeichnen ist eine Sache, aber ich kann auch alle möglichen Momente usw. berechnen.

Wie würden Sie zum Beispiel * Samples * aus $ f (x) = ce ^ {- x ^ 8} $ generieren?Beim Generieren von Beispielen werden keine PDF-Werte in regelmäßigen Abständen verwendet. Sie werden ein Array von Werten angeben, die das Histogramm von $ f (x) $ erzeugen.

Wie wäre es damit: i = 0;für x = lim_1 bis lim_2;i = i + 1;Proben (i) = c * exp (-x ^ 8);Ende;Ich weiß, dass etwas in meinem Verständnis nicht stimmt, aber ich kann es scheinbar nicht identifizieren.

Plot `hist (samples)`, ist es wie $ f (x) $?Wenn nicht, haben Sie keine Probe davon genommen.

Ich hab es geschafft. Vielen Dank.

Ben

2019-12-16 03:31:00 UTC

view on stackexchange narkive permalink

Die Wichtigkeitsabtastung ist eine Monte-Carlo-Integrationsmethode, mit der der erwartete Wert einer Funktion einer Zufallsvariablen geschätzt werden kann.Die Methode ist in Fällen nützlich, in denen das PDF bekannt ist, der erwartete interessierende Wert jedoch unbekannt ist (und aus dem PDF nicht analytisch berechnet werden kann).In diesen Fällen liefert das Verfahren eine recht effiziente Berechnung, solange die Erzeugungsverteilung angemessen ist.In Ihrer Frage haben Sie die Wichtigkeitsstichprobe noch nicht abgeschlossen, da Sie keine Schätzung einer Funktion der Zufallsvariablen mit der von Ihnen verwendeten Verteilung angegeben haben.

Es ist auch wichtig zu berücksichtigen, dass es für pädagogische Zwecke nützlich ist, Wichtigkeitsstichproben für eine Verteilung zu verwenden, bei der der erwartete interessierende Wert bekannt ist (aus analytischen Berechnungen), um zu bestätigen, dass die Schätzung tatsächlich konvergiertden gewünschten Wert.

Xi'an

2019-12-16 11:24:25 UTC

view on stackexchange narkive permalink

Der Code erzeugt tatsächlich Samples durch Resampling der Sampling-Wichtigkeit (Rubin 1987), dh durch Zeichnen von Punkten aus dem ursprünglichen iid-Sample $ (y_1, \ ldots, y_n) \ sim \ mathcal U (0,1) $ span>

  x_samples = rand (N, 1);

entsprechend der Verteilung $$ \ mathbb P (X = y_i) = \ omega_i \ big / \ sum_ {j = 1} ^ n \ omega_j $$ span> wobei die $ \ omega_j $ span> die Wichtigkeitsgewichte sind, $ \ omega_j = f (y_j) / g (y_j) $ span> mit $ f $ span> das Ziel true_func = @ (x) betapdf (x, 1 + 1,1 + 10); und $ g $ span> die einheitliche Dichte (die $ 1 $ span> und nicht 1 / N sein sollte .

Während dies zu konvergierenden (in $ n $ span>) Annäherungen an Integrale führt, abhängig von $ f $ span> und Für die Simulation von $ f $ span> ist keine exakte iid-Simulation von $ f $ span> für ein gegebenes $ f $ span> aufgrund (a) der durch die Normalisierung induzierten Verzerrung w = w ./ sum (w); und (b) die Abhängigkeit zwischen den neu abgetasteten Werten.

ⓘ

Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 4.0-Lizenz, unter der er vertrieben wird.

über - juristisches

Loading...