Frage:
Ich kenne das 95% -Konfidenzintervall für ln (x). Kenne ich auch das 95% -Konfidenzintervall von x?
Tamay
2020-07-12 05:06:26 UTC
view on stackexchange narkive permalink

Angenommen, das 95% -Konfidenzintervall für $ \ ln (x) $ span> ist $ [l, u] $ span>.Stimmt es, dass der 95% -KI für $ x $ span> einfach $ [e ^ l, e ^ u] $ ?

Ich habe die Intuition, die Antwort ist ja, weil $ \ ln $ span> eine kontinuierliche Funktion ist.Gibt es einen Satz, der meine Intuition unterstützt / widerlegt?

Was ist $ X $?Eine Schätzung des Mittelwerts?Wenn Sie also die CIs des Mittelwerts kennen, möchten Sie die CIs des Protokollmittelwerts finden?Oder meinten Sie, Sie kennen die Perzentile einer Zufallsvariablen $ X $ und möchten die entsprechenden Perzentile der Zufallsvariablen $ \ log (X) $ finden?
Letzteres - obwohl die Antwort anders wäre, wenn ich das erstere im Sinn hätte?
Tolle erste Frage!Willkommen bei Cross Validated.
Kontinuität ist nicht direkt relevant: nur Monotonie ist.
@Tamay, Obwohl Sie Konfidenzintervalle als Teil einer [Konfidenzverteilung] betrachten könnten (https://en.m.wikipedia.org/wiki/Confidence_distribution), ist es nicht sehr üblich, das Konfidenzintervall als Perzentile dieser Verteilung zu betrachten.Meinen Sie wirklich diesen letzteren Fall von Tchakravarty?Wenn Sie nach Transformationsregeln für Perzentile suchen, können Sie dann erläutern, mit welcher Verteilung Sie diese verbinden (eine Wahrscheinlichkeitsverteilung oder eine Vertrauensverteilung)?
Drei antworten:
Ben
2020-07-12 05:35:39 UTC
view on stackexchange narkive permalink

Das ist das 95% -Konfidenzintervall von a für $ x $ span>, nicht jedoch das 95% -Konfidenzintervall von the. Für jede kontinuierliche monotone Transformation ist Ihre Methode ein legitimer Weg, um ein Konfidenzintervall für den transformierten Wert zu erhalten. (Für monoton abnehmende Funktionen kehren Sie die Grenzen um.) Die andere hervorragende Antwort von tchakravarty zeigt, dass die Quantile für diese Transformationen übereinstimmen, was zeigt, wie Sie dieses Ergebnis beweisen können .

Im Allgemeinen gibt es unendlich viele mögliche 95% -Konfidenzintervalle, die Sie für $ x $ span> formulieren können, und obwohl dies eines davon ist, ist dies nicht der Fall im Allgemeinen das kürzeste mögliche Intervall mit diesem Vertrauensniveau. Bei der Formulierung eines Konfidenzintervalls ist es normalerweise am besten, zu optimieren, um ein möglichst kurzes Intervall mit dem erforderlichen Abdeckungsgrad zu erzielen. Dadurch wird sichergestellt, dass Sie bei dem erforderlichen Konfidenzniveau die genaueste Schlussfolgerung ziehen können. Eine Erklärung dazu finden Sie in einer verwandten Frage hier.

Wenn Sie eine nichtlineare Transformation eines vorhandenen Intervalls durchführen, erhalten Sie nicht das optimale (kürzeste) Konfidenzintervall (außer durch einen unglaublichen Zufall!).Die allgemeine Methode, um das kürzeste Konfidenzintervall zu erhalten, besteht darin, die anfängliche Wahrscheinlichkeitsangabe zu betrachten, die mit der zur Formulierung des Intervalls verwendeten Schlüsselgröße arbeitet.Anstatt "gleiche Schwänze" in der Wahrscheinlichkeitsangabe zu verwenden, legen Sie die relativen Schwanzgrößen als Kontrollvariable fest und finden dann die Formel für die Länge des Konfidenzintervalls, die von dieser Variablen abhängig ist.Schließlich verwenden Sie Berechnungsmethoden, um den Wert der Steuervariablen zu bestimmen, die die Intervalllänge minimiert.Oft kann diese Methode für breite Problemklassen programmiert werden, sodass Sie schnell optimale Konfidenzintervalle für ein Objekt von Interesse berechnen können.

(+1) Dies ist eine schöne und klare Antwort.Gibt es einen allgemeinen Rahmen, um das kürzestmögliche 95% -Konfidenzintervall zu finden?Tut die Delta-Methode dies?
@Ben-ReinstateMonica Ich denke, dass die Hauptfrage hier darin besteht, zu beweisen, dass die CIs gültig sind, was Sie in Ihrer Antwort angenommen haben.Es könnte auch hilfreich sein, eine gewisse Intuition darüber zu vermitteln, warum die nichtlineare Transformation möglicherweise nicht zum kürzesten CI führt und in welchen Szenarien sie zusammenfallen würde.Dies setzt offensichtlich voraus, dass das OP versteht, warum man sich um die kürzesten CIs kümmern sollte.
Es scheint mir, dass CIs im Allgemeinen ausgewählt werden, indem sie auf der Schätzstatistik zentriert werden, anstatt die Länge zu minimieren, obwohl diese in einigen Fällen zusammenfallen können.
@tchakravarty: Ich denke, Ihre Antwort deckt das Gültigkeitsproblem gut ab, daher freue ich mich, mich auf diesen anderen Aspekt des Problems zu konzentrieren.Ich habe die Antwort bearbeitet, um herauszufinden, warum kürzeste Konfidenzintervalle wünschenswert sind.
Hier ist ein anschauliches Beispiel für das Problem: Angenommen, $ Y = \ log_e (X) \ sim \ mathcal N (10,1) $.Dann $ \ mathbb P (8.08 \ le Y \ le 11.96) \ ca. 0.95 $, damit wir das logarithmisch normalverteilte $ X $ in der vorgeschlagenen Weise betrachten und $ \ mathbb P \ left (e ^ {8.08} \ le sagen könnene ^ Y \ le e ^ {11.96} \ rechts) \ ca. \ mathbb P \ links (3102.7 \ le X \ le 156367.5 \ rechts) \ ca. 0.95 $.Es ist aber auch wahr, dass $ \ mathbb P \ left (574.7 \ le X \ le 114250.1 \ right) \ ca. 0.95 $ und das ist ein engeres Intervall
Während es wahr ist, dass das Konstruieren auf der ursprünglichen Domäne zu einem kürzeren Konfidenzintervall führen kann, besteht ein weiteres Problem darin, dass diese transformierten CIs häufig das Ergebnis von (a) asymptotischer Mle-Theorie sind und (b) die Transformation verwendet wird, um Parameterbeschränkungen zu lösen (d. H.(Protokoll eines streng positiven Parameters).** Ohne Beweis angegeben **, haben oft asymptotische CIs viel bessere Abdeckungswahrscheinlichkeiten für den unbeschränkten Raum. Wenn man also asymptotische Normalität verwendet, um CIs zu konstruieren, ist es normalerweise besser, sie auf dem unbeschränkten Raum zu konstruieren und dann zu transformieren.
Die allgemeine Methode optimiert die Länge des Konfidenzintervalls nicht (dies würde eine vorherige Berücksichtigung der Parameter erfordern, um dieses Optimum zu definieren).Das Intervall, das im Allgemeinen optimiert wird, sind die Kriterien des Hypothesentests, auf dem das Konfidenzintervall basiert.Diese Art der Optimierung wird durch die Transformation der Parameter nicht beeinflusst.
Hallo @Ben-ReinstateMonica, Ich möchte zunächst bestätigen, dass mit „relativen Schwanzgrößen“ das Flächenverhältnis von zwei Schwänzen gemeint ist.Können Sie auch auf ein Beispiel verweisen, wie wir die CI-Länge als Funktion der relativen Schwanzgrößen berechnen können?
@Victor Luu: Angenommen, Sie nehmen das einfachste Beispiel für die Schlüsselgröße für ein CI für den Populationsmittelwert und nehmen an, Sie bilden ein CI auf $ 1- \ alpha $ -Ebene.Wenn Sie $ 0 \ leqslant \ theta \ leqslant 1- \ alpha $ einen der Endbereiche für die Berechnung des CI bezeichnen lassen, beträgt die Länge $ L (\ theta) = (t_ {n-1, \ theta} + t_{n-1, \ alpha- \ theta}) \ cdot s_n / \ sqrt {n} $, wobei $ t_ {n-1, \ theta} $ der kritische Punkt mit dem oberen Schwanzbereich $ \ theta $ ist.Wenn Sie diese Funktion berechnen, werden Sie feststellen, dass sie minimiert wird, wenn $ \ theta = \ alpha / 2 $.
(Beachten Sie, dass es viele gleichwertige Möglichkeiten gibt, wie Sie dieses Minimierungsproblem einrahmen können. Sie können es genauso gut anhand eines Parameters einrahmen, der den relativen Flächenanteil in einem der Schwänze usw. angibt. Aus diesem Grund ist dies nicht wirklich wichtigUm mit der Sprache sehr streng zu sein, was "relative" Schwanzbereiche betrifft. Alles, was wir brauchen, ist eine Parametrisierung, mit der Sie die Schwänze für das Intervall variieren können.)
tchakravarty
2020-07-12 05:32:59 UTC
view on stackexchange narkive permalink

Sie können leicht zeigen, dass dies der Fall ist.

Lassen Sie $ Y \ equiv \ log (X) $ span>. Dann ist das $ \ alpha $ span> -Quantil von $ Y $ span> $ y \ in \ mathbb {R} $ span>, so dass $ \ mathbb {P} [Y \ leq y] = \ alpha $ span>. In ähnlicher Weise ist das $ \ alpha $ span> -Quantil von $ X $ span> $ x \ in \ mathbb {R} ^ + $ span>, so dass $ \ mathbb {P} [X \ leq x] = \ alpha $ span > oder $ \ mathbb {P} [\ log (X) \ leq y] = \ alpha $ span> oder $ \ mathbb {P} [X \ leq \ exp (y)] = \ alpha $ span>. Somit ist $ y = \ exp (x) $ span>. Beachten Sie, dass es Regelmäßigkeitsbedingungen für die Kontinuität und Monotonie der Transformationsfunktion $ \ log $ span> gibt, bei denen Sie vorsichtig sein müssen, wenn Sie dieses Ergebnis allgemein anwenden.

Sextus Empiricus
2020-07-15 01:27:21 UTC
view on stackexchange narkive permalink

Konfidenzintervalle ändern sich nicht, wenn Sie die Parameter transformieren (mit einer monotonen Transformation)

Konfidenzintervalle basieren auf Wahrscheinlichkeiten, die von den Parametern abhängig sind, und werden nicht transformiert, wenn Sie die Parameter transformieren. Im Gegensatz zu (Bayes'schen) Wahrscheinlichkeiten der Parameter (auf denen glaubwürdige Intervalle basieren). Siehe zum Beispiel in dieser Frage: Wenn ein glaubwürdiges Intervall einen flachen Prior hat, entspricht ein 95% -Konfidenzintervall einem glaubwürdigen 95% -Intervall? Ein Konfidenzintervall ist nicht gerecht wie ein glaubwürdiges Intervall mit einem flachen Prior. Für ein Konfidenzintervall haben wir :

  • TDie Grenzen der Wahrscheinlichkeiten (Glaubwürdigkeitsintervalle) unterscheiden sich, wenn Sie die Variable transformieren (für Wahrscheinlichkeitsfunktionen ist dies nicht der Fall). . ZB für einen Parameter $ a $ span> und eine monotone Transformation $ f (a) $ span> (zB Logarithmus) Sie Holen Sie sich die äquivalenten Wahrscheinlichkeitsintervalle $$ \ begin {array} {ccccc} a _ {\ min} &<& a &<& a _ {\ max} \\ f (a _ {\ min}) &<& f (a) &<& f (a _ {\ max}) \ end {array} $$ span>

Warum ist das so?

Siehe in dieser Frage Können wir eine Nullhypothese mit Konfidenzintervallen ablehnen, die durch Stichproben anstelle der Nullhypothese erstellt wurden?

  • Sie sehen die Konfidenzintervalle möglicherweise als einen Wertebereich, für den ein Hypothesentest auf der Ebene $ \ alpha $ span> erfolgreich sein würde. und außerhalb des Bereichs ein Hypothesentest auf $ \ alpha $ span> -Niveau würde fehlschlagen.

Das heißt, wir wählen den Bereich von $ \ theta $ span> (als Funktion von $ X $ span >) basierend auf einer Wahrscheinlichkeit, die von den $ \ theta $ span> abhängig ist. Zum Beispiel

$$ I _ {\ alpha} (X) = \ lbrace \ theta: F_X (\ alpha / 2, \ theta) \ leq X \ leq F_X (1- \ alpha / 2, \ theta) \ rbrace $$ span>

der Bereich aller Hypothesen $ \ theta $ span>, für die sich die Beobachtung in einem zweiseitigen $ \ alpha \ befindet % $ span> Hypothesentest.

Diese Bedingung, die Hypothesen, ändert sich mit der Transformation nicht. Beispielsweise ist die Hypothese $ \ theta = 1 $ span> dieselbe wie die Hypothese $ \ log (\ theta) = 0 $ span>.

Grafische Intuition

Sie können eine 2D-Ansicht von Hypothesen auf der x-Achse und Beobachtungen auf der y-Achse betrachten (siehe auch Die grundlegende Logik zum Erstellen eines Konfidenzintervalls):

confidence intervals

Sie können einen $ \ alpha $ span> -% -Konfidenzbereich auf zwei Arten definieren:

  • in vertikaler Richtung $ L (\ theta) < X < U (\ theta) $ span> die Wahrscheinlichkeit für die Daten $ X $ span>, vorausgesetzt, der Parameter ist wirklich $ \ theta $ span>, um innerhalb dieser Grenzen zu liegen, ist $ \ alpha $ span>.

  • in horizontaler Richtung $ L (X) < \ theta < U (X) $ span> die Wahrscheinlichkeit, dass ein Experiment den wahren Parameter innerhalb des Vertrauens hat Das Intervall ist $ \ alpha $ span>%.

  • Für die eigentliche Berechnung des Konfidenzintervalls verwenden wir die vertikale Richtung. Wir berechnen die Grenzen für jedes $ \ theta $ span> als Hypothesentest. Diese Berechnung ist dieselbe für einen transformierten $ \ theta $ span>.

    Wenn Sie also den Parameter transformieren, sieht das Bild genauso aus und nur die Skalierung auf der x-Achse ändert sich. Für eine Transformation einer Wahrscheinlichkeitsdichte ist dies nicht dasselbe und die Transformation ist mehr als nur eine Änderung der Skala.

    Allerdings

    In der Tat, wie Ben geantwortet hat. Es gibt kein einziges Konfidenzintervall und es gibt viele Möglichkeiten, die Grenzen zu wählen. Wenn jedoch die Entscheidung getroffen wird, das auf Wahrscheinlichkeiten basierende Konfidenzintervall von den Parametern abhängig zu machen, spielt die Transformation keine Rolle (wie das zuvor erwähnte $ I _ {\ alpha} (X) = \ lbrace \ theta: F_X (\ alpha / 2, \ theta) \ leq X \ leq F_X (1- \ alpha / 2, \ theta) \ rbrace $ span>).

    Ich würde nicht zustimmen, dass es ein kürzest mögliches Intervall gibt.

    Oder zumindest kann dies nicht auf eindeutige Weise definiert werden, oder möglicherweise kann es basierend auf der bedingten Verteilung von Beobachtungen definiert werden, aber in diesem Fall spielt die Transformation (des bedingten Teils) keine Rolle.

    In diesem Fall (basierend auf der bedingten Verteilung) definieren Sie die Grenzen so, dass die vertikale Richtung am kleinsten ist (z. B. wie Personen häufig die kleinsten Entscheidungsgrenzen für einen Hypothesentest treffen). Dies ist die häufigste Methode zur Bestimmung des Konfidenzintervalls. Die Optimierung des Konfidenzintervalls so, dass Sie das kleinste Intervall in vertikaler Richtung erhalten, ist unabhängig von Transformationen des Parameters (Sie können dies als Dehnen / Verformen der Figur in horizontaler Richtung betrachten, wodurch sich der Abstand zwischen den Grenzen in vertikaler Richtung nicht ändert). .

    Es ist schwieriger, die Grenzen in horizontaler Richtung klein zu machen, da es keine gute Möglichkeit gibt, sie zu definieren / zu messen (um das Intervall für eine Beobachtung zu verkürzen, muss das Intervall für eine andere Beobachtung größer werden, und man muss auf irgendeine Weise wiegendie verschiedenen Beobachtungen).Es könnte möglicherweise möglich sein, wenn Sie einige vorherige für die Verteilung von $ \ theta $ span> verwenden.In diesem Fall könnte man die Auswahl der Grenzen verschieben (die immer noch in vertikaler Richtung liegen müssen, um eine Abdeckung von 95% zu gewährleisten, abhängig von $ \ theta $ span>, aber sie tun esmuss nicht in vertikaler Richtung optimal sein), um ein Maß für die Länge des Intervalls zu optimieren.In diesem Fall ändert die Transformation tatsächlich die Situation.Diese Art der Erstellung von Konfidenzintervallen ist jedoch nicht sehr typisch.

    Am Anfang wäre es hilfreich zu beschreiben, was Sie unter "Transformieren" einer Variablen verstehen, da viele bekannte Funktionen ansonsten Gegenbeispiele zu Ihren Behauptungen liefern.
    Da die Frage explizit ein Intervall betrifft, ist die Klasse der Injektionsfunktionen zu groß.Was "nicht sehr typisch" betrifft, sehen wir gelegentlich Dinge wie ein Quadrat oder eine trigonometrische Funktion.
    Dies ist erforderlich, wenn beliebige Intervalle in Intervalle abgebildet werden sollen.


    Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 4.0-Lizenz, unter der er vertrieben wird.
    Loading...