Frage:
Interpretation von Koeffizienten in einem logistischen Regressionsmodell mit einer kategorialen Variablen mit mehr als 2 Ebenen
Maddy
2014-06-05 09:44:59 UTC
view on stackexchange narkive permalink

In einem logistischen Modell mit einem dichotomen Prädiktor gibt es einige inhaltliche Online-Interpretationsquoten. Mein Problem ist das Verstehen von Koeffizienten, wenn es mehr als 2 Ebenen für eine kategoriale Variable gibt. Wie definieren Sie die Gewinnchancen ?

  Daten: X ist ein einzelner kategorialer Prädiktor mit 4 Ebenen: Teenager, Erwachsener, Reifer, Senior. Y: 1 = Rauchen, 0 = Nichtrauchen. LR: Wir verwenden n-1 Dummy-Variablen. Ich habe Erwachsenen als Referenzbehälter gewählt, da er die höchste Konzentration aufweist. (ok ??) ________ | Abschnitte | Padult | -4.3801 | 0teenager | -0,32456 | 0 reif | 1.45119 | 0old | -0,9891 | 0  

Interpretation der Koeffizienten

Teenager: Teenager rauchen weniger wahrscheinlich (mit Erwachsenen?). In der Tat ist ein Teenager 28% (exp-0.32456 -1) weniger wahrscheinlich zu rauchen als ein Erwachsener. Wird die Wahrscheinlichkeit, dass Teenager rauchen, immer gegen die Referenzgruppe erwähnt?

Älter: Ältere sind mehr zu rauchen (ohne Erwachsenen?). In der Tat ist eine reife 326% höhere Wahrscheinlichkeit zu rauchen als ein Erwachsener. Wird die Wahrscheinlichkeit eines reifen Rauchens immer gegenüber der Referenzgruppe erwähnt?

Übrigens ist es seltsam, * alle * Koeffizienten als "Abschnitte" zu beschreiben.
Drei antworten:
Scortchi - Reinstate Monica
2014-06-05 18:59:07 UTC
view on stackexchange narkive permalink

Wenn Sie das angepasste Modell für die logarithmischen Rauchwahrscheinlichkeiten ausschreiben

$$ \ log \ frac {\ Pr (Y = 1)} {\ Pr (Y = 0)} = -4,380 \, 1 + -0,324 \, 56 \ I_ \ mathrm {teen} + 1,451 \, 19 \ I_ \ mathrm {ausgereift} + -0,989 \, 1 \ I_ \ mathrm {old} $$

wo die Dummies sind $$ I_ \ mathrm {teen} = \ left \ {\ begin {array} {ll} 0 & X \ neq \ mathrm {Teenager} \\ 1& X = \ mathrm {Teenager} \\ \ end { Array} \ right. $$ &c. können Sie Ihre Berechnungen bestätigen. Beachten Sie jedoch, dass "wahrscheinlich" mehrdeutig ist - es könnte als Hinweis auf die Wahrscheinlichkeit angesehen werden -, &, den Sie vielleicht lieber sagen möchten als "die Wahrscheinlichkeit, dass ein Teenager raucht, ist in einem formalen oder didaktischen Kontext 28% niedriger als die des Rauchens eines Erwachsenen" .

Danke Scortchi. Es gab auch 1 weiteres verwandtes Q in meinem Beitrag ... Wie wähle ich den Prädiktor aus, der mein Intercept wird? Einige mögen sagen, es spielt keine Rolle, aber hier in LR ist es so, wie alle anderen 'potenzierten Koeffizienten -1' damit verglichen werden. Ich möchte ADULT nicht als Referenzfach wählen, da ich zeigen möchte, dass das Rauchen zunimmt, wenn JUGENDLICHE zu ERWACHSENEN werden. Ist es für eine solche Anforderung in Ordnung, wenn ich TEENAGERS zu meinem Abfangbehälter mache? Auf diese Weise kann ich zeigen, dass die Chancen gestiegen sind, wenn ich einen positiven Koeffizienten für ERWACHSENE erhalte. ADULTS bin hat jedoch die höchste Beobachtungszahl.
Sie können eine beliebige Gruppe als Referenzkategorie auswählen. Die Interpretation einzelner Koeffizienten ändert sich, aber das Modell als Ganzes bleibt davon unberührt - es hat die gleiche Wahrscheinlichkeit und macht die gleichen Vorhersagen. Beachten Sie, dass Sie unabhängig von Ihrer Wahl immer noch Unterschiede in den Log-Quoten zwischen bestimmten Kategorien des angepassten Modells * berechnen * können. Sie können jedoch auch eine auswählen, bei der die Koeffizienten sofort interessierende Mengen angeben. (Ich würde vorschlagen, dass Sie verschiedene Modelle schreiben, um dies zu sehen und es mit Ihrer Statistiksoftware zu bestätigen.)
honeyoak
2014-06-05 20:02:29 UTC
view on stackexchange narkive permalink

Es ist wichtig zu verstehen, dass logistische Regressionsparameter nur lokal wahr sind . Dies bedeutet, dass sich die relativen Auswirkungen jeder Schätzung abhängig vom Wert Ihrer unabhängigen Variablen ändern. Hier ist ein Papier, das helfen kann, Dinge zu erklären.

Willkommen im Lebenslauf! Vielen Dank für das Papier: Es ist eine klare Darstellung der Interpretation von Protokollen. Aber ich konnte Ihre Antwort überhaupt nicht verstehen: Vielleicht könnten Sie etwas ausführlicher erklären oder ein Beispiel hinzufügen, um es zu veranschaulichen ...
honeyoak
2014-06-05 20:53:32 UTC
view on stackexchange narkive permalink

Wenn $ y = F (\ beta x) $ und $ y \: \ epsilon \: (1,0) $ wobei $ F (x) $ eine Logit-Funktion ist, dann $ dy / dx_1 \ neq dy / dx_2 $. Dies liegt an der Kettenregel als $ dy / dx = \ frac {dy} {dF (x)} \ frac {dF (x)} {dx} $. Wenn Sie sich eine Logit-Funktion

ansehen, werden Sie feststellen, dass sich die Steigung von x ändert, je nachdem, wo Sie sich auf der Kurve befinden. In der Praxis bedeutet dies, dass Sie Rang und Anmeldung nur in einer logistischen Regression interpretieren, da das Ausmaß der Auswirkung davon abhängt, wie Ihre Parameter und Variablen mit der Logit-Funktion

interagieren


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...