Frage:
Statistischer Irrtum, wenn keine Variablen kontrolliert werden?
JackOfAll
2015-12-04 02:59:20 UTC
view on stackexchange narkive permalink

Wenn jemand sagt "Sie sehen nie einen Ferrari wie einen Honda rosten", ist der logische Fehler, dass ein Honda normalerweise als strenger Winterfahrer eingesetzt wird, während ein Ferrari ein 2. oder 3. Auto ist, das auf den Einsatz an sonnigen Wochenenden beschränkt ist.

Natürlich müssen Sie Variablen wie Kilometerstand und Wetterbedingungen kontrollieren. Gibt es einen Namen für diesen Irrtum? Logischer Irrtum? Irrtum der Basiszinsen? Unterschiede in den verglichenen Gruppen?

Es scheint, dass die Art von Argumentation, auf die Sie sich beziehen, eine Art Folgerung der Kausalität aus der Korrelation ist, und ich weiß nicht, ob es dafür einen schönen Namen gibt, obwohl "post hoc" -Fehler (von post hoc ergo propter hoc)könnte funktionieren.
Fünf antworten:
gung - Reinstate Monica
2015-12-04 03:10:45 UTC
view on stackexchange narkive permalink

Man könnte es die ausgelassene variable Verzerrung nennen (obwohl der Name keinen "Irrtum" enthält). Es ist eine Form der Endogenität; eng verwandt mit der ausgelassenen variablen Verzerrung / einer anderen Form der Endogenität ist der ökologische Irrtum, dessen Name "Irrtum" enthält.

Für das, was es wert ist, bin ich mir nicht sicher, ob die Aussage, wie Sie sie präsentieren ("Sie sehen nie einen Ferrari-Rost wie ein Honda"), zu Recht ein Trugschluss ist. Es ist einfach eine Aussage einer empirischen Beobachtung (und vermutlich richtig). Wenn jemand zu dem Schluss käme, dass Farraris nicht wie Hondas rosten kann, wäre das ein Trugschluss.

Penguin_Knight
2015-12-04 04:14:17 UTC
view on stackexchange narkive permalink

Soweit ich weiß, gibt es keinen "Irrtum", der nach Verwirrung benannt ist. Aber wenn jemand fälschlicherweise einen Kausalzusammenhang vorschlug (wie Automarke und Rost), nannten wir das eine "falsche Beziehung".

Carlos Cinelli
2017-11-21 03:28:44 UTC
view on stackexchange narkive permalink

Dies ist kein statistischer (assoziativer) Irrtum, sondern ein logischer Irrtum einer kausalen Behauptung. Nehmen wir die Aussage: "Sie sehen nie einen Ferrari-Rost wie einen Honda ". Statistisch bedeutet dies, dass sich das beobachtete Rosten in der "Bevölkerung" von Ferraris irgendwie von dem beobachteten Rosten in der "Bevölkerung" von Hondas unterscheidet. Dies könnte zutreffen und wäre überhaupt kein statistischer Irrtum.

Der Irrtum kommt ins Spiel, wenn jemand daraus schließt, dass diese beobachtete Assoziation durch einen bestimmten Mechanismus verursacht wird, beispielsweise durch die intrinsischen Eigenschaften von Ferraris oder Hondas. Wenn Sie also behaupten: "Der logische Fehler ist, dass ein Honda normalerweise als strenger Winterfahrer eingesetzt wird, während ein Ferrari ein 2. oder 3. Auto ist, das auf den Einsatz an sonnigen Wochenenden beschränkt ist" , was Sie tun erklärt einen möglichen Kausalmechanismus, der auch zu einer solchen Assoziation führt, sodass die beobachtete Assoziation zwei verschiedene Kausalmodelle nicht ausschließen kann.

Selbst wenn die Assoziation in der Bevölkerung legitim ist, ist die kausale Erklärung für diese Assoziation möglicherweise nicht legitim. Dieser logische Irrtum, aus der Assoziation einen bestimmten Kausalmechanismus abzuleiten, wird gewöhnlich als "falsche Ursache" bezeichnet. Aber dieser Irrtum ist nur der alte einfache "Bestätigung des konsequenten" Irrtums - das kausale Modell, dass Ferraris besser sind als Hondas, würde die beobachtete Assoziation erzeugen. Es ist jedoch ein Trugschluss zu schließen, dass dieses spezifische Kausalmodell wahr ist, weil die Assoziation wahr ist. Es gibt mehrere konkurrierende Modelle, die dieselbe beobachtete Assoziation erzeugen könnten, z. B. Ihre alternative Erklärung, wie Ferraris und Hondas unterschiedliche Nutzungsmuster aufweisen.

Diese "falsche" Zuordnung kann aus mehreren Gründen auftreten und nicht nur dazu führen, dass eine Variable nicht "kontrolliert" wird.Wenn es an einem Versagen der Kontrolle über eine häufige Ursache liegt, nennen wir dies normalerweise "verwirrende Voreingenommenheit".Sie können jedoch tatsächlich eine nicht kausale Assoziation erstellen, indem Sie nach falschen Variablen suchen. Wie in dieser anderen Antwort gezeigt, würde im folgenden Modell die "Kontrolle" des Fahrzeugtyps des Patienten die Effektschätzung beeinflussen:

enter image description here

Dies wird normalerweise als "Collider Bias" oder "Selection Bias" bezeichnet.Sie können auch Verzerrungen aufgrund der Steuerung für Mediatoren, aufgrund von Messfehlern usw. haben.

Aksakal
2015-12-04 03:10:00 UTC
view on stackexchange narkive permalink

Sie können es verwirrend oder Vermittlung nennen, abhängig von der genauen Beziehung zwischen den Kontrollvariablen und den interessierenden Variablen

Ich denke, er möchte eher einen Namen für einen Irrtum als das Phänomen selbst.
Deke
2015-12-11 05:30:57 UTC
view on stackexchange narkive permalink

"Korrelation bedeutet keine Ursache".

CarMake hat eindeutig eine sehr starke Korrelation mit Rost: CarMake = Honda hat oft Rost, CarMake = Ferrari hat nie Rost.

Aber Das bedeutet nicht, dass CarMake Rost verursacht. Stattdessen verursacht ConsumerDesireForLuxuryCar CarMake = Ferrari, und ConsumerDesireForLuxuryCar verursacht auch TakingCareOfCar, das NoRust verursacht.

Ich würde den anderen Antworten nicht widersprechen, aber "Korrelation impliziert keine Ursache "ist eine sehr häufig verwendete Phrase in der Statistik und erfasst diese Situation (und viele andere auch).

Ich suche den Schritt über "Korrelation ist keine Ursache" hinaus.Es ist offensichtlich, dass C! = C ist, aber WARUM ist Korrelation in diesem Rostbeispiel keine Ursache?Ist es nur die lauernde Variable oder der Kilometerstand oder die saisonale Nutzung?


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...