Frage:
Wie heißt dieser statistische Irrtum?
thanby
2015-09-03 00:31:49 UTC
view on stackexchange narkive permalink

Mir wurde heute eine Anekdote von jemandem erzählt, der versuchte, einen Punkt in Bezug auf Sicherheit zu beweisen. Sie sagten, "50 Menschen haben in den letzten zwei Jahren strike> ein Jahr in [Gebiet a] gelebt (anscheinend habe ich mich an das falsche Gespräch erinnert) und es gab daher keine Zwischenfälle Das Gebiet ist sicher, damit mehr Menschen dort leben können. "

[Gebiet a] ist nach Ansicht der Regierung eine Hochrisikozone mit einer erhöhten Gefahr für die persönliche Sicherheit (insbesondere den Tod). Ich weiß, dass die Argumentation dieser Person fehlerhaft ist, aber ich würde gerne den genauen Namen und die Erklärung dieses Fehlers erfahren, da ich der Meinung bin, dass dies ziemlich häufig vorkommt.

Ich sehe zwei Hauptfaktoren, die zum Fehler beitragen:

  • Kleine Stichprobengröße
  • Das Risiko ist stark auf der "Todesseite" gewichtet, es ist kein erhöhtes Risiko, einen Papierschnitt zu bekommen

Wie würde ich diesen Fehler nennen, obwohl die Person technisch richtig sagt "Es gab keine Zwischenfälle"?

Aus Gründen der Klarheit bearbeiten: Dies [Bereich a] entspricht einem Gebäude und wird von mehr als nur diesem Beispielsatz belegt. Das Gebiet befindet sich in einer größeren Region, in der ein erhöhtes Risiko für Schaden oder Tod besteht, und das Gebiet bietet keinen besonderen Schutz dagegen. Risikovorfälle sind selten, aber sicherlich höher als die Hintergrundrate und treten in dieser größeren Region auf.

Klingt nach dem Gesetz der kleinen Zahlen http://pirate.shu.edu/~hovancjo/exp_read/tversky.htm
Ich sehe keinen Fehler * per se *: Dies scheint ein begründeter Versuch zu sein, mit Daten zu argumentieren, wenn auch vielleicht mit einem kleinen Datensatz (was an sich kein Fehler ist).Aber sind diese 50 Personen nur diejenigen, die Ihr Gesprächspartner zufällig kennt, oder handelt es sich um eine vollständige Volkszählung aller in der Region lebenden Personen?
Nur die, die er zufällig kennt, in einer viel größeren Region, in der Vorfälle * auftreten *.
Und soweit ich weiß, treten in [Bereich a] andere Vorfälle auf, die diesen Beispielsatz einfach nicht beeinflussen.
Ich nenne diesen Irrtum "den nicht überzeugenden Argumentationsfehler".Das Argument ist zu vage, um falsch zu sein.Es überzeugt einfach nicht.
"Nicht überzeugendes Argument" ist genau der Grund, warum ich es hierher gebracht habe :) Ich hoffe, es gibt einen wissenschaftlicheren Namen / eine wissenschaftlichere Erklärung dafür.
Das erinnert mich an einen Witz.Das "Argument" eines imaginären Verbrechers vor Gericht lautet: "Ich kann 50 Zeugen mitbringen, die nicht gesehen haben, was Sie von mir behaupten."
@thanby: Ich habe Mathematik studiert und nie vollständig verstanden, wie wichtig es ist, falsche Argumente zu taxonomisieren.Es folgt oder nicht ;-) Aber sicher, wenn viele Leute genau den gleichen Fehler machen, sollte es einen Namen dafür geben, ob es "das Zeichen beim Kopieren umdrehen" oder "anekdotischer Irrtum" ist.
Ich würde es einfach "ungültige Stichprobe" nennen.... oder "So haben wir die Korrelation 'Verdammte Lügen und Statistik' erhalten".
Verwandte ELU: [Glauben Sie, dass es nicht passieren wird, weil es nie passiert ist?] (Http://english.stackexchange.com/questions/145403/is-there-are-term-for-when-you-believe-that-because-Etwas-ist-nicht-passiert-i) * falsche Analogie / Verallgemeinerung *
Siehe auch [wiki / Faulty_generalization] (https://en.wikipedia.org/wiki/Faulty_generalization) * Irrtum einer fehlerhaften Induktion *
Obligatorische xkcd-Referenz: [Was-wäre-wenn-Nr. 27] (https://what-if.xkcd.com/27/).Wussten Sie, dass nur 93% der Menschen, die jemals gelebt haben, tatsächlich gestorben sind?Das heißt, es besteht eine 7% ige Chance, unsterblich zu sein, oder ...?Noch besser, wenn Sie Mitglied der Beatles sind - nur 50% von ihnen sind gestorben ...
Sie müssen genauer sagen, was die Gefahr ist, da im Moment nicht einmal klar ist, wie das Argument falsch ist.Wenn das Risiko beispielsweise Katastrophen (z. B. Erdbeben) sind, ist das Argument falsch, da Katastrophen seltener als alle zwei Jahre auftreten.Wenn das Risiko eine Kontamination ist, die beispielsweise Krebs verursacht, ist das Argument falsch, da zwei Jahre nicht lang genug sind, um Krebs zu bilden.Auf der anderen Seite, wenn das Risiko so etwas wie das Töten von Menschen durch Bären ist, dann sind keine Zwischenfälle in zwei Jahren ein ziemlich guter Beweis dafür, dass der Ort sicher ist.
Nate Silver macht dies in seinem Buch The Signal and The Noise deutlich.Wenn ein Gebiet in der Vergangenheit durchschnittlich alle 35 Jahre ein Erdbeben hatte, aber seit 40 Jahren kein Erdbeben mehr, bedeutet dies nicht, dass es morgen passieren wird oder dass dies nicht der Fall ist, und es ändert auch nichts an der Statistik.Wie viele andere darauf hingewiesen haben.
Ich frage mich, ob es um C8 geht
Soweit ich das beurteilen kann, ist dies einfach nur ein altes Non Sequitur: Seine Schlussfolgerung folgt einfach nicht logisch aus seinen Daten.
@DavidRicherby Das Risiko liegt näher bei "Bären töten Menschen" und in der größeren Region kommt es mehrmals im Jahr vor, in diesem kleinen Gebiet ist es einfach nicht passiert.Nach der schönen xkcd-Logik, auf die AndyT hingewiesen hat, muss dies bedeuten, dass jeder, der in diesem Bereich lebt, unsterblich ist.
Acht antworten:
#1
+18
Greg Snow
2015-09-03 01:18:45 UTC
view on stackexchange narkive permalink

Ich habe keinen bestimmten Namen für den Irrtum, aber hier ist eine Referenz, die ich für relevant halte (entlang des Gesetzes der kleinen Zahlen):

Die gefährlichste Gleichung

Auch eine statistische Faustregel (siehe Abschnitt 2.9) besagt, dass ein ungefähres 95% -Konfidenzintervall für die 2-Jahres-Inzidenzrate, bei der in 2 Jahren keine gegeben wurde, von stammen würde 0 bis $ \ frac {3} {50} $, sodass die Inzidenz bis zu 6% betragen kann. Wenn Sie also weitere 1.000 Personen einziehen würden, wäre es nicht überraschend, in den nächsten 2 Jahren 60 Vorfälle zu sehen.

Denken Sie mehr darüber nach, wenn das kleine Gebiet ausgewählt wurde, weil es keine Vorfälle gibt und es einige gibt im größeren Bereich wäre dies dann eine Variation des Texas Sharpshooter Fallacy.

Falls der Link "Gefährlichste Gleichung" nicht mehr funktioniert, wird angegeben, dass kleine Stichproben eine größere Variabilität aufweisen, sodass Sie mit größerer Wahrscheinlichkeit ein extremeres Ergebnis ("sehr sicher" oder "sehr gefährlich") erzielen, wenn Sie nur einen kleinen Bereich betrachten.Ich bin mir sicher, dass es einen Namen für dieses Phänomen geben sollte, aber ich kann mir das nicht vorstellen.
Es scheint, dass einige Leute es den Irrtum der Stichprobengröße oder den Irrtum der kleinen Stichprobe nennen: http://www.oxfordreference.com/view/10.1093/oi/authority.20110803100439475
Erwähnenswert ist auch, dass dies die Grundlage für [Trichterdiagramme] (https://en.wikipedia.org/wiki/Funnel_plot) ist, die die erhöhte Variabilität in kleineren Stichproben zeigen.
Seltsamerweise antwortete die Person, als sie zu diesem Thema herausgefordert wurde, dass [Bereich a] sicherer ist als [Bereich b] (der nicht weit entfernt ist), weil [Bereich b] in den letzten zehn Jahren tatsächlich einen ziemlich großen Vorfall hatte, also denke ichTexas Sharpshooter Fallacy trifft etwas zu, obwohl es nicht ihr ursprüngliches Argument war
#3
+5
wonder
2015-09-03 05:37:14 UTC
view on stackexchange narkive permalink

Es klingt auch wie das Gleichnis vom Thanksgiving-Truthahn:

http://www.businessinsider.com/nassim-talebs-black-swan-thanksgiving-turkey-2014-11

Jeden Morgen füttert der Bauer den Truthahn gut. Nach 1000 Tagen argumentiert der Truthahn, dass der Bauer wohlwollend ist und das Muster fortgesetzt wird. Aber Tag 1001 ist Thanksgiving ...

(Hinweis für globale Leser: Thanksgiving ist ein US-Feiertag, an dem es üblich ist, Truthahn zu essen.)

Können Sie "das Gleichnis vom Thanksgiving-Truthahn" erklären (z. B. für den Fall, dass die Verbindung unterbrochen wird)?
Dieses Argument des "schwarzen Schwans" könnte der beste Kontrapunkt zur Annahme der Sicherheit sein, da, wie Nassim beschreibt, ein einziger Vorfall die gesamte Annahme gefährden würde (was eine ziemlich große Sache ist, wenn man über Menschenleben spricht).
#4
+5
Hugh
2015-09-03 07:19:45 UTC
view on stackexchange narkive permalink

Dies ist kein Irrtum, sondern das Problem der Induktion, wie es von David Hume populär gemacht wurde.

#5
+4
NoAnswer
2015-09-03 17:18:36 UTC
view on stackexchange narkive permalink

Allgemeiner Fall von Überlebensfehlern:

Wenn Sie nur nach Dingen suchen, die nicht fehlgeschlagen sind, wird Ihre Wahrnehmung verzerrt. Dies kann zu einem ungetesteten und damit fehlerunverträglichen Verhalten führen.

Das übliche Beispiel ist die Beobachtung von Flugzeugen, die aus dem Luftkampf zurückkehren: "Müssen Sie die Panzerung an Stellen erhöhen, an denen die zurückkehrenden Flugzeuge getroffen wurden?" Angeblich ist es , wo Flugzeuge wahrscheinlich getroffen werden .

Die Antwort lautet jedoch kontraintuitiv: "Nein, denn dort werden Flugzeuge wahrscheinlich getroffen ." und überleben . " Treffer dort sind also sowieso überlebensfähig.

Sie erzielen echte Ergebnisse, wenn Sie die Rüstung an Stellen erhöhen, an denen die "Überlebenden" nicht getroffen wurden, da dort die "Nicht-Überlebenden" getroffen wurden.

Für Ihren Fall (Singular):

Unter der Voraussetzung, dass eine einzelne Person in ein Gebiet mit Vorfällen gebracht wird, die zum Tod führen. Muss ich in ein Untergebiet umziehen, das nicht hat? wurde von einem Vorfall getroffen?

Nein, für diese Unterbereiche haben Sie einfach keine schlüssigen Daten.

Stattdessen müssen Sie in einen Unterbereich wechseln, in dem Vorfälle auftreten passieren, aber nicht zum Tod führen. Das Ziel ist nicht, keinen Vorfall zu haben, sondern ihn zu überleben, falls es passiert, oder?

Wenn Sie nicht möchten, dass der Vorfall passiert, sollten Sie im ersten Bereich nicht in den größeren Bereich ziehen Ort!

Für Ihren Fall (Plural):

Wenn Sie eine statistisch relevante Anzahl von Personen in den Bereich bringen möchten, in dem Vorfälle überlebensfähig sind, müssen Sie zunächst prüfen, ob die Der Grund, warum Vorfälle überlebensfähig sind, ist die geringe Bevölkerungsdichte in diesem Gebiet.

Wenn Vorfälle in Gebieten mit geringer Bevölkerungsdichte überlebensfähig sind, würde das Einziehen von Personen die Menschen nicht sicher machen, aber das Gebiet unsicher > Eine andere Sicht auf die Dinge:

Wenn es in dem größeren Gebiet 1000 Menschen gibt, von denen 20 bei dem letzten Vorfall starben, sind noch 980 Überlebende übrig, um die Geschichte zu erzählen. Ist es sicher, weil mehr Menschen überlebt haben als gestorben sind?

Sicherlich waren die meisten der 980 Menschen nicht einmal in der Nähe der 20, die starben, als es passierte. Wird es sicherer, wenn Sie nur diese fragen?

Können Sie die 20 Toten fragen, ob sie es immer noch für sicher halten?

Fazit: Sie werden es tun Fühlen Sie sich sicher, solange Sie Überlebende fragen, die den Vorfall nicht miterlebt haben. Da Sie nur Überlebende fragen können , ist es wahrscheinlich, dass sie den Vorfall nicht miterlebt haben.

Daher Irrtum der Überlebenden .

Verwandte Irrtümer:

Andere haben andere Irrtümer erwähnt. Ich möchte sie nicht im Detail wiederholen. Ich sehe jedoch, dass sie auch gelten. Hier ist eine Zusammenstellung und die Aspekte, warum sie gelten und warum sie unterschiedlich sind:

  • Irrtum der Überlebenden : Konzentration nur auf günstige Ergebnisse.
  • Texas Sharpshooter-Irrtum : Auswahl einer Teilstichprobe im Nachhinein.
  • Hot Hand-Irrtum : Interpretation zufälliger Variationen der Ergebnisse als Hinweis auf die Wahrscheinlichkeitsverteilung, insbesondere beim Betrachten Neueste Geschichte.
  • Gesetz über kleine Zahlen : Unter Berufung auf unzureichende Daten.
  • Irrtum der Basisrate : Unterschätzen der Bedeutung von Allgemeine Informationen zugunsten spezifischerer Informationen.

Es gibt einen weiteren bekannten Irrtum, den ich ursprünglich für "Hot Hand" gehalten habe. Jetzt, wo ich darüber nachdenke, trifft es nicht zu:

  • Irrtum des Spielers : Das Gesetz der großen Zahlen falsch zu verstehen, um das zu bedeuten Unabhängige Ereignisse würden sich auf lange Sicht ausgleichen.

Es ist eine Art umgekehrter Irrtum der heißen Hand: Wenn Sie auf "heiße Hand" hereinfallen, würden Sie darauf wetten, was in der jüngeren Geschichte am häufigsten passiert ist, weil es so ist scheint wahrscheinlicher zu sein.
Wenn Sie sich in "Gambler" verlieben, würden Sie gegen das wetten, was am häufigsten passiert ist, da das Gegenteil auf lange Sicht ausgeglichen werden muss.

Ich mag Ihre Zusammenfassung unten, aber das sagt der Irrtum des Spielers nicht.Der Irrtum des Spielers ist die Idee, dass zukünftige Stichproben dazu neigen, (Abweichungen von den erwarteten Werten) vergangener Stichproben zu kompensieren.
Danke für die gründliche Antwort.Derjenige, der mich wirklich zum Nachdenken brachte, war der "Irrtum des Überlebenden", denn in diesem Fall trifft das tatsächlich zu.Die Person, die die Annahme macht, kennt niemanden persönlich, der mit einem Opfer in Verbindung gebracht wurde (die Gesamtunfallrate ist immer noch gering, sie ist nur viel höher als der Durchschnitt für eine größere geografische Region), daher denke ich, dass dies ihr Urteilsvermögen in gewissem Maße trübt.
#6
+3
Lauren Goodwin
2015-09-03 03:08:00 UTC
view on stackexchange narkive permalink

Das klingt für mich nach dem Trugschluss der heißen Hand.

https://en.wikipedia.org/wiki/Hot-hand_fallacy

Als ich Intro-Statistiken unterrichtete, stellte ich fest, dass viele Schüler auf diesen Irrtum hereinfielen . Die Idee ist also im Sinne des Basketballs, er hat X Schüsse gemacht, es ist wahrscheinlicher, dass er den X + 1 Schuss macht. Gleiche Idee hier X Anzahl von Menschen lebt hier ohne Zwischenfälle, daher sollten keine Zwischenfälle auftreten, wenn X + 1 Personen anwesend sind.

Dies muss sehr sorgfältig formuliert werden.Es gibt keinen Irrtum in der Annahme, dass ein Basketballschuss eher erfolgreich ist, wenn der Schütze seine letzten $ X $ -Schüsse gemacht hat, als wenn er gerade seine letzten $ X $ -Schüsse verpasst hätte: Das heißt nur, dass gute Spieler mehr machenSchüsse als schlechte Spieler.Der Irrtum ist, dass der Glaube, dass ein bestimmter Spieler, der mit einer Wahrscheinlichkeit von $ p $ schießt, seinen nächsten Schuss mit einer Wahrscheinlichkeit von mehr als $ p $ macht, wenn er seine vorherigen $ X $ -Schüsse gemacht hat;Es stellt sich heraus, dass aufeinanderfolgende Schüsse eines bestimmten Spielers nahezu unabhängig sind.
Die Wikipedia-Seite muss aktualisiert werden.Es gibt einige ziemlich gute Beweise dafür, dass es jetzt einen Grund gibt, an Streifen zu glauben.Gelman bleibt auf dem Laufenden, damit Sie seinen Blog überprüfen können.
@John Interessant.Ich muss zugeben, dass ich selbst dem richtig formulierten Irrtum ein wenig skeptisch gegenüberstand: Sicherlich hat jeder Spieler gute und schlechte Tage, und wenn er gerade eine Serie gemacht hat, ist es weniger wahrscheinlich, dass der beobachtete Spieler einen schlechten Tag hat.
Ich kann sagen, dass die Unabhängigkeit vom Erfolg im Laufe der Zeit nicht unbedingt wahr ist.Das Ereignis meines "ersten Aufschlags" im Tennis ist sehr positiv autokorreliert.Dies hätte schwerwiegende Auswirkungen auf die Wahrscheinlichkeit eines Doppelfehlers, wenn nur "erste" Aufschläge verwendet werden, selbst als zweite Aufschläge.Basierend auf der Unabhängigkeit ist die Wahrscheinlichkeit eines Doppelfehlers = 1 - (1-p) ^ 2, wobei p die Wahrscheinlichkeit ist, dass ein Aufschlag vorliegt. Eine positive Autokorrelation erhöht die tatsächliche Wahrscheinlichkeit eines Doppelfehlers, wenn nur "erste" Aufschläge verwendet werden, viel höher.Im Groove zu sein kann ein sehr reales Phänomen im Sport und bei anderen Unternehmungen sein.
Ich habe darüber nachgedacht und obwohl es eine Rolle bei der anfänglichen Einschätzung der Person spielen mag, denke ich nicht, dass es die vollständige Antwort ist.Die Annahme ist, dass die Sicherheit für x-> unendlich garantiert ist, nicht nur für x + 1
#7
+2
shadowtalker
2015-09-04 09:46:16 UTC
view on stackexchange narkive permalink

Dies ist der Basisratenfehler :

Wenn verwandte Basisrateninformationen (dh allgemeine, allgemeine Informationen) und spezifische Informationen angezeigt werden Informationen (Informationen, die sich nur auf einen bestimmten Fall beziehen), neigt der Verstand dazu, die ersteren zu ignorieren und sich auf die letzteren zu konzentrieren.

In diesem Fall ist die Grundtodesrate ziemlich hoch, aber die Spezifische Informationen besagen, dass in der Region mindestens 50 Menschen leben, die unversehrt geblieben sind.

Das ist ein guter logischer Punkt, aber ich würde es fast als doppelte Basisrate bezeichnen, da die Basisrate für die größere Region im Vergleich zur Bevölkerung immer noch niedrig ist, aber viel höher als die Basisrate für den Rest der Welt (Ich vereinfache etwas, um die Länge der Kommentare zu gewährleisten, aber Sie haben die Idee.
@thanby vielleicht, aber das hängt davon ab, was Sie als Ihre "Basis" definieren.Es geht darum, marginale und bedingte Verteilungen zu verwechseln.Ich dehne die Definition auch ein wenig mehr aus, als mir beim ersten Posten klar wurde.
#8
  0
Alecos Papadopoulos
2015-09-03 15:32:31 UTC
view on stackexchange narkive permalink

Die statistische Inferenz wird ungültig, wenn keine Variabilität vorliegt. In diesem Fall ist die Variabilität nicht vorhanden. Der einzige Weg, auf dem das Argument lautet:

"50 Menschen haben in den letzten zwei Jahren in [Gebiet a] gelebt und es gab keine Zwischenfälle, daher ist das Gebiet für mehr Menschen sicher dort leben. "

kann untersucht werden, ist nicht statistisch, dh deterministisch. Daher ist das Argument nur dann methodisch gültig (nicht sachlich korrekt), wenn es als

gelesen wird. "50 Personen haben in den letzten zwei Jahren in [Gebiet a] gelebt und es gab keine Zwischenfälle. Daher ist die Vorfallrate in dem Gebiet und bleibt Null . "

Wow. Ich bin beeindruckt vom Konfidenzniveau der Person, die dies sagt.

Jede implizite Folgerung vom Typ "Wenn die Rate in der Stichprobe Null ist, erwarten wir, dass sie in" klein / akzeptabel / "normal" ist Die Bevölkerung "(so könnte man die Behauptung" es ist sicher, dort zu leben "verstehen) ist Müll, sowohl weil es keine Basis gibt, um von Stichprobe zu Bevölkerung zu extrapolieren, als auch weil es keine Basis gibt, um von Vergangenheit / Gegenwart zu extrapolieren in die Zukunft.

Wie Fisher sagen würde, "mehr Daten erhalten".

Ich stimme Ihrer Einschätzung voll und ganz zu.Diese Person ist in der Tat zuversichtlich, dass die Vorfallrate Null bleiben wird, und ich bin auch beeindruckt (und ein bisschen entsetzt) über ihr Selbstvertrauen.
Sie können jedoch beispielsweise ein Konfidenzintervall erstellen, das auf einer Binomialbeobachtung von Null basiert.Das ist eine gültige statistische Inferenz ohne Variation.Wie bereits erwähnt, ist Ihr Anspruch ungültig.
@kjetilbhalvorsen [vielleicht] (http://andrewgelman.com/wp-content/uploads/2014/09/fundamentalError.pdf)


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...