Frage:
Berühmte statistische Siege und Horrorgeschichten für Unterrichtszwecke
Placidia
2019-11-01 18:07:37 UTC
view on stackexchange narkive permalink

Ich entwerfe ein einjähriges Programm zur Datenanalyse mit einem örtlichen Community College. Das Programm zielt darauf ab, die Schüler auf grundlegende Aufgaben in den Bereichen Datenanalyse, Visualisierung und Zusammenfassung, fortgeschrittene Excel-Kenntnisse und R-Programmierung vorzubereiten.

Ich möchte eine Reihe kurzer Beispiele aus der Praxis vorbereiten, die veranschaulichen, wo gewöhnliche Intuition versagt und statistische Analysen erforderlich sind. Ich interessiere mich auch für "berühmte statistische Fehler", aber mehr für die Siege. Die betreffenden Daten sollten frei verfügbar sein.

Ein perfektes Beispiel für das, wonach ich suche, ist der Berkeley-Diskriminierungsfall, der Simpsons Paradoxon veranschaulicht. Die Daten dafür sind in den Datensätzen von R gespeichert.

Interessant sind auch historische Fälle. Die Analyse der Broad Street-Pumpendaten durch John Snow ist ein gutes Beispiel für die Leistungsfähigkeit der Visualisierung.

Es gibt viele Fehler bei der Datenerfassung (Auswahlverzerrung) usw., und die Literatur in der medizinischen Statistik ist voll davon.

Im Bereich der Variablenauswahl und des Stichprobenentwurfs treten viele "statistische Gewinne" auf. Ich interessiere mich für Paradoxien, die in anderen Bereichen auftreten - wie die Analyse als solche.

Siehe diese aktuelle Frage: https://stats.stackexchange.com/questions/432866/famous-easy-to-understand-examples-of-a-confounding-variable-invalidating-a-stud/432940#432940
Eine sehr große Anzahl von Beispielen in jeder Ausgabe von * Statistics * (Freedman, Pisani und Purves) ist von dieser Art: Das ist ein Grund, warum es ein großartiges Buch ist.
"The Signal and the Noise", eine einfache, nicht technische Lektüre von Nate Silver, enthält viele solcher interessanten Beispiele.Einschließlich, wie schlechte Annahmen und fehlgeschlagene statistische Modelle zum Absturz des US-Immobilienmarktes im Jahr 2008 beigetragen haben.
Eine "große Liste" -Frage, bei der es keine Grenzen für korrekte Antworten gibt, macht dies "zu breit".
Ich bin mir nicht sicher, ob Sie etwas daraus machen können, aber ich mochte es immer: 30% der Todesfälle im Auto betreffen Drogen oder Alkohol;und 70% beinhalten keine Drogen oder Alkohol.Daher sollte jeder unter Drogen oder betrunken fahren, da dies sicherer ist, als nüchtern um 2: 1 zu fahren.
Erwähnenswert ist auch der Klassiker https://en.m.wikipedia.org/wiki/How_to_Lie_with_Statistics.
Relevante XKCD: https://xkcd.com/1138/
Zwölf antworten:
Semoi
2019-11-01 21:20:21 UTC
view on stackexchange narkive permalink

Das deutsche Panzerproblem hat mir sehr gut gefallen.Es zeigt, wie Daten, die normalerweise als irrelevant angesehen werden, in der Hand eines Statistikers zu wertvollen Informationen werden.Außerdem mochte ich das Gesetz der kleinen Zahlen und den Basiszinsfehler.

Ein weiterer häufiger Irrtum, der dem falsch positiven Paradoxon (auch bekannt als Basisraten-Irrtum) ähnelt, ist [Simpsons Paradoxon] (https://en.wikipedia.org/wiki/Simpson%27s_paradox).Dies erklärt, warum beispielsweise das medizinische Verfahren mit der höchsten Erfolgschance paradoxerweise häufig eine niedrigere Erfolgsquote aufweist als andere Optionen.
Das Komma nach "Shows" ist so deutsch wie die Panzer, von denen Sie sprechen.;) gutes Beispiel, übrigens.
carlo
2019-11-01 19:41:28 UTC
view on stackexchange narkive permalink

R gegen Sally Clark ist ein berühmter Fall, in dem eine Frau wegen Mordes verurteilt wurde, weil dem Gericht Statistiken und Wahrscheinlichkeitsgrundsätze nicht bekannt waren.

Aber wenn ich das sagen muss, was mich am meisten beeindruckt hat, als ich anfing, Statistik zu studieren, dann ist das Regression zum Mittelwert, was auch der statistischen Regression den Namen gab (auch wenn das so isteine ganz andere Sache).Der Nobelpreisträger (für Wirtschaftswissenschaften, auch wenn er Psychologe ist) Daniel Kahneman erzählte in einer faszinierenden Anekdote, wie er erkannte, wie eine Regression des Mittelwerts Menschen zu falschen Überzeugungen führen kann.

Edit: Eine andere sehr interessante Geschichte, die mir gerade in den Sinn gekommen ist und die Wichtigkeit fehlender Daten betrifft, ist die von Abraham Wald und den Einschusslöchern von Kriegsflugzeugen.

Schön!Tatsächlich spielt der Kahneman-Punkt eine zentrale Rolle in Demings Qualitätsrevolution, in der er die Auszeichnung "Verkäufer des Monats" kritisierte, die die Arbeiter demoralisiert, indem sie Zufälligkeit belohnt.Ich werde das sicher benutzen.
Dieser [Fall] (https://arxiv.org/abs/math/0607340) (eine Krankenschwester, die wegen einer hohen Todesrate verurteilt wurde) ist ähnlich.https://stats.stackexchange.com/a/314249/164061
Die Wald-Geschichte ist gut geeignet, um das Konzept der [Überlebensbias] zu demonstrieren (https://en.wikipedia.org/wiki/Survivorship_bias).Es kann auch als leuchtende Übung verwendet werden, indem die Schüler die Empfehlung abgeben, wo zusätzliche Rüstungen angebracht werden sollen.
corey979
2019-11-01 19:48:56 UTC
view on stackexchange narkive permalink

Um zu veranschaulichen, wo gewöhnliche Intuition versagt , ist das Monty Hall-Paradoxon ein guter Anfang.

Huy Pham
2019-11-01 18:50:12 UTC
view on stackexchange narkive permalink

Wenn Sampling Teil Ihres Kurses ist, ist es schwer, Dewey schlägt Truman

zu schlagen
Das habe ich vergessen.Vielen Dank.
PsychometStats
2019-11-02 08:21:24 UTC
view on stackexchange narkive permalink

Ein weiterer interessanter Fall, wie falsches Glücksspiel verlaufen kann, ist das Beispiel des Monte Carlo Casino.

Bei einem Roulette-Spiel im Monte Carlo Casino am 18. August 1913 fiel der Ball 26 Mal hintereinander schwarz.Dies war ein äußerst ungewöhnliches Ereignis: Die Wahrscheinlichkeit, dass eine Sequenz von Rot oder Schwarz 26 Mal hintereinander auftritt, liegt bei 1 zu 66,6 Millionen, vorausgesetzt, der Mechanismus ist unvoreingenommen.Zu dieser Zeit verloren die Spieler Millionen von Franken beim Wetten gegen Schwarz, was fälschlicherweise darauf hinwies, dass der Streifen ein Ungleichgewicht in der Zufälligkeit des Rades verursachte und dass ihm ein langer Streifen Rot folgen musste.

Gambler's Trugschluss und Gambler's Ruine geben eine gute Erklärung für dieses Beispiel.

War das Rad montiert?Gibt es weitere Diskussionen zu dieser Geschichte in der statistischen Literatur?
@innisfree war meines Wissens nicht
Angesichts der Menge an Roulette, die weltweit gespielt wird, ist ein solcher Zufall irgendwo durchaus plausibel.Es wird erwartet, dass dies ungefähr einmal pro 66,6 Millionen Gelegenheiten geschieht.Aber die Chancen stehen sehr hoch, dass es an Ihrem bestimmten Tisch in einer Nacht, in der Sie spielen, auftritt.
@Chromatix absolut richtig.Denken Sie nur an eine Fallstudie eines Mannes, der im Laufe seines Lebens sieben Mal von einer Beleuchtung getroffen wurde.Auch ein sehr unwahrscheinliches Ereignis, aber es war nicht überraschend, dass es sich über den gesamten Verlauf der Geschichte ereignete
Es ist auch ziemlich plausibel, dass Gauner im frühen zwanzigsten Jahrhundert ein Roulette-Rad in einem Casino manipuliert haben;)
Die frequentistische Denkweise: Um die Plausibilität zu beurteilen, dass eine bestimmte Folge von Drehungen an einem bestimmten Roulette-Tisch in Monte Carlo im Jahr 1910 manipuliert wurde, muss ich über alle (realisierten und nicht realisierten) Drehungen an allen Tischen auf der ganzen Welt in der Welt nachdenkengesamte aufgezeichnete Geschichte der Menschheit: D.
Zu Ihrer Information, die Quelle für diese Geschichte scheint Huff & Geis (1959) zu sein, How to Take a Chance.Ich habe jedoch keinen Zugriff darauf.
Peter - Reinstate Monica
2019-11-03 23:11:54 UTC
view on stackexchange narkive permalink

Ich finde das false-positive Paradoxon bemerkenswert, weil es so kontraintuitiv ist. Ein gutes Beispiel:

Cancer-Screening der Allgemeinbevölkerung erhöht die Lebenserwartung nicht, , obwohl eindeutig Leben gerettet werden, da einige Krebsarten frühzeitig erkannt werden und besser behandelt werden können. Die US-amerikanische Task Force für Präventivdienste empfahl 2009 entsprechend kein Routine-Screening für Frauen im Alter von 40 bis 49 Jahren.

Dies ist gutes Unterrichtsmaterial, da es sich um ein nicht triviales Beispiel aus dem wirklichen Leben handelt, das fast jeden irgendwann in seinem Leben betrifft. Es gibt einen Artikel des National Cancer Institute hier.

Die Argumentation lautet wie folgt:

  • Die Anzahl der Krebserkrankungen ist gering, so dass die "Anzahl der zur Behandlung benötigten" (lesen: Bildschirm) groß ist.
  • Die Tests sind ziemlich zuverlässig. Die niedrige Inzidenzrate führt jedoch zu einer großen absoluten falsch positiven Zahl mit der Folge einer großen Anzahl unnötiger Biopsien (> 90% sind falsch positiv).
  • Krebserkrankungen fallen in eine der folgenden Untergruppen:
    1. Aggressive Krebsarten, die den Patienten töten, egal was passiert.
    2. Langsame Krebserkrankungen, die den Patienten nicht töten, bevor er an anderen Ursachen stirbt. Das Erkennen dieser Fälle wird als Überdiagnose bezeichnet. Aus dem USPSTF-Dokument: "Selbst mit der konservativen Schätzung, dass 1 von 8 Brustkrebsfällen überdiagnostiziert wird, für jede Frau, die einen Brusttod vermeidet Krebs durch Screening werden 2 bis 3 Frauen unnötig behandelt. "
  • Krebserkrankungen, die auch bei später Erkennung ohne Screening behandelt werden können.
  • Krebserkrankungen, die aggressiv genug sind, um den Patienten zu töten, wenn sie spät erkannt werden, aber dennoch behandelt werden können, wenn sie früh erkannt werden.
  • ol>

    Nur Klasse 4 profitiert vom Screening auf Kosten einer großen Anzahl unnötiger Krankenhausbesuche, unnötiger Biopsien und vieler schlafloser Nächte.All dies sind kleine, aber messbare Gesundheitsrisiken, die sich über die zur Behandlung erforderliche große Anzahl ansammeln und den sehr realen Nutzen für die kleine Anzahl in Teilmenge 4 überwiegen.

    Ist die Mammographie im allgemeinen Pop über 40 oder über 50 ein klares Beispiel dafür?Sehr geringer Anstieg des Brustkrebsrisikos durch Röntgenexposition multipliziert mit einer sehr großen Anzahl von Mammographien = ein Ausgleich zu der Prävention, die durch die Früherkennung Ihres Brustkrebses vom Typ 4 hervorgerufen wird.
    @Alexis Ja, das ist es.Ich habe einen Artikel der USPSTF verlinkt, der ziemlich aufschlussreich ist.Sie empfahlen kein Routine-Screening für jüngere Frauen.Bei Frauen im Alter von 50 bis 60 Jahren besteht eine Wahrscheinlichkeit von * 60% * für ein falsches Positiv über 10 Jahre und immer noch eine Wahrscheinlichkeit von 9,4% für eine unnötige Biopsie.(Und beachten Sie, dass die "wahren Positiven" immer noch alle 4 meiner Untergruppen umfassen, d. H. Eine signifikante Anzahl wurde ohnehin überdiagnostiziert oder tödlich.)
    @Alexis Und ich würde die anderen Risiken, die mit einfachen Krankenhausbesuchen verbunden sind, nicht unterschätzen, geschweige denn Biopsien.Bei mehreren resistenten Stämmen ist jedes invasive Verfahren ein erhebliches Risiko.Der Schaden, der allein durch die Fehldiagnose oder Überdiagnose (ohne Behandlung!) Verursacht wird, ist ebenfalls erheblich.Menschen sind normalerweise außer sich, wenn Krebs diagnostiziert wird, schlafen nicht gut, essen nicht gut, mit welchen Nebenwirkungen auch immer (physiologische, Unfälle, Drogenmissbrauch).Es ist alles ziemlich klein, aber für große Zahlen.
    Ioannis
    2019-11-05 04:48:19 UTC
    view on stackexchange narkive permalink

    Benfords Gesetz:

    Hier beschrieben. Ziffern erscheinen nicht mit einheitlicher Häufigkeit vor Zahlen, sondern folgen einem bestimmten Muster: Ziffer 1 ist mit einer Wahrscheinlichkeit von 30% am wahrscheinlichsten die erste Ziffer, gefolgt von 2 (Wahrscheinlichkeit 17,6%), und so weiter am. Das folgende Bild (aus Wikipedia) zeigt die Häufigkeit jeder Ziffer am Anfang jeder Zahl in einigen natürlich vorkommenden Datensätzen:

    Frequency of each digit at the beginning of each number, in some naturally-occurring datasets

    Es gibt bestimmte Bedingungen, unter denen das Gesetz gilt (z. B. sollten sich die Daten über mehrere Skalen erstrecken, sodass Dinge wie die Größe von Menschen nicht förderfähig sind), aber sie sind recht allgemein gehalten.

    Die vielleicht überraschendste Anwendung ist die Betrugserkennung. Dies basiert auf der Annahme, dass Menschen, die versuchen, Zahlen herzustellen, dazu neigen, die Ziffern gleichmäßig zu verteilen, was gegen Benfords Gesetz verstößt.

    Ich erinnere mich, als ich dies einer Klasse erklärte, und in der Pause kam einer der Schüler auf eine Buchhaltungstabelle seiner Firma, in der er versucht hatte, meine Ansprüche zu validieren. Es hat funktioniert :)

    Zipfs Gesetz

    Hier beschrieben: Die Häufigkeit eines Wortes in einem Korpus ist umgekehrt proportional zu seinem Rang. Was überrascht, ist, dass diese Beziehung für jeden Korpus gilt, selbst für alte Sprachen, die noch nicht übersetzt wurden. Ein interessantes Video, in dem mehr darüber erklärt wird, warum dieses Muster möglicherweise gilt, ist hier. Das folgende Bild zeigt Rang (horizontal) und Häufigkeit (vertikal) in einer Log-Log-Skala für die ersten 10 Millionen Wörter in 30 Wikipedias ( Quelle). Beachten Sie, dass das Gesetz eine gerade Linie vorhersagen würde: Rank vs Frequency

    Diese beiden Gesetze sind mächtig und kontraintuitiv. In dem Sinne, dass sie das Verständnis der Welt über Statistiken verbessern, können sie als "statistische Gewinne" bezeichnet werden.

    Was bedeutet "Rang" eines Wortes?Meine erste Vermutung ist, dass es den Rang (Häufigkeit) bedeutet.Wenn dies der Fall ist, ist der interessante Teil davon, dass die Linie zwischen diesen beiden so ähnlich ist, da sie per Definition monoton ist.
    In der Tat ist es der Frequenzrang (innerhalb eines bestimmten Korpus).Der interessante Teil ist, dass der Rang die Frequenz so gut vorhersagt - umgekehrt ist das natürlich per Definition der Fall.
    Chromatix
    2019-11-04 01:22:25 UTC
    view on stackexchange narkive permalink

    Mein Lieblingsbeispiel als Beispiel dafür, wie fehlerhafte Statistiken langfristige Konsequenzen haben können, wenn sie zur Steuerung der Regierungspolitik verwendet werden, ist der groß angelegte Eisenbahnvandalismus, der als Beeching Axe bekannt ist . Dies ergab sich aus einem Verkehrsminister mit engen Beziehungen zur Straßenbauindustrie ( Ernest Marples), der einen Experten für die Petrochemieindustrie ( Richard Beeching) anstellte, um festzustellen, welche Teile der Briten Das Eisenbahnnetz machte Verluste und sollte daher beschnitten werden.

    Ungefähr 4000 Streckenmeilen wurden als direkte Folge gesperrt, was sich direkt positiv auf die Nachfrage nach Straßen auswirkte (und unweigerlich einen Großteil der heutigen Überlastung). Weitere Schließungen wurden bis in die 1980er Jahre fortgesetzt, einschließlich der wichtigen und vor relativ kurzer Zeit modernisierten Woodhead-Route über die Pennines, und nur mit dem Fall der Settle & Carlisle-Linie gestoppt, die einst der nördliche Teil des Mittellandes gewesen war Hauptstrecke der Eisenbahn.

    Es ist vielleicht bemerkenswert, dass Marples später aus dem Land geflohen ist, um der Strafverfolgung wegen Steuerbetrugs zu entgehen. Zu dieser Zeit gab es auch den Verdacht auf Interessenkonflikte, da er seinen 80-prozentigen Anteil an seinem früheren Straßenbau von Marples Ridgeway (wie gesetzlich durch seine Ernennung zum Minister vorgeschrieben) an seine Frau verkauft hatte, was es ihm leicht machte um sie später wieder zu erwerben.

    Eine gute Quelle zu diesem Thema ist "Ich habe versucht, eine Eisenbahn zu betreiben" von Gerard Fiennes.

    Die hier auftretenden statistischen Fehler waren größtenteils darauf zurückzuführen, dass das Problem zu eng gefasst wurde. Die Stationen der Nebenstrecken wurden besucht, um ihre Einnahmen zu überprüfen und Verkehrserhebungen durchzuführen. Der saisonale Verkehr, der die Strecke benutzte und dessen Fahrkarten an anderer Stelle im Land verkauft wurden, wurde jedoch ignoriert. In vielen Fällen wurden die Kosten durch veraltete Arbeitspraktiken erhöht, die hätten rationalisiert werden können. Diese Option wurde jedoch bei der Auswahl der vollständig geschlossenen Leitungen nicht berücksichtigt. Dies führte auch dazu, dass einige Strecken, deren Verluste nur gering waren und die den Eisenbahnen insgesamt indirekt zugute kamen, durch den "Netzwerkeffekt", Ziele ohne Änderung des Modus erreichen zu können, in die Sperrliste aufgenommen wurden.

    Diese Fehler wurden im späteren Serpell-Bericht wiederholt, der ein noch drastischeres Abschlussprogramm vorschlug, das jedoch glücklicherweise abgelehnt wurde.

    Heute steigt die Nachfrage im Eisenbahnverkehr in Großbritannien stark an, und die Strecken werden neu gebaut und wiedereröffnet, um die Nachfrage zu befriedigen. Einige Linien, die durch die Bemühungen von Beeching und Marples geschlossen wurden, wären äußerst vorteilhaft, wenn sie noch heute existieren würden.

    Interessant ist auch die Geschichte der späteren Privatisierung der Eisenbahnen als Beispiel für falsches Denken.Kapitel 2 von Private Island ist ein ausgezeichneter Bericht darüber.https://www.versobooks.com/books/1731-private-island
    fr_andres
    2019-11-02 08:38:01 UTC
    view on stackexchange narkive permalink

    Gute Qualitätssicherung!hier meine zwei Cent: Es geht hauptsächlich darum, wie Korrelation sehr verdächtig sein kann und einige traditionelle Methoden, um sie herauszufinden:

    https://www.tylervigen.com/spurious-correlations

    https://en.wikipedia.org/wiki/Anscombe%27s_quartet

    https://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient

    Um es ein wenig näher zu erläutern: Der Kanon für Korrelation und Kausalität in der modernen Statistik ist sicherlich Judea Perl.Nielsens (Web-) Buch bietet eine gute Rezension:

    http://www.michaelnielsen.org/ddi/if-correlation-doesnt-imply-causation-then-what-does/

    Ich erinnere mich an ein Statistikbuch, in dem Storchensichtungen und Geburtenrate verwendet wurden, um darauf hinzuweisen, dass Korrelation nicht unbedingt eine Ursache darstellt.
    Cliff AB
    2019-11-04 06:14:04 UTC
    view on stackexchange narkive permalink

    Ich weiß nicht, ob dies als "Intuition fehlt" gilt, sondern eine "naive Analyse liefert eine kontraintuitive und irreführende Antwort".

    Einer meiner Statistikprofessoren stellte eine Studie zum Zusammenhang zwischen Rauchen und FEV bei jungen Studenten vor.

    FEV kann als Maß für das Lungenvolumen angesehen werden. Als der Professor die Daten zum ersten Mal vorstellte, fragte er, wie die Beziehung aussehen würde. Wir alle dachten, dass Rauchen mit einem niedrigeren FEV verbunden sein würde. Bei den Daten stimmte das jedoch nicht! In der Tat hatten Raucher größere FEV als Nichtraucher. Wurde diese Klasse von einem Raucher verweigert?

    Dann analysierte er die Daten erneut, diesmal jedoch altersbereinigt. Damit haben wir gesehen, was wir erwartet hatten: einen negativen Einfluss des Rauchens auf die FEV. Dies lag daran, dass Raucher viel häufiger ältere Schüler als jüngere Schüler waren. Während sich das Rauchen negativ auf das FEV auswirkte, war es nicht so sehr, dass es den Anstieg des FEV vollständig vom Erwachsenwerden ausschloss.

    Einen Link zu einem Rundgang durch die Daten in R finden Sie hier.

    +1 zum Hinzufügen eines Links zu den Daten.Schönes Beispiel für einen Confounder!
    Michelle
    2019-11-04 15:16:26 UTC
    view on stackexchange narkive permalink

    Das Versäumnis, den Zusammenhang zwischen der Starttemperatur und der Auswirkung der Starttemperatur auf die O-Ringe des Space Shuttles zu zeigen, führte kurz nach dem Start zum katastrophalen Ausfall der Columbia. Eine Übersicht über das Problem finden Sie hier.

    Der von Ihnen bereitgestellte Link erfasst nicht ganz, was passiert ist.Tatsächlich [erkannten die Ingenieure das Problem im Voraus, aber die Manager ignorierten ihre Bedenken.] (Https://en.wikipedia.org/wiki/Space_Shuttle_Challenger_disaster#O-ring_concerns)
    Zitat aus derselben Wikipedia-Seite: "Als ein Thiokol-Manager Ebeling nach der Möglichkeit eines Starts bei 18 ° F (-8 ° C) fragte, antwortete er:" [W] Wir sind nur für 40 ° [40 ° F oder 4 qualifiziert° C] ... was für ein Geschäft hat jemand, das an 18 ° denkt, wir sind im Niemandsland. '"
    David Smith
    2019-11-05 01:29:47 UTC
    view on stackexchange narkive permalink

    In den letzten anderthalb Jahren hat Bloomberg News die Tesla 3-Produktion unter Verwendung mehrerer Datenquellen regelmäßig geschätzt.Sie haben diese Arbeit gerade beendet, aber ich denke, die Geschichte ist interessant.



    Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 4.0-Lizenz, unter der er vertrieben wird.
    Loading...