Entschuldigung, ein bisschen neu hier, bitte entschuldigen Sie, wenn dies nicht allzu viel hilft.
Die US-amerikanische Sozialversicherungsbehörde führt Aufzeichnungen über Geburten und Todesfälle und stellt ihre Informationen zum Kauf zur Verfügung (anscheinend für ein hoher Preis): Hier
Ich habe jedoch eine Quelle gefunden, die behauptet, sie gekauft zu haben und sie kostenlos anbietet (sowie die nach Datum sortierten Daten auf der Website anbietet ): Hier
Ich gehe davon aus, dass Sie dies einfach als Beispiel verwenden und alle Daten mit einem Skript durchgehen können, um herauszufinden, wie viele Menschen an ihrem Geburtstag tatsächlich sterben. Ich würde das selbst tun, aber ich habe noch 20 Minuten zum Herunterladen (sie sind ungefähr 1,5 GB), also werde ich versuchen, mich selbst mit den Statistiken zu befassen, wenn ich die Zeit finde, ein Skript zu schreiben.
Natürlich können die Vereinigten Staaten nicht die gesamte Weltbevölkerung repräsentieren, aber es ist ein guter Anfang. Ich gehe davon aus, dass Sie an Geburtstagen aufgrund von "Problemen der ersten Welt" eine höhere Rate an Todesfällen sehen werden, weil wir die Vereinigten Staaten nutzen und ich denke, dass der Effekt auf der ganzen Welt weniger sichtbar wäre ...
Update - Nummern: D
Ich habe die Todesstammdatei der sozialen Sicherheit aus der kostenlosen Quelle durchgesehen, sodass ich nicht wissen kann, ob die Informationen gültig sind. Angesichts der Größe von jeweils ~ 3 Gigabyte und der Tatsache, dass niemand diese Art von Dateien fälschen kann, gehe ich davon aus, dass sie gültig sind.
Sie können den Code sehen, der Ich habe es hier durchgearbeitet: http://pastebin.com/9wUFuvpN
Es ist in C # geschrieben und liest die Zeilen des Todesindex nacheinander durch analysiert das Datum mit Regex. Ich nahm an, dass die Datei im Grunde genommen dieses Format hatte:
`(Sozialversicherungsnummer) (Vorname) (Nachname) (zweiter Vorname) (ein Buchstabe) (MM-TT-JJJJ des Todes) (MM-TT-JJJJ der Geburt) `
Ich hatte Regex, habe nur den letzten Teil für das Geburts- / Sterbedatum ausgewählt und überprüft, ob eines der Felder nur 0 ist (was meiner Meinung nach bedeutet, dass die Sozialversicherung keinen gültigen Monat / Datum für bekommen konnte den Datensatz) und verwerfen Sie die Nullen. Dann wird geprüft, ob der Tag der Geburt und der Monat der Geburt mit dem Tag des Todes / dem Monat des Todes übereinstimmen, und dies wird zur Anzahl der am Geburtstag Verstorbenen hinzugefügt. Es werden alle Datensätze, die keine Nullen sind, zur Anzahl der Todesfälle hinzugefügt.
Die Ergebnisse werden in diesem Format ausgegeben:
Todesfälle am Geburtstag / Durchgesehene Todesfallzeilen - Personen mit einer 0 in einem ihrer Datensätze
Es ist großartig, wenn jemand diesen Code überprüfen kann, da ich einige Fehler gefunden habe, die ich zuvor gemacht habe und nur feststellen konnte weil meine Ergebnisse keinen statistischen Sinn ergaben.
Hier ist die Konsolenausgabe:
Rechnen ...
- Datei 1 hatte 44665 Todesfälle an einem Geburtstag von 14879058 Todesfälle insgesamt
- Datei 2 hatte 47060 Todesfälle an einem Geburtstag von 15278724 Todesfälle insgesamt
- Datei 3 hatte 49289 Todesfälle an einem Geburtstag von 15374049 Todesfälle insgesamt
- Insgesamt haben wir 141014 Todesfälle an einem Geburtstag von 45531831.
Wir haben also eine statistische Wahrscheinlichkeit von ~ 0,3097%, an einem Geburtstag zu sterben (1 /) 365) würde uns glauben machen, dass es nur eine ~ 0,27397% ige Chance gibt, an einem Geburtstag zu sterben. Das ist in der Tat eine 13% ige Erhöhung der Sterbewahrscheinlichkeit an einem Geburtstag von 1/365. Natürlich ist diese Stichprobe nur für Amerikaner und hat nur 45 Millionen Datensätze. Ich bin sicher, dass Organisationen, die ihre Arbeit ursprünglich veröffentlicht haben, Zugang zu viel zuverlässigeren und größeren Todesindizes hatten. Ich denke jedoch, dass es in der Tat gültig ist, dass Todesfälle an einem Geburtstag wahrscheinlicher sind als Todesfälle an einem anderen Tag.
Hier ist ein Zeitartikel, in dem Sprünge in Todesgründen an Geburtstagen genannt werden: Artikel
Bearbeiten 2: @cbeleites wies darauf hin, dass ich vergessen habe, Todesfälle am selben Tag zu berücksichtigen, was ein großer Faktor für die Zunahme der Todesfälle an Geburtstagen wäre. Genau genommen sind meine Daten immer noch gültig, aber ich habe sie nicht weggeworfen, wenn eine Person am selben Tag gestorben ist, an dem sie geboren wurde. Es ist interessant, dass meine Ergebnisse nicht zu stark von diesem Fehler betroffen waren. Es scheint also, dass diese Aufzeichnungen den Tod am ersten Tag nicht enthalten. Ich werde später darauf eingehen. Ich denke, es gibt sehr interessante Statistiken, nach denen ich suchen kann, wie zum Beispiel den Tod an Tagen im Monat und eine Art Heatmap. Ich werde das wahrscheinlich irgendwann versuchen ...