Ich lese Statistisches Umdenken (Abschnitt 4.3).
Wenn über die i.i.d. Annahme zur Erstellung eines linearen Regressionsmodells - ohne zu wissen, ob Verteilungswerte korreliert sind, sagt der Autor:
Die Reflexion eines Augenblicks sagt uns, dass dies im physischen Sinne kaum jemals wahr ist. Unabhängig davon, ob dieselbe Entfernung wiederholt gemessen oder eine Population von Höhen untersucht wird, ist es schwer zu argumentieren, dass jede Messung unabhängig von den anderen ist. Zum Beispiel werden Höhen innerhalb von Familien aufgrund von Allelen korreliert, die durch kürzlich geteilte Vorfahren geteilt wurden.
Der i.i.d. Die Annahme muss jedoch nicht unangenehm erscheinen, solange Sie sich daran erinnern, dass die Wahrscheinlichkeit innerhalb des Golems [des Modells] und nicht außerhalb der Welt liegt. Die i.i.d. Bei der Annahme geht es darum, wie der Golem seine Unsicherheit darstellt. Es ist eine erkenntnistheoretische Annahme. [...] Es geht nicht darum zu sagen, dass Erkenntnistheorie die Realität übertrumpft, sondern dass in Unkenntnis solcher Korrelationen die konservativste zu verwendende Verteilung i. D. ist [...]
Darüber hinaus gibt es viele Arten von Korrelationen, die wenig oder gar nichts mit der Gesamtform einer Verteilung zu tun haben, sondern nur die genaue Reihenfolge beeinflussen, in der Werte angezeigt werden. Zum Beispiel haben Schwesternpaare stark korrelierte Höhen. Die Gesamtverteilung der weiblichen Körpergröße bleibt jedoch nahezu normal. In solchen Fällen, d.h. bleibt trotz Ignorieren der Korrelationen vollkommen nützlich.
Warum ist i.i.d. die konservativste Verteilungsannahme? Weil es keine zusätzlichen Annahmen in das Modell einführt?