Die Formel wurde von Iglewicz und Hoaglin $ ^ 1 $ angegeben (Referenz unten).
Das mad für einen Vektor $ x $ von $ n $ Beobachtungen sei definiert als $ m (x) = \ text {median} (| x- \ text {median} (x) |) $. Wenn $ x $ normal verteilt ist, kann dies gezeigt werden
$$
\ lim_ {n \ rightarrow \ infty} E (m (x)) = \ sigma \ Phi ^ {- 1} (0,75)
$$
Dabei ist $ \ Phi ^ {- 1} (0,75) \ ca. 0,6745 $ das $ 0,75 ^ \ text {th} $ Quantil der Standardnormalverteilung und wird aus Gründen der Konsistenz verwendet. Das heißt, so dass
$ m (x) /0.6745$ ist ein konsistenter Schätzer der Standardabweichung $ \ sigma $.
Wenn Sie keine Normalität annehmen können, können Sie das 0,75 $ ^ \ text {th} $ -Quantil jeder anderen Verteilung verwenden, die symmetrisch zu einem Wert (nicht unbedingt dem Mittelwert) ist, der standardisiert ist, um den Mittelwert 0 und die Standardabweichung 1 zu haben Typischerweise wird eine t-Verteilung verwendet, wenn ein Fettschwanz angenommen wird.
Iglewicz und Hoaglin schlagen vor, $ \ pm3.5 $ als Grenzwert zu verwenden, dies ist jedoch eine Frage der Wahl ($ \ pm3 $ wird ebenfalls häufig verwendet).
$ ^ 1 $ Boris Iglewicz und David Hoaglin (1993), "Band 16: Erkennen und Behandeln von Ausreißern", Die ASQC-Grundreferenzen zur Qualitätskontrolle: Statistische Techniken, Edward F. Mykytka, Ph.D., Herausgeber .