In einer Art von Box-Whisker-Plot sollen die Zäune an den Enden der Whisker Grenzwerte anzeigen, ab denen jeder Punkt als Ausreißer betrachtet wird.
Die Standarddefinitionen, die ich gefunden habe für diese Grenzwerte sind
$$ q_1 - k \ times \ mathrm {IQR} $$ für den unteren Zaun und $$ q_3 + k \ times \ mathrm {IQR} $$ für den oberen Zaun wobei $ q_1 $ und $ q_3 $ das erste bzw. dritte Quartil sind, ist $ \ mathrm {IQR}: = q_3 - q_1 $ der Interquartilbereich und $ k $ ist eine Konstante $ > 0 $. (Der Wert von $ k $, den ich am häufigsten gesehen habe, ist 1,5, wobei 3 eine entfernte Sekunde ist.)
So weit so gut.
Das Problem ist, dass bei diesen Definitionen, der Abstand zwischen dem unteren Zaun und $ q_1 $ wäre immer der gleiche wie der Abstand zwischen dem oberen Zaun und $ q_3 $, nämlich $ k \ times \ mathrm {IQR} $. IOW, die Länge des oberen Whiskers würde immer gleich der Länge des unteren 1 sup> sein.
Dies stimmt nicht mit der überwiegenden Mehrheit des BW überein Grundstücke, die ich da draußen sehe. Für einige dieser Diagramme sollen die Enden der Whisker natürlich die Min- und Max-Werte darstellen, daher gelten die obigen Kommentare nicht für sie. Es gibt jedoch viele andere Fälle, in denen die Zäune das Kriterium für die Klassifizierung von Punkten als Ausreißer bezeichnen sollen und angeblich auf Formeln wie den oben gezeigten basieren, die resultierenden Whisker jedoch unterschiedliche Längen haben. ( Zum Beispiel.)
Was fehlt mir?
1 sup> Nach "Länge der oberer / unterer Whisker "Ich meine natürlich den Abstand zwischen dem Punkt, an dem der Whisker auf die Box trifft, und dem" freien "Endpunkt des Whiskers. sub>