Zusätzlich zu den Links zu Simpsons Paradoxon in den Kommentaren gibt es hier eine andere Möglichkeit, darüber nachzudenken.
Stellen Sie sich einen Datensatz vor, der durch Zählen der Anzahl und Art der Münzen gesammelt wird, mit denen verschiedene Personen arbeiten sie (ich werde US-Währung für das Beispiel verwenden, aber es könnte auch in andere Währungen umgerechnet werden).
Jetzt erstellen wir 3 Variablen, die y-Variable ist ein Indikator dafür, ob die Änderung mehr als beträgt 1 Dollar (\ $ 1,00), x1 ist die Gesamtzahl der Münzen und x2 ist die Gesamtzahl der Pennys (\ $ 0,01) und Nickel (\ $ 0,05) (dies ist eine Teilmenge von x1). Wenn wir nun einzeln zurückgehen würden, würden wir erwarten, dass x1 und x2 positive Koeffizienten haben würden. Je mehr Münzen, desto wahrscheinlicher ist es, dass die Summe über 1 $ liegt. Wenn es jedoch zusammen in ein Regressionsmodell eingefügt wird, ist es sinnvoll, dass der Koeffizient auf x2 negativ wird. Denken Sie daran, dass die Definition des einzelnen Koeffizienten die Änderung von y (oder im logistischen Fall die Änderung der logarithmischen Quoten von y) für a ist Änderung von 1 Einheit in x , während die anderen Variablen konstant bleiben . Wenn wir also die gleiche Anzahl an Gesamtmünzen (x1) haben, aber die Anzahl an Münzen mit kleinem Wert (x2) erhöhen, haben wir weniger Münzen mit großem Wert und damit eine geringere Chance, mehr als \ $ 1 zu erhalten.