Kann mir bitte jemand ein Beispiel geben, wann Ridge Lasso spielen würde?
Wird Lasso unter den meisten Umständen nicht besser?Wenn ein Regressor einen großen Koeffizienten hat, bedeutet dies, dass der Regressor ein guter Prädiktor ist. Wenn wir also Grat verwenden, bestrafen wir diesen Koeffizienten mehr.Ist das nicht schlimm?Lasso bestraft die kleineren Koeffizienten mehr und die größeren Koeffizienten weniger, da der Grat den Koeffizienten in der Verlustfunktion (L2-Norm) quadriert, während Lasso nur die L1-Norm ist.
Wir möchten weniger Koeffizienten, um eine Überanpassung zu verhindern. Wäre Lasso also nicht IMMER besser?
Lasso wird offensichtlich besser sein, wenn es 2 gute und 15 schlechte Regressoren gibt. Gibt es ein kanonisches Beispiel dafür, wann Ridge das Lasso übertreffen würde?