Dies ist kein Fehler in R.
Welch-Satterthwaite-Typ-T-Tests (der Standard-T-Test mit zwei Stichproben in R) haben tatsächlich keine T-Verteilung.
Das t-mit-Bruch-d.f. Sie erhalten eine Annäherung an die Nullverteilung.
Die Welch-Satterthwaite-Tests funktionieren in einer Vielzahl von Situationen gut, aber selbst wenn alle Annahmen zutreffen, ist die Nullverteilung der p-Werte etwas ungleichmäßig (dies wirkt sich auf die Signifikanzniveaus aus; Sie haben nicht ganz das Signifikanzniveau, das Sie angestrebt haben).
Es gibt effektiv 3 Parameter, die die Nullverteilung steuern - das Verhältnis der Populationsvarianzen und die beiden Stichprobengrößen. Der Test verwendet eine Näherung, um ihn nur zu einer Funktion eines einzelnen Parameters (Welch-Satterthwaite d.f.) zu machen.
Bei einigen Auswahlmöglichkeiten des Varianzverhältnisses und des Stichprobengrößenverhältnisses ist die Verteilung der p-Werte tendenziell etwas zu niedrigeren Werten verzerrt, und bei anderen Auswahlmöglichkeiten ist sie tendenziell etwas zu höheren Werten verzerrt.
Dies macht sich bei kleinen Stichprobengrößen eher bemerkbar, tritt jedoch ganz allgemein auf.
Es ist möglich, die Simulation mit Ihrem spezifischen n- und Varianzverhältnis anstelle der t-Näherung zu verwenden, um eine bessere Kontrolle der Signifikanzniveaus und damit genauere p-Werte zu erhalten, falls dies erforderlich ist. Wenn Ihre Stichprobengrößen jedoch gleich sind (wie es in Ihrer Simulation aussieht), hat ein T-Test mit gleicher Varianz wenig Probleme mit der Kontrolle des Signifikanzniveaus, selbst wenn die Varianzen ungleich sind, so dass dies tatsächlich ein vernünftiger Standard sein kann Wahl, wenn Sie gleiche Stichprobengrößen haben.