Wenn die funktionale Beziehung zwischen Exposition und durchschnittlicher Reaktion keine S-förmige Logistikkurve ist, gibt es immer noch Gründe, warum wir eine S-förmige Logistikkurve als aussagekräftige Zusammenfassung dieser Daten betrachten könnten.
Als Beispiel haben wir möglicherweise einen Prognosefaktor in einem Modell weggelassen, was bedeutet, dass die wahre marginale Beziehung zwischen der Exposition und dem Ergebnis nicht logistisch ist, sondern eine komplizierte halblogistische Funktion, die gemittelt wird Risiken über mehrere bedingte logistische Kurven hinweg erhöhen. Dies ist das Prinzip der Nichtkollabierbarkeit bei der logistischen Regression.
Grundsätzlich können wir selten sicher sein, dass der S-förmige logistische Trend tatsächlich der "richtige" ist ... aber er ist nützlich! Alle Modelle sind falsch, einige Modelle sind nützlich.
Kenji hat Recht, wenn wir versuchen, einen S-förmigen Trend zu approximieren und die Daten starke Verteilungsverletzungen zeigen, müssen möglicherweise einige Sensitivitätsanalysen in Betracht gezogen werden, beispielsweise das Testen auf Polynomeffekte höherer Ordnung. Eine andere Art von Test, die berücksichtigt werden muss, sind Haltepunkte, bei denen "Knoten" angepasst werden, damit Trends die Richtung ändern können. Diese Ansätze werden in Splines hybridisiert und durch Verwendung von LOESS-Kurven noch allgemeiner gestaltet, um allgemeine nichtlineare Beziehungen zwischen Expositionen und Ergebnissen zu untersuchen.
Sie können jedoch zur ursprünglichen Frage zurückkehren: Sie können sagen: "Ich möchte diese Daten mit einer einzigen logistischen Kurve zusammenfassen, deren Achsenabschnitt die logarithmischen Quoten des Ergebnisses für Exposition = 0 darstellt und deren Steigung das logarithmische Quotenverhältnis istals Maß für die Assoziation zwischen einer Exposition und einem Ergebnis. "Der Wunsch besteht dann darin, eine robuste Fehler -Schätzung zu erhalten, die unvoreingenommen und konsistent ist.Die S-Kurve wird dann verwendet, um einen Trend erster Ordnung in den Daten zusammenzufassen, den Sie als Faustregel betrachten können: Steigt oder sinkt das Risiko tendenziell mit steigender Exposition und um wie viel?Dazu müssen Sie nur Sandwich-basierte Standardfehler anwenden.Dies kann unter Verwendung von verallgemeinerten Schätzungsgleichungen mit Kovarianzstruktur der Arbeitsunabhängigkeit, logistischer Verknüpfung und binomialer Varianzstruktur erfolgen.