Frage:
Sind Messungen am selben Patienten unabhängig?
Jorge Amaral
2012-10-29 19:16:07 UTC
view on stackexchange narkive permalink

Ich arbeite derzeit an der Klassifizierung von Lungenerkrankungen mittels Spirometrie. Dies ist ein Verfahren, bei dem der Patient Luft in einen Schlauch bläst und wir Luftvolumen, Druck usw. sammeln, um die spirometrischen Parameter zu erhalten.

Meine Frage lautet: Wenn ich die Spirometrie dreimal bei demselben Patienten durchführe, kann ich diese drei Untersuchungen am selben Tag als drei verschiedene Datenpunkte in meinem Training des Testsatzes betrachten oder so Besser die Ergebnisse mitteln und nur einen Datenpunkt berücksichtigen? Wenn der Patient an einem anderen Tag kommt, kann ich diese Untersuchungen als unabhängig betrachten?

Ich denke, es ist in Ordnung, die Untersuchungen als unterschiedliche Datenpunkte zu betrachten, aber ich würde gerne andere Meinungen hören.

FWIW, für die Spirometrie besteht der Industriestandard darin, jeden Patienten dreimal zu behandeln. Wenn die Maßnahmen um <10% variieren, wird dies als guter Test angesehen. Die meisten Befürworter befürworten die Mittelung der Messungen, aber eine Minderheit befürwortet die Verwendung der besten nach der Theorie. Es ist eine genauere Messung dessen, was ihre Lungen tun können. Aus Sicht der Statistiken ist beides eine gute Messung, solange für alle die gleiche Methode angewendet wird. Unter Verwendung des Durchschnitts ergibt sich eine Verringerung des Messfehlers um 58% im Vergleich zur besten. Es gibt keinen nennenswerten Trend, außer bei Patienten mit COPD b / c führt das Auf und Ab dazu, dass sie ihre Atemwege frei machen.
@gung: Wow. Dies ist ein sehr beeindruckendes und sehr unerwartetes Wissen.
Fünf antworten:
#1
+11
Peter Flom
2012-10-29 19:21:54 UTC
view on stackexchange narkive permalink

Sie sind definitiv drei verschiedene Datenpunkte, aber sie sind definitiv auch nicht unabhängig (ob sie am selben Tag oder am anderen Tag sind). Was Sie dagegen tun sollten, hängt von den Zielen Ihrer Analyse ab. Es ist jedoch wahrscheinlich, dass ein mehrstufiges Modell eine gute Wahl ist. Die Mittelung der Punkte ist ebenfalls möglich, verringert jedoch die Variabilität und verhindert, dass Trends im Zeitverlauf betrachtet werden können.

#2
+8
Stephan Kolassa
2012-10-29 20:14:19 UTC
view on stackexchange narkive permalink

Ich stimme der Antwort von @ PeterFlom größtenteils zu. Meiner Meinung nach sollten Sie Ihre Daten nicht mitteln (Sie werfen im Grunde genommen 2/3 Ihrer Informationen weg, warum sollten Sie das tun?), Aber Sie sollten auf jeden Fall die Tatsache berücksichtigen, dass Messungen an demselben Patienten dazu neigen näher beieinander liegen als Messungen an verschiedenen Patienten. In einer solchen Situation empfehle ich normalerweise gemischte lineare Modelle, die eine einfache Instanz der von @PeterFlom empfohlenen mehrstufigen Modelle sind.

Insbesondere würden Sie ein verallgemeinertes lineares gemischtes Modell verwenden. Die Verknüpfungsfunktion wäre logistisch, wie bei der "normalen" logistischen Regression. Die funktionale Form würde jedoch mehrere Beobachtungen an jedem Teilnehmer beinhalten, die durch einen zufälligen Effekt modelliert werden, genau wie in "gewöhnlichen" linearen gemischten Modellen, $ y∼F (Xβ + Zγ) $. In R können Sie dies mit glmer () unter Verwendung der Binomialfamilie in das lme4 -Paket einfügen. Für die Vorhersage können Sie eine einzelne Messung verwenden.

Ob ein gemischtes Modell in einer bestimmten Umgebung besser vorhersagt als ein nicht gemischtes Modell, ist natürlich schwer zu sagen. Das gemischte Modell berücksichtigt die Variabilität innerhalb der Person. Wenn Sie nur die drei ursprünglichen Datenpunkte mitteln, verlieren Sie die gesamte Variabilität zwischen den Messungen, sodass Sie zu optimistisch sind, was Sie aus einer einzelnen neuen Beobachtung vorhersagen können.

Wenn Sie dies andererseits tun Werfen Sie einfach alle Beobachtungen ein, ohne die Gruppierung zu berücksichtigen. Sie werden wieder zu optimistisch sein, da alle Standardfehler schrumpfen. Überlegen Sie, was passieren würde, wenn Sie mit einer einzelnen Beobachtung pro Teilnehmer beginnen würden, beispielsweise 100 Datenpunkte ... und dann jede Beobachtung einfach 100 Mal kopieren würden. Sie würden am Ende 10.000 "Beobachtungen" und weitaus kleinere Standardfehler als bei den Originaldaten haben, obwohl Sie keine neuen Informationen eingegeben haben.

Darüber hinaus ermöglichen gemischte Modelle die Modellierung anderer Gruppierungsfaktoren wie Standort, spezifische Demografie, Personal, Diagnoseeigenschaften usw. Sie sind also viel allgemeiner als die Mittelwertbildung.

(-1) Das OP schrieb, sein Ziel sei die "Klassifizierung von Lungenerkrankungen mittels Spirometrie". Ihre Antwort bezieht sich auf die Modellierung von Spirometrieergebnissen als DV, aber was OP wollte, ist die Verwendung von Spirometrieergebnissen als IV, um Krankheiten zu klassifizieren ...
@amoeba: Ich denke, Sie haben meine Antwort möglicherweise falsch verstanden (und möglicherweise auch die anderen, die Sie abgelehnt haben). Ich habe nicht über die Modellierung von Spirometrieergebnissen als DV gesprochen, sondern als IV - mit der Herausforderung, dass die Messungen für jeden Teilnehmer korreliert werden. Mein Vorschlag war, dass das OP die drei Messungen nicht mitteln und den Durchschnitt als IV verwenden sollte, sondern alle drei Messungen als IV verwenden und die Abhängigkeit zwischen den Mehrfachmessungen jedes Teilnehmers unter Verwendung gemischter Modelle berücksichtigen sollte. Bitte überdenken Sie Ihre Ablehnung meiner und der anderen Antworten.
Ich werde gerne meine Ablehnung rückgängig machen, aber lassen Sie mich sehen, ob ich verstehe. Nehmen wir an, wir möchten einzelne kategoriale $ y $ (gesund / krank) durch eine Reihe von Spirometrie-Beobachtungen $ \ mathbf {X} $ (Luftvolumen, Druck usw.) vorhersagen. Ich denke, Sie sprechen von einem logistischen Regressionsmodell (oder?), $ Y \ sim F (\ boldsymbol {\ beta} \ mathbf {X}) $. Jetzt haben wir für jeden Teilnehmer drei Sätze von Spirometriemessungen, $ \ mathbf {X} ^ {(i)} $ mit $ i $ von 1 bis 3. Wie nehmen Sie dies in die glm auf? Ich kenne gemischte Modelle für die Klassifizierung nicht, deshalb war ich (wahrscheinlich) verwirrt. Wenn ja, entschuldige ich mich.
(Forts.) Ich habe vergessen hinzuzufügen, dass wir zur Testzeit $ y $ für einen neuen Patienten vorhersagen möchten, indem wir nur eine Instanz von $ \ mathbf {X} $ haben, nicht drei.
Sie würden ein verallgemeinertes lineares gemischtes Modell verwenden. Die Verknüpfungsfunktion wäre logistisch, wie bei der "normalen" logistischen Regression. Die funktionale Form würde jedoch mehrere Beobachtungen an jedem Teilnehmer enthalten, die durch einen zufälligen Effekt modelliert werden, genau wie in "gewöhnlichen" linearen gemischten Modellen, $$ y \ sim F (X \ beta + Z \ gamma) $$. In R können Sie dies mit glmer () unter Verwendung der Binomialfamilie in das lme4-Paket einfügen: http://cran.rstudio.com/web/packages/lme4/lme4.pdf Und ja, für die Vorhersage können Sie a verwenden Einzelmessung.
Jetzt schließen Sie alle drei Messungen pro Subjekt als Zeilen + einen zufälligen Effekt des Subjekts ein: $ Z $ codiert die Subjekt-ID und $ \ gamma $ ist ein zufälliger Effektkoeffizient - habe ich das richtig verstanden? Aber was verwenden wir als $ Z \ gamma $, wenn ein neues Thema kommt? Ich denke, ohne Informationen zu diesem Thema haben wir einfach $ 0 $ dort hingelegt, oder? Zur Testzeit berechnen wir also $ F (X \ beta) $? Wenn ja, sagen Sie, dass dieses Modell besser klassifiziert als ein einfaches $ y \ sim F (X \ tilde \ beta) $ -Modell ohne zufälligen Effekt? Gibt es eine Intuition warum? Danke vielmals.
Ja genau. Ob ein gemischtes Modell in einer bestimmten Umgebung besser vorhersagt als ein nicht gemischtes Modell, ist natürlich schwer zu sagen. Das gemischte Modell berücksichtigt die Variabilität innerhalb der Person. Wenn Sie nur die drei ursprünglichen Datenpunkte mitteln, verlieren Sie die gesamte Variabilität zwischen den Messungen, sodass Sie zu optimistisch sind, ob Sie aus einer einzelnen neuen Beobachtung Vorhersagen treffen können. Darüber hinaus ermöglichen gemischte Modelle die Modellierung anderer Gruppierungsfaktoren wie Standort, spezifische Demografie, Personal, Diagnoseeigenschaften usw. Sie sind also viel allgemeiner als die Mittelwertbildung.
Ich glaube nicht, dass ich eine Mittelwertbildung vorschlagen würde, ich würde nur die Beobachtungen zusammenfassen, ohne sie zu gruppieren. Dann sollte das Problem, zu optimistisch zu sein, nicht auftauchen. Es wäre sehr interessant, Beispiele dafür zu sehen, wann sich ein solches Modell merklich von dem unterscheidet, was Sie vorgeschlagen haben! Aber auf jeden Fall sehe ich jetzt, dass meine ursprüngliche Kritik falsch war, also entferne ich die Downvote (s). Danke noch einmal.
Es tut mir leid, aber es stellt sich heraus, dass Stimmen nur während der ersten 5 Minuten geändert werden können und danach gesperrt werden, sofern die Antwort nicht aktualisiert wird. Das war mir nicht bewusst. Ich würde mich also freuen, wenn ich sie nach unten (und tatsächlich nach oben) entfernen würde, aber Sie müssten zuerst Ihre Antwort aktualisieren. Wenn Sie möchten, können Sie z. füge hinzu, was wir in den Kommentaren besprochen haben ...
Ich habe die meisten meiner Kommentare in den Originalartikel aufgenommen und auch Ihren Vorschlag diskutiert, einfach alle Beobachtungen in das Modell aufzunehmen.
#3
+5
FairMiles
2013-04-05 00:59:06 UTC
view on stackexchange narkive permalink

Die drei Prüfungen sind verschiedene Datenpunkte. Obwohl es sich eindeutig nicht um unabhängige (oder zufällige) Beobachtungen aller möglichen Prüfungen in Ihrer interessierenden Population handelt, zumindest für jede Analyse, die ich mir vorstellen kann.

Andere haben betont, dass Sie dies möglicherweise tun Nehmen Sie diese Datenpunkte gut in Ihre Analyse auf (da Sie sie bereits haben), als einfache Replikate innerhalb des Patienten [ein verschachteltes Design] oder als "Zeit / Besuch" als absolute (z. B. Datum) oder relative (Anzahl der Besuche) Variable von Interesse [irgendeine Form von Design mit wiederholten Messungen], falls interessant. Ich bin damit einverstanden, dass dies das interessanteste (und wahrscheinlichste) Szenario ist.

Es ist jedoch möglicherweise nicht erforderlich, für eine erhöhte Komplexität zu zahlen oder Ihre Schlussfolgerungen zu verbessern, wenn Sie dies tun sind nur an Variablen zwischen Subjekten interessiert. Angenommen, Sie kümmern sich nur um Unterschiede zwischen Männern und Frauen, oder Sie möchten das Luftvolumen nach Alter des Patienten erklären. Da Sie wissen, dass Sie einen Patienten nicht mit einem Schlag richtig charakterisieren können (weil die Messergebnisse selbst für denselben Patienten im selben Moment variabel sind), ergreifen Sie mehrere Maßnahmen und mitteln sie. Diese Variante interessiert dich nicht, sie ist einfach unvermeidlich. Sie möchten nur so nah wie möglich an den "wahren" (Mittelwert) für diesen Patienten (zu / in dieser Zeit) heranrücken. Dies ist möglicherweise die vernünftigste Analyse.

[Überprüfen Sie dieses Dokument auf eine gute Lektüre über Einfachheit und Komplexität bei statistischen Analysen.] P. >

Vielen Dank für den Link zu einem schönen Artikel, es macht einen sehr guten Punkt!
#4
+1
D L Dahly
2013-04-05 20:43:11 UTC
view on stackexchange narkive permalink

In Übereinstimmung mit den anderen Antworten (nein, diese Beobachtungen sind sicherlich nicht unabhängig, also was tun Sie dagegen) ....

Aber möchten Sie diese Informationen verwenden, um andere Variablen vorherzusagen ? Viele der bisherigen Vorschläge scheinen davon auszugehen, dass Sie die Spirometrie als abhängige Variable verwenden möchten, und daher ist die Modellierung des Fehlers einfacher (unter Verwendung eines Mehrebenenmodells). Wenn Sie stattdessen die Spirometriemessungen als unabhängige Variable verwenden möchten, sollten Sie ein Bestätigungsfaktor-Analysemodell verwenden, bei dem die drei Wiederholungsmaße als Indikatoren für eine einzelne zugrunde liegende latente Variable modelliert werden. Die Varianz der zugrunde liegenden latenten Variablen ist diejenige, die von allen drei Kennzahlen geteilt wird, und spiegelt somit besser wider, wonach Sie wirklich suchen (im Vergleich zum Beispiel zum Mittelwert).

Ich bin mir nicht sicher, ob eine Faktorenanalyse hier nützlich wäre: Ich denke, OP wollte den Klassifikator verwenden, um die Krankheit bei einer einzelnen Spirometriemessung eines neuen Patienten zu klassifizieren, ohne darauf zu warten, zuerst drei Messungen zu erfassen (daher könnten Sie FA nicht anwenden auf die realen Testdaten).
#5
  0
Aksakal
2014-03-06 21:58:44 UTC
view on stackexchange narkive permalink

Die Messungen können unabhängig sein oder nicht. Wenn Sie den gemessenen Wert als $ y_t = x_t + \ varepsilon_t $ beschreiben, wobei $ x_t $ - wahrer Wert und $ \ varepsilon_t $ - Messfehler, bedeutet Unabhängigkeit, dass $ cov (\ varepsilon_t, \ varepsilon_ {ti}) = 0 ist $ für alle Zeiten. Dies kann wahr sein oder nicht. Wenn Sie zwei Messungen unmittelbar nacheinander durchführen, ist dies höchstwahrscheinlich nicht der Fall. Wenn zwei Messungen zeitlich getrennt, aber durchgeführt wurden, kaufen Sie denselben Techniker erneut. Dies ist möglicherweise nicht der Fall. usw.

Andererseits muss es möglich sein, die Messung so einzurichten, dass $ \ varepsilon_t $ unabhängig voneinander und von $ x_t $ ist.

$ y_t $ sind definitiv nicht unabhängig durch $ x_t $ -Korrelationen, aber das ist nicht das, was mit Unabhängigkeit gemeint ist



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...