Gemischtes Modell
Ein gemischtes Modell (englisch mixed model) ist ein statistisches Modell, das sowohl feste Effekte als auch zufällige Effekte enthält, also gemischte Effekte. Diese Modelle werden in verschiedenen Bereichen der Physik, Biologie und den Sozialwissenschaften angewandt. Sie sind besonders nützlich, sofern eine wiederholte Messung an der gleichen statistischen Einheit oder Messungen an Clustern von verwandten statistischen Einheiten durchgeführt werden.
Geschichte und momentaner Stand der Forschung
BearbeitenRonald Fisher führte das Modell mit zufälligen Effekten ein, um Korrelationen von charakteristischen Merkmalen zwischen Verwandten zu untersuchen.[1] In den fünfziger Jahren entwarf Charles Roy Henderson beste lineare erwartungstreue Schätzer für feste Effekte und beste lineare erwartungstreue Vorhersagen (BLEV) für zufällige Effekte.[2][3][4][5] Anschließend wurde gemischte Modellierung eines der Hauptforschungsfelder der statistischen Forschung, einschließlich Arbeiten zur Berechnung von Maximum-Likelihood-Schätzern, nichtlinearen gemischte-Effekte-Modellen, fehlenden Daten in gemischten Modellen und bayessche Schätzungen von gemischten Modellen. Gemischte Modelle werden in vielen Disziplinen angewandt, insbesondere sofern verschiedene korrelierte Messungen an jeder zu untersuchenden Einheit gemacht werden. Sie werden besonders häufig bei Forschung über Menschen oder Tieren benutzt, wobei die Spanne der Einsatzmöglichkeiten von Genetik bis zu Marketing reicht.
Definition
BearbeitenIn Matrixschreibweise kann ein gemischtes Modell dargestellt werden als:
- ,
wobei gilt:
- ist ein Vektor aus Beobachtungen der abhängigen Variablen, mit Erwartungswert
- ist ein Vektor aus festen Effekten
- ist ein Vektor aus zufälligen Effekten mit Erwartungswert und Varianz-Kovarianzmatrix
- ist ein Vektor aus zufälligen Fehlertermen mit Erwartungswert und Varianz-Kovarianzmatrix
- ist die Datenmatrix, für die festen Effekte
- ist die Datenmatrix für die zufälligen Effekte. Sie enthält beispielsweise Informationen über die Gruppe zu der ein Individuum gehört.
Schätzung
BearbeitenDie Henderson'schen Mischmodellgleichungen (englisch mixed model equations, kurz: MME) lauten:[2][4]
Die Lösungen der Mischmodellgleichungen und sind beste lineare erwartungstreue Schätzer (BLES bzw. englisch Best Linear Unbiased Estimator, kurz: BLUE) für bzw. . Dies folgt aus dem Satz von Gauß-Markow, da die konditionelle Varianz des Ergebnisses nicht auf die Einheitsmatrix skalierbar ist. Falls die konditionelle Varianz bekannt ist, ist der mit der inversen Varianz gewichtete Kleinste-Quadrate-Schätzer BLES. Jedoch ist die konditionelle Varianz selten bekannt, sodass es bei der Lösung der Mischmodellgleichungen erwünscht ist, die Varianz und die gewichteten Parameterschätzungen gemeinsam zu schätzen.
Eine Methode zur Anpassung gemischter Modelle ist der EM-Algorithmus[6], in dem die Komponenten der Varianz als unbeobachtete Störparameter in der gesamten Wahrscheinlichkeit behandelt werden. Zurzeit ist diese Methode in den wichtigsten Statistiksoftwarepaketen R (lme() im nlme Paket und lmer() im lme4 Paket) und SAS (proc mixed) implementiert. Die Lösung der Mischmodellgleichungen ist eine Maximum-Likelihood-Schätzung, falls die Fehler normalverteilt sind.[7]
Weiterführende Literatur
Bearbeiten- G. A. Milliken, D. E. Johnson: Analysis of messy data: Vol. I. Designed experiments. Chapman & Hall, New York 1992.
- B. T. West, K. B. Welch, A. T. Galecki: Linear mixed models: A practical guide to using statistical software. Chapman & Hall/CRC. New York 2007.
Einzelnachweise
Bearbeiten- ↑ R. A. Fisher: The correlation between relatives on the supposition of Mendelian inheritance. In: Transactions of the Royal Society of Edinburgh. Band 52, 1918, S. 399–433.
- ↑ a b G. K. Robinson: That BLUP is a Good Thing: The Estimation of Random Effects. In: Statistical Science. Band 6, Nr. 1, 1991, S. 15–32, doi:10.1214/ss/1177011926, JSTOR:2245695.
- ↑ C. R. Henderson, Oscar Kempthorne, S. R. Searle and C. M. von Krosigk: The Estimation of Environmental and Genetic Trends from Records Subject to Culling. In: Biometrics. Band 15, Nr. 2. International Biometric Society, 1959, S. 192–218, doi:10.2307/2527669, JSTOR:2527669.
- ↑ a b L. Dale Van Vleck: Charles Roy Henderson, April 1, 1911 – March 14, 1989. (PDF) United States National Academy of Sciences, abgerufen am 28. Mai 2012.
- ↑ Robert A. McLean, William L. Sanders, Walter W. Stroup: A Unified Approach to Mixed Linear Models. In: The American Statistician. Band 45, Nr. 1. American Statistical Association, 1991, S. 54–64, doi:10.2307/2685241, JSTOR:2685241.
- ↑ M. L. Lindstrom, D. M. Bates: Newton-Raphson and EM algorithms for linear mixed-effects models for repeated-measures data. In: JASA. Band 83, Nr. 404, 1988, S. 1014–1021, doi:10.2307/2290128.
- ↑ Nan M. Laird, James H. Ware: Random-Effects Models for Longitudinal Data. In: Biometrics. Band 38, Nr. 4. International Biometric Society, 1982, S. 963–974, doi:10.2307/2529876, PMID 7168798.