Gelman-Rubin-Statistik
Die Gelman-Rubin-Statistik erlaubt eine Aussage über die Konvergenz von iterativen Monte-Carlo-Simulationen.
Motivation
BearbeitenDas Problem, das die Gelman-Rubin-Statistik löst, ist die Unsicherheit darüber, ob und wann MCMC-Simulationen konvergiert sind. Konvergenz bedeutet in diesem Kontext, dass die von der MCMC-Simulation generierten Zufallszahlen die zugrunde liegende Wahrscheinlichkeitsverteilung repräsentieren. Wenn eine Kette nicht konvergiert, können die daraus resultierenden Schätzungen verzerrt und ungenau sein.
Die Gelman-Rubin-Statistik löst dieses Problem, indem sie die Varianz innerhalb der Ketten mit der Varianz zwischen den Ketten vergleicht. Wenn diese beiden Varianzen ähnlich sind, deutet dies darauf hin, dass die Kette konvergiert hat. Die Gelman-Rubin-Statistik wird als Verhältnis dieser beiden Varianzen berechnet, und ein Wert nahe 1 deutet auf Konvergenz hin.
Es ist wichtig zu beachten, dass die Gelman-Rubin-Statistik nur ein Diagnosewerkzeug ist und keine Garantie für die Konvergenz bietet.
Schätzung
BearbeitenEs werden Monte-Carlo Simulationen (Ketten) mit unterschiedlichen Startwerten gestartet. Die Stichproben aus den jeweiligen Burn-In Phasen werden verworfen.
Aus den Stichproben (der j-ten Simulation) wird die Varianz zwischen den Ketten und die Varianz in den Ketten geschätzt:
- Mittelwert der Kette j
- Mittelwert der Mittelwerte aller Ketten
- Varianz der Mittelwerte der Ketten
- Über alle Ketten gemittelte Varianzen der einzelnen Ketten
Ein Schätzwert der Gelman-Rubin-Statistik ergibt sich dann als[1]
- .
Wenn L gegen unendlich und B gegen null strebt, strebt R gegen 1.
Alternativen
BearbeitenDie Geweke Diagnostik vergleicht ob der Mittelwert der ersten x Prozent einer Kette und der Mittelwert der letzten y Prozent einer Kette übereinstimmen.