Formelsammlung Stochastik

Wikimedia-Liste

Dies ist eine Formelsammlung zu dem mathematischen Teilgebiet Stochastik einschließlich Wahrscheinlichkeitsrechnung, Kombinatorik, Zufallsvariablen und Verteilungen sowie Statistik.

Notation

Bearbeiten

In der Stochastik gibt es neben der üblichen mathematischen Notation und den mathematischen Symbolen folgende häufig verwendete Konventionen:

  • Zufallsvariablen werden in Großbuchstaben geschrieben:  ,   etc.
  • Realisierungen einer Zufallsvariablen werden mit den entsprechenden Kleinbuchstaben geschrieben, z. B. für die Beobachtungen in einer Stichprobe:  .
  • Für die Bezeichnung von Wahrscheinlichkeitsfunktionen und Wahrscheinlichkeitsdichten werden Kleinbuchstaben benutzt, z. B.  .
  • Für die Bezeichnung von Verteilungsfunktionen werden Großbuchstaben benutzt, z. B.  .
    • Speziell die Wahrscheinlichkeitsdichte der Standardnormalverteilung wird die Bezeichnung   und für die Verteilungsfunktion   benutzt.
  • Griechische Buchstaben (z. B.  ) werden benutzt, um unbekannte Parameter (Parameter der Grundgesamtheit) zu bezeichnen.
  • Eine Schätzfunktion wird häufig mit einem Zirkumflex über dem entsprechenden Symbol bezeichnet, z. B.   (gesprochen: Theta Dach).
  • Das arithmetische Mittel wird mit   bezeichnet (gesprochen:   quer).

Im Folgenden sei stets ein Wahrscheinlichkeitsraum   gegeben. Darin ist der Ergebnisraum   eine beliebige nichtleere Menge,   eine σ-Algebra von Teilmengen von  , die   enthält, und   ein Wahrscheinlichkeitsmaß auf  

Grundlagen

Bearbeiten

Axiome: Jedem Ereignis   wird eine Wahrscheinlichkeit   zugeordnet, so dass gilt:

 ,
 ,
für paarweise disjunkte Ereignisse   gilt  

Rechenregeln: Aus den Axiomen ergibt sich:

 
Für   gilt  , insbesondere  
Für das Gegenereignis   gilt  
 

Laplace-Experimente

 

Bedingte Wahrscheinlichkeit

 

Satz von Bayes:

 

Unabhängigkeit:

Zwei Ereignisse   sind unabhängig  

Fakultät: Anzahl der Möglichkeiten beim Ziehen aller   Kugeln aus einer Urne (ohne Zurücklegen):

 

wobei  

  ohne Wiederholung
(von n Elementen)
 
 
mit Wiederholung
(von r + s + … + t = n Elementen,
von denen jeweils r, st nicht unterscheidbar sind)
 
Permutation
 
   

Binomialkoeffizientn über k

 

Anzahl der Möglichkeiten beim Ziehen von   Kugeln aus einer Urne mit   Kugeln:

  ohne Wiederholung
(ohne Zurücklegen)
(siehe Hypergeometrische Verteilung)
 
 
mit Wiederholung
(mit Zurücklegen)
(siehe Binomialverteilung)
 
 
Variation
 
   
Kombination
 
   

Diskrete Zufallsgrößen

Bearbeiten

Eine Funktion   heißt Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariablen  , wenn folgende Eigenschaften erfüllt sind:

  1. Für alle   gilt  
  2.  

Für die zugehörige Zufallsvariable gilt dann:

 

Eine Zufallsgröße   und deren Verteilung heißen diskret, falls die Funktion   die Eigenschaft (2) hat. Man nennt   die Wahrscheinlichkeitsfunktion von  .

 
 
 

Stetige Zufallsgrößen

Bearbeiten

Eine Funktion   heißt Dichte(-Funktion) einer stetigen Zufallsvariablen  , wenn folgende Eigenschaften erfüllt sind:

  1. Für alle   gilt  
  2.  

Für eine stetige Zufallsgröße gilt dann:

 

Eine Zufallsgröße   und deren Verteilung heißen stetig, falls es eine geeignete Dichtefunktion   mit dieser Eigenschaft gibt. Die Funktion   heißt Dichte(Funktion) von  .

Für die Wahrscheinlichkeit gilt

  für alle  
 

Erwartungswert und Varianz sind gegeben durch

 
 
 

Erwartungswert, Varianz, Kovarianz, Korrelation

Bearbeiten

Für den Erwartungswert  , die Varianz  , die Kovarianz   und die Korrelation   gelten:

 
 , allgemein  
Für unabhängige Zufallsvariablen   gilt:  
 
 
Für unabhängige Zufallsvariablen   gilt:  
 
 
 
 
 
 
 

Tschebyschow-Ungleichung:

 

Gegeben ist ein  -stufiger Bernoulli-Versuch (d. h.   mal dasselbe Experiment, unabhängig voneinander, mit nur zwei möglichen Ausgängen und konstanten Wahrscheinlichkeiten) mit der Erfolgswahrscheinlichkeit   und der Misserfolgswahrscheinlichkeit  . Die Wahrscheinlichkeitsverteilung der Zufallsgröße  : Anzahl der Erfolge heißt Binomialverteilung.

Die Wahrscheinlichkeit für   Erfolge berechnet sich nach der Formel:

 

Erwartungswert:

 

Varianz:

 

Standardabweichung:

 

σ-Regeln

Bearbeiten

(Wahrscheinlichkeiten von Umgebungen des Erwartungswertes bei Binomialverteilungen) Zwischen dem Radius einer Umgebung um den Erwartungswert und der zugehörigen Wahrscheinlichkeit der Umgebung gelten folgende Zuordnungen (falls  ):

Radius der Umgebung Wahrscheinlichkeit der Umgebung
0,68
0,955
0,997
Wahrscheinlichkeit der Umgebung Radius der Umgebung
0,90 1,64σ
0,95 1,96σ
0,99 2,58σ

Standardisieren einer Verteilung

Bearbeiten

Hat die Zufallsvariable   eine Verteilung mit Erwartungswert   und Standardabweichung  , dann wird die standardisierte Variable   definiert durch

 

Die standardisierte Variable   hat den Erwartungswert 0 und die Standardabweichung 1.

Poisson-Näherung

Bearbeiten

Gegeben sei eine Binomialverteilung mit großem Stichprobenumfang   ≥ 100 und kleiner Erfolgswahrscheinlichkeit  . Mithilfe von   kann man dann näherungsweise die Wahrscheinlichkeit für   Erfolge berechnen:

 
 

Die Beziehungen lassen sich zusammenfassen zu:

 

Poisson-Verteilung

Bearbeiten

Gilt für die Verteilung einer Zufallsgröße  

 

Näherungsformeln von Moivre und Laplace

Bearbeiten

Sei   eine binomialverteilte Zufallsgröße mit   (brauchbare Näherung besser  ). Die Wahrscheinlichkeit für genau und höchstens   Erfolge lässt sich näherungsweise berechnen durch:

 
 

Standardnormalverteilung

Bearbeiten

Die Dichte(Funktion)   (auch als Glockenkurve bekannt) der Standardnormalverteilung ist definiert durch:

 

und die Verteilungsfunktion   durch:

 

Näherungsformeln für eine diskrete Verteilung unter Anwendung der Kontinuitätkorrektur:

 
 
 

In einer Grundgesamtheit vom Umfang   seien zwei Merkmalsausprägungen vom Umfang   bzw.   vertreten. Eine Stichprobe vom Umfang   werde genommen. Dann nennt man die Verteilung der Zufallsgröße  : Anzahl der Exemplare der 1. Merkmalsausprägung in der Stichprobe einer hypergeometrischen Verteilung.

Die Wahrscheinlichkeit, dass in der Stichprobe vom Umfang   genau   Exemplare der 1. Merkmalsausprägung sind, ist:

 

  = Anzahl der Elemente,   = Anzahl der positiven Elemente,   = Anzahl der Ziehungen,   = Anzahl der Erfolge.

Sei   der Anteil, mit dem die 1. Merkmalsausprägung in der Gesamtheit vorkommt, dann gilt:

 
 

Gegeben ist ein Bernoulli-Versuch mit Erfolgswahrscheinlichkeit  . Die Verteilung der Zufallsgröße  : Anzahl der Stufen bis zum ersten Erfolg heißt geometrische Verteilung. Es gilt:

  (Erfolg genau beim  -ten Versuch)
  (  Misserfolge hintereinander bzw. der erste Erfolg kommt erst nach dem  -ten Versuch)
  (Erfolg spätestens beim  -ten Versuch bzw. bis zum  -ten Versuch tritt mindestens ein Erfolg ein)

Der Erwartungswert ist

 

Die unzähligen weiteren speziellen Verteilungen können hier nicht alle aufgeführt werden, es sei auf die Liste univariater Wahrscheinlichkeitsverteilungen verwiesen.

Approximationen von Verteilungen

Bearbeiten

Unter gewissen Approximationsbedingungen können Verteilungen auch durcheinander approximiert werden um Berechnungen zu vereinfachen. Je nach Lehrbuch können die Approximationsbedingungen etwas unterschiedlich sein.

Nach
Von      
Diskrete Verteilungen
Binomialverteilung
 
--  ,
 
 ,
 
Hypergeometrische Verteilung
 
 
 
 ,  ,
 
 
 
Poisson-Verteilung
 
--  ,
 
Stetige Verteilungen
Chi-Quadrat-Verteilung
 
 
 
Studentsche t-Verteilung
 
 
 
Normalverteilung
 
--

Bei dem Übergang von einer diskreten Verteilung zu einer stetigen Verteilung kommt auch noch eine Stetigkeitskorrektur (wenn   oder  ) in Betracht   und insbesondere  .[1]

Kritische Werte

Bearbeiten

Das  -Level ist der Wert einer Wahrscheinlichkeitsverteilung für den gilt:  . Es gibt eine Standardnotation für einige häufig verwendete Verteilungen:

  •   oder   für die Standardnormalverteilung
  •   oder   für die t-Verteilung mit   Freiheitsgraden
  •   oder   für die Chi-Quadrat-Verteilung mit   Freiheitsgraden
  •   oder   für die F-Verteilung mit   und   Freiheitsgraden

Lagemaße

Bearbeiten

Arithmetisches Mittel:  

Median

Modus

Streuungsmaße

Bearbeiten

empirische Varianz:  

empirische Standardabweichung:  

Zusammenhangsmaße

Bearbeiten

Empirische Kovarianz:

 

Empirischer Korrelationskoeffizient:

 

Gleichung der Regressionsgeraden einer linearen Einfachregression:   mit

 
 ,

wobei   und   die arithmetischen Mittel bedeuten.

Mittelwerte

Bearbeiten
Mittelwert Zwei Zahlen Allgemein
Modus Ausprägung mit höchster Häufigkeit
Median (Zentralwert) Sofern   sortiert sind:

 

Arithmetisches Mittel    
Geometrisches Mittel    
Harmonisches Mittel    
Quadratisches Mittel    

Parameter

Bearbeiten

Im Allgemeinen werden in der Statistik unbekannte Parameter der Grundgesamtheit oder eines Modells mit griechischen Buchstaben (z. B.  ) bezeichnet.

  • Das arithmetische Mittel in der Grundgesamtheit:  .
  • Die Varianz in der Grundgesamtheit:  .
  • Den Anteilswert einer dichotomen Variablen in der Grundgesamtheit:  .
  • Der Achsenabschnitt   und die Steigung   im einfachen linearen Regressionsmodell  .

Eine Schätzfunktion für einen unbekannten Parameter wird häufig durch einen Großbuchstaben der Parameterbezeichnung aus der beschreibenden Statistik bezeichnet. Die Schätzfunktion ergibt sich aus den Stichprobenvariablen  .

Parameter Bedingung Schätzfunktion Verteilung
    1.  

2. Wenn der zentrale Grenzwertsatz gilt, dann gilt  

    bekannt    
    unbekannt    
    1. Ziehen mit Zurücklegen:  

2. Ziehen ohne Zurücklegen:  
    mit   und   der Umfang der Grundgesamtheit.

 ,     Wenn  , dann folgt  
Parameter Punktschätzer   Konfidenzintervall
    1. Wenn   bekannt:  
2. Wenn   unbekannt:  
   
    1. Ziehen mit Zurücklegen: Wenn  , dann gilt approximativ:

 

2. Ziehen ohne Zurücklegen: Wenn  , dann gilt approximativ:

 

Bei der Berechnung eines Schätzintervalls mittels einer Stichprobe in 1. und 2. wird   durch   ersetzt.

Einzelnachweise

Bearbeiten
  1. Yates, F. (1934). Contingency Tables Involving Small Numbers and the χ2 Test. Supplement to the Journal of the Royal Statistical Society 1(2): 217–235. JSTOR Archive for the journal
Bearbeiten