Diskussion:Standardfehler
Zum Archiv |
Wie wird ein Archiv angelegt? |
Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 7 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind. |
In der englischen Wikipedia wird zwischen
- http://en.wiki.x.io/wiki/Sampling_error und
- http://en.wiki.x.io/wiki/Standard_error_%28statistics%29
unerschieden. Ist also eine Unterscheidung zwischen Standardfehler und Stichprobenfehler sinnvoll? --Chrisqwq 12:00, 5. Nov. 2006 (CET)
Abgrenzung
BearbeitenStichprobenfehler: Wenn man zufällig n Personen aus der Bevölkerung auswählt und deren Durchschnittsalter bestimmt, dann ist nicht sichergestellt, daß dieser Wert dem Durchschnittsalter der Bevölkerung insgesamt entspricht. Das »arithmetische Mittel« kann in dieser und anderen möglichen Stichproben vom wahren Durchschnittswert der Grundgesamtheit zufällig abweichen.
Die Abweichungen vom Grundgesamtheitsparameter durch Stichprobenziehung bezeichnet man als Stichprobenfehler (engl.: sampling error). Wenn man alle möglichen Zufallsstichproben vom Umfang n betrachtet und jeweils das arithmetische Mittel notiert, erhält man einen Überblick über die Verteilung des arithmetischen Mittels, die man auch graphisch darstellen kann. Diese Darstellung vermittelt einen Eindruck davon, wie sehr das arithmetische Mittel in Stichproben schwanken kann, wie groß also der Stichprobenfehler ist. Die Streuung der arithmetischen Mittel über die verschiedenen Stichproben mißt man mit dem Standardfehler.
Standardfehler: Der Standardfehler (engl.: standard error) ist ein Maß für die Streuung eines Stichprobenparameters über alle möglichen Zufallsstichproben vom Umfang n aus der Grundgesamtheit. Er ist ein Maß für die durchschnittliche Größe des Stichprobenfehlers des Stichprobenparameters (z.B. des arithmetischen Mittels oder des Anteilswertes). Der Standardfehler einer Stichprobenstatistik hängt von verschiedenen Faktoren ab, je nachdem, um welchen Parameter es sich handelt. Ganz allgemein kann man jedoch sagen:
- Der Standardfehler wird um so kleiner, je größer der Stichprobenumfang ist. Größere Stichproben erlauben präzisere Schätzungen, weil der Stichprobenfehler kleiner wird.
(unsignierter Beitrag)
Ich möchte bitte eine seriöse Quelle dafür, dass der Standardfehler synonym als Stichprobenfehler bezeichnet wird. Ohne eine solche Quellenangabe beabsichtige ich, den Begriff in der Einleitung zu löschen.--Sigma^2 (Diskussion) 15:41, 28. Apr. 2024 (CEST)
gute Abbildungen
BearbeitenGute Abbildungen gibt es hier: [1] Was ich mich frage: Wie hängt die Größe der Stichprobe mit dem Standardfehler und der Effektstärke zusammen? Wird die dort dargestellte [2] Normalverteilungskurve schmaler wenn N steigt? Und wenn ja, warum?
Standardabweichung des Mittelwerts
BearbeitenIch habe die laut (jeweils aktuellen) GUM (Guide to the expression of uncertainty) und VIM (Vocabulaire international de métrologie) "richtige" Bezeichnung "Standardabweichung des Mittelwerts" hinzugefügt. Im GUM steht weiter, manchmal würde fälschlicherweise auch die Bezeichnung "Standardfehler" benutzt. Sollte man darauf hinweisen oder sind das nur Spitzfindigkeiten von Metrologen?
Evtl. könnte man auch ergänzen: "'Standardabweichung des Mittelwerts' (im Gegensatz zu der Standardabweichung einer Einzelmessung)". (nicht signierter Beitrag von 192.53.103.101 (Diskussion | Beiträge) 11:12, 29. Jul 2009 (CEST))
- Mir persönlich gefällt Standardabweichung des Mittelwerts (oder genauer: des arithmetischen Mittels) auch besser, weil Fehler eigentlich eine verkehrte Bezeichnung ist. Die Varianz bezeichnet ja keinen Fehler, sonder die Schwankung einer Zufallsvariablen. -- Philipendula 13:50, 29. Jul. 2009 (CEST)
Meiner Ansicht nach ist der Begriff Standardfehler viel zu eng gefasst. Wie oben bereits gesagt, ist der Standardfehler die Standardabweichung einer Schätz- oder Stichprobenfunktion. Für ist es natürlich , aber z.B. in SPSS wird bei der linearen Regression auch für die Regressionkoeffizienten ein Standardfehler ausgegeben, der natürlich ist. -- Sigbert 08:59, 11. Okt. 2009 (CEST)
Beipiele (Binomialverteilung), Korrekturen der Formel
BearbeitenHier gab es offenbar schon seit längerem ein Missverständnis: man muss die Parameter der Binomialverteilung, z.B. N und p, und Stichprobenlänge n unterscheiden. In den bisherigen Korrekturen der Formel wurde manchmal von N=1 ausgegangen oder aber von N=n. Tatsächlich sind es aber verschiedene Parameter, oder? Der Wert N=1 wäre auch nachvollziehbar, dann hätte man aber eine Bernoulli-Verteilung, aus der man n-mal zieht. -- KurtSchwitters 14:03, 24. Nov. 2009 (CET)
Eiscreme-Beispiel - Fehlerbalken
BearbeitenMüßte man für die Berechnung des Konfidenzintervalls nicht die T-Verteilung zu Grunde legen? Der Faktor von 1,96 für ein beidseitiges 95%-Konfidenzintervall gilt ja strengenommen nur bei unendlich großer Stichprobengröße bzw. näherungsweise ab etwa 1000 Werten - und das ist hier bei weitem nicht gegeben. --Jogy sprich mit mir 17:13, 22. Feb. 2010 (CET)
- Wie kommt man aus die Aussage "näherungsweise ab etwa 1000 Werten"? -- Da hätte ich aber gerne mal eine Quelle zu. -- Ich finde immer nur so etwas wie "ab ca. 35 Werten kann man die t-Verteilung approximativ mit der Normalverteilung ersetzen" ...
- Norman Markgraf (Diskussion) 19:15, 14. Jun. 2020 (CEST)
Berechnung des Standardfehlers bei verschiedenen Standardabweichungen
BearbeitenHey! im Abschnitt "Standardfehler des arithmetischen Mittels" sollte evtl. darauf hingewiesen werden, wie man den Standardfehler berechnet, wenn die Varianzen der einzelnen Messungen von einander abweichen. Denn bei n Stichproben von jeweils m Werten, werden die Varianzen der n Mittelwerte oft voneinander abweichen. So ist die so oft zitierte Formel , mit µ als den Mittelwert der Grundgesamtheit, nicht ohne weiteres anwendbar. Ich schlage daher vor: In der Herleitung darauf hinzuweisen, dass die einzelnen Varianzen der Stichproben als gleich angenommen werden und für abweichende Varianzen gilt:
- (nicht signierter Beitrag von Xeltok (Diskussion | Beiträge) 11:18, 6. Jul 2010 (CEST))
- Ich habe es ergänzt. Danke --Sigbert 08:14, 8. Jul. 2010 (CEST)
"durchschnittliche Abweichung des geschätzten Parameterwertes "
Bearbeiten"Der Standardfehler ist daher die durchschnittliche Abweichung des geschätzten Parameterwertes vom wahren Parameterwert."
Wenn man damit die durchschnittliche Differenz eines Wertes vom Mittelwert meint, stimmt das m.E. nicht. Die Werte -2,0,2 weichen im Schnitt um (|-2-0|+|0-0|+|2-0|)/3 = 4/3 = 1,333 vom Mittelwert 0 ab. Der Standardfehler beträgt nach der angegebenen Formel aber Sqrt(((-2-0)²+(0-0)²+(2-0)²)/3) = Sqrt(8/3) = 1.633. equa 21:10, 7. Aug. 2011 (CEST)
Standardabweichung des Absolutglieds der linearen Einfachregression
BearbeitenEs gab einen kleinen Editwar bei Standardfehler#Standardfehler_der_Regressionskoeffizienten. Richtig ist
oder
- .
Bin mal auch so frei, bei linearer Einfachregression B0 und B1 in a und b umzutaufen. Die vorher verwendete Bezeichnungsweise bietet sich vor allem bei multipler Regression an, die hier aber vermieden wird. --Philipendula (Diskussion) 16:23, 8. Jul. 2012 (CEST)
- Das + gehört nicht in die Formel. Zusätzlich zum Nachschlagen oder Herleiten der Formel kann man auch folgende Überlegung anstellen: Die Schätzwerte bei der Regression werden um so genauer, je mehr Meßwerte vorliegen (bei gleichem und etwa gleichen -Werten). Bei einer Verdopplung der Meßwerte verdoppeln sich sowohl also auch , der Quotient bleibt also etwa gleich. In der oberen, korrekten Formel wird wegen der Multiplikation mit die Standardabweichung kleiner. In der Formel
- (so stand sie im Artikel) konvergiert mit wachsendem gegen einen Wert größer als 0, was den Formeln der Regression widerspricht (s. arithmetisches Mittel). .gs8 (Diskussion) 11:13, 9. Jul. 2012 (CEST)
- Die von Dir angegebene Formel hat einen Fehler, weil im Zähler statt steht. Das ist speziell eine Umformung für Mediziner u.ä., die besser als verstehen. Es stimmt tatsächlich, ich habs nachgerechnet. Gruß --Philipendula (Diskussion) 11:46, 9. Jul. 2012 (CEST)
- Ich hab die Formel aus der letzten Bearbeitung von Dakawo hierhin kopiert. Daß die Änderung in Deiner Formel oben eine beabsichtigte Korrektur ist, war mir nicht aufgefallen. Nach eigener Umformung komme ich auch zu dem Ergebnis, daß beide Formeln von Dir korrekt sind. Wegen des fehlenden Summenzeichens stimmt meine obige Überlegung auch wieder. Trotzdem ist die zweite Formel für mich gewöhnungsbedürftig. Gruß .gs8 (Diskussion) 12:28, 9. Jul. 2012 (CEST)
- Ja, für mich auch. --Philipendula (Diskussion) 13:54, 9. Jul. 2012 (CEST)
- Ich hab die Formel aus der letzten Bearbeitung von Dakawo hierhin kopiert. Daß die Änderung in Deiner Formel oben eine beabsichtigte Korrektur ist, war mir nicht aufgefallen. Nach eigener Umformung komme ich auch zu dem Ergebnis, daß beide Formeln von Dir korrekt sind. Wegen des fehlenden Summenzeichens stimmt meine obige Überlegung auch wieder. Trotzdem ist die zweite Formel für mich gewöhnungsbedürftig. Gruß .gs8 (Diskussion) 12:28, 9. Jul. 2012 (CEST)
- Die von Dir angegebene Formel hat einen Fehler, weil im Zähler statt steht. Das ist speziell eine Umformung für Mediziner u.ä., die besser als verstehen. Es stimmt tatsächlich, ich habs nachgerechnet. Gruß --Philipendula (Diskussion) 11:46, 9. Jul. 2012 (CEST)
Standardfehler -> Binomial / Anteilswerte
BearbeitenZu
bzw
Ich glaube dennoch, die Formel ist falsch (Korrektur muss noch gesichtet werden). Das Statistikbuch (einzige zur Hand), Bortz, 1999, ist im Einklang mit Seiten aus dem Internet, die klar machen, dass das groß-N da nichts verloren hat, sondern bei Antweilswerten (komischerweise in anderssprachigen Wikis nicht aufgeführt) lautet:
- http://onlinestatbook.com/2/estimation/proportion_ci.html
- https://www.easycalculation.com/statistics/standard-error-sample-proportion.php
(deswegen BREXIT fehlprognostiziert!?!? *scherzamrande*) 84.147.233.98 20:55, 3. Dez. 2016 (CET)
- Das war wohl schon so gedacht: Es wird eine Stichprobe vom Umfang n aus binomialverteilten Zufallsvariablen mit Parameter N und p gezogen. Ist vielleicht ein etwas ungewöhnliches Szenario, aber warum nicht? -- HilberTraum (d, m) 16:12, 4. Dez. 2016 (CET)
Quadratwurzel ist immer positiv
BearbeitenGleich im ersten Absatz gibt es einen Verständnisfehler, was Quadratwurzeln betrifft. Es ist zwar so, dass eine quadratische Gleichung wie zwei Lösungen fü x aufweist, nämlich 2 und –2. Aber:
Das Ergebnis einer Quadratwurzel ist immer positiv.
Genauer gesagt, ist das Ergebnis einer Quadratwurzel ein Betrag – und Beträge sind immer positiv, auch dann, wenn das, was zwischen den Betragsstrichen steht, ein negativer Wert ist. Vgl. dazu den Wikipedia-Artikel Quadratwurzel oder auch beispielsweise das folgende PDF-Dokument:
Eindeutigkeit der Wurzel ↔ 2 Lösungen bei quadratischen Gleichungen.
(Ein Blick in jede beliebige Formelsammlung tuts auch.) Korrekt wird die oben angegebene quadratische Gleichung also so gelöst:
(1) |Wurzel ziehen
(2) |Betrag auflösen
(3)
(4)
Viele Grüße
--Jake2042 (Diskussion) 03:17, 28. Sep. 2019 (CEST)
- Wenn das der einzige Fehler dieses Grotten schlechten Beitrags wäre, könnte man darüber hinweg sehen. -- Aber das permanente Springen zwischen Zufallsvariabeln und Statistischen Variablen (aka Merkmale) und deren Werte (aka Merkmalsausprägungen) lässt einen an jeder Ecke schaudern. Hier gehört definitiv mal ein "Bitte dringend überarbeiten"- Schild an den Beitrag!
- Norman Markgraf (Diskussion) 19:31, 14. Jun. 2020 (CEST)
- Norman Markgraf: Welches springen von ZVen und Merkmalsausprägungen meinst du genau? Habe beim groben überfliegen nichts entdecken können. Zudem wird aus Gründen der Vereinfachung zwischen ZVen und Merkmalsausprägungen oft in der Notation nicht unterschieden (auch in der Fachliteratur). Ist daher nicht unbedingt ein Makel. Wenn aber schon unterschieden wird in der Notation, dann sollte die Unterscheidung natürlich durchgehend verwendet werden.--Jonski (Diskussion) 19:37, 14. Jun. 2020 (CEST)
- Mal ein Beispiel. Im Text steht:
- Für die Schätzfunktionen
- und
- ergibt sich dann
- und .
- und
- Die Standardfehler der Regressionskoeffizienten ergeben sich zu
- und
- .
- Für die Schätzfunktionen
- Was ist nun , die Zufallsvariable oder vielleicht doch deren Realisation , welche ich aus der Beobachtung/ Messung habe? -- Okay, macht keinen Unterschied, wenn ich die Regressionkoeffizenten kenne und auch das Residuum. -- Aber ... die kenne ich doch gar nicht...
- Analog die Frage nach dem oder ist es doch eher als Mittelwert der Realisationen ?
- Wie die Standardfehler nun genau sind, möge man mal mit den Kollegen von https://de.wiki.x.io/wiki/Standardfehler_des_Regressionskoeffizienten diskutieren. Die beiden Fassungen sind nämlich nicht äquivalent.
- Norman Markgraf (Diskussion) 20:40, 14. Jun. 2020 (CEST)
- Ich habe den von dir verlinkten Artikel geschrieben und auch die hiesige Formel eingefügt. und sind ZVen deswegen sind sie groß notiert. Konkret zu deiner Frage: ist die Zufallsvariable und ist kein Mittelwert von Realisierungen sondern von Zven. Wenn ich es richtig verstanden habe, dann verstehst du nicht genau wie man auf die rechte Seite der Gleichung kommt bei den jeweiligen Parameterschätzern?--Jonski (Diskussion) 20:54, 14. Jun. 2020 (CEST)
- Dass wie von dir behauptet im Abschnitt #Standardfehler der Regressionskoeffizienten im einfachen Regressionsmodell angeblich rumgesprungen wird zwischen Zufallsvariabeln und statistischen Variablen entspricht schlicht nicht der Wahrheit.--Jonski (Diskussion) 21:33, 14. Jun. 2020 (CEST)
- Ich habe den von dir verlinkten Artikel geschrieben und auch die hiesige Formel eingefügt. und sind ZVen deswegen sind sie groß notiert. Konkret zu deiner Frage: ist die Zufallsvariable und ist kein Mittelwert von Realisierungen sondern von Zven. Wenn ich es richtig verstanden habe, dann verstehst du nicht genau wie man auf die rechte Seite der Gleichung kommt bei den jeweiligen Parameterschätzern?--Jonski (Diskussion) 20:54, 14. Jun. 2020 (CEST)
- Mal ein Beispiel. Im Text steht:
- Norman Markgraf: Welches springen von ZVen und Merkmalsausprägungen meinst du genau? Habe beim groben überfliegen nichts entdecken können. Zudem wird aus Gründen der Vereinfachung zwischen ZVen und Merkmalsausprägungen oft in der Notation nicht unterschieden (auch in der Fachliteratur). Ist daher nicht unbedingt ein Makel. Wenn aber schon unterschieden wird in der Notation, dann sollte die Unterscheidung natürlich durchgehend verwendet werden.--Jonski (Diskussion) 19:37, 14. Jun. 2020 (CEST)
Standardfehler des arithmetischen Mittels
BearbeitenHallo. Entschuldigt, falsch ich was falsch verstanden habe, aber der Standardfehler des Mittelwertes bezieht sich immer auf eine Stichprobe, nicht die Grundgesamtheit oder? Also müsste man dann nicht s statt sigma schreiben? (nicht signierter Beitrag von 195.37.187.155 (Diskussion) 17:16, 14. Okt. 2020 (CEST))
- Standardfehler des arithmetischen Mittels ist eine verkürzte und seltsame Formulierung. Es gibt einen Standardfehler der Mittelwertschätzung und einen geschätzten Standardfehler.--Sigma^2 (Diskussion) 23:02, 28. Apr. 2024 (CEST)
Standardfehler ist kein Streuungsmaß
BearbeitenDer Standardfehler ist kein eingenständiges Streuungsmaß, sondern eine Schätzung der Standardabweichung einer Schätzfunktion. Da es unterschiedliche Möglichkeiten zur Schätzung gibt, gibt es streng genommen auch nicht den Standardfehler. --KlausTh-Mathe (Diskussion) 09:59, 15. Feb. 2024 (CET)
- Es müssen drei Dinge auseinandergehalten werden
- der (theoretischen) Standardfehler der Schätzfunktion (eine in der Regel unbekannte Konstante, die von einem unbekannten Parameter abhängt),
- ein Schätzwert für diesen Standardfehler (verschiedenene Schätzfunktionen für den unbekannten Parameter führen zu verschiedenen Schätzwerten),
- eine Schätzfunktion für den Standardfehler der Schätzfunktion (Zufallsvariable, nicht eindeutig).
- Beispiel stochastisch unabhängig mit ; ist unbekannt. ist in diesem Kontext eine übliche Schätzfunktion für .
- Der Standardfehler der Schätzfunktion für ist .
- Wenn ein Schätzwert für ist, dann ist ein Schätzwert für den Standardfehler der Schätzung von durch oder der geschätzte Standardfehler. Der geschätzte Standardfehler wird in bestimmten Anwendungsbereichen häufig einfach als Standardfehler bezeichnet.
- Der Schätzwert für ist der realisierte Wert einer Schätzfunktion (eine Zufallsvariable mit Wahrscheinlichkeitsverteilung). Dann ist eine Schätzfunktion für den Standardfehler der Schätzung von durch oder der zufällige geschätzte Standardfehler. In Wahrscheinlichkeitsaussagen (z. B. Konfidenzaussagen) muss die Zufallsvariable, der zufällige geschätzte Standardfehler, verwendet werden.
- Der Standardfehler ist ein Streuungsmaß für eine Schätzfunktion, da er die Standardabweichung einer Schätzfunktion ist. In der statistischen Theorie werden Schätzfunktionen unter anderem anhand ihres Standardfehlers verglichen.
- Beispiel: Die Schätzfunktion hat den Standardfehler , die ebenfalls denkbare Schätzfunktion hat den Standardfehler . Für hat den kleineren Standardfehler als .
- In einigen Anwendungsbereichen (teils ganzen Fächern) wird in Statistik eine unscharfe Pfuscherei betrieben, indem man - teilweise auch schon in der Lehre - versucht, um die konzeptionelle und sprachliche Unterscheidung der drei Objekte , und herumzukommen. Vor allem dort, wo man glaubt, man könne Statistik anhand von Software verstehen. Dort wird aber nur eine Zahl ausgespuckt, die heißt dann z. B. "S. E." für Standard Error.
- In dieser Beziehung ist der Artikel noch erheblich verbesserungsfähig, z. B. ist die nicht erklärte Notation für diejenigen verständlich, die den Artikel nicht benötigen, aber sonst könnte damit ein Schätzwert (eine Zahl) oder ein Schätzer (eine Zufallsvariable) gemeint sein. Insbesondere könnte im Artikel mehr zu geschätzten Standardfehlern stehen, mit denen die Anwender konfrontiert sind.--Sigma^2 (Diskussion) 15:34, 28. Apr. 2024 (CEST)
- Vielen Dank für die ausführliche Darstellung, mit der ich im wesentlichen übereinstimme; insbesondere betrifft dies die kritischen Bemerkungen im vorletzten Absatz.
- In der Literatur wird die Bezeichnung Standardfehler oftmals nur für die (theoretische bzw. konkrete) Schätzung der Standardabweichung einer Schätzfunktion (im obigen Beispiel 2. und 3.) verwendet, nicht jedoch für den theoretischen Wert (im obigen Beispiel 1.). Ich denke, dass es hier für oder gegen beide Varianten gute Gründe gibt.
- Hinsichtlich der Bezeichnung des Standardfehlers als Streuungsmaß habe ich eine andere Auffassung, da für mich das Streuungsmaß der Operator (also hier die Standardabweichung) ist. In der Literatur wird der Begriff aber auch für die Ergebnisse verwendet, so dass ich zugeben muss, dass meine ursprüngliche Kritik überzogen war. --KlausTh-Mathe (Diskussion) 20:12, 29. Apr. 2024 (CEST)
- Wir sind uns ziemlich einig. Eine Literatursichtung hat mir gezeigt, dass der Begriff Standardfehler in der Statistikliteratur erstaunlich selten verwendet wird, am ehesten in sehr anwendungsnahen Büchern (Ökonometrie, Biometrie). Und dann geht es richtig durcheinander: gemeint sein kann 1. die Standardabweichung des Fehlers (eigentliche Bedeutung!) = die Standardabweichung der Schätzfunktion (da ), 2. ein Schätzwert für diese Standardabweichung, 3. eine Schätzfunktion (ein Schätzer) für diese Standardabweichung. Dies muss in einem enzyklopädischen Artikel dargestellt sein. In der jetzigen Fassung liest es sich so, als sei es ein klar definierter und eindeutiger Begriff der statistischen Theorie.--Sigma^2 (Diskussion) 21:51, 29. Apr. 2024 (CEST)