Diskussion:Kovarianz (Stochastik)

Wertebereich der Kovarianz

Letzter Kommentar: vor 20 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Die Aussage, dass die Kovarianz nach der angegebenen Formel Werte zwischen -1 und +1 annehmen kann ist m.E. falsch. Das gilt nur für den Korrelationskoeffizienten, den man durch Normierung der Kovarianz erhält:

Cov(x,y) = E[(x - E[x])(y - E[y])]
Korrelationskoeffizient(x,y) = Cov(x,y) / (SD(x)*SD(y))

wobei SD(x) = sqrt(Var(x)) = sqrt(E[(x - E[x])²]) (Standardabweichung)

Für den Korrelationskoeffizienten wird in dem entsprechenden Artikel behauptet, dass dieser Werte zwischen -1 und +1 annehmen kann, daraus folgt, dass die Kovarianz(x,y) Werte von -SD(x)*SD(y) bis +SD(x)*SD(y) annehmen kann.

Statistik ist schon eine Weile her bei mir. Bitte kommentieren!

Milch77 21:36, 27. Mai 2004 (CEST)Beantworten

Das ist richtig. Die Kovarianz und die Korrelation sind beides Maße für den Zusammenhang von 2 Zufallsgrößen, wobei aber nur die Korrelation auf -1 bir 1 normiert ist. Für die Kovarianz Grenzen anzugeben macht, wie man oben auch sieht, wenig Sinn, da gibt es eben keine festen Werte.

Gowilei 15:57, 18. Juni 2004 (CEST)

Dann solltest Du es auch in diesem Artikel umsetzen! --Philipendula 16:19, 18. Jun 2004 (CEST)

Kovarianz zweier Merkmale einer Stichprobe

Sollte es nicht ${\frac {1}{n}}$ vor der Summe heissen anstatt ${\frac {1}{n-1}}$ ? Da es um n Elemente der Stichprobe geht unter der Annahme das alle gleichwarscheinlich sind ergibt sich diese Einzelwahrscheinlichkeit. Oder irre ich mich da?

Du beziehst dich auf die Kovarianz der Stichprobe. Es gibt die dekriptive Kovarianz mit

{\frac {1}{n}}

und die inferentielle (für Schätzen und Testen) mit

{\frac {1}{n-1}}

. --Philipendula 19:12, 10. Jun 2005 (CEST)

Gude!

Hier scheint jemand was zu verwechseln... Bei der Varianz jibbet einmal die der Grundgesamtheit, und einmal die der Stichprobe. Unterschied: Die 1. hat den Faktor 1/n, die 2. den Faktor 1/(n-1). Bei einer Kovarianz wird zwar die 1. benutzt, dies ist aber eine reiner Vereinfachung beim Rechnen, und hat nichts mit Sichprobe oder Grundgesamtheit zu tun, also der Fakto 1/(n-1) ist nicht richtig, es ist 1/n.

Gruß Schubbiaschwilli

Gude!

Nochma: Die Kovarianz wird berechnet durch Cov[X,Y] = E(XY) − E[X]E[Y]. Wenn man das weiter aufdröselt, kommt man darauf, das der Erwartungswert mit dem Faktor 1/n berechnet wird, und dieser Faktor dann auch in der Formel bleibt.

Gruß Schubbiaschwilli

Du hast aber bei der Stichprobenkovarianz rumkorrigiert. Der Nenner n-1 ergibt sich, weil EX durch

{\overline {x}}

ersetzt wird. Gruß --Philipendula 13:33, 27. Jun 2005 (CEST)

Gude!

Der Erwartungswert (Mittelwert) wird aber mit dem Faktor 1/n ermittelt, also: 1/n. Übrigens benutzt man die Varianz der Grundgesamtheit um die Korrelation zu berechnen, was aber nichts ausmacht, da der Faktor 1/n in der Korrelation sowieso weggekürtzt wird.

Gruß Schubbiaschwilli

Unterschreibe doch bitte mit --~~~~

Erst mal: Man macht gar nichts. Denn auch die Kovarianz selber findet ihre Verwendung. Dann zum Nenner: Im Artikel ist erst die Kovarianz zweier Zufallsvariablen angegeben, also

{\mbox{Cov}}(X,Y):=E((X-EX)(Y-EY))

.

Das ist der Erwartungswert des Produktes zweier Zufallsvariablen (Ja, ich weiß, nachdem der Erwartungswert ...). Man könnte das nun noch präzisieren und schreiben: Bei zwei stetigen Zufallsvariablen errechnet sich die Kovarianz als

\int _{x}\int _{y}(x-EX)(y-EY)f_{XY}(x,y)dydx

und bei zwei diskreten als

\sum _{i}\sum _{j}(x_{i}-EX)(y_{j}-EY)f_{XY}(x_{i},y_{j}).

Das betrifft also die Grundgesamtheit. Wir wollen diese Kovarianz jetzt praktisch schätzen, kommen also zu

{\mbox{cov}}_{xy}={\frac {1}{n-1}}\sum _{i=1}^{n}{(x_{i}-{\bar {x}})(y_{i}-{\bar {y}})}

Jetzt betrachte ich beispielsweise Länge x und Breite y von 100 Kriegsschiffen. Da x und y kein Schild mit dem Erwartungswert umhaben, muss ich die Erwartungswerte mit ${\overline {x}}$ und ${\overline {y}}$ schätzen. Die aus den 100 Wertepaaren geschätzte Stichprobenkovarianz hat dann den Nenner n-1. Das sind meine letzten Ausführungen zu Thema. --Philipendula 10:59, 29. Jun 2005 (CEST)

Begriffsklärung?

Wäre es nicht sinnvoller den Artikel unter "Kovarianz (Statistik)" oder so zu speichern und hier direkt die Begriffsklärung hinzuetzen? -- AllesMeins 19:27, 20. Jul 2005 (CEST)

Zustimmung. Und Ermutigung: wenn in den nächsten Tagen kein Widerspruch kommt, und wenn Du willens bist, auch die Links auf diese Seite anzupassen, dann sei mutig. -- Frau Holle 19:26, 20. Jul 2005 (CEST)

Gibt es irgend eine Möglichkeit die Links auf diese Seite effektiv zu finden? -- AllesMeins 14:52, 22. Jul 2005 (CEST)

integrale

wo sind die integrale? aha, passenderweise stehen sie beim Verschiebungssatz (Statistik). waere es nicht sinnvoll, sie (auch) hier unterzubringen oder wenigstens besser auf den v-satz zu verweisen? -- 141.3.12.146 18:10, 13. Jul 2006 (CEST)

Unterschied zu Kovarrianz

Letzter Kommentar: vor 17 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Kann mir jemand den Unterschied zwischen Kovarianz und Korrelation erklären? Oder sind das zwei grundsätzlich verschiedene Dinge?

Zum Einen gibt es die Kovarianz und den Korrelationskoeffizienten, die beide "den Grad" einer linearen Beziehung zwischen zwei Merkmalen messen. Die Kovarianz ist nicht normiert, der KK ist es. Wenn man sagt, zwischen den Variablen Blah und Tröt besteht eine Korrelation, heißt das, dass die Kovarianz und damit der Korrelationskoeffizient ungleich Null sind. --Philipendula 21:39, 1. Feb. 2007 (CET)Beantworten

Maß der Kovarianz

Letzter Kommentar: vor 16 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Zitat: Ist z.B. die Kovarianz zweier Variablen mit der Maßeinheit "Meter" 5,2 so ist die Kovarianz der gleichen Werte in der Maßeinheit "Zentimeter" 520.

Müsste dass nicht quadratisch steigen, da ja beide Werte ( E(X)-X) und (E(Y)-Y) ) um den Faktor hundert vergrößert werden? Also quasi 52000 Zentimeter? (nicht signierter Beitrag von 89.14.238.206 (Diskussion) 2008-02-24T12:45:44)

Ja, auf jeden Fall! Sind X und Y Zufallsvariablen und skaliere ich beide durch einen beliebigen Faktor s (wie beim Umrechnen von Meter auf Zentimeter mit s=100), so gilt $\operatorname {Cov} (sX,sY)=E((sX-E(sX))(sY-E(sY))=s^{2}E((X-EX)(Y-EY))$ . Es muss also 52000 Zentimeter heißen. Ich änder das mal. -- 85.182.20.104 11:53, 17. Aug. 2008 (CEST)Beantworten

Definition

Letzter Kommentar: vor 16 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Es ist ein Klammerfehler in der Definition.Es fehlt einmal "Klammer auf" nach cov(x,y)=E... Da gehört einmal ( mehr hin! (nicht signierter Beitrag von 77.187.219.50 (Diskussion) 16:46, 4. Mar 2008)

wo, genau? -- seth 23:45, 4. Mär. 2008 (CET)Beantworten

Beispiel

Letzter Kommentar: vor 12 Jahren3 Kommentare3 Personen sind an der Diskussion beteiligt

Ist es nicht möglich ein Beispiel für die Anwendung in der Praxis mit anzugeben, damit auch Leute wie ich die nicht permanent mit Statistik zu tun haben die Zusammenhänge verstehen? Wäre übrigens m.E. für alle Statistikfunktionen sinnvoll.

Danke schon mal (nicht signierter Beitrag von 87.178.46.242 (Diskussion) 6:09, 22. Mar 2008)

Das würde ich gern unterschreiben. Um mathematische dinge zu verstehen ist wikipedia absolut ungeeignet weil man unentwegt mit mathematischen symbolen zugeschwallt wird.

schön wäre ein eispiel,in dem man vll anhand irgendwelcher realen zahlen nachvollziehen kann,wie das ergebnis ist und wie man da hinkommt.

denn so ist das absolut überhaupt nicht ersichtlich.

und wenn es hier nur darum geht ein kompendium aufzubauen kann man die beispiele ja gleich weglassen (nicht signierter Beitrag von 91.51.91.228 (Diskussion 22:00, 13. Jun. 2010 (CEST)) Beantworten

ja, ein kleines beispiel wäre nett. 212.90.151.90 14:45, 15. Mai 2012 (CEST)Beantworten

Sucht ihr eventuell alle den Artikel Stichprobenkovarianz? Das ist nämlich der in der Statistik verwendete Begriff für die "Kovarianz" von Zahlenreihen. Leider sagt man dazu aber meist auch nur Kovarianz, daher vielleicht die Missverständnisse. Hier geht es ausschließlich um die Kovarianz von Zufallsvariablen (und Beispiele hat dieser Artikel ja mittlerweise auch). -- HilberTraum (Diskussion) 15:10, 15. Mai 2012 (CEST)Beantworten

W-Raum der Zufallsvariablen

Letzter Kommentar: vor 15 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Sollte die Definition der Kovarianz nicht auch fordern, dass die Zufallsvariablen $X,Y$ den selben Wahrscheinlichkeitsraum $(\Omega ,{\mathcal {F}},P)$ teilen? Die Definition scheitert doch sonst an zwei Stellen: 1. Haben $X,Y$ einen unterschiedlichen Definitionsbereich $\Omega$ , so existiert das Produkt der Zufallsvariablen $(X-\mu )(Y-\nu )$ gar nicht. 2. Haben $X,Y$ ein unterschiedliches W-Maß $P$ , so existiert der äußere Erwartungswert $E((X-\mu )(Y-\nu ))=\int ((X-\mu )(Y-\nu ))\,dP$ nicht. --Xtrawurst 14:30, 15. Feb. 2009 (CET)Beantworten

Ich teile die Meinung, dass die gesamte Seite relativ schwach ist, was mathematisch korrekte definitionen angeht. Die Voraussetzungen waren auch falsch formuliert (die quadratische Integrierbarkeit von den Zufallsvariabeln wurde vorausgesetzt), das habe ich geändert, damit hat sich auch der 2. Punkt erledigt. Aber zu 1. :die Zufallsvariabeln X und Y haben beide den Definitionsbereich der reellen Zahlen (ansonsten schreibt man i.d.R. Zufallsgröße). Alle Definitionsbereiche, die eine Teilmenge der reellen Zahlen sind, können folglich mit der Definition induziert werden. Für alle anderen Definitionsbereiche der Zufallsgrößen ist die Kovarianz schlicht nicht definiert (zumindest in der Wiki).

--Beben 23:02, 6. Dez. 2009 (CET)Beantworten

Einheit der Kovarianz

Letzter Kommentar: vor 15 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

In dem Teil, der erklärt, dass der Absolutwert der Kovarianz keine Aussage über die Stärke des Zusammenhangs macht, wird dieses Beispiel mit den 5,2 m und 520 cm gegeben. Wie weiter oben in der Diskussion schon angesprochen, müsste es hier ja 52,000 heißen. Meine Anmerkung ist, dass genau genommen auch eine Einheit dazu gehört, nämlich im ersten Fall m² und im zweiten cm², oder nicht? Anschaulich kann man die Kovarianz ja machen als den Mittelwert der Flächen der Rechtecke, die von den Stichprobenwerten (x,y) und dem Punkt (Mittelwert (x), Mittelwert (y)) aufgespannt werden. Damit wird auch die Normierung durch die Standardabweichungen anschaulich.

Grüße Klapauzius64 25. April 2009 (16:42, 25. Apr. 2009 (CEST), Datum/Uhrzeit nachträglich eingefügt, siehe Hilfe:Signatur)Beantworten

Fehler

Letzter Kommentar: vor 14 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Ganz unten in der letzten Rechnung, in der aufgezeigt wird, dass Unkorreliertheit nicht Unabhängigkeit bedingt, muss am Schluss ein "=0" hin statt "=1". (nicht signierter Beitrag von 92.75.8.250 (Diskussion | Beiträge) 11:46, 6. Feb. 2010 (CET)) Beantworten

gudn tach!

danke fuer den hinweis, hab's korrigiert. kannst du naechstes mal aber auch gerne selbst machen. -- seth 23:00, 7. Feb. 2010 (CET)Beantworten

Verständnis

Letzter Kommentar: vor 13 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Für das Verständnis wäre ein Beispiel sinnvoll. Hab den Text nun öfters gelesen und nicht verstanden. Die Begriffserklärung ist als Definition gut, doch für Laien nicht verständlich.

Gruß aus Bayern (nicht signierter Beitrag von 131.220.178.124 (Diskussion) 08:52, 12. Jan. 2011 (CET)) Beantworten

Verschiebungssatz von Steiner?

Letzter Kommentar: vor 13 Jahren4 Kommentare2 Personen sind an der Diskussion beteiligt

Guten Tag!

Seit wann heißt der Verschiebungssatz in der Statistik "Verschiebungssatz von Steiner". Ich kenne nur den Verschiebungssatz von Steiner aus der Physik, wo es aber um die Umrechnung eines bekannten Trägheitsmomentes auf eine parallele Achse geht. Bitte um eine Quelle, wo belegt wird, dass dieser mathematische Satz auch von Steiner kommt und so genannt wird. Solange muss Steiner leider in diesem Artikel verzichtet werden. Außer der Formalia, dass in beiden Sätzen etwas von etwas abgezogen wird, kann ich leider keinen Zusammenhang zwischen den beiden Sätzen erkennen...--svebert 13:29, 27. Mär. 2011 (CEST)Beantworten

gudn tach!

ich habe es auch so gelernt, dass die formel "steiner-formel" heisse. in meinem stochastik-script wird explizit auf Jakob Steiner verwiesen. eine kleine google-recherche bestaetigt, dass dies haeufig getan wird, vgl. z.b. [1] oder auch steiner -wikipedia&tbs=bks:1&source=og google-books-suche. -- seth 20:21, 3. Apr. 2011 (CEST)Beantworten

Ok, habe jetzt bei google-books auch bei vielen Büchern gefunden, dass der Verschiebungssatz auch Steinerscher Satz genannt wird. Dann ist das ja geklärt :-) Mal wieder was dazugelernt --svebert 02:23, 6. Apr. 2011 (CEST)Beantworten

Definition für komplexe Größen

Letzter Kommentar: vor 13 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

\operatorname {Cov} (X,Y):=\operatorname {E} {\bigl (}(X-\operatorname {E} (X))(Y-\operatorname {E} (Y))^{*}{\bigr )}

z.b. in Fundamentals of statistical signal processing, estimation theory, volume 1; Kay, Steven M.; Prentice Hall; 1993; Seite 501 (nicht signierter Beitrag von 80.156.46.210 (Diskussion) 10:48, 20. Jun. 2011 (CEST)) Beantworten

Beispiele sind Dreck

Letzter Kommentar: vor 13 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Keines der Beispiele hilft dem Verständnis der Stoffes, da alle nicht nachvollziehbar sind. Die "Rechnungen" sind einfach nur hingewixter Dreck, welcher sogar eher noch Verwirrung stiftet, weil man sich fragt, wie das Ergebnis eigentlich zustande kommt. Aber genau das sollten Beispiele doch klarmachen. (nicht signierter Beitrag von 217.225.41.95 (Diskussion) 14:18, 18. Aug. 2011 (CEST)) Beantworten

"Fehler beim Parsen"

Letzter Kommentar: vor 10 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Bei allen Beweisen auf dieser Seite kommt bei mir sowohl unter Firefox als auch unter Chrome der Fehler(in rot):

"Fehler beim Parsen(Unbekannte Funktion „\begin“):..." (nicht signierter Beitrag von 89.107.167.14 (Diskussion) 00:17, 9. Feb. 2014 (CET))Beantworten

Das ist leider ein derzeit generelles Problem, das nichts mit dem speziellen Lemma, noch nur mit der deutschen WP zu tun hat: siehe Diskussion hier

--Lefschetz (Diskussion) 16:54, 9. Feb. 2014 (CET)Beantworten

Satz?

Letzter Kommentar: vor 9 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Der "Satz": Sei Cov(X ,Y)= 0, so sind die Zufallsvariablen X und Y im Allgemeinen nicht stochastisch unabhängig, ist eigentlich kein richtiger Satz, sondern ein Gegenbeispiel. Nijdam (Diskussion) 11:29, 20. Jun. 2015 (CEST)Beantworten

Sehe ich auch so. Ich habe die Stelle mal gestrafft. -- HilberTraum (d, m) 21:04, 21. Jun. 2015 (CEST)Beantworten

Definition Stetig/diskret

Letzter Kommentar: vor 5 Jahren6 Kommentare2 Personen sind an der Diskussion beteiligt

@HilberTraum: Wieso bist der Meinung, dass die Definition im stetigen und diskreten Fall keinen zusätzlichen Nutzen hat? Sonst wird im Artikel soweit ich das richtig gesehen habe ja gar nicht darauf eingegangen wie sie im diskreten und stetigen Fall definiert ist. Habe gerade bemerkt, dass die Definition hier schon einmal diskutiert oder zumindest erwähnt wurde. Grüße.--Jonski (Diskussion) 20:15, 4. Dez. 2019 (CET)Beantworten

Sieh auch [2].--Jonski (Diskussion) 20:25, 4. Dez. 2019 (CET)Beantworten

Nach BKs: : Na ja, es handelt sich ja bei der Kovarianz nur um einen Erwartungswert. Und wie man Erwartungswerte definiert/berechnet, reicht ja von mathematisch sehr einfach bis sehr anspruchsvoll. Das kann dieser Artikel mMn sowieso nicht vollständig darstellen. (Außerdem war, wie heute jemand im Bearbeitungskommentar erwähnt hat, gar nicht erklärt, was

f

ist.) Grüße -- HilberTraum (d, m) 20:27, 4. Dez. 2019 (CET)Beantworten

Ja okay, das war nicht ganz eindeutig beschrieben. Aber ich finde es gilt immer die Devise "verbessern statt löschen". Ohne diese Definition finde ich den Artikel höchst unvollständig. Vllt kann man die Definition auch anhand eines Beispiels erläutern. Im ganzen Artikel fehlt übrigens ein Rechenbeispiel...Was genau meinst du mit "sehr anspruchsvoll" bei der Berechnung von Erwartungswerten? Mir fällt ad hoc kein sehr anspruchsvoller Fall ein.--Jonski (Diskussion) 20:34, 4. Dez. 2019 (CET)Beantworten

Ja, Beispiele wären gut. Aber im Abschnitt „Definition“ sind solche Beschreibungen mMn zu ausufernd. Durch die Formel mit dem Erwartungswert ist die Kovarianz ja bereits vollständig definiert. Ich denke, die Definition für beliebige Zufallsvariable Erwartungswert#Allgemeine Definition ist mathematisch sehr anspruchsvoll; die würde ich keinem Schüler und noch nicht mal einem Mathematikstudenten im ersten Semester zumuten wollen. -- HilberTraum (d, m) 20:50, 4. Dez. 2019 (CET)Beantworten

Okay da hast du Recht, die ist anspruchsvoll. Werde mal gucken ob ich ein passendes Beispiel finde.--Jonski (Diskussion) 20:53, 4. Dez. 2019 (CET)Beantworten

Polarform?

Letzter Kommentar: vor 4 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Mir ist gerade aufgefallen, dass Benutzer:Florianwicher mit diesem Edit [3] "Verallgemeinerung" in "Polarform" geändert hat. Was ist genau darunter zu verstehen? Beschreibt es "Polarform" besser als "Verallgemeinerung"?--Jonski (Diskussion) 21:05, 4. Dez. 2019 (CET)Beantworten

Die zu einer quadratischen Form gehörige symmetrische Bilinearform ist ihre Polarform. Siehe z.B. Grundwissen Mathematikstudium 715ff.

lg Florian Wicher (Diskussion) 08:50, 16. Dez. 2019 (CET)Beantworten

Berechnung

Letzter Kommentar: vor 2 Jahren10 Kommentare2 Personen sind an der Diskussion beteiligt

@Jonski: Was genau siehst du hier für ein Problem? Physikinger (Diskussion) 23:48, 12. Mär. 2022 (CET)Beantworten

Ich sehe mehrere Probleme. In diesem Artikel geht es ausschließlich um die Kovarianz von Zufallsvariablen, wie bereits hier festgestellt Diskussion:Kovarianz (Stochastik)#Beispiel. Die "empirische Berechnung der Kovarianz aus einer Datenreihe" ist also ganz falsch hier. Zudem kann eine Kovarianz basierend auf Messwerten niemals Erwartungstreu für die Populationskovarianz

\sigma _{xy}

sein. Du hast

s_{xy}={\tfrac {1}{N-1}}\sum _{i}\left(x_{i}-{\bar {x}}\right)\left(y_{i}-{\bar {y}}\right)

statt

S_{XY}={\frac {1}{n}}\sum _{i=1}^{n}(X_{i}-{\bar {X}})(Y_{i}-{\bar {Y}})

geschrieben, dabei ist

s_{xy}

nur eine Realisierung von

S_{xy}

, hat daher einen Erwartungswert Null und kann damit auch nicht Erwartungstreu für

\sigma _{xy}

sein. Hier unterStichprobenkovarianz#Korrigierte Stichprobenkovarianz ist alles korrekt beschrieben. Weiterhin schreibst du "empirische Berechnung der Kovarianz aus einer Datenreihe erfolgt gemäß ihrer Definition durch die Gleichung" und kürzt dann diese Kovarianz mit

\sigma _{xy}

ab. Allerdings werden für Populationsgrößen werden konventionell griechische Buchstaben und für Stichprobengrößen lateinische Buchstaben verwendet. Du schreibst

\sigma _{xy}\approx s_{xy}

und davor, dass die Kovarianz geschätzt werden muss also müsstest du

{\hat {\sigma }}_{xy}=S_{xy}

schreiben.--Jonski (Diskussion) 00:20, 13. Mär. 2022 (CET)Beantworten

Wie ich schon bei der Varianz erklärt habe: Ziel und Stärke der Wikipedia ist es, komplizierte Sachverhalte in möglichst einfacher und allgemeinverständlicher Sprache zu erklären und auf den Punkt zu bringen. Ich bemühe mich dabei, so gut wie möglich, auf Fachtermina zu verzichten. Mit

\sigma _{xy}\approx s_{xy}

erkennt jeder sofort, dass hier eine Näherung gemeint ist. Deine Schreibweise verwirrt mehr, als sie hilft. Die Symbole

{\hat {\sigma }}_{xy}

und

S_{xy}

werden nicht erklärt oder definiert und sind damit didaktisch völlig nutzos. Der Abschnitt Berechnung, den ich eingefügt habe, ist doch genau das, was sich 95% der Leser wünschen, hier zu finden, wenn sie die Kovarianz nachschlagen. Es gibt nur sehr wenige, die sich in der Wikipedia über diese philosophisch anmutenden Begriffswelten der Mathematiklehrbücher informieren wollen, zumal das auch nicht allumfassend erklärt ist. Wenn du also den Lesern eine hochgestochene Fachsprache aufzwängen willst, musst du erstens einen zwingenden Grund dafür haben und zweitens diese Sprache auch erklären. Und wenn du sie erklärst, dann verwässert der Artikel und die wichtige Information geht unter. Die Fachsprache hilft kaum jemandem, vor allem wenn sie nicht erklärt ist, oder wenn sie über viele anderen Artikel verstreut ist, so dass man, um diesen Artikel zu verstehen, erst viele andere Artikel lesen muss. Es muss doch das Ziel sein, das so gut wie möglich zu vermeiden. Ich habe versucht, diesen Missstand zu beheben und verstehe nicht, warum du diesen Bemühungen entgegenwirkst.--Physikinger (Diskussion) 08:20, 13. Mär. 2022 (CET)Beantworten

Du hast den Misstand aber nicht behoben sondern eine Version geschaffen die nicht mehr konsistent ist. Wenn jemand "Kovarianz" in die Suche eingibt kommt er direkt auf die BKL-Seite wo die gewünschte Seite aufgerufen werden kann. Bei "komplizierte Sachverhalte einfach erklären" stimme ich dir zu, aber du musst es so umsetzen dass die Einleitung des Artikels wenigstens zu deiner Einfügung passt. Was nicht geht ist einen Absatz der thematisch nicht hier her gehört und zudem fehlerhaft ist einfach irgendwo unterbringen zu wollen.--Jonski (Diskussion) 13:32, 13. Mär. 2022 (CET)Beantworten

Was soll daran fehlerhaft gewesen sein? Wenn du solche Behauptungen machst, dann muss du sie auch Begründen bevor du fremde Arbeit vernichtest. Fehlerhaft und schlechter ist hingegen was du jetzt daraus gemacht hast:

Die Überschrift "Schätzung" und der erste Satz ist falsch, da es sich bei der ersten Formel nicht im Allgemeinen um ein Schätzung handelt, sondern sie kann auch dem wahren Wert entsprechen. Das war bei meiner Version präzise und korrekt ausgedrückt.
Deine Formulierung ist ziemlich schlecht in der hinsicht, dass sie nicht besonders allgemeinverständlich ist und es werden Symbole verwendet, die nicht erklärt oder definiert sind. Das ist didatisch völlig unsinnig.
Der Abschnitt "Schätzung" ist im Artikel Stichprobenkovarianz schon im Prinzip abgedeckt und passt dort auch viel besser hin. Warum schreibst du das ähnlich formulierte hier nochmal? Wo ist da der Mehrwert? Mein Abschnitt "Berechnug" hat da eine deutlich besser Übersicht zur Auswahl der richtigen Formel geboten.
Wo sind meine Formeln mit der Gewichtungen geblieben, die ich lange recherchiert und hier eingefügt habe? Das ist doch das Wesentliche, warum ich den Abschnitt Berechnung ergänz habe, weil das alles so schwer bzw. gar nicht zu finden war.

Also, wie machen wir jetzt hier weiter? Ich kann dein Anliegen auch nicht richtig erkennen was dein übergeordnetes Ziel bei der Gestaltung des Artikels ist und was genau dein Problem mit meiner Gestaltung ist. Geht es dir wirklich um die Sache, oder frustriert dich irgendwas anderes? Was mich wirklich beim Thema stört, ist wenn Wikipedia-Artikel so aus der "Klugscheißerperspektive" geschrieben sind. Es gibt ja so gewisses vermeutliches Klugscheißer-Wisser das Schema folgt "X ist nämlich gar nicht Y". Damit glaubt man, Leute beeindrucken zu können oder fühlt sich überlegen, wenn man irgendein Allgemeinwissen auf den Kopf stellen kann. Du hast das bestimmt auch schon gehört, Sätze wie z.B. "Mandeln und Paranüsse sind eigentlich gar keine Nüsse, sondern Kerne", "Erdnüsse sind nämlich gar keine Nüsse, sondern Bohnen", oder "Erdbeeren sind eigentlich gar keine Beeren, sondern Nüsse". Kein Witz, solche Aussagen gibt es wirklich. Das Problem dabei ist allerdings, dass sie sich bei genauerer Betrachtung als falsch erweisen und nur in einem bestimmten Kontext Sinn ergeben und richtig sind. Bei den Nüssen ist das z.B. eine bestimmte botanische Sortenzugehörigkeit der Mutterpflanze, aber es ist schlicht falsch, wenn man dagegen vom Phänotyp redet. Und wer bei bei Lebensmitteln mit Erdnüssen drauf schreibt "enthält keine Nüsse", macht sogar strafbar, weil es für Allergiker gefährlich ist. So ähnlich ist das auch mit Aussagen wie "Die Stichprobenvarianz ist nämlich gar keine Varianz". Auch hier zeigt sich bei näherer Berachtung, dass es nicht stimmt und nur aus dem Zusammenhang falsch verstanden und falsch zitiert wird. Gemeint ist, dass sich die Zahlenwerte zwischen der Stichprobenkovarianz und der theoretischen idealen Kovarianz unterscheiden, aber es steht in keine Lehrbuch pauschal drin, dass die Stichprobenkovarianz nicht zur Kategorie Kovarianz gehört. Das ist so als würdest du sagen die "geschätze Länge" sei gar keine "Länge", nur weil sich der Wert der geschätzen Länge von dem der wahren Länge unterschiedet. Und solche Klugscheißerei und Rechthaberei finde ich für die Wikipedia äußerst schädlich. Mein Anliegen ist es, den Leuten, die hier Information suchen, Wissen aufzubereiten und ihnen eine Brücke zur Mathematik zu bauen und sie nicht mit hochgestochen klingender Fachsimpelei beeindrucken zu wollen oder abzuschrecken.

Wenn dir deine Sprechweise so wichtig ist, dann müssten wir vielleicht einen Fork machen und einen zusätzlichen Artikel "Kovarianz (Wahrscheinlichkeitstheorie)" anglegen, wo sich Leute wie du austoben können während der allgemeine Artikel "Kovarianz (Stochastik)", den Leuten eine schnelle Hilfe bei der Suche nach der richtigen Formel bietet. Was hältst du davon?--Physikinger (Diskussion) 22:57, 14. Mär. 2022 (CET)Beantworten

Ich habe dir doch schon oben aufgezählt was daran fehlerhaft ist. Du fügst in den Artikel ein empirische Berechnung der Kovarianz aus einer Datenreihe obwohl oben klar und deutlich der Hinweis steht Dieser Artikel behandelt die Kovarianz von zwei Zufallsvariablen; zur Kovarianz einer Datenreihe oder Stichprobe siehe Stichprobenkovarianz. Weiterhin steht in der Einleitung Zusammenhangsmaß für einen monotonen Zusammenhang zweier Zufallsvariablen. Zufallsvariablen werden bekanntermaßen Großgeschrieben und fügst hier etwas über Datenreihen ein schreibst die Variablen klein. Fallen dir diese eklatanten Widersprüche gar nicht auf? Dass ich hier angeblich komplizierte Materie einfüge wie du hier suggerierst entspricht auch nicht der Realität, ich habe hier lediglich die relativ leichten Fachwörter "Schätzfunktion" und "Schätzung" eingefügt wohingegen du hier Dutzende unverständliche Begriffe wie "systematischen Verzerrung", "individuelles Gewicht", "Gewichtsnorm", "inverse Messunsicherheiten" eingefügt hast. Wieso fügst du das alles nicht einfach in den Artikel Stichprobenkovarianz ein? Wir können es nicht ändern, dass Laien oft von Kovarianz sprechen und eigentlich die Stichprobenkovarianz meinen. Genau dafür gibt es zu Beginn der Seite den BKL-Hinweis. Noch einen dritten Artikel zur Kovarianz finde ich nicht gut. Wir wollen doch gerade Redundanzen vermeiden. Außerdem ist die stochastische Sichtweise doch schon im Artikel Stichprobenkovarianz unter Stichprobenkovarianz#Korrigierte Stichprobenkovarianz vorhanden. Kovarianz wie hier beschrieben und Stichprobenkovarianz verhält sich außerdem nicht wie "geschätze Länge" und "Länge". Ich kann die Problematik, dass die meisten "einfachste Formel" suchen aber dann auf komplizierte stoßen teilweise verstehen; aber du kannst dann nicht einfach beides mischen, sondern es muss eine ganzheitliche Lösung her damit der eingefügte Inhalt auch zur Einleitung passt.--Jonski (Diskussion) 23:45, 14. Mär. 2022 (CET)Beantworten

Zudem gibt es nicht "meine Sprechweise": ich habe den Artikel weder angelegt, noch bin ich Hauptautor noch habe ich die Aufteilung in Kovarianz (Stochastik) und Stichprobenkovarianz vorgenommen. Die Aufteilung fand bereits 2011mit diesem Edit im Konsens statt und anscheinend hat sich nie jemand beschwert.--Jonski (Diskussion) 00:38, 15. Mär. 2022 (CET)Beantworten

Aber dann ist doch nicht mein Abschnitt falsch, sondern diese Überschrift veraltet. Es ist völlig egal, welche Symbole verwendet werden, weil außer dir keiner diese Symbole kennt, der sich hier informiert, da es nicht erklärt ist. Deine angeblichen Regeln für Symbole muss du beweisen. Es sind nur Symbole, die einen Typ von Variable symbolisieren. Wenn diese nicht erklärt oder definiert sind, dann sind sie sinnlos. Ich habe den Abschnitt Schätzung gelöscht, da er laut deiner Aussage hier nicht hingehört. Außerdem hat er ja nichts neues zu bieten, gegenüber den Artikel Stichprobenkovarianz. Dieser Artikel ist im übrigen sehr schlecht und überlappt sich zum Teil. Daran könntest du mal arbeiten, anstatt meine Beiträge zu löschen.

Da beide Artikel zusammen relativ kurz sind, würde es sich anbieten, beide zusammenzulegen. Dieser Artikel heißt ja schon "Stochastik" und nicht "Wahrscheinlichkeitstheorie", daher muss man ihn nicht mal umbennen.--Physikinger (Diskussion) 22:30, 15. Mär. 2022 (CET)Beantworten

Könnte man machen, aber halte ich nur für bedingt sinnvoll. Es fehlt noch einiges zum Thema Stichprobenkovarianz und wenn man die Artikel zusammenführen würde, dann würde der Abschnitt über die Stichprobenkovarianz irgendwann so lang werden dass man dann ohnehin den Artikel wieder aufteilt. Ich denke es wäre zukunftsorientierter wenn man es bei der jetzigen Lösung belässt. Mit "Stochastik" ist nicht "Wahrscheinlichkeitstheorie + Statistik" gemeint, sondern dass der Artikel hier die Kovarianz als Kennzahl einer gemeinsame Wahrscheinlichkeitsverteilung beschreibt (so steht es z. B auch in der englischen Wikipedia in der Einleitung A distinction must be made between (1) the covariance of two random variables, which is a population parameter that can be seen as a property of the joint probability distribution, and (2) the sample covariance, which in addition to serving as a descriptor of the sample, also serves as an estimated value of the population parameter. In der Literatur werden diese Themen immer gänzlich separat behandelt und sogar Einführungsbücher wie "Statistik für Dummies" trennen Varianz (Stochatstik)/Stichprobenvarianz und Kovarianz (Stochatstik)/Stichprobenkovarianz vollständig, siehe z. B. hier [4] diese Übersicht bei "Statistik-Formeln für Dummies". Dass dein Beitrag jetzt unter Stichprobenvarianz zu finden ist finde ich schon mal sehr gut...Ich glaube wenn wir beide gegenseitig besser zuhören dann können wir doch noch konstruktiv zusammenarbeiten:)--Jonski (Diskussion) 19:18, 16. Mär. 2022 (CET)Beantworten

Der größte Schönheitsfehler ist jetzt halt, dass die Kovarianz nur in einen der beiden Artikel erklärt ist und die Formel zur Berechnung nur im anderen zu finden ist, obwohl das thematisch zusammengehört. Optimal ist das nicht. Ich muss natürlich zugeben, dass ich gestern selbst alle Erklärungen aus Stichprobenvarianz entfernt habe, da sie Duplikate zu diesem Artikel sind. Aber da ist eher die Aufteilung das Problem, die aus Anwendersicht absolut keinen Mehrwert gibt und eher von Mathematikern für Mathematiker optimiert zu sein scheint. Auch in dem Buch Statistik für Dummies, dass du zitierst, ist gleich auf der ersten Seite der Vorschau ("Schummelseite") beides auf einer Seite zu finden, Definitionen und Formeln. Und wo findet man die Formeln im Buch? Im Kapitel "Kovarianz und Korrelationskoeffizient", also da wo der Dummie sie sucht und nicht unter "Stichprobenkovarianz", wonach der Dummie eben nicht sucht, weil er das Wort nämlich gar nicht kennt. Außerdem ist die Stichprobenkovarianz eine Varianz und nicht etwa eine Rebsorte oder Atemwegserkrankung, daher fehlt einfach etwas, wenn im Artikel Kovarianz keine Formel dafür zu finden ist. Es ist nach wie vor sehr unbefriedigend.--Physikinger (Diskussion) 21:16, 16. Mär. 2022 (CET)Beantworten

Definition

Letzter Kommentar: vor 1 Jahr2 Kommentare2 Personen sind an der Diskussion beteiligt

In der Definition steht als letzter Satz "In der Statistik werden E(x) und E(Y) als Abweichungen vom arithmetischen Mittelwert berechnet."

Macht man das da wirklich so? Der Erwartungswert hat doch eine relativ einfache Definition, die auf der Wikipedia-Seite vom Erwartungswert steht (ist sogar schon in der Definition verlinkt). Für diskrete Zufallsgrößen zum Beispiel einfach die Summe der Zufallsvariablen mal ihren Wahrscheinlichkeiten. Das ist vor allem verwirrend, da noch die Ausdrücke X-E(X) und Y-E(Y) in der Definition auftauchen, die eben die Abweichungen vom Erwartungswert sind (der ja nicht der arithmetische Mittelwert ist).

Ich würde den letzten Satz rausnehmen. --2A01:598:B181:3D56:F051:C5A4:3506:F27E 13:11, 20. Sep. 2022 (CEST)Beantworten

Stimmt, das macht keinen Sinn, da es keine Abweichungen sind. Habe ich korrigiert. --Physikinger (Diskussion) 10:38, 9. Jun. 2023 (CEST)Beantworten

Abschnitt hinzufügen