Archiv
Gesamtinhaltsverzeichnis und Register
Wie wird ein Archiv angelegt?

Die Wikipedia erhebt in ihrem Selbstverständnis einen enzyklopädischen Anspruch; als Enzyklopädie wird gewöhnlich der Versuch bezeichnet, das Wissen der Welt zu sammeln und kohärent darzustellen. Dabei gibt es eine Reihe von konstituierenden Merkmalen und grundsätzlichen Problemen. Eine aktuelle Wissensdefinition bezieht sich auf Wissen aller Arten, in jeder Menge und Güte (Spinner 1994).

Das Kriterium der enzyklopädischen Relevanz wird nach belieben für oder gegen die Inklusion von Artikeln verwendet; es gibt bisher keinerlei Richtlinien die auch nur annäherungsweise erklären würden, was man unter enzyklopädischer Relevanz für die Wikipedia zu verstehen hätte.

Da das Wissen der Welt im 21. Jahrhundert also nicht mehr so leicht definitorisch eingegrenzt werden kann wie vielleicht im Mittelalter, brauchen wir intersubjektiv nachvollziehbare und pragmatisch umsetzbare Kriterien, um die enzyklopädische Relevanz bezogen auf die Wikipedia intersubjektiv prüfbar zu machen. Diese Kriterien sollen hier entwickelt werden. --asb 10:57, 27. Apr 2004 (CEST)

Siehe auch: Wikipedia:Artikel, Wikipedia:Archiv/Themendiskussion, Wikipedia:Lockerung der Löschregeln

Leitfragen für Kriterien zur "enzyklopädischen Relevanz"

Ein paar Denkanstöße: (--asb 22:14, 20. Apr 2004 (CEST))

  1. Ist ein Artikel, der im Brockhaus existiert, auch automatisch "enzyklopädisch relevant" für die Wikipedia?
  2. Wenn ja, welche Ausgabe des Brockhaus wird zugrunde gelegt?
  3. Wenn nein, welche anderen Relevanzkriterien werden angelegt, abgesehen von persönlichen Meinungen und Überzeugungen?
  4. Welche Wissensarten will die Wikipedia abbilden: Akademische Wissenschaft und Hochkultur oder auch Grenzwissenschaften und Populärkultur? Wo und nach welchen Kriterien wird eine Grenze gezogen zwischen zulässigen und nicht mehr zulässigen Inhalten?
  5. Welche Position bezieht Wikipedia zu den Entitäten der Wirtschaftsordnung? Sind Artikel zu Unternehmen, Produkten oder Dienstleistungen für unsere Enzyklopädie relevant? Welche Kriterien grenzen ggf. relevante (Groß-) Unternehmen von möglicherweise nicht relevanten Kleinunternehmen oder womöglich sogar Handwerksbetrieben ab? Warum? Wie gehen wir mit dem Werbeverdacht um?
  6. Können wir überhaupt solche intersubjektiv verständlichen und pragmatisch umsetzbaren Kriterien aufstellen?

Positionierungen zur "enzyklopädischen Relevanz"

Ansatz 1: Exklusionistische Position

Die Exklusionisten gehen davon aus, dass bestimmte Kriterien zu Abgrenzung enzyklopädisch relevanter Inhalte von beliebigen Modeworten, Fachterminologie, enzyklopädisch irrelvanten Privatpersonen etc. erfoderlich sind. Jede konventionelle Enzyklopädie arbeitet nach diesem Ansatz, egal ob Brockhaus oder Britannica. Dieser Prozess, die sogenannte Lemmaselektion, wird dabei durch eine Redaktion von Experten durchgeführt, die durch interne Prozesse Kohärenz und Kohäsion des jeweiligen Projekts gewährleisten. Da die Wikipedia diesen Mechanismus einer geschlossenen Redaktion nicht hat, müsste für den exklusionistischen Ansatz ein alternativer Mechanismus entwickelt bzw. vorhandene Mechanismen ausgebaut werden. Ich habe Ulis Position mal den Exklusionisten zugeordnet, ich hoffe, das ist tendenziell so vertretbar. --asb 11:22, 28. Apr 2004 (CEST)

Wir kommen meiner Meinung nach nicht ohne Relevanzkriterien aus. Wobei ich ja durchaus dafür bin, die relativ niedrig zu legen.

Wir sollten uns erstmal grundsätzlich über eines einig sein, weil es für die Relevanzkriterien von wirklich wichtiger Bedeutung ist: Dem Unterschied zwischen einem Begriff und einem Ding:

Eine Tasse beschreibt einen generischen Begriff, die Tasse auf dem Schreibtisch von Ulrich Fuchs mit dem Wikipedia-Logo drauf, beschriebt ein Ding. Firmen, Webseiten, Sportvereine, Softwareprodukte, Personen, Meditationsschulen etc., all die Artikel, bei denen wir uns immer wieder wegen der Relevanz streiten, beschreiben Dinge in diesem Sinne.

Ich bin der Meinung, dass wir bei Begriffen keinerlei Relevanzkriterien brauchen (insofern hier abolut keine "exklusionistische" Position. Hier sind in der Tat die Verifizierungskriterien völlig ausreichend, um eine Aufnahme zu rechtfertigen. Wir laufen in keine Probleme, wenn wir hier weitaus mehr Lemmas haben als jede Papierenzyklopädie.

Bei den "Dingen" sieht das anders aus. Eine Enzylopädie erklärt also, was eine Schraube (ein Begriff) ist, aber sie erklärt nicht, was die Schraube an der hinteren linken Bremsbacke am Fahrrad von Ulrich Fuchs (ein Gegenstand) ist.

Eine Enzyklopädie unterscheidet sich also grundsätzlich von z.B. einem Auktionskatalog. Sie erklärt zwar, was eine Hellebarde ist, aber sie führt nicht 200 einzelne Hellebarden auf, mit einer Beschreibung, was an der jeweiligen Hellebarde nun das interessante ist. Das ist Aufgabe spezieller Verzeichnisse von Gegenständen bzw. Dingen. Anders ausgedrückt: Begriffe gibt es ein paar Millionen, die Dinge auf dieser Welt jedoch sind Legion.

Eine Ausnahme besteht immer dann, wenn ein bestimmter Gegenstand allgemein so wichtig geworden ist, dass er im Grunde einen eigenen Begriff darstellen. Das sind also Dinge, die man kennen sollte. Die sind das, was ich als "enzyklopädisch relevant" bezeichne.

Uli führt hier einen interessanten Punkt an, der die Diskussion leider komplizierter macht (wie das leider bei guten Diskussionen häufig ist); wir sind uns nämlich überhaupt nicht einig darüber, was wir unter "Enzyklopädie" verstehen, bzw. was unser gedrucktes Vorbild ist.
Ein Beispiel zu Illustration, das ich mir gestern gerade in der Berliner Staatsbibliothek ausführlich angeschaut habe: Der Ersch/Gruber (erschienen von 1818 und 1889) umfaßt acht (!) dicke Bände zum Lemma Griechenland (1. Section, Bd. 80-87; mythische Gestalten, griechische Philosophen sind natürlich separat lemmatisiert). Diese Bände gehen verdammt tief ins Detail und machen eigentlich genau das, was Uli oben entsprechend mit seinem "Hellebarden"-Beispiel als un-enzyklopädisch bezeichnet hat, nämlich beispielsweise das Erörtern von Details von irgendwelchen abgelegenen Tempeln, wobei im heutigen Baedeker nichtmal der Tempel erwähnt wird. Da die "Allgemeine Encyclopädie" unbestreitbar zu den Prototypen einer bestimmten Form von Enzyklopädie gehört, können wir jetzt immerhin schon mal konstatieren, dass wir nach Ulis Verständnis offensichtlich etwas anderes machen als Ersch und Gruber, die mit ihren 167 Bänden nur bis zum Lemma Phyxius gekommen sind.
Die engere Begrenzung des Wissens wird (wieder) eingeführt mit dem Konversationslexikon, das allerdings dem Zwecke der Konversation und nicht dem der Wissenschaft diente; mit Brockhaus, Meyer, Herder und Pierer wurde die Begrenzung des Umfangs (so um die 12 bis 20 Bände) und damit eine verschärfte Lemmaselektion eingeführt. Uli sieht uns also anscheinend mehr in der Tradition der Konversationslexika (die immerhin später zumindest teilweise in "enzyklopädisches Lexikon" umbenannt wurden). Immerhin kommen wir so doch dem Verständnis von "Enzyklopädie" näher, nämlich im Sinne einer generalisierenden Darstellung von Dingen, die relevant sind für eine erweiterte Allgemeinbildung; das würde spezialisierte Inhalte ausgrenzen, die sich nicht generalisieren (also auf relativ abstrakte Lemmata zurückführen) lassen; als Ausnahmen werden dann Begriffe zugelassen, die eine Bedeutung erlangt haben, die sie aus der generalisierbaren Masse herausheben. In diesem Verständnis operiert m.E. auch Brockhaus; der kennt mittlerweile zwar Google (als wichtigste Suchmaschine und zentrales Hilfsmittel zum Benutzen des Interne), nicht jedoch Ebay (zwar Marktführer, aber nicht wichtig zum Benutzen des Internet).
Die Frage, die wir jetzt klären sollten, lautet: Wollen wir uns wirklich in der Tradition eines Konversationslexikons verorten, dessen Stoffmenge physikalisch durch den Umfang von 12 bis 20 Bänden begrenzt ist, oder wollen wir die Befreiung von dieser physikalischen Limitierung durch elektronische Datenspeicherung und -verarbeitung gezielt ausnutzen und uns daher eher an dem Projekt von Ersch/Gruber orientieren? --asb 21:00, 28. Apr 2004 (CEST)


Fakt 1: Die Wikipedia ist mehr als Hypertext

Die Wikipedia ist kein reiner Hypertext. Davon auszugehen, ist grundsätzlich falsch. Die Wikipedia benutzt Artikelnamen, die etwas aussagen. Wenn ich den Artikel "Elektrofachgeschäft" aufrufe, erwarte ich Informationen über das Grundsätzliche von Elektrofachgeschäften. Ich erwarte nicht die Telefonnummer von Elektro Meier in Posemuckel. Der Unterschied zum Hypertext ist, dass wir diese Artikelnamen als Sucheinstieg haben.

Weiterhin hat die Wikipedia (oder sollte sie zumindest haben) eine Volltext-Suchfunktion. Das heißt, Benutzer können mit dem Suchbegriff "Elektrofachgeschäft" einsteigen und erwarten sich dann Informationen über Elektrofachgeschäfte im Allgemeinen. Auch hier erwarten sie nicht, die Telefonnummer der Elektrofachgeschäfte in Posemuckel zu erfahren, dafür würden sie in die gelben Seiten sehen. Bleibt die Frage, ob man die Wikipedia dahin bekäme, die gelben Seiten zu ersetzen, und der Anwender erwarten könne, die Telefonnummer zu sehen. Unten wird sich zeigen, dass das mit der Wikipedia nicht gehen wird.

Grundproblem 1: Wir haben nicht genug Lemmata für alle Dinge

Die Wikipedia ist ein Wiki. Das heißt, alle Artikel sind unter ihrem Namen abgelegt. Es können keine zwei Artikel den selben Namen haben.

Das ist anders, als spezialisierte Datenbanken aufgebaut sind. In einer Musikdatenbank etwa würde ein Eintrag unter einem eindeutigen Schlüssel (z.B. "767871323") auch, aber nicht nur mit einem beschreibenden Namen aufzufinden sein. Die Aufnahme, die Frank Sinatra vielleicht von As time goes by gemacht hätte, würde in einer Datenbank also folgendermaßen abgelegt sein: Titel: As Time Goes By / Hauptkünstler: Frank Sinatra / Aufnahmedatum: 30.4.1960. Das wären drei einzelne Felder, die den Artikel eindeutig machen. So lassen sich aus der Datenbank zum Beispiel alle Stücke heraussuchen, die Frank Sinatra aufgenommen hat, und es kann mehrere Stücke geben, die As time goes by heißen.

In der Wikipedia ist das anders. Hier muss alles, was einen Artikel eindeutig klassifiziert, in den Artikelnamen hineingepackt werden.

Wollten wir also zum Beispiel alle Songs aller Interpreten haben, so müssten wir den Artikel As time goes by in zig Versionen haben, weil ihn zig Leute gesungen haben. Wir hätten also neben As time goes by (Film) (die Fortsetzung von Casablana) noch As time goes by (Musik, Dooley Wilson) (die Filmmusik), As time goes by (Musik, Frank Sinatra), As Time Goes by (Musik, Frank Sinatra, spätere Aufnahme), As Time Goes by (Musik, Frank Sinatra, spätere Aufnahme, remix von 1999) etc.. und der Trompeter, der beim letzten mitgespielt hat, hat eben nicht mehr As time goes by aufgenommen, sondern As Time Goes by (Musik, Frank Sinatra, spätere Aufnahme, remix von 1999). Und genau da liegen die Probleme, weil das kein Mensch mehr vernünftig verlinken kann.

Ein anderes Beispiel sind Rezepte. Auch hier werden wir Schwierigkeiten bekommen, wenn wir zum Beispiel Rezepte vernünftig zugänglich aufnehmen wollten. Mit einem Artikelnamen Roulade vom Flugentenbrüstchen in Sahnesoße an Spaghettigratin auf Balsamico-Rosenkohldressing wird jeder, der ihn verwenden soll, wahnsinnig, und was machen wir, wenn noch ein zweites Rezept kommt, das auch Roulade vom Flugentenbrüstchen in Sahnesoße an Spaghettigratin auf Balsamico-Rosenkohldressing beschreibt, aber etwas weniger Balsamico verwendet. Nennen wir den Artikel dann Roulade vom Flugentenbrüstchen in Sahnesoße an Spaghettigratin auf Balsamico-Rosenkohldressing mit etwas weniger Balsamico als bei "Roulade vom Flugentenbrüstchen in Sahnesoße an Spaghettigratin auf Balsamico-Rosenkohldressing"?

Grundproblem 2: Rauschen

Eine Enzyklopädie hat mitnichten die Aufgabe, das Wissen der Welt zu sammeln. Mal ganz abgesehen davon, dass das schon aus Prinzip unmöglich ist (weil das Wissen über das Wissen wiederum zum Wissen gehört, und man in einen unendliche Rekursion gerät), ist der wesentliche Gag einer Enzyklopädie der, das Wissen abrufbar zu machen. Anders formuliert: Es nützt uns nichts, wenn die Wikipedia ein Datengrab ist, in dem man das, was man sucht, nicht findet, weil man vor lauter Wald den Baum nicht sieht.

Nehmen wir den Benutzer, der Informationen über "Elektrofachgeschäft" sucht. Er kann zwei grundsätzliche Anliegen haben: Erstens, er will etwas über das Elektrofachgeschäft in seiner Stadt wissen, dann sucht er nach Informationen über ein Ding. Oder er sucht Informationen über Elektrofachgeschäfte im allgemeinen, dann sucht er nach Informationen über einen Begriff. Grundsätzlich kann eine Suche nur eines von beiden Anliegen sinnvoll befriedigen: Entweder sie ist so ausgelegt, dass sie schnell das richtige Ding findet (in dem man beispielsweise nach "Branche:Elektrofachgeschäft", "Stadt:Posemuckel" sucht), oder sie ist so ausgelegt, dass sie Informationen zum Begriff liefert: Dann sollte eine Suche nach Elektrofachgeschäft beispielswiese die wichtige Information im Artikel Kaufhaus finden, dass diese "den Elektrofachgeschäften Umsatz wegnehmen". Dann sollte der Benutzer allerdings nur die Informationen erhalten, die zum Begriff Elektrofachgeschäft gehören. Die Telefonnummern der 10293 Elektrofachgeschäfte Deutschlands, Geburtsdaten der 23242 Elektrofachgeschäftsführer, interessieren dann absolut nicht, weil sie das eigentliche Suchergebnis verrauschen. Bitte daran denken, dass man in einen Hypertext nicht nur über Links, sondern auch über die Volltextsuche einsteigen möchte, eben um bspw. die obige Information mit den Kaufhäusern zu finden.

Die Wikipedia als textorientiertes System wird Suchanfragen der ersten Art (nach Dingen) nie richtig bedienen können. Dazu ist sie von ihrem EDV-technischen Aufbau her absolut nicht konzipiert, weil die Daten unstrukturiert abgelegt werden. EDV-Systeme, die auf die spezifischen Ding-Kategorien eingehen (etwa eine Filmdatenbank sind, die gelben Seiten sind, ein Softwarekatalog sind etc.) werden der Wikipedia in allen diesbezüglichen Suchanfragen hunderttausendmal überlegen sein, weil die Datenstrukturen dort für die Suche optimiert sind ("Zeige mit alle Elektrofachgeschäfte im Umkreis von 1 km um die Hinterwegstraße in Posemuckel", "Zeige mir alle Filme, in denen Bogart und die Hepburn gleichzeitig spielen", "Zeige mir alle erotisierenden Rezepte, die ich mit einer Zucchini, einer Flasche Orangensaft und einem Harzer Roller machen kann" etc.) Wikipedia wird das nie können. (Wenn sie es kann, weil sie beispielsweise mit einem Filmdatenbankmodul erweitert wurde, ist sie nicht die Wikipedia, über die wir heute reden, und für die wir heute Strategien finden müssen.)

Es bleibt als ureigenste Aufgabe der Wikipedia, dem Anwender bei Suchanfragen vom Typ 2 (nämlich nach Begriffen) möglichst viel Information zu liefern. Wenn er aber nach Begriffen sucht, wird die Information über Dinge das Ergebnis zwangsläufig verrauschen. Die einzige Möglichkeit, dem Benutzer dieses Rauschen zu ersparen ist es, die Texte über Dinge in einem erträglichen Rahmen zu halten. In der Regel ist der Rahmen dann erträglich, wenn das Ding eine Besonderheit hat, die von allgemeinem Interesse ist. Das erste Elektrofachgeschäft Deutschlands zu sein wäre so eine Besonderheit: Jemand, der nach dem Begriff Elektrofachgeschäft sucht, ist an der Information über dieses spezielle Ding vermutlich durchaus interessiert. Was der Wikipedia aber nicht passieren darf, ist, bei einer Volltextsuche zum Stichwort "Elektrofachgeschäft" das zu liefern, was google liefer: [1] In Bezuf auf die Suche nach dem Begriff ist diese Ergebnismenge nämlich völlig unbrauchbar.

Grundproblem 3: Der Aktualitätsbezug von neuen Artikeln führt bei abseitigen Themen zu Fehlern in alten Artikeln

Wikipedia ist, zu dem Zeitpunkt, als dies geschrieben wird, 3 Jahre alt. Bis jetzt brüsten wir uns, aktueller zu sein als jede Enzyklopädie. Aber das wird bald nach hinten losgehen. Wir werden umso unaktueller, je weiter ab vom medialen Geschehen ein Gegenstand liegt.

Aktualitätsbezog betrifft meistens wiederum Dinge, nicht Begriffe: Ein Krieg wird auch in fünf Jahren noch ein Krieg sein, aber der Irak wird in fünf Jahren ein anderer sein als heute. Die Wikipedia tendiert dazu, bei aktuellen Ereignissen sehr schnell Dinge aufzunehmen, die hiervon betroffen sind. Die Pflege der Artikel unterbleibt aber erfahrungsgemäß, sobald das Thema aus den Medien raus ist.

Beispiel: ISAF, Abschnitt "Führung": "voraussichtlich bis zum 17. Juli 2003 führt Brigadegeneral Werner Freers die KMNB" heute ist der 22. Mai 2004. Aha.

Solche Probleme werden nun aber umso größer, je weiter ab vom Schuss das Thema ist, und je weniger Leute den Artikel a) bemerken und b) aktualisieren können. Schon bei einem relevanten Thema wie der ISAF, das ab und zu ja medial aufkippt, haben wir solche Probleme. Aber was machen wir in fünf Jahren mit einem Artikel zum Thekenverein Spielvereinigung Dorfschenke Hinterdupfing, der heute eingestellt wird, mit vollen Angaben zum Trainer, den Mitgliedern und dem letzten Ergebnis gegen die alten Hunde Bimsenburg (3:2 nach Verlängerung) und der seit dem nie wieder angefasst wurde?. Oder der Newcomerband AAA - The picklings, die in Berlin-Reinickendorf schon einen ganzen Auftritt imn einem Jugendclub hatte, und die in zwei Wochen auseinanderfallen wird, weil der Bassist was mit der Sängerin angefangen hat? Steht der Artikel immer noch da in fünf Jahren, mit dem schönen Schlussatz "ihnen kann man eine große Zukunft prophezeien"? Findet man den Artikel gar, wenn man was über Berlin wissen möchte, an erster Stelle?

Artikel zu unrelevanten, nur ein paar Leutchen interessierenden Dingen(!) werden nicht gepflegt. Die Artikel, inhaltlich dürftig wie sie meist sind, sind dann eben in ein paar Jahren nicht mehr einfach nur veraltet. Sie sind 100% falsch. Das gilt für die o.g. Newcomerband genauso wie für das 150-Seelendorf in Niedersachen ("Für 2001 ist der Bau einer Umgehungsstraße geplant"), die 3. Weltkonferenz der Harfenbauer ("Es steht zu vermuten, dass auf dieser Konferenz, die voraussichtlich im Herbst 2002 stattfinden wird, Herr Soundso zum Vorsitz gewählt wird"), oder die im Jahr 2005 längst eingestampfte Opensource-Software "YAW - Yet another wiki: Dieses Projekt, das 2001 gestartet wurde und sich derzeit (2002) noch in der Planungsphase befindet, hat das Ziel, eine Software zu erstellen, mit der sogenannte Wikis im Internet vielleicht eines Tages dazu verwendet werden können, eine Enzyklopädie zu erstellen".

Anmerkungen

Es folgen mittlerweile recht zusammenhanglose Kommentare, weil man wieder mal eine Artikelseite mit einer Diskussionsseite verwechselt hat ;-)

Warum nicht? Ich bin mir bewußt, das es praktisch nicht machbar ist, aber man kann es Versuchen. Vieles pegelt sich von selber ein. Das Problem ist doch, das letztendlich jeder für sich selbst, vor seinem eigenem Terminal, hinwurstelt. Eigentlich müßten sich für verschiedene Dinge die Leute, die thematisch an einer Sache arbeiten, zusammensetzten, und durchdiskutieren, wie ihre Position ist. Um die Mathematik wieder hervorzukramen, ist fast eine Ausnahme, weil sie letztlich nicht viele verschiedene Standpunkte (falls überhaupt) zuläßt. Die Struktur ist das Problem. Nicht die Inhalte. Was ich nicht lesen will, das lese ich halt nicht. Aber was mich interessiert, das soll dann für mich eingängig sein, oder wenn ich wissend bin, die richtige Struktur haben. --Arbol01 14:38, 28. Apr 2004 (CEST)

Unix-Kommandos sind auch eindeutig, das ist definitiv kein Lemmatisierungsproblem eines begrenzten Begriffsraumes. Das Problem hierbei ist der irgendwie bei uns inhärende Gleichbehandlungsgrundsatz ("wenn ls einen eigenen Artikel hat, muß auch Windows-Tray einen eigenen Artikel bekommen dürfen"). Deshalb werden momentan KDE-Programme unter KDE aggregiert, um ungefähr gleich einzuordnende "Gewichtigkeiten" zu bekommen. --asb 21:00, 28. Apr 2004 (CEST)

Bei Rezepten sehe ich weder ein Lemmatisierungsproblem (die könnte man m.E. wieder aggregieren; warum sollten unter Schwarzwälder Kirschtorte nicht drei verschiedene Rezepte abgehandelt werden?), noch ein Gleichbehandlungsproblem. Wir tun uns damit schwer, weil keine halbwegs aktuelle Enzyklopädie Back- oder Kochrezepte aufnimmt. Die Ursache dafür ist m.E. eine andere; ebenso wie um 1600 handwerkliche Tätigkeiten abschätzig behandelt und in den damaligen Enzyklopädien durchweg ignoriert wurden, haben die meisten von uns das Bauchgefühl, dass Rezepte nicht in eine Enzyklopädie gehören. Ich glaube nicht, daß das irgendjemand rational begründen kann, aber einen relativ breiten Konsens wird es dazu vermutlich geben. Zu den enzyklopädisch revolutionären Neuerungen der Encyclopédie gehörte, dass erstmals das triviale Handwerk enzyklopädisch abgehandelt wurde. Die damalige Motivation war aufklärerisch begründet, Handwerk war die Grundlage der modernen Wissenschaften und damit des Fortschritts, um die Welt adäquat abzubilden waren Diderot und d'Alembert geradezu gezwungen, ihr Themenspektrum zu erweitern. Von Rezepten könnte man das heute wohl nicht sagen, möglicherweise aber von diesem Kübelbock <sp?> oder anderen Vertretern der Trivialkultur; möglicherweise muß eine Enzyklopädie sich heute in die Niederungen der Trivialkultur herabbewegen, um die heutige Welt adäquat abzubilden (was übrigens m.E. geradezu antiaufklärerisch wäre). --asb 21:00, 28. Apr 2004 (CEST)

Die anderen von Uli genannten Punkte sind weitaus gravierender für die Lemmatisierung; tatsächlich bekommen wir potenziell Namensprobleme bei Musiktiteln, Filmtiteln und Rezepten. Filmlexika lösen das durch "Titel (Jahr)" bzw. "Titel (Jahr/II)", richtig eklig wird es aber spätestens bei Musiktiteln. Die Frage ist dabei, ob uns das notwendigerweise davon abhalten muß, derartige Themenbereiche aufzunehmen; m.E. spielen auch hier noch ganz andere Faktoren eine Rolle... --asb 21:00, 28. Apr 2004 (CEST)

@Asb: Wohltuend mal eine eine differenzierte und kenntnisreiche Betrachtung zu lesen! Zu den Rezepten kann ich dir nur zustimmen. Ich denke, dass man in der Wikipedia aber auch auf anderen Gebieten Namensprobleme, so wie angemessene Darstellung und NPOV lokalisieren kann. Das heisst, diejenigen, die Kenntnisse von und Liebe zu einem Thema haben, müssen entscheiden. Das kann kein schematischer, sondern muss ein dynamischer Prozess sein. Wenn es z.B. in der Wikipedia gerade viele Informatiker, aber wenige Literaten gibt, wird die Darstellung der Informatik automatisch anders sein als die der Literatur. Die Probleme entstehen dann, wenn jemand, der nicht einmal Grundkenntnisse auf einem Gebiet hat, glaubt den anderen Vorschriften machen zu müssen. Diskussion:Die Entdeckung des Himmels zeigt das sehr deutlich. Hier ist doch nicht der Namen das Problem, sondern die frappierende Unbildung des Löschanträgers, die sich mit Unfähigkeit, differenziert zu argumentieren, paart. Man muss daher aufpassen, dass die Lösung nicht problematischer ist, als das Problem, das zu lösen sie vorgibt. Heizer 22:37, 28. Apr 2004 (CEST)

Uli schreibt: "Eine Enzyklopädie hat mitnichten die Aufgabe, das Wisssen der Welt zu sammeln". Die Wikipedia wäre die erste Enzyklopädie, die dieden Anspruch nicht erhebt; das Sammeln und Präsentieren des Wissens der Welt ist das enzyklopädische Merkmal aller Enzyklopädien seit über 2000 Jahren. Belege: Aktuelle Brockhaus-Werbung ("Brockhaus ? das Wissen der Welt", [2]) und Britannica-Werbung von 1911 ("The Sum of Human Knowledge"); entsprechende Belege kann man in nahezu jeder größeren Enzyklopädie in Band 1 (Vorrede, Discours préliminaire, Artikel wie "Encyclopédie" etc.). Wichtig ist dabei natürlich, den Subtext zu lesen (bei der Britannica ist es die Summe des menschlichen Wissens, Diderot spricht von einer lexikalischen Zusammenfassung usw.), es gibt also immer eine inhärente Programmatik, was das "gesamte Wissen der Welt" konstituiert. --asb 20:24, 29. Apr 2004 (CEST)

Sei doch nicht päpstlicher als der Papst, menno: Mir gings vor allem um den Unterschied sammeln<>wiederfinden. Also, der Satz soll heißen: "Eine Enzyklopädie hat mitnichten die Aufgabe, das Wisssen der Welt zu sammeln" - jetzt klarer? Uli 10:16, 30. Apr 2004 (CEST)

@Uli: Du beschreibst unter Grundproblem 2: Rauschen sehr zutreffend ein Findeproblem (Information Retrieval); ich glaube allerdings, man sollte das, was gesammelt wird, trennen von der Methode, wie man es findet; weil es automatisch ein Findeproblem ab einer bestimmten Größe gibt, ergibt sich daraus noch nicht zwangsläufig die Notwendigkeit für exklusionistische Relevanzkriterien (wenn wir davon ausgehen, dass wir nicht ab einer bestimmten Artikelzahl die Schotten dicht machen und keine neuen Artikel mehr zulassen, wenn wir also von einem weiteren Wachstum ausgehen, dann werden wir in jedem Fall zunehmend mit Findeproblemen umgehen müssen). Man könnte ebenso nach besseren Lösungen für das Findeproblem suchen, sprich die Relevanz der Suchergebnisse für eine bestimmte Suchanfrage erhöhen. Genau das hat ja auch Google gegenüber Altavista geleistet; die Lösung für das Findeproblem wäre also möglicherweise die Entwicklung eines schlauen Retrieval-Algorithmus für die Wikipedia.--asb 20:24, 29. Apr 2004 (CEST)

Ich sehe keine Probleme bei "Wir haben nicht genug Lemmata für alle Dinge" oder "Rauschen"(Finden eines Artikels). Ich sehe die Problematik ganz woanders. Darin, dass wenig (weniger als möglich wäre) Arbeit aufgebracht wird sinnvolle Artikel zu erstellen. Und das Löschen von Artikeln mit sinnvollem Inhalt vernichtet naturlich die Infos und (in meinen Augen noch schlimmer) verscheucht Artikel Schreiber. Die Problematik ist also keineswegs zuviel sinnvolle Artikel zu haben, sondern zuwenig sinnvolle Artikel zu bekommen. Jeder kann sich ja für sich selbst beurteilen, ob ein Thema so wichtig ist, dass er einen Artikel darüber schreiben möchte, aber diese Vorstellung darin münden zu lassen ANDERE Artikel zu löschen halte ich für falsch. 2 Beispiele dazu:

  • 1. Glaubt irgendjemand, dass der Ersch/Gruber bei Phyxius aufhört weil ZUVIELE Artikel in dem erschienenen Teil stehen? Wohl kaum, der Grund wird sein, dass ZUWENIG Arbeit für die "fehlenden" Artikel aufgebracht wurde, und da bringt doch Löschen von vorhandenen Artikeln gar nichts.
  • 2.Ich mußte mal JCL, eine Sprache für Großrechner, aus den 60 Jahren lernen, und die war für heutige Vorstellungen sehr userunfreundlich. Der Grund war, dass menschliche Arbeitskraft beim Programmieren gegenüber der Hardware damals sehr preiswert war. Aber die Wikipedia wird von "Freiwilligen" geschrieben und wenn, dass ausbleibt wird das Projekt nicht besser.--Dirk33 00:51, 6. Mai 2004 (CEST)

Anmerkungen zu "Grundproblemen"

  • zu Problem eins: Solange Wikipedia kein Personenregister ist sehe kein Problem bei der Anzahl der Lemma. Und manchmal wird es halt eine BKS.
  • zu Problem 2: Die wiki Artikel sind spitzenmäßig mit internen Links verbunden, da ist die Gefahr des Rauschens nicht so hoch.
  • zu Problem drei: Wenn jemand schreibt zu dem und dem Zeitpunkt war etwas so und so wird das nie falsch. Man sollte also beim Artikel schreiben daran denken das ein Artikel längere Zeit bestand haben könnte und nicht nur ein Moment zu lesen ist und dementsprechend formulieren. Bei einer freiwilligen Arbeit kann man niemand dazu zwingen alle Artikel aktuell zu halten. Aber wenn sich die Wikipedia sehr restrektiv gegen neue Artikel und deren Autorren verhält wird es noch schwieriger die Aktualität der Artikel zu waren, da weniger Mitarbeiter da sind.--Dirk33 01:24, 22. Okt 2004 (CEST)

Ansatz 2: Inklusionistische Positionen

Die Inklusionisten gehen davon aus, dass das "Wissen der Welt" weiter gefasst werden kann (muß?), als es konventionelle Enzyklopädie à la Brockhaus und Britannica tun; sie vertreten den Standpunkt, die klassischen enzyklopädischen Relevanzkriterien erheblich zu lockern, ganz fallen zu lassen oder durch einen alternativen Satz an Kriterien zu ersetzen. Der Ansatz der Inklusionisten ist im Verständnis der von Konversationslexika abgeleiteten Enzyklopädien à la Brockhaus unenzyklopädisch, ist aber viel näher am eigentlichen Anliegen der Enzyklopädie, das "Wissen der Welt zu sammeln und zu präsentieren" (vgl. Geschichte). Durch das elektronische Speicherprinzip sind Begenzungen von Speicherplatz (Stellplatz für eine gedruckte Enzyklopädie im Regal) und durch das Wiki-Prinzip ökonomische Begrenzungen (Anzahl der zu bezahlenden Redakteure) weitgehend aufgehoben; Wikipedia hat daher erstmals das Potenzial, zur ersten wirklich umfassenden Enzyklopädie im ursprünglichen Sinne überhaupt zu werden. An Stelle konventionelle Ausgrenzungskriterien versuchen die Inklusionisten, alternative Mechanismen zur Handhabung der Informationsflut zu entwickelen. Ich habe Kurts Position mal den Exklusionisten zugeordnet, ich hoffe, das ist tendenziell so vertretbar. --asb 11:22, 28. Apr 2004 (CEST)

Arbeitsthese: Wir brauchen keine Ausgrenzungskriterien für die Inklusion oder Exklusion von Artikeln. Das nach meiner Einschätzung für uns wichtigste Instrument zur Steuerung ist nicht die Lemmaselektion, also die Schlagwortauswahl durch "Zensur" oder "Löschen", sondern die gezielte Ent- oder Verlinkung von Artikeln. Was schlecht verlinkt ist, wird gar nicht oder schlecht gefunden; keine Spamagentur wird sich die Mühe machen, ein ganzes Begriffsnetz in wichtigen Artikeln anzulegen, um von wichtigen Artikeln auf ihre Unternehmensartikel zu kommen. Selbst wenn sich eine Agentur diesem Aufwand unterziehen würde: Es würde auffallen.

Ich denke daher, Elektro-Meyer kann einen Artikel in der Wikipedia schreiben; er wird auf NPOV geprüft werden, wenn er in den neuen Artikeln auftaucht, und er wird erneut geprüft werden, wenn er erneut bearbeitet wurde. Er wird auffallen, wenn er sich selbst in jedem Elektroartikel verlinkt. Er ist findbar, wenn sich jemand für Elektro-Meyer interessiert, und er stört nicht, wenn er nur in dem Umfang verlinkt ist, der für ihn relevant ist: Beispielsweise als Elektromeister in Posemuckel. --asb 00:54, 24. Apr 2004 (CEST)


Die Diskussion um enzyklopädische Relevanz ist müßig, die meisten Nutzer, die "Irrelevanz" als Argument bei den Löschkandidaten anführen zeigen nur eins: ihren beschränkten Horizont. (Ich bin übrigens verwundert wie häufig gerade neue Nutzer zu wissen glauben, was nicht in die Wikipedia gehört (und damit andere Neulinge vor den Kopf stoßen und wieder vertreiben).)

Das einzige Ausschlusskriterium für ein Lemma kann die fehlende Verifizierbarkeit der im Artikel geschilderten Fakten (*) anhand von Quellen sein, sonst nichts. Das genügt, um Wikipedia nicht ins uferlose wachsen zu lassen. Verifizierbarkeit, zusammen mit dem Neutralen Standpunkt und der enzyklopädischen Form genügen m.M.n. als die drei Grundpfeiler beim Erstellen unserer Artikel. Alle auf Wikipedia:Was Wikipedia nicht ist genannten Punkte lassen sich daraus ableiten, die Relevanz eines Lemmas im Voraus zu beurteilen ist nicht notwendig.

Die Diskussion um die Verifizierbarkeit der dargestellen Fakten, also bspw. Frage, welche Quellen wir gelten lassen, halte ich für sehr viel hilfreicher und spannender. Vielleicht auf Wikipedia:Verifizierbarkeit oder Wikipedia:Quellen?

(*) Nur damit ich nicht falsch verstanden werde: Als Faktum gilt für mich z.B. die Aussage "Bush sagte, im Irak gäbe es Massenvernichtungswaffen" - ob es wirklich welche gab ist dabei unwichtig. Das wird ja manchmal durcheinandergeworfen. --Kurt Jansson 02:42, 28. Apr 2004 (CEST)

Gerade mich wundert es nicht, daß besonder Neulinge (ich war/bin auch einer) in der Hinsicht auf Löschkandidaten, negativ auffallen. Sie sind neu, motieviert, und haben ihre Bereiche im Kopf. Alles andere zählt nicht. Das man Dinge, die einen nicht (oder noch nicht) interessieren, auch ignorieren kann, statt sie zu vernichten, das kommt erst mit der Zeit. Auch ich hägtte es gerne gehabt, das 90% (oder 99%) gelöscht wird, und habe dann später begriffen, das dies kein gangbarer Weg ist.
Und das Brett vorm Kopf, den geistigen Tunnelblick haben ja wohl viele bis alle. --Arbol01 14:38, 28. Apr 2004 (CEST)
Um das etwas zu ergänzen: Bei mir war es gerade zu Anfang so, dass ich die Wikipedia als eine selektierende Enzyklopädie gesehen habe. Der Herausgeber einer Enzyklopädie wählt ja die Artikel, Orte, Personen usw. danach aus, ob sie eine langfristig wissenswerte Information sind, die er seinen Lesern bieten kann. So würde ich ein Fernsehluder, das zwei Tage Berühmtheit durch irgendeine Affäre mit einem Star erlangt hat, ganz sicher nicht in eine Enzyklopädie aufnehmen, die vielleicht gedruckt über fünf bis zehn Jahre verkauft und gelesen wird. Ich würde sie aus qualitativen Gründen auch nicht in die Wikipedia aufnehmen, weil der Wissenswert die Dauer des Artikelschreibens kaum übersteht. Die Einführungstexte, die man als neuer User hier liest, unterstützen auch diese Einstellung.
Nun ist die Wikipedia natürlich etwas Anderes als eine althergebrachte Enzyklopädie. Die Wikipedia muss nicht so stark selektieren, sie kann akkumulieren. Der Druck, der von Seiten der Fans eines Artikels (einer Person, einer bestimmtent neuen Privattheorie, einer lokalen Punkgruppe...) kommt, ist zudem manchmal gewaltig. Ich bin daher inzwischen dazu übergegangen, Artikel, die ich für wenig (und nur kurzfristig) wissenswert halte, zu ignorieren. Es wäre nicht schade, wenn sie fehlen, aber stören tun sie auch nicht. Jedenfalls jetzt noch nicht - im Laufe der Zeit wird der Anteil der ungepflegten, vergessenen Artikel anwachsen, ich bin gespannt, wie dann die Pflege der Wikipedia aussehen wird. (Gerade die wachsende Zahl an Personenartikeln könnte ein Problem werden. Nach meiner Meinung sollte man da schon stärker selektieren als bisher.)
Die Artikel stören insoweit nicht, als die Wikipedia keine alphabetisch sortierte Enzyklopädie ist und man beim Durchblättern nicht über störende Füllartikel stolpert. Meist bewegt man sich in einem Themengebiet und folgt den thematischen Fäden.
Ein kategorisches Nein gibt es aber von mir zu Artikeln, wenn (reine) Werbung, Theoriebildung (meist sind es ja ziemlich wilde, obskure Neuschöpfungen), Fehlinformationen, (reine) Propaganda, unsubstanziierte Verschwörungstheorien oder jede andere Form von Desinformation in die Wikipedia geschmuggelt werden soll.
Alles, was ich bis hierher schrieb, betrifft die Auswahl der Artikel. Ein ganz anderes Thema ist der manchmal katastrophale Stil, in dem (meist neue) Artikel geschrieben sind. -- Terabyte 22:35, 15. Mai 2004 (CEST)

Ich bin u.A. dafür, das man die Programmiesprachen (insbesondere die "Script-Sprachen") ausführlicher abhandelt, möglichtst in einem direkten Vergleich mitienander, und damit über das kindische "hello world" bzw. "hallo welt" hinausgeht. Das umfaßt Ein und Ausgabe, String Operationen, Arrays und Mathematische Operationen (inklusive Beispielen). Ähnliches sehe ich für die Mathematik. Es sollte dem Interessieren möglich sein, aus den entsprechenden Artikeln z.B. das Ableiten zu verstehen und anzuwenden. Um über die derzeitigen Möglichkeiten herauszugehen: Wenn jemand auf einen Komponisten, mit seinen Stücken stößt, sollte es ihm möglich sein, über midi oder mp3, in die Einzelnen Stücke reinzuhören. Bei geometrischen Objekten sollte der Interessierte im Idealfall die Objekte annfassen, oder zumindest "anfassen" können. Dem Interessierten sollte durch Wikipedia dämmern, daß alles mit allem zusammenhängt. Nicht weniger. Wikipedia sollte keine 1:1 Internet-version eines "interaktivem" Nachsclagewerk auf CD sein. --Arbol01 12:10, 28. Apr 2004 (CEST)

Konkrete Vorschläge für Kriterien zur "enzyklopädischen Relevanz"

  • keine Kriterien Rat 10:55, 13. Jul 2004 (CEST)