Wikipedia Diskussion:WikiProjekt Vorlagenauswertung/Archiv/2010

DB-Dump der Vorlagen

Hallo Kolossos und sk

Wir würden gerne probieren anhand der Vorlagen thematische Karten zu erstellen. Das ganze soll im Rahmen einer Bachelorarbeit an der Uni Hannover stattfinden (dauer ca. 6 Monate). Ist es möglich ein DB-Dump zu erhalten oder wäre es einfacher, auf dem Toolserver ein Konto einzurichten, um auf die Daten zuzugreifen? Viele Grüße -- Tobias dahinden 10:39, 25. Mär. 2010 (CET)

Ein Toolserver-Account wäre sicherlich eine gute Möglichkeit direkt auf die Datenbank zuzugreifen. Das sollte auch recht unbürokratisch gehen, da das ggf. über mich geht. Die Dateien liegen auf dem Toolserver bei Stefan Kühn, leider ungepackt und in einem Verzeichnis, das nicht über das Netz zugänglich ist. Dazu kommt, dass die Dateien im Moment leider zerschossen sind, da er im Moment an einer Umstellung arbeitet.
Was für Karten sollen das denn werden? Da braucht Ihr doch hauptsächlich Koordinaten, oder? Die gibt es woanders. Andererseits sind wir auch an Spezialkarten interessiert und haben auf dem Toolserver dafür eine im Aufbau befindliche PostGIS Datenbank. Dafür suche wir wirklich noch Unterstützung. --Kolossos 21:14, 25. Mär. 2010 (CET)
Wir wollen versuchen Karten zu erstellen, in denen z.B. Kraftwerke eingezeichnet sind oder sogar die Energieproduktion. Solche Karten findet man in Atlanten wie dem Diercke oder dem Alexander. Es geht darum, aufzuzeigen, wie man Wikipedia für die Produktion solcher Karten verwenden kann. Dabei ist es nicht entscheidend, dass die Daten auf dem aktuellsten Stand sind. Dann beantrage ich wohl am besten mal einen Toolserveraccount und schaue, ob der Datenbankzugriff für uns ausreicht. Falls es nicht geht, versuche ich den DB-Dump von Wikipedia selber zu parsen (einen Dump habe ich bereits und Stefan Kühn hat mir mal seine Skripte geschickte, damit sollte ich das wohl schaffen).
Die Koodinaten (Wikipedia-World) habe ich und konnte damit auch ein paar interessante Experimente machen. Zum Beispiel lässt sich damit und den Interwikilinks feststellen, wo welche Sprache gesprochen wird (sofern es für diese Sprache eine Wikipedia gibt). Oder ich habe bei einem Artikel über einen Fluss bei jedem Link geschaut, ob er Koordinaten besitzt und diese in einer Karte eingezeichnet. Daraus konnte man den Flussverlauf recht gut erkennen. --Tobias dahinden 09:20, 26. Mär. 2010 (CET)
Zu dem Beispiel mit den Kraftwerken kenne ich allerdings genügend Artikel, die ohne diese Infobox-Vorlage auskommen. Man wird also auf wohl z.T. auch auf dem Kategorienbaum zurückgreifen müssen, dieser ist aber auch auf der Toolserver-Datenbank hinterlegt,müßte allerdings dafür mal "aufgedrösselt" werden. Im Gegensatz zu den in Schulatlanten aufgeführten Datensätzen dürfte man oftmals eine deutlich größere Datenbasis haben, andererseits hat man in der WP nur selten eine Gewähr auf Vollständigkeit. Das muß man einfach beachten.
Zur Info, für dein Beispiel mit dem Fluß haben wir auch schon ein fertiges Skript [1], was einem alle verlinkte Artikel oder alle Koordinaten in einem Artikel ausgibt.
Ja genau, das war sowas. Allerdings habe ich dann noch eine Dichteschätzung angewendet, dann haben Begriffe wie z.B. Deutschland nur einen kleinen Einfluss. Zudem habe ich das mal für Flächen gemacht, etwa um die Grenzen von Landschaftsregionen zu bestimmen. Habe das anhand der Kantone der Schweiz getestet und konnte so 80% der Fläche richtig zuordnen (was ein erstaunlich gutes Resultat ist). Vielleicht sollte ich mal auf einer Seite zusammenstellen, was es so an wissenschaftlichen Artikeln im Bereich Geoinformatik gibt, die Wikipedia-World verwenden.
Auf dem Toolserver kannnst du natürlich Dumps runterladen oder auf die von Stefan runtergeladenen Dumps zugreifen und diese dann mit Pearl oder sonstwas durchscannen. Einen Datenbankzugriff finde ich da aber deutlich einfacher. Einen Volltext-Zugriff auf die Datenbank haben wir leider nicht, aber ein Haufen Tabellen für Kategorien,Interwikilinks,externe Links (z.B. auf den Geohack), diese sind also nach Möglichkeit zu bevorzugen.
Dein Account muss jetzt nur noch von einem Admin freigeschalten werden.
Was die Kartenerstellung angeht, siehe auch: https://wiki.toolserver.org/view/OpenStreetMap#first_steps --Kolossos 13:23, 26. Mär. 2010 (CET)
Hat super geklappt mir dem Anmelden auf dem Toolserver: Herzlichen Dank. Was die Karten und die Vollständigkeit der Karten betrifft, da werde ich da gerne mal die verschiedenen Möglichkeiten ausprobieren. --Tobias dahinden 21:08, 30. Mär. 2010 (CEST)

Fehler in der Statistik

Hallo Leute,

ich weiß nicht, ob das hier noch jemand ließt, aber die Zahl der Einbindungen wird teilweise nicht korrekt im templatetiger angegeben. Vorlage:Begriffsklärung wird als nur vier mal eingebunden angezeigt. --cwbm 20:22, 26. Aug. 2010 (CEST)

Es werden nur Vorlagen mit Parameter innerhalb der Vorlagenauswertung betrachtet. Der Umherirrende 20:33, 26. Aug. 2010 (CEST)
Und wie kann ich dann erfahren, wie oft die Vorlage eingebunden ist (insb. "Begriffsklärungshinweis")? --cwbm 20:35, 26. Aug. 2010 (CEST)
Da wäre noch Spezial:Meistbenutzte Vorlagen, was bis zu 3 Tage alte Daten liefert. Aktuell: 139. Vorlage:Begriffsklärungshinweis ‎(7.688 Links). Alternativ bleibt selber zählen per Linkliste oder per API --Der Umherirrende 20:39, 26. Aug. 2010 (CEST)
Danke ich wußte da war doch was. --cwbm 20:42, 26. Aug. 2010 (CEST)

Neuer Stand?

Hallo,

der letzte Datenstand für dewiki ist wohl vom 15. August 2010 (http://toolserver.org/~kolossos/templatetiger/). Ist geplant, dass irgendwann demnächst ein neuer Stand kommt?

Danke und Gruss,
--S.K. 13:57, 21. Dez. 2010 (CET)

Der letzte verfügbare Dump ist auch vom Oktober, hoffentlich kommt da mal Nachschub von der Foundation. Also, ja wir wollen das Projekte hin und wieder aktualisieren, aber eigentlich sollte da mal was vernünftiges wie Wiki-Data kommen auf das man das Echtzeitzugriff hätte. --Kolossos 22:58, 21. Dez. 2010 (CET)
Danke für den Update. Ich weiss ja nicht, wieviele andere Leute die Vorlagenauswertung nutzen, aber ich finde sie sehr hilfreich und fände es sehr schade, wenn die Auswertungen wegen veralteter Daten nicht mehr so nützlich wären. Danke und Gruß, -- S.K. 21:33, 22. Dez. 2010 (CET)