Tools und Ressourcen

Aus linguistische-wikipedistik
Zur Navigation springen Zur Suche springen

Zur (sprachwissenschaftlichen und diskursanalytischen) Untersuchung der Wikipedia gibt es zahlreiche Tools und Ressourcen, die im Folgenden beschrieben werden:


Projekte

Contropedia

Diese Plattform ermöglicht die Echtzeit-Analyse und Visualisierung von Kontroversen in Wikipedia-Artikeln. Anhand der Versionsgeschichte und der Diskussionen über einen Artikel bzw. miteinander verwandten Artikeln wird ein Aktivitätenprotokoll generiert, aus welchem die Ausprägung der Kontroversen (‚controversy score‘) extrahiert wird. Die Versionsgeschichte eines Artikels und die dazugehörige Diskussion konstituieren zwei parallele Abläufe von Benutzerinteraktion, welche gemeinsam den Prozess der kollaborativen Erstellung eines Artikels abbilden. Momentan können nur englischsprachige Artikel analysiert werden, eine Erweiterung für andere Sprachen ist in Planung.

http://contropedia.net/


WikiWho

Dieser Algorithmus analysiert die komplette Versionsgeschichte eines Wikipedia-Artikels um zu identifizieren, wer genau welches Textelement zu welchem Zeitpunkt geschrieben, bearbeitet oder entfernt hat. So kann in einer spezifischen (z.B. der aktuellen) Artikelversion mit Hilfe von WikiWho hinsichtlich jeden Wortes (und Sonderzeichens) nachvollzogen werden, welcher Benutzer dieses zuerst eingeführt hat und inwieweit es anschließend gelöscht oder erneut eingeführt worden ist. Das Entwicklerteam postuliert, das einzige Tool dieser Art mit einer solch hohen Genauigkeit (~95%) und wissenschaftlicher Validierung zur Verfügung zu stellen. Die aktuellen Erweiterungen des Tools ermöglichen es, Beziehungen zwischen Lösch- und Reintegrationsprozessen nachzuvollziehen.

http://f-squared.org/wikiwho/


WhoVisual

Whovisual ermöglicht interaktive Visualisierungen zur Erforschung der Artikelgenese, welches sich in die Projekte WhoColor (Alphaversion) und whoVIS (Alphaversion) aufteilt.

WhoColor ermöglicht ein Color-Markup der Originalautoren einzelner Textelemente. Es ist ein JavaScript für die Tamper-/Greasemonkey-Browsererweiterung für Chrome und Firefox. Öffnet man einen englischsprachigen Wikipedia-Artikel, zeichnet es den Text farbig aus und zeigt dadurch die Autoren des Inhaltes auf. Zudem erscheint eine Liste der Autoren, geordnet nach deren prozentualem Textanteil am Artikel sowie (bald) zusätzliche Provenienzinformationen. Es ist damit zum einen möglich, die Diskussion um bestimmte Wörter aufzuzeigen, zum anderen lässt sich der Bearbeitungsverlauf eines Wortes nachvollziehen (Extras nur als Demoversion erhältlich).

WhoVIS ist der Prototyp einer Netzwerk-Visualisierung der Interaktion zwischen Editoren für einzelne Artikel. Er basiert auf den Wörtern/Tokens, welche von Editoren entfernt und wiedereingeführt worden sind. Da sich die Anwendung noch in der Anfangsphase befindet, dauert das Laden der Seite mitunter länger.

http://www.f-squared.org/whovisual/


Suche

Global Wikipedia Article Search

Diese Seite erlaubt es, alle Wikipedia-Hauptseiten nach Artikeln zu durchsuchen, welche den eingegebenen Begriff in den unterschiedlichen Sprachen im Titel tragen. Dadurch werden fehlende Verbindungen zwischen den (verschiedensprachigen) Wikipedia-Artikelseiten offenbart. Dabei leistet die Seite weder eine wörtliche Übersetzung noch eine Volltextsuche, sondern prüft lediglich, ob ein Artikel mit dem eingegebenen Namen existiert. Dadurch ist primär die Suche nach Namen von Personen, Bands, Ortschaften, Tierarten, Jahren usw. sinnvoll. Die Ergebnisse werden in einer Liste mit Angaben zu Land, Größe, Zeitstempel, Mitwirkenden und Weiterleitungen der Artikel angezeigt. Da die Daten von Servern auf der ganzen Welt abgerufen werden, kann die Suche einige Zeit in Anspruch nehmen.

http://vs.aka-online.de/globalwpsearch/


Kategorien

Category Analysis

Diese Seite listet Benutzerbeiträge innerhalb einer Kategorie (Betaversion) hinsichtlich verschiedener Parameter auf. Dazu zählen beispielsweise die betroffenen Seiten, die Benutzer und schließlich die jeweiligen Bearbeitungen. Zudem wird eine monatige Auswertung erstellt, welche hinzugefügte und entfernte Bytes zu allen Artikeln, die Neuanlage von Artikeln, beteiligte Benutzer und deren jeweilige Anteile an den Bearbeitungen enthält. Es kann mit Kategoriennamen nach Artikeln einer Kategorie oder mit Präfixen nach Artikeln einer Unterkategorie gesucht werden. Zur besseren Anwendbarkeit werden Bots und Benutzer mit weniger als zehn Beiträgen in den dargestellten Daten nicht berücksichtigt.

https://tools.wmflabs.org/meta/catanalysis/


CatNap

Diese Seite listet alle Wikipedia-Artikel einer bestimmten Kategorie auf, gruppiert nach anderen Kategorien, in welche sie ebenfalls eingeordnet sind. Eine Gruppe bilden die Artikel der Kategorie, eine andere Gruppe entsteht durch die Auflistung aller anderen Kategorien, in die diese Artikel eingeordnet sind. Dadurch ist auch eine Mehrfachnennung von Artikeln in der Ergebnisliste möglich. Es lassen sich verschiedene Sprachversionen vorauswählen, wobei bei den Ergebnissen immer auch auf Ergebnisse anderer Sprachversionen verwiesen wird. Sollen bestimmte Kategorien bei der Analyse ausgelassen werden, können diese auszulassenden Kategorien in einem Dialogfenster vermerkt werden.

http://tools.wmflabs.org/catnap/


PetScan

Diese Seite kann Listen von Wikipedia-Seiten (und verwandten Projekten) oder Wikidata-Elementen erstellen, die bestimmte Kriterien erfüllen, beispielsweise alle Seiten in einer bestimmten Kategorie oder alle Elemente mit einer bestimmten Eigenschaft. PetScan kann einige temporäre Listen (hier als "Quellen" bezeichnet) auf verschiedene Arten kombinieren, um eine neue Liste zu erstellen. Für längerfristige Beobachtungen können die erstellten Anfragen auch über eine URL gespeichert werden, wobei die Anfrage dann die möglicherweise neuen aktualisierten Projektinhalte ebenfalls berücksichtigt. Zahlreiche einstellbare Parameter ermöglichen äußerst präzise Anfragen, darunter beispielsweise Namensräume, Kategorien, Größe (Byte), aber auch Mindestanzahl der Verlinkungen, letzte Änderungen oder Bot-Aktivität. Das Ausgabeformat der Ergebnisse kann ebenfalls variiert werden, eine ausführliche Anleitung zur Einstellung der Suchparameter ist ebenfalls vorhanden (auch eine vereinfachte deutschsprachige Version).

http://tools.wmflabs.org/catscan2/catscan2.php?interface_language=de&project=wikipedia&language=de


Items by Cat

Dies ist ein Tool, um vorhandene oder fehlende Elemente anhand einer Wikipedia-Kategorie zu finden. Es gibt drei Eingabefelder, die als Offset, Limit und Rekursionsebene bezeichnet werden, wobei entweder die ersten beiden oder das dritte verwendet werden können. Ein gesetztes Limit überschreibt die Rekursionsebene, entsprechende Limits ergeben dabei vor allem deshalb Sinn, wenn besonders umfangreiche Kategorien untersucht werden, was gemäß der Nutzerseite zum Tool ohne entsprechendes Limit des Öfteren zu Fehlern der Anwendung führt. Das Eingabefenster der Rekursionsebene ermöglicht die Berücksichtigung von Unterkategorien, wobei der eingegebene Wert die Anzahl der zu berücksichtigenden Unterkategorien (also die ‚Tiefe’) definiert. Gerade hierbei kommt es jedoch ebenfalls aufgrund größerer Datenmengen vermehrt zu Fehlern bei der Anwendung, auf der Nutzerseite zum Tool wird daher eine gewisse Vorsicht bei dieser Funktion empfohlen. Diese Nutzerseite fasst ebenfalls weitere Probleme des Tools zusammen und liefert gleichzeitig eine rudimentäre Anleitung. Das Ausgabeformat der Ergebnisse kann zwischen HTML, Wiki-Markup und einfachem Text variiert werden. Das Tool ist in elf verschiedenen Sprachen verfügbar.

http://tools.wmflabs.org/bene/itemsbycat/


TreeViews

Dieses Tool erstellt eine monatliche Abrufstatistik für Kategorienbäume. Dabei können Start- und Enddatum vom Nutzer eingestellt werden, ebenso wie weitere Parameter, darunter die Sprachversion oder die Untersuchungstiefe. Zusätzlich aktivierbare Optionen erweitern die Suchmöglichkeiten, beispielsweise die automatische Suche in anderen Sprachversionen, die Abfrage der Entstehungszeitpunkte jeder einzelnen Seite oder dein Einbezug jeglicher Seiten, die in nur einer Kategorie vorzufinden sind (standardgemäß werden nur jene Seiten berücksichtigt, die in allen angegebenen Kategorien vorzufinden sind). Verwiesen wird bei diesen Zusatzoptionen auf die möglicherweise stark erhöhte Bearbeitungszeit bei entsprechender Aktivierung. Bei den vom Nutzer angegebenen Kategorien kann ebenfalls durch entsprechende Optionen auch die Diskussionsseite berücksichtigt werden, oder aber die Seiten, welcher in einer bestimmten Kategorie zu finden sind, ausgeschlossen werden. Die Darstellung der Ergebnisse erfolgt tabellarisch mit absteigender Abrufhäufigkeit.

http://tools.wmflabs.org/glamtools/treeviews/


Historie