Tools und Ressourcen
Zur (sprachwissenschaftlichen und diskursanalytischen) Untersuchung der Wikipedia gibt es zahlreiche Tools und Ressourcen, die im Folgenden beschrieben werden:
Projekte
Contropedia
Diese Plattform ermöglicht die Echtzeit-Analyse und Visualisierung von Kontroversen in Wikipedia-Artikeln. Anhand der Versionsgeschichte und der Diskussionen über einen Artikel bzw. miteinander verwandten Artikeln wird ein Aktivitätenprotokoll generiert, aus welchem die Ausprägung der Kontroversen (‚controversy score‘) extrahiert wird. Die Versionsgeschichte eines Artikels und die dazugehörige Diskussion konstituieren zwei parallele Abläufe von Benutzerinteraktion, welche gemeinsam den Prozess der kollaborativen Erstellung eines Artikels abbilden. Momentan können nur englischsprachige Artikel analysiert werden, eine Erweiterung für andere Sprachen ist in Planung.
WikiWho
Dieser Algorithmus analysiert die komplette Versionsgeschichte eines Wikipedia-Artikels um zu identifizieren, wer genau welches Textelement zu welchem Zeitpunkt geschrieben, bearbeitet oder entfernt hat. So kann in einer spezifischen (z.B. der aktuellen) Artikelversion mit Hilfe von WikiWho hinsichtlich jeden Wortes (und Sonderzeichens) nachvollzogen werden, welcher Benutzer dieses zuerst eingeführt hat und inwieweit es anschließend gelöscht oder erneut eingeführt worden ist. Das Entwicklerteam postuliert, das einzige Tool dieser Art mit einer solch hohen Genauigkeit (~95%) und wissenschaftlicher Validierung zur Verfügung zu stellen. Die aktuellen Erweiterungen des Tools ermöglichen es, Beziehungen zwischen Lösch- und Reintegrationsprozessen nachzuvollziehen.
WhoVisual
Whovisual ermöglicht interaktive Visualisierungen zur Erforschung der Artikelgenese, welches sich in die Projekte WhoColor (Alphaversion) und whoVIS (Alphaversion) aufteilt.
WhoColor ermöglicht ein Color-Markup der Originalautoren einzelner Textelemente. Es ist ein JavaScript für die Tamper-/Greasemonkey-Browsererweiterung für Chrome und Firefox. Öffnet man einen englischsprachigen Wikipedia-Artikel, zeichnet es den Text farbig aus und zeigt dadurch die Autoren des Inhaltes auf. Zudem erscheint eine Liste der Autoren, geordnet nach deren prozentualem Textanteil am Artikel sowie (bald) zusätzliche Provenienzinformationen. Es ist damit zum einen möglich, die Diskussion um bestimmte Wörter aufzuzeigen, zum anderen lässt sich der Bearbeitungsverlauf eines Wortes nachvollziehen (Extras nur als Demoversion erhältlich).
WhoVIS ist der Prototyp einer Netzwerk-Visualisierung der Interaktion zwischen Editoren für einzelne Artikel. Er basiert auf den Wörtern/Tokens, welche von Editoren entfernt und wiedereingeführt worden sind. Da sich die Anwendung noch in der Anfangsphase befindet, dauert das Laden der Seite mitunter länger.
http://www.f-squared.org/whovisual/
Suche
Global Wikipedia Article Search
Diese Seite erlaubt es, alle Wikipedia-Hauptseiten nach Artikeln zu durchsuchen, welche den eingegebenen Begriff in den unterschiedlichen Sprachen im Titel tragen. Dadurch werden fehlende Verbindungen zwischen den (verschiedensprachigen) Wikipedia-Artikelseiten offenbart. Dabei leistet die Seite weder eine wörtliche Übersetzung noch eine Volltextsuche, sondern prüft lediglich, ob ein Artikel mit dem eingegebenen Namen existiert. Dadurch ist primär die Suche nach Namen von Personen, Bands, Ortschaften, Tierarten, Jahren usw. sinnvoll. Die Ergebnisse werden in einer Liste mit Angaben zu Land, Größe, Zeitstempel, Mitwirkenden und Weiterleitungen der Artikel angezeigt. Da die Daten von Servern auf der ganzen Welt abgerufen werden, kann die Suche einige Zeit in Anspruch nehmen.
http://vs.aka-online.de/globalwpsearch/
Kategorien
Category Analysis
Diese Seite listet Benutzerbeiträge innerhalb einer Kategorie (Betaversion) hinsichtlich verschiedener Parameter auf. Dazu zählen beispielsweise die betroffenen Seiten, die Benutzer und schließlich die jeweiligen Bearbeitungen. Zudem wird eine monatige Auswertung erstellt, welche hinzugefügte und entfernte Bytes zu allen Artikeln, die Neuanlage von Artikeln, beteiligte Benutzer und deren jeweilige Anteile an den Bearbeitungen enthält. Es kann mit Kategoriennamen nach Artikeln einer Kategorie oder mit Präfixen nach Artikeln einer Unterkategorie gesucht werden. Zur besseren Anwendbarkeit werden Bots und Benutzer mit weniger als zehn Beiträgen in den dargestellten Daten nicht berücksichtigt.
https://tools.wmflabs.org/meta/catanalysis/
CatNap
Diese Seite listet alle Wikipedia-Artikel einer bestimmten Kategorie auf, gruppiert nach anderen Kategorien, in welche sie ebenfalls eingeordnet sind. Eine Gruppe bilden die Artikel der Kategorie, eine andere Gruppe entsteht durch die Auflistung aller anderen Kategorien, in die diese Artikel eingeordnet sind. Dadurch ist auch eine Mehrfachnennung von Artikeln in der Ergebnisliste möglich. Es lassen sich verschiedene Sprachversionen vorauswählen, wobei bei den Ergebnissen immer auch auf Ergebnisse anderer Sprachversionen verwiesen wird. Sollen bestimmte Kategorien bei der Analyse ausgelassen werden, können diese auszulassenden Kategorien in einem Dialogfenster vermerkt werden.
http://tools.wmflabs.org/catnap/
PetScan
Diese Seite kann Listen von Wikipedia-Seiten (und verwandten Projekten) oder Wikidata-Elementen erstellen, die bestimmte Kriterien erfüllen, beispielsweise alle Seiten in einer bestimmten Kategorie oder alle Elemente mit einer bestimmten Eigenschaft. PetScan kann einige temporäre Listen (hier als "Quellen" bezeichnet) auf verschiedene Arten kombinieren, um eine neue Liste zu erstellen. Für längerfristige Beobachtungen können die erstellten Anfragen auch über eine URL gespeichert werden, wobei die Anfrage dann die möglicherweise neuen aktualisierten Projektinhalte ebenfalls berücksichtigt. Zahlreiche einstellbare Parameter ermöglichen äußerst präzise Anfragen, darunter beispielsweise Namensräume, Kategorien, Größe (Byte), aber auch Mindestanzahl der Verlinkungen, letzte Änderungen oder Bot-Aktivität. Das Ausgabeformat der Ergebnisse kann ebenfalls variiert werden, eine ausführliche Anleitung zur Einstellung der Suchparameter ist ebenfalls vorhanden (auch eine vereinfachte deutschsprachige Version).
http://tools.wmflabs.org/catscan2/catscan2.php?interface_language=de&project=wikipedia&language=de
Items by Cat
Dies ist ein Tool, um vorhandene oder fehlende Elemente anhand einer Wikipedia-Kategorie zu finden. Es gibt drei Eingabefelder, die als Offset, Limit und Rekursionsebene bezeichnet werden, wobei entweder die ersten beiden oder das dritte verwendet werden können. Ein gesetztes Limit überschreibt die Rekursionsebene, entsprechende Limits ergeben dabei vor allem deshalb Sinn, wenn besonders umfangreiche Kategorien untersucht werden, was gemäß der Nutzerseite zum Tool ohne entsprechendes Limit des Öfteren zu Fehlern der Anwendung führt. Das Eingabefenster der Rekursionsebene ermöglicht die Berücksichtigung von Unterkategorien, wobei der eingegebene Wert die Anzahl der zu berücksichtigenden Unterkategorien (also die ‚Tiefe’) definiert. Gerade hierbei kommt es jedoch ebenfalls aufgrund größerer Datenmengen vermehrt zu Fehlern bei der Anwendung, auf der Nutzerseite zum Tool wird daher eine gewisse Vorsicht bei dieser Funktion empfohlen. Diese Nutzerseite fasst ebenfalls weitere Probleme des Tools zusammen und liefert gleichzeitig eine rudimentäre Anleitung. Das Ausgabeformat der Ergebnisse kann zwischen HTML, Wiki-Markup und einfachem Text variiert werden. Das Tool ist in elf verschiedenen Sprachen verfügbar.
http://tools.wmflabs.org/bene/itemsbycat/
TreeViews
Dieses Tool erstellt eine monatliche Abrufstatistik für Kategorienbäume. Dabei können Start- und Enddatum vom Nutzer eingestellt werden, ebenso wie weitere Parameter, darunter die Sprachversion oder die Untersuchungstiefe. Zusätzlich aktivierbare Optionen erweitern die Suchmöglichkeiten, beispielsweise die automatische Suche in anderen Sprachversionen, die Abfrage der Entstehungszeitpunkte jeder einzelnen Seite oder ein Einbezug jeglicher Seiten, die in nur einer Kategorie vorzufinden sind (standardgemäß werden nur jene Seiten berücksichtigt, die in allen angegebenen Kategorien vorzufinden sind). Verwiesen wird bei diesen Zusatzoptionen auf die möglicherweise stark erhöhte Bearbeitungszeit bei entsprechender Aktivierung. Bei den vom Nutzer angegebenen Kategorien kann ebenfalls durch entsprechende Optionen auch die Diskussionsseite berücksichtigt werden, oder aber die Seiten, welcher in einer bestimmten Kategorie zu finden sind, ausgeschlossen werden. Die Darstellung der Ergebnisse erfolgt tabellarisch mit absteigender Abrufhäufigkeit.
http://tools.wmflabs.org/glamtools/treeviews/
Historie
Contributors
Dieses Tool erstellt eine Liste aller Mitwirkenden an einem bestimmten Artikel eines bestimmten Projekts als Wikitext-Aufzählung der Versionsgeschichte. Start- und Enddatum des zu untersuchenden Zeitraums können dabei auf den Tag genau festgelegt werden.
http://tools.wmflabs.org/inkowik/contributors.php
Get Distinct Authors
Erstellte eine Liste aller beteiligten Autoren verschiedener, definierter Seiten. Das Ergebnis wird als reiner Text, also ohne Formatierungen angezeigt, und ist dazu gedacht, in andere Seiten oder zur Weiterverarbeitung kopiert zu werden. Die Darstellung erfolgt dabei tabellarisch anhand absteigender Bearbeitungen der jeweiligen Autoren (in Klammern).
http://tools.wmflabs.org/magnustools/get_distinct_authors.php
Herding Sheep
Dieses Tool ermöglicht es, die gemeinsamen Bearbeitungen einer Autorengruppe innerhalb einer Kategorie, oder aber die von Bearbeitungen einer bestimmten Autorengruppe betroffenen Kategorien nachzuverfolgen. Entsprechend kann entweder eine Kategorie zur Untersuchung definiert werden oder aber eine Liste von Autoren. Die Einstellung des zu untersuchenden Zeitfensters kann dabei bis auf die Sekunde genau vorgenommen werden. Ebenfalls kann ein Limit der anzuzeigenden Ergebnisse definiert werden.
http://tools.wmflabs.org/magnustools/herding_sheep.php
Recent Changes Statistic
Dieses Tool erstellt eine statistische Übersicht der letzten Änderungen einer ausgewählten Wikipedia-Sprachversion. Der zu berücksichtigende Zeitraum kann über ein Dropdown-Menü von der letzten Minute bis hin zu den letzten vierundzwanzig Stunden eingestellt werden. Die Länge der anzuzeigenden Ergebnisse kann festgelegt werden, ebenso kann ein spezieller Nutzer über ein Eingabefenster in der Ergebnispräsentation hervorgehoben werden. Die Ergebnispräsentation erfolgt in drei Kategorien, den Nutzern, den Seiten und einer Übersichtsstatistik. Die Nutzer und Seiten sind absteigend nach Anzahl der Bearbeitungen im definierten Zeitraum angezeigt. Die Übersichtsstatistik liefert eine sekundengenaue Angabe der ersten sowie letzten Bearbeitung im definierten Zeitraum, die absolute Zahl der Bearbeitungen und einen ‚Bearbeitungen pro Minute’-Quotienten. Schließlich werden die absoluten Zahlen der bearbeiteten Seiten und der bearbeitenden Nutzer des untersuchten Zeitraums angegeben.
http://vs.aka-online.de/rchiststat/
WikiBlame
WikiBlame kann die Versionen eines Artikels auf eine bestimmte Zeichenkette hin untersuchen. Dieses Tool dient vor allem der Qualitätssicherung von Artikeln hinsichtlich ihrer jeweiligen Quellenlage. So ermöglicht WikiBlame, die Version des ersten Vorkommens von Textelementen zu identifizieren, um so die jeweiligen Urheber (beziehungsweise die jeweiligen Quellen) sichtbar zu machen. Gemäß der Nutzerseite zum Tool können diese Ergebnisse zum Nachtragen von Einzelnachweisen, zum Nachfragen bei Autoren oder zum lizenzkonformen Kopieren genutzt werden. Durchsucht wird nach Angabe der Sprachversion, des Projekts, des Artikels und des entsprechenden Suchbegriffs. Wird innerhalb eines Projekts nicht zwischen Sprachversionen unterschieden, kann das entsprechende Feld freigelassen werden. Bei der Suchanfrage kann entweder einfacher Text oder aber auch Interwikitags und ähnliches definiert werden. Neben der Einstellung des Startdatums der Untersuchung und der maximal zu durchsuchenden Versionen wird zwischen verschiedenen Suchvarianten und möglichen Zusatzoptionen (zumeist quantitativer Art) unterschieden, was in der Beschreibung auf der Nutzerseite zum Tool aber hinreichend erklärt wird.
http://wikipedia.ramselehof.de/wikiblame.php
Wikidata Recent Changes
Hierbei handelt es sich um eine konzentrierte Darstellung der jüngsten Änderungen in der Wikipedia, in welcher nur die bislang ungeprüften Änderungen angezeigt werden. Die Ergebnisse können nach Art der Bearbeitung und nach Items unterschieden werden, ebenfalls kann die Anzahl der präsentierten Ergebnisse von fünfundzwanzig bis zweihundertfünfzig eingestellt werden. Zusätzlich kann eine automatische Aktualisierung der Ergebnisse nach vordefinierten Zeiträumen eingerichtet werden, das dem Anspruch der Unmittelbarkeit der Ergebnisse Rechnung trägt. Jedes Einzelergebnis ist mit dem jeweils betroffenen Namensraum, beziehungsweise der Artikelseite vermerkt, dem dortigen Vorgang (Änderung, Löschung etc.), der IP-Adresse, beziehungsweise dem Nutzernamen, und der entsprechenden Uhrzeit. Zwar ist prinzipiell über entsprechende Links hinter jedem angezeigten Vorgang eine Direktreaktion (zum Beispiel eine Löschung) möglich, dazu ist jedoch eine vorige Authentifizierung über einen entsprechenden Login notwendig.
http://tools.wmflabs.org/pltools/rech/
WikiHistory
Dieses Tool visualisiert Artikelstatistiken einzelner Artikelseiten übersichtlich. Nach Eingabe des zu untersuchenden Artikels wird in übersichtlichen Angaben nach allgemeinen Informationen, zeitlicher Entwicklung und Benutzern unterschieden. Die allgemeinen Informationen beinhalten die Gesamtzahl der Artikelbearbeitungen unter Berücksichtigung kleiner oder anonymer Bearbeitungen (durch ein Tortendiagramm dargestellt). Ebenfalls werden beteiligte unterschiedliche Benutzer angegeben sowie anonym Benutzer und durchschnittliche Bearbeitungen pro Benutzer. Ebenfalls im Durchschnitt werden Bearbeitungen pro Tag, pro Monat und pro Jahr sowie die aktuelle Artikelgröße zusammengefasst (die zeitliche Entwicklung der Bearbeitungen wird durch ein Histogramm dargestellt). Schließlich werden die beteiligten Benutzer nach absteigendem Textanteil, samt absoluter Bearbeitungszahlen, sowie Erst- und Letztbearbeitung tabellarisch aber auch prozentual in einem Tortendiagramm präsentiert. Nach Entwicklerangaben erfolgt die Bestimmung der Autorenanteile basierend auf WikiHistory. Die Zeitangaben erfolgen in UTC.
http://tools.wmflabs.org/wikihistory/
Wikipedia Page History Statistics
Dieses Tool zeigt die Menge an Änderungen an einem Artikel im Zeitverlauf sowie die Autoren eines Artikels nach der Anzahl ihrer anteiligen Bearbeitungen an. Eine Übersichtsstatistik liefert Informationen über die Gesamtzahl der Bearbeitungen, der ersten und jüngsten Bearbeitung, der durchschnittlichen Zeit zwischen einzelnen Bearbeitungen sowie die durchschnittlichen Bearbeitungen pro Monat und pro Jahr innerhalb der gesamten Lebensdauer des betrachteten Artikels. Zusätzlich wird eine Gesamtzahl beteiligter Nutzer und die durchschnittliche Bearbeitungszahl pro Nutzer angegeben. Der Aktualität wird durch die Angabe der Bearbeitungen innerhalb des letzten Tages, der letzten Woche, des letzten Monats und des letzten Jahres angegeben. Eine tabellarische Jahres- und Monatsübersicht erlaubt den Zeitvergleich der Bearbeitungsintensität. Eine tabellarische Präsentation der beteiligten Nutzer, angeordnet nach absteigender Bearbeitungszahl, erlaubt Rückschlüsse auf die wichtigsten Beteiligten der Artikelbearbeitungen.
http://vs.aka-online.de/cgi-bin/wppagehiststat.pl
X!’s Page History
Dieses Tool fasst Bearbeitungsinformationen über eine Artikelseite zusammen und erstellt verschiedene Visualisierungen der Bearbeitungen. Die Darstellung der Ergebnisse wird unterteilt in einführende Übersichtsstatistiken, die wichtigsten Bearbeiter, eine Bot-Liste, eine Autorenschaftsübersicht sowie Jahres- und Monatsübersichten (außerdem gibt es eine Tabelle zur Darstellung semi-automatisierter Bearbeitungen). Neben den absoluten Zahlen der Bearbeitungen und beteiligten Bearbeiter fasst die Übersichtsstatistik außerdem die Seitenaufrufe zusammen, liefert Informationen zu Verlinkungen der Artikelseite und Textoberflächeninformationen (Anzahl der Wörter etc.). Die zeitbezogene Analyse der Bearbeitungen gibt einen Überblick über die durchschnittlich vergangene Zeit zwischen Bearbeitungen, die durchschnittlichen Bearbeitungen pro Nutzer, pro Tag, pro Monat und pro Jahr. Zur Veranschaulichung der Aktualität der Artikelbearbeitungen werden ebenfalls die Bearbeitungen innerhalb der letzten vierundzwanzig Stunden, der letzten sieben Tage, der letzten dreißig Tage und der letzten 365 Tage angegeben. Die tabellarische wie tortendiagrammische Darstellung der wichtigsten Bearbeiter unterscheidet nach Anzahl der Bearbeitungen und beigetragenem Textanteil. Die Bot-Liste ordnet die beteiligten Bots absteigend nach Anzahl der Bearbeitungen, über Links können dabei die größten Bearbeitungen Einzelübersichten der Bearbeitungen eines Bots angezeigt werden lassen. Bei der Übersicht der Autorschaft sind die wichtigsten Autoren absteigend nach Textanteil am Artikel (gemessen anhand der Buchstabenzahl) tabellarisch, aber auch in einem Tortendiagramm dargestellt. Die Jahres- und Monatsübersichten (tabellarisch, diagrammisch) ermöglichen einen zeitbezogenen Überblick über die Bearbeitungsintensität. Die angezeigten Statistiken können über einen Link heruntergeladen werden.
http://tools.wmflabs.org/xtools-articleinfo/index.php?&uselang=en