Tools und Ressourcen
Zur (sprachwissenschaftlichen und diskursanalytischen) Untersuchung der Wikipedia gibt es zahlreiche Tools und Ressourcen, die im Folgenden beschrieben werden.*
Dieser Artikel in der Zeitschrift für digitale Geisteswissenschaften erläutert für einige der aufgeführten Tools, wie diese in Diskursanalysen eingesetzt werden können:
Gredel, Eva (2018): Digitale Methoden und Werkzeuge für Diskursanalysen am Beispiel Wikipedia. In: Zeitschrift für digitale Geisteswissenschaft (= Sonderband 3: Wie Digitalität die Geisteswissenschaften verändert. Neue Forschungsgegenstände und Methoden. Hrsg. von Martin Huber/ Sybille Krämer). URL: http://zfdg.de/sonderbaende |
Inhaltsverzeichnis
- 1 Ressourcen
- 2 Tools
- 2.1 Analyse und Visualisierung von Beteiligung
- 2.2 Analyse und Visualisierung von Kontroversen
- 2.3 Analysen von Artikel-Historien
- 2.4 Statistische Auswertungen
- 2.5 Analyse von Seitenaufrufen
- 2.6 Suche nach enzyklopädischen "Leerstellen"
- 2.7 Multimodale Analysen
- 2.8 Analyse von Kategorien
- 2.9 Andere Tools
Ressourcen
Wikipedia-Korpora im Deutschen Referenzkorpus (DeReKo)
Die Wikipedia steht unter freien Lizenzen zur Verfügung und bietet damit der Forschung die Möglichkeit, die Daten in linguistisch aufbereitete Korpora zu überführen. Das Institut für Deutsche Sprache (IDS) bietet seit 2005 über seine Korpusinfrastruktur Zugriff auf linguistisch aufbereitete Korpora u.a. zu Wikipedia-Artikeln, Wikipedia-Diskussionen und Wikipedia-Benutzerdiskussionen zu verschiedenen Jahrgängen und in mehreren Sprachen. Der Bestand wird laufend erweitert und ausgebaut: Seit 2011 erscheint alle zwei Jahre eine neue Konvertierung der deutschsprachigen Wikipedia (vgl. Lüngen/Kupietz 2017). Die Wikipedia-Korpora sind Bestandteil des deutschen Referenzkorpus (DeReKo), das mit 42 Milliarden Wörtern (Release vom 23.02.2018) das größte Archiv von Korpora geschriebener Gegenwartssprache darstellt. Über das Corpus Search, Management and Analysis System (COSMAS II) sind zudem Wikipedia-Korpora in acht weiteren Sprachen verfügbar (Englisch, Französisch, Spanisch, Kroatisch, Polnisch, Italienisch, Ungarisch, Norwegisch). Weitere Hinweise zur Korpusressource finden sich unter: http://www1.ids-mannheim.de/kl/projekte/korpora/archiv/wp.html
Use Case auf YouTube zu COSMAS und den Wikipedia-Korpora in DeReKo
In diesem Video im YouTube-Kanal des CLARIN-D-Infrastrukturprojekts zeigt Eva Gredel, wie die oben beschriebenen Wikipedia-Korpora im Deutschen Referenzkorpus (DeReKo) mithilfe von COSMAS II für Sprach-Analysen am Beispiel von „-itis“- Kombinationen als Wortbildungsprodukte auf den Diskussionsseiten der Wikipedia genutzt werden können.
https://www.youtube.com/watch?v=bKw1yaf_imk
Tools
Analyse und Visualisierung von Beteiligung
WhoVisual und WhoVIS
Whovisual ermöglicht interaktive Visualisierungen zur Erforschung der Artikelgenese, welches sich in die Projekte WhoColor (Alphaversion) und whoVIS (Alphaversion) aufteilt.
WhoVIS ist der Prototyp einer Netzwerk-Visualisierung der Interaktion zwischen Editoren für einzelne Artikel. Er basiert auf den Wörtern/Tokens, welche von Editoren entfernt und wiedereingeführt worden sind. Da sich die Anwendung noch in der Anfangsphase befindet, dauert das Laden der Seite mitunter länger.
http://www.f-squared.org/whovisual/
WhoColor
WhoColor ermöglicht ein Color-Markup der Originalautoren einzelner Textelemente. Es ist ein JavaScript für die Tamper-/Greasemonkey-Browsererweiterung für Chrome und Firefox. Öffnet man einen englischsprachigen Wikipedia-Artikel, zeichnet es den Text farbig aus und zeigt dadurch die Autoren des Inhaltes auf. Zudem erscheint eine Liste der Autoren, geordnet nach deren prozentualem Textanteil am Artikel sowie (bald) zusätzliche Provenienzinformationen. Es ist damit zum einen möglich, die Diskussion um bestimmte Wörter aufzuzeigen, zum anderen lässt sich der Bearbeitungsverlauf eines Wortes nachvollziehen (Extras nur als Demoversion erhältlich).
https://www.f-squared.org/whovisual/#color
Contributors
Dieses Tool erstellt eine Liste aller Mitwirkenden an einem bestimmten Artikel eines bestimmten Projekts als Wikitext-Aufzählung der Versionsgeschichte. Start- und Enddatum des zu untersuchenden Zeitraums können dabei auf den Tag genau festgelegt werden.
http://tools.wmflabs.org/inkowik/contributors.php
Global User Contributions
Dieses Tool erlaubt die Nachverfolgung aller Beiträge eines bestimmten Nutzers in allen Wikimedia-Wikis. Hierzu kann im Suchfenster sowohl der Nutzername als auch die IP-Adresse angegeben werden. Über eine zusätzliche Option lässt sich eine Präfixsuche aktivieren, ein Dropdown-Menü ermöglicht die Eingrenzung der Ergebnisse von allen Beiträgen auf nur jene der vergangenen dreißig Tage oder der vergangenen letzten Stunde. Die Sortierung der Ergebnisse kann wahlweise nach Wiki oder nach Datum geordnet werden. Bei der Ergebnisdarstellung wird nach Projekten, beziehungsweise Sprachversionen, unterschieden und die Auswahl auf die letzten zwanzig Beiträge begrenzt. Absteigend nach Aktualität sortiert werden dabei sowohl der Vorgang als auch der entsprechende Artikel (oder Ähnliches) angegeben. Über entsprechende Links kann zu jeder Aktivität eine Differenzdarstellung der Bearbeitungen oder aber die nutzerbezogene Versionsgeschichte aufgerufen werden.
https://tools.wmflabs.org/guc/index.php
X!’s AdminStats
Dieses Tool erstellt Statistiken von Admin-Aktivitäten. Hierbei kann bei der Eingabemaske neben dem Projekt und einer entsprechenden Sprachversion auch der Betrachtungszeitraum auf den Tag genau eingestellt werden. In den Ergebnissen wird zunächst eine Übersichtsstatistik dargeboten, welche beispielsweise die Gesamtzahl der aktiven Admins im betrachteten Zeitraum angibt. In der tabellarischen Anordnung (absteigend nach absoluter Zahl der Aktivitäten) werden nur solche Admins aufgeführt, welche im Betrachtungszeitraum mindestens eine Aktivität aufweisen. Es wird darauf verwiesen, dass einige der aufgeführten Akteure keine Admins mehr sind oder noch nie welche waren, jedoch Aktionen durchgeführt haben, welche gewisser Admin-Rechte bedürfen. Die einzelnen Admins werden mit Informationen dargestellt, welche unter anderem Lösch- oder Wiederherstellungsvorgänge in absoluten Zahlen angeben. Klickt man auf den Namen des angeführten Admins, gelangt man zu dessen Benutzerseite. Je nach Anfrage kann die Bearbeitungsdauer variieren und entsprechend lange Ladezeiten nach sich ziehen.http://tools.wmflabs.org/xtools/adminstats/?uselang=en
X!'s Edit Counter
Dieses Tool erstellt eine umfangreiche Zusammenfassung von Aktivitäten eines bestimmten Nutzers. In der Eingabemaske kann neben dem entsprechenden Projekt und dem Nutzernamen anhand verschiedener vordefinierter Kriterien die Ergebnispräsentation eingeschränkt werden, indem bestimmte Betrachtungskategorien ausgelassen werden. Die Kategorien beinhalten eine Übersichtsstatistik, eine Zusammenfassung der Aktivität nach Namensräumen, nach Jahren, nach Monaten, die am meisten bearbeiteten Seiten, eine Historie der erworbenen/verlorenen Bearbeitungsrechte, und die jüngsten Bearbeitungen. Die Ergebnispräsentation kann unter Umständen manche Kategorien nicht berücksichtigen, wenn der Nutzer die Freigabe für die entsprechenden Daten nicht erteilt hat. Die Übersichtsstatistik beinhaltet neben Basisinformationen wie der Gesamtzahl der Bearbeitungen etc. eine genauere Betrachtung der Bearbeitungen (durchschnittliche Bearbeitungen pro Tag etc.), eine genauere Betrachtung der bearbeiteten Seiten (durchschnittliche Bearbeitungen pro Seite), der Dateien, der Blocks, der Aktionen (Danken etc.), der Administratorenaktivitäten (Schützen eines Beitrags etc.) und der Aktivität in unterschiedlichen Sprachversionen und Projekten. Die Darstellung der Aktivitäten nach Namensräumen erfolgt tabellarisch absteigend (absolut, prozentual) und tortendiagrammisch. Alle angezeigten Daten können über einen Link heruntergeladen werden. Die Ladezeit nach erfolgter Anfrage variiert stark je nach vorhandener Datenmenge bei den Ergebnissen.
http://tools.wmflabs.org/xtools-ec/?uselang=en
xContribs
Dieses Tool gibt einen Überblick über die ‚xWikiness‘ eines Benutzers, beispielsweise über die Verteilung der Beiträge in verschiedenen Projekten. Verschiedene numerische Werte, darunter der Theil-Index (Ungleichverteilungsmaß) sollen Rückschlüsse darüber erlauben, wie engagiert der betrachtete Nutzer auch projektübergreifend agiert.
https://tools.wmflabs.org/erwin85/xcontribs.php
Analyse und Visualisierung von Kontroversen
Contropedia
Diese Plattform ermöglicht die Echtzeit-Analyse und Visualisierung von Kontroversen in Wikipedia-Artikeln. Anhand der Versionsgeschichte und der Diskussionen über einen Artikel bzw. miteinander verwandten Artikeln wird ein Aktivitätenprotokoll generiert, aus welchem die Ausprägung der Kontroversen (‚controversy score‘) extrahiert wird. Momentan können nur englischsprachige Artikel analysiert werden, eine Erweiterung für andere Sprachen ist in Planung.
Analysen von Artikel-Historien
WikiHistory
Dieses Tool visualisiert Artikelstatistiken einzelner Artikelseiten übersichtlich. Nach Eingabe des zu untersuchenden Artikels wird in übersichtlichen Angaben nach allgemeinen Informationen, zeitlicher Entwicklung und Benutzern unterschieden. Die allgemeinen Informationen beinhalten die Gesamtzahl der Artikelbearbeitungen unter Berücksichtigung kleiner oder anonymer Bearbeitungen (durch ein Tortendiagramm dargestellt). Ebenfalls werden beteiligte unterschiedliche Benutzer angegeben sowie anonym Benutzer und durchschnittliche Bearbeitungen pro Benutzer. Ebenfalls im Durchschnitt werden Bearbeitungen pro Tag, pro Monat und pro Jahr sowie die aktuelle Artikelgröße zusammengefasst (die zeitliche Entwicklung der Bearbeitungen wird durch ein Histogramm dargestellt). Schließlich werden die beteiligten Benutzer nach absteigendem Textanteil, samt absoluter Bearbeitungszahlen, sowie Erst- und Letztbearbeitung tabellarisch aber auch prozentual in einem Tortendiagramm präsentiert. Nach Entwicklerangaben erfolgt die Bestimmung der Autorenanteile basierend auf WikiHistory. Die Zeitangaben erfolgen in UTC. http://tools.wmflabs.org/wikihistory/
Recent Changes Statistic
Dieses Tool erstellt eine statistische Übersicht der letzten Änderungen einer ausgewählten Wikipedia-Sprachversion. Der zu berücksichtigende Zeitraum kann über ein Dropdown-Menü von der letzten Minute bis hin zu den letzten vierundzwanzig Stunden eingestellt werden. Die Länge der anzuzeigenden Ergebnisse kann festgelegt werden, ebenso kann ein spezieller Nutzer über ein Eingabefenster in der Ergebnispräsentation hervorgehoben werden. Die Ergebnispräsentation erfolgt in drei Kategorien, den Nutzern, den Seiten und einer Übersichtsstatistik. Die Nutzer und Seiten sind absteigend nach Anzahl der Bearbeitungen im definierten Zeitraum angezeigt. Die Übersichtsstatistik liefert eine sekundengenaue Angabe der ersten sowie letzten Bearbeitung im definierten Zeitraum, die absolute Zahl der Bearbeitungen und einen ‚Bearbeitungen pro Minute’-Quotienten. Schließlich werden die absoluten Zahlen der bearbeiteten Seiten und der bearbeitenden Nutzer des untersuchten Zeitraums angegeben. http://vs.aka-online.de/rchiststat/
WikiBlame
WikiBlame kann die Versionen eines Artikels auf eine bestimmte Zeichenkette hin untersuchen. Dieses Tool dient vor allem der Qualitätssicherung von Artikeln hinsichtlich ihrer jeweiligen Quellenlage. So ermöglicht WikiBlame, die Version des ersten Vorkommens von Textelementen zu identifizieren, um so die jeweiligen Urheber (beziehungsweise die jeweiligen Quellen) sichtbar zu machen. Gemäß der Nutzerseite zum Tool können diese Ergebnisse zum Nachtragen von Einzelnachweisen, zum Nachfragen bei Autoren oder zum lizenzkonformen Kopieren genutzt werden. Durchsucht wird nach Angabe der Sprachversion, des Projekts, des Artikels und des entsprechenden Suchbegriffs. Wird innerhalb eines Projekts nicht zwischen Sprachversionen unterschieden, kann das entsprechende Feld freigelassen werden. Bei der Suchanfrage kann entweder einfacher Text oder aber auch Interwikitags und ähnliches definiert werden. http://wikipedia.ramselehof.de/wikiblame.php
Wikidata Recent Changes
Hierbei handelt es sich um eine konzentrierte Darstellung der jüngsten Änderungen in der Wikipedia, in welcher nur die bislang ungeprüften Änderungen angezeigt werden. Die Ergebnisse können nach Art der Bearbeitung und nach Items unterschieden werden, ebenfalls kann die Anzahl der präsentierten Ergebnisse von fünfundzwanzig bis zweihundertfünfzig eingestellt werden. Zusätzlich kann eine automatische Aktualisierung der Ergebnisse nach vordefinierten Zeiträumen eingerichtet werden, das dem Anspruch der Unmittelbarkeit der Ergebnisse Rechnung trägt. Jedes Einzelergebnis ist mit dem jeweils betroffenen Namensraum, beziehungsweise der Artikelseite vermerkt, dem dortigen Vorgang (Änderung, Löschung etc.), der IP-Adresse, beziehungsweise dem Nutzernamen, und der entsprechenden Uhrzeit. Zwar ist prinzipiell über entsprechende Links hinter jedem angezeigten Vorgang eine Direktreaktion (zum Beispiel eine Löschung) möglich, dazu ist jedoch eine vorige Authentifizierung über einen entsprechenden Login notwendig. http://tools.wmflabs.org/pltools/rech/
X!’s Page History
Dieses Tool fasst Bearbeitungsinformationen über eine Artikelseite zusammen und erstellt verschiedene Visualisierungen der Bearbeitungen. Die Darstellung der Ergebnisse wird unterteilt in einführende Übersichtsstatistiken, die wichtigsten Bearbeiter, eine Bot-Liste, eine Autorenschaftsübersicht sowie Jahres- und Monatsübersichten (außerdem gibt es eine Tabelle zur Darstellung semi-automatisierter Bearbeitungen). Neben den absoluten Zahlen der Bearbeitungen und beteiligten Bearbeiter fasst die Übersichtsstatistik außerdem die Seitenaufrufe zusammen, liefert Informationen zu Verlinkungen der Artikelseite und Textoberflächeninformationen (Anzahl der Wörter etc.). Die zeitbezogene Analyse der Bearbeitungen gibt einen Überblick über die durchschnittlich vergangene Zeit zwischen Bearbeitungen, die durchschnittlichen Bearbeitungen pro Nutzer, pro Tag, pro Monat und pro Jahr. Zur Veranschaulichung der Aktualität der Artikelbearbeitungen werden ebenfalls die Bearbeitungen innerhalb der letzten vierundzwanzig Stunden, der letzten sieben Tage, der letzten dreißig Tage und der letzten 365 Tage angegeben. Die tabellarische wie tortendiagrammische Darstellung der wichtigsten Bearbeiter unterscheidet nach Anzahl der Bearbeitungen und beigetragenem Textanteil. Die Bot-Liste ordnet die beteiligten Bots absteigend nach Anzahl der Bearbeitungen, über Links können dabei die größten Bearbeitungen Einzelübersichten der Bearbeitungen eines Bots angezeigt werden lassen. Bei der Übersicht der Autorschaft sind die wichtigsten Autoren absteigend nach Textanteil am Artikel (gemessen anhand der Buchstabenzahl) tabellarisch, aber auch in einem Tortendiagramm dargestellt. Die Jahres- und Monatsübersichten (tabellarisch, diagrammisch) ermöglichen einen zeitbezogenen Überblick über die Bearbeitungsintensität. Die angezeigten Statistiken können über einen Link heruntergeladen werden.
http://tools.wmflabs.org/xtools-articleinfo/index.php?&uselang=en
Statistische Auswertungen
Wikimedia Statistics
Diese Seite vereint zahlreiche statistische Analysen, Visualisierungen und Links und stellt umfangreiche Datensätze zur Verfügung. Auf der Start- beziehungsweise Übersichtsseite lassen sich die Statistiken nach den jeweiligen Projekten (Wikipedia, Wiktionary etc.) getrennt anzeigen, in der Monatsübersicht lassen sich entweder alle Projekte oder aber jeweils einzelne mit Übersichtsinformationen anzeigen. Diese sind unterteilt in die Kategorien Aufrufe, Beiträge und Inhalt. Bei den Aufrufen wird die Gesamtzahl in allen Sprachversionen (sofern im Projekt in Sprachversionen unterschieden wird) mit dem jeweiligen Monats- und Jahrestrend im Vergleich angezeigt. In absteigender Anordnung wird ebenfalls eine Liste der Länder mit den meisten Aufrufen dargeboten, bei einem Klick auf die jeweiligen Übersichten wird man zu detaillierteren Darstellungen weitergeleitet. In der Kategorie der Beiträge wird wie bei den Aufrufen die Gesamtzahl der Beiträge angegeben, darüber hinaus die Anzahl der neu registrierten Nutzer (ebenfalls mit vergleichendem Monats- und Jahrestrend) sowie die meisteditierenden Benutzer. Beim Inhalt wird lediglich die Entwicklung der Datenmenge (in Gigabyte) im Differenzvergleich angegeben. Hinsichtlich der einzelnen Projekte (Wikipedia etc.) sind verschiedene Übersichtsstatistiken beispielsweise zu den Sprachversionen in einer Tabelle zusammengefasst, in welcher Informationen zu den Regionen, der Beteiligung, den Bearbeitungen, Aufrufen usw. zu finden sind. Über Links sind zu jeder Ergebniszeile entsprechende detailliertere Zusammenfassungen, Tabellen und Diagramm verfügbar. In einer weiteren Tabelle finden sich Vergleichsstatistiken, beispielsweise die Anzahl der Wörter in der Wikipedia im Ländervergleich im Zeitverlauf (dies ist jedoch nur eine von zahlreichen Statistiken zu den verschiedensten Themengebieten im Vergleich). In einem themenbezogenen Bereich, der von der Übersichtsseite aus erreichbar ist, sind umfangreiche Linksammlungen zu verschiedensten Anwendungen (beispielsweise fortgeschrittene dynamische Visualisierungsangebote) zu finden, wobei durch Symbole neben den Links erkennbar gemacht wird, ob dieser Link auf eine Seite der Wikimedia Foundation (Host der Seite), eines speziellen Toolserver, der Wikipedia oder eines externen Anbieters weiterleitet. Ein Suchfunktion auf der Übersichtsseite erlaubt ein konzentrierteres Suchen nach Informationen (Statistiken, Visualisierungen etc.) eines spezifischen Interesses (Aufrufe, Bearbeitungen, Nutzer, Bots etc.).http://stats.wikimedia.org/
Listen to Wikipedia
Dieses Tool kreiert eine audiovisuelle Echtzeit-Repräsentation von Veränderungsvorgängen in der Wikipedia. Hierbei stehen Glockentöne für Ergänzungen der Wikipedia und Saitentöne für Löschvorgänge. Die jeweilige Tonhöhe variiert entsprechend des Umfangs des jeweiligen Vorgangs (je umfangreicher die Bearbeitung, desto tiefer der entsprechende Ton). Während die reguläre visuelle Darstellung mittels hellgrauer Kreise (in der Größe entsprechend des Umfangs der Bearbeitung) erfolgt, sind Aktivitäten nicht registrierter Nutzer grün und jene von Bots violett. Bei der visuellen Darstellung wird ebenfalls der entsprechende Titel des bearbeiteten Artikels angezeigt. Neuregistrierungen von Nutzern werden auditiv durch einen länger andauernden Saitenton repräsentiert sowie visuell über ein Banner oberhalb der Kreisdarstellung. Unterhalb dieser Kreisdarstellung befindet sich eine tabellarische Zusammenfassung der Vorgänge, wobei auch die Zahl der bereits gehörten/gesehenen Änderungen angezeigt wird. Über verschiedene Optionen können bestimmte Aspekte der Darstellung ausgeschlossen werden, so zum Beispiel die Neuregistrierung. Es kann ebenfalls die zu betrachtende/belauschende Sprachversion ausgewählt werden, wobei vierzig Sprachen zur Auswahl stehen. Es können mehrere Sprachversionen gleichzeitig berücksichtigt werden. http://listen.hatnote.com/
Simple Edit Counter
Dieses Tool ermöglicht die schnelle und einfache numerische Zusammenfassung der Bearbeitungsvorgänge eines bestimmten Nutzers. In der Eingabemaske kann neben der Angabe des zu betrachtenden Projekts und Nutzernamens (optional auch die IP-Adresse) ein spezifischer Namensraum für die Zählung definiert werden. Der Betrachtungszeitraum kann auf den Tag genau eingegrenzt werden. In der Ergebnisdarstellung finden sich dann die Nutzergruppen des Nutzers, die Gesamtzahl der Bearbeitungen im Betrachtungszeitraum, Live-Bearbeitungen und gelöschte Bearbeitungen. Über Links sind die beispielsweise die Benutzerkonteninformationen oder das Benutzersperr-Logbuch auf der Wikipedia zu erreichen.
http://tools.wmflabs.org/xtools/sc/?project=de.wikipedia.org&uselang=en
Replay Edits
Dieses Tool erstellt eine Videorepräsentation der Versionsgeschichte eines Artikels. Dabei werden Änderungen farblich hervorgehoben. Das Abspieltempo kann eingestellt werden, ebenso ist es möglich zu pausieren. Die Darstellung des Artikels erfolgt wie im Originalartikel, lediglich die Umgebung (Artikeldiskussion, Werkzeuge etc.) ist nicht vorhanden. Das Tool zielt darauf ab, dabei zu helfen, eine Vielzahl von Revisionen einfacher und in kürzerer Zeit als mit der aktuellen Benutzeroberfläche zu überprüfen und durchzuarbeiten. Es zeigt dem Benutzer, wie sich die Änderungen auf einer Seite visuell entwickelt haben. Auf diese Weise kann der Benutzer die auf der Seite vorgenommenen Änderungen auf animierte Weise besser nachvollziehen. Die Seite zum Vergleichen der aktuellen Version hat nur eine Dimension, die Zeilennummer. Die Zeilen werden nebeneinander dargestellt und zeigen auf der linken Seite die ältere Version und auf der rechten Seite die neuere Version. Die vorgeschlagenen Änderungsideen werden direkt in ihrer vorgesehenen Position im Artikel angezeigt und entsprechend markiert.
http://cosmiclattes.github.io/wikireplay/player.html
Analyse von Seitenaufrufen
Pageview Analysis
Pageview Analysis ermöglicht den Vergleich der Abrufstatistiken mehrerer Artikelseiten. Dabei können in einem Dialogfeld mehrere Artikelseitennamen eingegeben werden, welche vergleichend in einem Diagramm zusammengefasst werden. Der darzustellende Zeitraum lässt sich tagesgenau definieren, zudem lässt sich das spezifische Projekt, beziehungsweise eine spezifische Sprachversion, angeben. Zusätzlich kann über ein Dropdown-Menü zwischen Plattformen (Desktop, Mobile App, etc.) und Agenten (User, Bot, etc.) unterschieden werden. Eine tabellarische Auflistung gibt zudem Auskunft über Bearbeitungen, Autoren usw. der untersuchten Artikelseiten. Hinsichtlich der diagrammischen Darstellungen können verschiedene Diagrammtypen (Linie, Säule, Netz, etc.) zur Veranschaulichung ausgewählt werden. Über Zusatzoptionen kann das jeweilige Diagramm zudem die Werte ausgeschrieben einbeziehen, logarithmieren oder die Y-Achse beim Nullwert beginnen lassen. Ist das Diagramm erst einmal erstellt, kann es über einen Permanentlink oder Download gesichert werden. Die Daten des Tools reichen bis Anfang 2015 zurück, Diagramme für vorige Zeiträume können nicht erstellt werden. https://meta.wikimedia.org/wiki/Pageviews_Analysis/
Page Views for Wikipedia (Non-mobile, Normalized)
Diese Seite präsentiert eine detaillierte, tabellarische Übersicht der monatlichen Aufrufzahlen verschiedener Sprachversionen und ihrer Trends im Vergleich. Zahlreiche statistische Angaben reichern die einzelnen Zellen der Tabelle an und betten den angezeigten Wert orientierend in den Kontext der Entwicklungen ein. Die angezeigten Werte sind dabei normalisiert (optional kann auf die Rohdaten zugegriffen werden) und werden nach Angaben der Seite stündlich aktualisiert. Die Daten der Seite beziehen sich dabei jedoch lediglich auf die nicht-mobilen Seiten, zudem ist die Kopfzeile mit generellen Trendinformationen aktuell nicht funktionsfähig (05.01.19). Für Langzeituntersuchungen sollte beachtet werden, dass im Mai 2015 eine Anpassung des Algorithmus’ zur Zählung stattgefunden hat, was dieses Datum umfassende Untersuchungen in ihrer Aussagekraft einschränken könnte. Alle präsentierten Daten können heruntergeladen werden.
https://stats.wikimedia.org/EN/TablesPageViewsMonthly.htm
Wikitrends
Diese Seite fasst die Suchtrends für Artikelseiten für die jeweils verschiedenen Sprachversionen zusammen. Dabei wird unterschieden in aufsteigende Trends, absteigende Trends und die meistgesuchten Artikelseiten, wobei die angezeigte Auswahl auf zehn Ergebnisse beschränkt ist. Hinsichtlich der zu berücksichtigenden Zeitspanne kann zwischen dem aktuellen Tag, der aktuellen Woche oder des aktuellen Monats gewählt werden. Hinter den Titeln der Ergebnisse werden in Klammern die Aufrufzahlen angezeigt, beziehungsweise der prozentuale Anstieg/Abfall. Durch einen Klick auf den Titel gelangt man zur entsprechenden Artikelseite.http://www.wikitrends.net
Suche nach enzyklopädischen "Leerstellen"
Missing Topics
Dieses Tool ermöglicht die Zusammenfassung fehlender Artikel (‚redlinks’) innerhalb bestimmter Kategorien oder Artikelseiten. Neben dem entsprechenden Projekt, beziehungsweise der entsprechenden Sprachversion, und der jeweiligen Artikelseite oder der Kategorie kann auch die Tiefe numerisch angegeben werden, also der Wert der angibt, wie viele Unterkategorien bei der Analyse berücksichtigt werden sollen. Die Ergebnisse werden schließlich absteigend nach der Zahl ihrer Vorkommen aufgelistet, durch das Klicken auf das jeweilige Ergebnis wird man zur entsprechenden Seite weitergeleitet. Entsprechend eignet sich dieses Tool vor allem zur Identifikation von Erweiterungsbedarf spezifischer Projekte/Kategorien.
http://tools.wmflabs.org/missingtopics/
Most wanted
Diese Seite listet die meistgewünschten Artikel für verschiedene Sprachversionen anhand der Zahl roter Wikilinks (‚redlinks’). Diese Auflistung ist derzeit für zwölf verschiedene Sprachversionen verfügbar, darunter auch die deutsche. Die Anzahl der angezeigten Ergebnisse lässt sich von zwanzig bis tausend variieren, womit aber auch entsprechende Ladezeiten einhergehen. Die Ergebnisse werden absteigend nach der Zahl der ‚redlinks’ angeordnet und stellen gleichzeitig Links zur entsprechenden Seite im jeweiligen Projekt dar, ebenso kann optional die jeweilige Kategorie des Ergebnisses eingeblendet werden. Zusätzlich lassen sich ebenfalls über einen Direktlink die einzelnen Verlinkungen einsehen oder auch eine Internet-Recherche starten. Somit scheint diese Seite explizit zur Erweiterung des jeweiligen Projekts animieren zu wollen. Die Seite wird täglich aktualisiert.
http://tools.wmflabs.org/most-wanted/
Not in the Other Language
Dieses Tool gibt Seiten einer bestimmten Sprache an, zu denen es keine entsprechende Seite in anderen Sprachversionen gibt. Dazu kann die Ausgangssprache festgelegt werden und die Sprache der voraussichtlich fehlenden Seite. Dabei besteht die Auswahl zwischen vier Projekten: Wikipedia, Wikisource, Wikivoyage und Wiktionary. Optional kann auch ein Kategorienbaum mit entsprechender Tiefe (zu berücksichtigende Subkategorien) definiert oder ein Teil des Titels angegeben werden. Das Ergebnis selbst ist ein Link zu einer entsprechend zusammenfassenden WikiData-Seite.
http://tools.wmflabs.org/not-in-the-other-language/
Wikidata Terminator
Dieses Tool kann Wikidata-Elemente suchen, denen eine Bezeichnung, Beschreibung oder ein Artikel in einer bestimmten Sprache fehlt. In der Eingabemaske kann hierzu zunächst über ein Dropdown-Menü zwischen einer Suche nach fehlenden Bezeichnungen (‚labels’), fehlenden Beschreibungen (‚descriptions’) oder fehlenden Artikeln (‚articles’) gewählt werden. Anschließend können eine oder auch mehrere Sprachversionen zur Anfrage angegeben werden. Zur Präsentation der Ergebnisse stehen verschiedene Optionen zur Sortierung zur Verfügung, ebenso kann die Anzahl der anzuzeigenden Ergebnisse zwischen fünfzig und fünfhundert variiert werden. Eine SPARQL-Anfrage kann ebenfalls formuliert werden. Direktverlinkungen bei den Ergebnissen ermöglichen eine unmittelbare Ergänzung der fehlenden Elemente.
http://tools.wmflabs.org/wikidata-terminator/
Multimodale Analysen
Wikipedia Cross-Lingual Image Analysis
Dieses Tool stellt zu einer angegebenen Artikelseite die hierbei in anderen Sprachversionen verwendeten Bilder vergleichend gegenüber. Hierzu genügt es, im Eingabefeld die URL des Ausgangsartikels anzugeben. Das Tool durchsucht alle Sprachversionen und stellt schließlich die jeweils verwendeten Bilder tabellarisch dar. Die Ergebnisliste lässt sich dabei nach Sprachen oder Bildern anordnen. Die Anordnung nach Bildern gibt einen Überblick über etwaige Verwendung identischer Bilder in verschiedenen Sprachversionen. Über Links in der Kopfleiste gelangt man direkt zur Artikelseite der ausgewählten Sprachversion. Die können über einen Download gesichert werden (hierbei handelt es sich jedoch nur um eine Zusammenstellung der entsprechenden Links, die Bilder werden als solche nicht gesichert).
https://tools.digitalmethods.net/beta/wikipediaCrosslingualImageAnalysis/
Analyse von Kategorien
Category Analysis
Diese Seite listet Benutzerbeiträge innerhalb einer Kategorie (Betaversion) hinsichtlich verschiedener Parameter auf. Dazu zählen beispielsweise die betroffenen Seiten, die Benutzer und schließlich die jeweiligen Bearbeitungen. Zudem wird eine monatige Auswertung erstellt, welche hinzugefügte und entfernte Bytes zu allen Artikeln, die Neuanlage von Artikeln, beteiligte Benutzer und deren jeweilige Anteile an den Bearbeitungen enthält. Es kann mit Kategoriennamen nach Artikeln einer Kategorie oder mit Präfixen nach Artikeln einer Unterkategorie gesucht werden. Zur besseren Anwendbarkeit werden Bots und Benutzer mit weniger als zehn Beiträgen in den dargestellten Daten nicht berücksichtigt.
https://tools.wmflabs.org/meta/catanalysis/
CatNap
Diese Seite listet alle Wikipedia-Artikel einer bestimmten Kategorie auf, gruppiert nach anderen Kategorien, in welche sie ebenfalls eingeordnet sind. Eine Gruppe bilden die Artikel der Kategorie, eine andere Gruppe entsteht durch die Auflistung aller anderen Kategorien, in die diese Artikel eingeordnet sind. Dadurch ist auch eine Mehrfachnennung von Artikeln in der Ergebnisliste möglich. Es lassen sich verschiedene Sprachversionen vorauswählen, wobei bei den Ergebnissen immer auch auf Ergebnisse anderer Sprachversionen verwiesen wird. Sollen bestimmte Kategorien bei der Analyse ausgelassen werden, können diese auszulassenden Kategorien in einem Dialogfenster vermerkt werden.
http://tools.wmflabs.org/catnap/
PetScan
Diese Seite kann Listen von Wikipedia-Seiten (und verwandten Projekten) oder Wikidata-Elementen erstellen, die bestimmte Kriterien erfüllen, beispielsweise alle Seiten in einer bestimmten Kategorie oder alle Elemente mit einer bestimmten Eigenschaft. PetScan kann einige temporäre Listen (hier als "Quellen" bezeichnet) auf verschiedene Arten kombinieren, um eine neue Liste zu erstellen. Für längerfristige Beobachtungen können die erstellten Anfragen auch über eine URL gespeichert werden, wobei die Anfrage dann die möglicherweise neuen aktualisierten Projektinhalte ebenfalls berücksichtigt. Zahlreiche einstellbare Parameter ermöglichen äußerst präzise Anfragen, darunter beispielsweise Namensräume, Kategorien, Größe (Byte), aber auch Mindestanzahl der Verlinkungen, letzte Änderungen oder Bot-Aktivität. Das Ausgabeformat der Ergebnisse kann ebenfalls variiert werden, eine ausführliche Anleitung zur Einstellung der Suchparameter ist ebenfalls vorhanden (auch eine vereinfachte deutschsprachige Version).http://tools.wmflabs.org/catscan2/catscan2.php?interface_language=de&project=wikipedia&language=de
Items by Cat
Dies ist ein Tool, um vorhandene oder fehlende Elemente anhand einer Wikipedia-Kategorie zu finden. Es gibt drei Eingabefelder, die als Offset, Limit und Rekursionsebene bezeichnet werden, wobei entweder die ersten beiden oder das dritte verwendet werden können. Ein gesetztes Limit überschreibt die Rekursionsebene, entsprechende Limits ergeben dabei vor allem deshalb Sinn, wenn besonders umfangreiche Kategorien untersucht werden, was gemäß der Nutzerseite zum Tool ohne entsprechendes Limit des Öfteren zu Fehlern der Anwendung führt. Das Eingabefenster der Rekursionsebene ermöglicht die Berücksichtigung von Unterkategorien, wobei der eingegebene Wert die Anzahl der zu berücksichtigenden Unterkategorien (also die ‚Tiefe’) definiert. Gerade hierbei kommt es jedoch ebenfalls aufgrund größerer Datenmengen vermehrt zu Fehlern bei der Anwendung, auf der Nutzerseite zum Tool wird daher eine gewisse Vorsicht bei dieser Funktion empfohlen. Diese Nutzerseite fasst ebenfalls weitere Probleme des Tools zusammen und liefert gleichzeitig eine rudimentäre Anleitung. Das Ausgabeformat der Ergebnisse kann zwischen HTML, Wiki-Markup und einfachem Text variiert werden. Das Tool ist in elf verschiedenen Sprachen verfügbar.
http://tools.wmflabs.org/bene/itemsbycat/
TreeViews
Dieses Tool erstellt eine monatliche Abrufstatistik für Kategorienbäume. Dabei können Start- und Enddatum vom Nutzer eingestellt werden, ebenso wie weitere Parameter, darunter die Sprachversion oder die Untersuchungstiefe. Zusätzlich aktivierbare Optionen erweitern die Suchmöglichkeiten, beispielsweise die automatische Suche in anderen Sprachversionen, die Abfrage der Entstehungszeitpunkte jeder einzelnen Seite oder ein Einbezug jeglicher Seiten, die in nur einer Kategorie vorzufinden sind (standardgemäß werden nur jene Seiten berücksichtigt, die in allen angegebenen Kategorien vorzufinden sind). Verwiesen wird bei diesen Zusatzoptionen auf die möglicherweise stark erhöhte Bearbeitungszeit bei entsprechender Aktivierung. Bei den vom Nutzer angegebenen Kategorien kann ebenfalls durch entsprechende Optionen auch die Diskussionsseite berücksichtigt werden, oder aber die Seiten, welcher in einer bestimmten Kategorie zu finden sind, ausgeschlossen werden. Die Darstellung der Ergebnisse erfolgt tabellarisch mit absteigender Abrufhäufigkeit.
http://tools.wmflabs.org/glamtools/treeviews/
Get Distinct Authors
Erstellte eine Liste aller beteiligten Autoren verschiedener, definierter Seiten. Das Ergebnis wird als reiner Text, also ohne Formatierungen angezeigt, und ist dazu gedacht, in andere Seiten oder zur Weiterverarbeitung kopiert zu werden. Die Darstellung erfolgt dabei tabellarisch anhand absteigender Bearbeitungen der jeweiligen Autoren (in Klammern).
http://tools.wmflabs.org/magnustools/get_distinct_authors.php
Herding Sheep
Dieses Tool ermöglicht es, die gemeinsamen Bearbeitungen einer Autorengruppe innerhalb einer Kategorie, oder aber die von Bearbeitungen einer bestimmten Autorengruppe betroffenen Kategorien nachzuverfolgen. Entsprechend kann entweder eine Kategorie zur Untersuchung definiert werden oder aber eine Liste von Autoren. Die Einstellung des zu untersuchenden Zeitfensters kann dabei bis auf die Sekunde genau vorgenommen werden. Ebenfalls kann ein Limit der anzuzeigenden Ergebnisse definiert werden.
http://tools.wmflabs.org/magnustools/herding_sheep.php
Wikipedia Page History Statistics
Dieses Tool zeigt die Menge an Änderungen an einem Artikel im Zeitverlauf sowie die Autoren eines Artikels nach der Anzahl ihrer anteiligen Bearbeitungen an. Eine Übersichtsstatistik liefert Informationen über die Gesamtzahl der Bearbeitungen, der ersten und jüngsten Bearbeitung, der durchschnittlichen Zeit zwischen einzelnen Bearbeitungen sowie die durchschnittlichen Bearbeitungen pro Monat und pro Jahr innerhalb der gesamten Lebensdauer des betrachteten Artikels. Zusätzlich wird eine Gesamtzahl beteiligter Nutzer und die durchschnittliche Bearbeitungszahl pro Nutzer angegeben. Der Aktualität wird durch die Angabe der Bearbeitungen innerhalb des letzten Tages, der letzten Woche, des letzten Monats und des letzten Jahres angegeben. Eine tabellarische Jahres- und Monatsübersicht erlaubt den Zeitvergleich der Bearbeitungsintensität. Eine tabellarische Präsentation der beteiligten Nutzer, angeordnet nach absteigender Bearbeitungszahl, erlaubt Rückschlüsse auf die wichtigsten Beteiligten der Artikelbearbeitungen.http://vs.aka-online.de/cgi-bin/wppagehiststat.pl
Andere Tools
Histropedia
Histropedia nutzt Daten aus Wikipedia und Wikidata, um automatisiert interaktive Zeitstrahlen zu generieren mit Ereignissen, die auf Wikipedia-Artikel verweisen. Es bietet die Möglichkeit, Zeitstrahlen und Ereignisse zu kombinieren, um eigene benutzerdefinierte Zeitstrahlen zu erzeugen. Über die Suchbox von Histropedia im Zeitstrahl-Verzeichnis können tausende von Zeitstrahlen zu hunderten von Themen entdeckt werden. Auf dem Zeitstrahl erscheinen Pop-Up-Boxen mit Informationen zum Thema in Form von YouTube-Videos, Twitter-Erwähnungen oder Bücher auf Amazon zu ähnlichen Themen. Die Seite bezieht zurzeit nur englischsprachige Wikipedia-Artikel mit ein. Eine Liste der beliebtesten Zeitstrahlen bietet zwanzig verschiedene Zeitstrahlen zum Erkunden an.http://www.histropedia.com/
Wikidata Translate
Dieses Tool ermöglicht eine sprachübergreifende Suche nach bestimmten Übersetzungen, beziehungsweise Artikelseiten. Nach der Wahl der Ausgangssprache über ein Dropdown-Menü kann in einem Eingabefenster der zu suchende Begriff eingegeben werden. Sofern vorhanden, erscheinen dann die entsprechenden Übersetzungen mit Verlinkungen zur Artikelseite der jeweiligen Sprachversion. Insgesamt arbeitet dieses Tool mit den Sprachen Deutsch, Englisch, Französisch, Niederländisch und Spanisch. http://tools.wmflabs.org/hay/wdtranslate/
Global Wikipedia Article Search
Diese Seite erlaubt es, alle Wikipedia-Hauptseiten nach Artikeln zu durchsuchen, welche den eingegebenen Begriff in den unterschiedlichen Sprachen im Titel tragen. Dadurch werden fehlende Verbindungen zwischen den (verschiedensprachigen) Wikipedia-Artikelseiten offenbart. Dabei leistet die Seite weder eine wörtliche Übersetzung noch eine Volltextsuche, sondern prüft lediglich, ob ein Artikel mit dem eingegebenen Namen existiert. Die Ergebnisse werden in einer Liste mit Angaben zu Land, Größe, Zeitstempel, Mitwirkenden und Weiterleitungen der Artikel angezeigt. Da die Daten von Servern auf der ganzen Welt abgerufen werden, kann die Suche einige Zeit in Anspruch nehmen. http://vs.aka-online.de/globalwpsearch/
Wikipedia TOC Scraper
Dieses Tool durchforstet die ‚Table of Contents‘ nach Bearbeitungen eines Artikels und zeigt die Ergebnisse anhand chronologisch geordneter TOCs an. Dabei kann die Sprachversion ausgewählt und die Ergebnisliste auf bis zu fünfhundert Ergebnisse begrenzt werden. Ist die Suche abgeschlossen, werden die Ergebnisse einzeln durchklickbar (‚TOC Browser’) mit dem jeweiligen Bearbeiter, Zeitstempel und einem Kommentar zum Bearbeitungsvorgang angezeigt. https://tools.digitalmethods.net/beta/wikitoc/
Community Health Initiative | Interaction Timeline
Dieses Tool erstellt einen chronologischen, vergleichenden Überblick über die Aktivität zweier Bearbeiter einer Seite. Dies soll ermöglichen, im Konfliktfall den Verlauf der Aktivitäten beider Disputbeteiligter besser nachvollziehen zu können. Dazu können die beiden zu vergleichenden Bearbeiter sowie das zu durchsuchende Wiki angegeben werden. Die Anfrage kann zeitlich tagesgenau eingeschränkt werden. Die erstellte Zeitleiste zeigt dann im angegeben Zeitfenster jene Artikelbearbeitungen an, welche die angegeben Benutzer gemeinsam an einem Artikel durchgeführt haben. Damit lassen sich auch artikelübergreifende Entwicklungen nachvollziehen und ein Konflikt einer Artikelseite kann somit besser in einem gegebenenfalls größerem Konfliktkontext verstanden werden. Dem Anspruch der Sichtbarmachung von Konfliktdynamiken folgt auch die farbliche Markierung zur Veranschaulichung der Zeitabstände zwischen den Bearbeitungen – dies soll Aufschluss darüber geben, ob sogenannte ‚Edit-Wars’ intensiver stattfinden. https://tools.wmflabs.org/interaction-timeline/
*Angesichts der komprimierten Beschreibungen wurde zur leichteren Lesbarkeit die (generisch) maskuline Form verwendet. Es sei ausdrücklich darauf hingewiesen, dass trotzdessen alle Geschlechter gemeint – und entsprechend mitzudenken – sind.