Tools und Ressourcen: Unterschied zwischen den Versionen

Aus linguistische-wikipedistik
Zur Navigation springen Zur Suche springen
 
(39 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 11: Zeile 11:
 
|-
 
|-
 
|}
 
|}
 +
<br>
 +
<br>
 +
<br>
  
 +
=='''Ressourcen'''==
 +
<br>
 +
'''Wikipedia-Korpora im Deutschen Referenzkorpus (DeReKo)'''
 +
<br>
 +
[[Datei:Maulwurf gross1.gif|left|frameless|border]]
 +
<small>Die Wikipedia steht unter freien Lizenzen zur Verfügung und bietet damit der Forschung die Möglichkeit, die Daten in linguistisch aufbereitete Korpora zu überführen. Das Institut für Deutsche Sprache (IDS) bietet seit 2005 über seine Korpusinfrastruktur Zugriff auf linguistisch aufbereitete Korpora u.a. zu Wikipedia-Artikeln, Wikipedia-Diskussionen und Wikipedia-Benutzerdiskussionen zu verschiedenen Jahrgängen und in mehreren Sprachen.  Der Bestand wird laufend erweitert und ausgebaut: Seit 2011 erscheint alle zwei Jahre eine neue Konvertierung der deutschsprachigen Wikipedia (vgl. Lüngen/Kupietz 2017). Die Wikipedia-Korpora sind Bestandteil des deutschen Referenzkorpus (DeReKo), das mit 42 Milliarden Wörtern (Release vom 23.02.2018) das größte Archiv von Korpora geschriebener Gegenwartssprache darstellt. Über das Corpus Search, Management and Analysis System (COSMAS II) sind zudem Wikipedia-Korpora in acht weiteren Sprachen verfügbar (Englisch, Französisch, Spanisch, Kroatisch, Polnisch, Italienisch, Ungarisch, Norwegisch). Weitere Hinweise zur Korpusressource finden sich unter: http://www1.ids-mannheim.de/kl/projekte/korpora/archiv/wp.html</small>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
'''Use Case auf YouTube zu COSMAS und den Wikipedia-Korpora in DeReKo'''
 +
[[Datei:Clarin-D.png|left|frameless|border]]
 +
 +
<small>In diesem Video im YouTube-Kanal des CLARIN-D-Infrastrukturprojekts zeigt Eva Gredel, wie die oben beschriebenen Wikipedia-Korpora im Deutschen Referenzkorpus (DeReKo) mithilfe von COSMAS II für Sprach-Analysen am Beispiel von „-itis“- Kombinationen als Wortbildungsprodukte auf den Diskussionsseiten der Wikipedia genutzt werden können.
 +
https://www.youtube.com/watch?v=bKw1yaf_imk</small>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
  
 
=='''Tools'''==
 
=='''Tools'''==
Zeile 20: Zeile 49:
 
[[Datei:WhoVIS.png|left|frameless|border]]
 
[[Datei:WhoVIS.png|left|frameless|border]]
 
<small> '''Whovisual''' ermöglicht '''interaktive Visualisierungen zur Erforschung der Artikelgenese''', welches sich in die Projekte WhoColor (Alphaversion) und whoVIS (Alphaversion) aufteilt.  
 
<small> '''Whovisual''' ermöglicht '''interaktive Visualisierungen zur Erforschung der Artikelgenese''', welches sich in die Projekte WhoColor (Alphaversion) und whoVIS (Alphaversion) aufteilt.  
 +
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 
'''WhoVIS''' ist der Prototyp einer '''Netzwerk-Visualisierung der Interaktion zwischen Editoren''' für einzelne Artikel. Er basiert auf den Wörtern/Tokens, welche von Editoren entfernt und wiedereingeführt worden sind. Da sich die Anwendung noch in der Anfangsphase befindet, dauert das Laden der Seite mitunter länger. </small>
 
'''WhoVIS''' ist der Prototyp einer '''Netzwerk-Visualisierung der Interaktion zwischen Editoren''' für einzelne Artikel. Er basiert auf den Wörtern/Tokens, welche von Editoren entfernt und wiedereingeführt worden sind. Da sich die Anwendung noch in der Anfangsphase befindet, dauert das Laden der Seite mitunter länger. </small>
 
<small>http://www.f-squared.org/whovisual/</small>
 
<small>http://www.f-squared.org/whovisual/</small>
 +
<br>
 
<br>
 
<br>
 
<br>
 
<br>
Zeile 59: Zeile 90:
  
 
<small>Dieses Tool '''erstellt Statistiken von Admin-Aktivitäten'''. Hierbei kann bei der Eingabemaske neben dem Projekt und einer entsprechenden Sprachversion auch der Betrachtungszeitraum auf den Tag genau eingestellt werden. In den Ergebnissen wird zunächst eine Übersichtsstatistik dargeboten, welche beispielsweise die Gesamtzahl der aktiven Admins im betrachteten Zeitraum angibt. In der tabellarischen Anordnung (absteigend nach absoluter Zahl der Aktivitäten) werden nur solche Admins aufgeführt, welche im Betrachtungszeitraum mindestens eine Aktivität aufweisen. Es wird darauf verwiesen, dass einige der aufgeführten Akteure keine Admins mehr sind oder noch nie welche waren, jedoch Aktionen durchgeführt haben, welche gewisser Admin-Rechte bedürfen. Die einzelnen Admins werden mit Informationen dargestellt, welche unter anderem Lösch- oder Wiederherstellungsvorgänge in absoluten Zahlen angeben. Klickt man auf den Namen des angeführten Admins, gelangt man zu dessen Benutzerseite. Je nach Anfrage kann die Bearbeitungsdauer variieren und entsprechend lange Ladezeiten nach sich ziehen.</small><small>http://tools.wmflabs.org/xtools/adminstats/?uselang=en</small>
 
<small>Dieses Tool '''erstellt Statistiken von Admin-Aktivitäten'''. Hierbei kann bei der Eingabemaske neben dem Projekt und einer entsprechenden Sprachversion auch der Betrachtungszeitraum auf den Tag genau eingestellt werden. In den Ergebnissen wird zunächst eine Übersichtsstatistik dargeboten, welche beispielsweise die Gesamtzahl der aktiven Admins im betrachteten Zeitraum angibt. In der tabellarischen Anordnung (absteigend nach absoluter Zahl der Aktivitäten) werden nur solche Admins aufgeführt, welche im Betrachtungszeitraum mindestens eine Aktivität aufweisen. Es wird darauf verwiesen, dass einige der aufgeführten Akteure keine Admins mehr sind oder noch nie welche waren, jedoch Aktionen durchgeführt haben, welche gewisser Admin-Rechte bedürfen. Die einzelnen Admins werden mit Informationen dargestellt, welche unter anderem Lösch- oder Wiederherstellungsvorgänge in absoluten Zahlen angeben. Klickt man auf den Namen des angeführten Admins, gelangt man zu dessen Benutzerseite. Je nach Anfrage kann die Bearbeitungsdauer variieren und entsprechend lange Ladezeiten nach sich ziehen.</small><small>http://tools.wmflabs.org/xtools/adminstats/?uselang=en</small>
 +
<br>
 +
<br>
 +
'''X!'s Edit Counter'''
 +
 +
[[Datei:Edit Counter.png|rahmenlos|Edit Counter|left|frameless|border]]
 +
<small>Dieses Tool erstellt eine '''umfangreiche Zusammenfassung von Aktivitäten eines bestimmten Nutzers'''. In der Eingabemaske kann neben dem entsprechenden Projekt und dem Nutzernamen anhand verschiedener vordefinierter Kriterien die Ergebnispräsentation eingeschränkt werden, indem bestimmte Betrachtungskategorien ausgelassen werden. Die Kategorien beinhalten eine Übersichtsstatistik, eine Zusammenfassung der Aktivität nach Namensräumen, nach Jahren, nach Monaten, die am meisten bearbeiteten Seiten, eine Historie der erworbenen/verlorenen Bearbeitungsrechte, und die jüngsten Bearbeitungen. Die Ergebnispräsentation kann unter Umständen manche Kategorien nicht berücksichtigen, wenn der Nutzer die Freigabe für die entsprechenden Daten nicht erteilt hat.
 +
Die Übersichtsstatistik beinhaltet neben Basisinformationen wie der Gesamtzahl der Bearbeitungen etc. eine genauere Betrachtung der Bearbeitungen (durchschnittliche Bearbeitungen pro Tag etc.), eine genauere Betrachtung der bearbeiteten Seiten (durchschnittliche Bearbeitungen pro Seite), der Dateien, der Blocks, der Aktionen (Danken etc.), der Administratorenaktivitäten (Schützen eines Beitrags etc.) und der Aktivität in unterschiedlichen Sprachversionen und Projekten. Die Darstellung der Aktivitäten nach Namensräumen erfolgt tabellarisch absteigend (absolut, prozentual) und tortendiagrammisch. Alle angezeigten Daten können über einen Link heruntergeladen werden. Die Ladezeit nach erfolgter Anfrage variiert stark je nach vorhandener Datenmenge bei den Ergebnissen.</small>
 +
 +
<small>http://tools.wmflabs.org/xtools-ec/?uselang=en</small>
 
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 +
'''xContribs'''
 +
[[Datei:Single User Contributions.png|left|frameless|border]]
 +
<small>Dieses Tool gibt einen '''Überblick über die ‚xWikiness‘ eines Benutzers''', beispielsweise über die Verteilung der Beiträge in verschiedenen Projekten. Verschiedene numerische Werte, darunter der Theil-Index (Ungleichverteilungsmaß) sollen Rückschlüsse darüber erlauben, wie engagiert der betrachtete Nutzer auch projektübergreifend agiert.</small>
  
 +
<small>https://tools.wmflabs.org/erwin85/xcontribs.php</small>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
 +
 +
<br>
 +
<br>
 
===Analyse und Visualisierung von Kontroversen===
 
===Analyse und Visualisierung von Kontroversen===
 
'''Contropedia'''
 
'''Contropedia'''
Zeile 74: Zeile 128:
 
<br>
 
<br>
 
<br>
 
<br>
 
  
 
===Analysen von Artikel-Historien===
 
===Analysen von Artikel-Historien===
Zeile 112: Zeile 165:
  
 
<br>
 
<br>
===Suchoptionen===
+
===Statistische Auswertungen===
 
 
'''Global Wikipedia Article Search'''
 
[[Datei:Global Search.png|left|frameless|border]]
 
<small>Diese Seite erlaubt es, '''alle Wikipedia-Hauptseiten nach Artikeln zu durchsuchen, welche den eingegebenen Begriff in den unterschiedlichen Sprachen im Titel tragen'''. Dadurch werden fehlende Verbindungen zwischen den (verschiedensprachigen) Wikipedia-Artikelseiten offenbart. Dabei leistet die Seite weder eine wörtliche Übersetzung noch eine Volltextsuche, sondern prüft lediglich, ob ein Artikel mit dem eingegebenen Namen existiert. Die Ergebnisse werden in einer Liste mit Angaben zu Land, Größe, Zeitstempel, Mitwirkenden und Weiterleitungen der Artikel angezeigt. Da die Daten von Servern auf der ganzen Welt abgerufen werden, kann die Suche einige Zeit in Anspruch nehmen. http://vs.aka-online.de/globalwpsearch/</small>
 
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 
 
 
===Statistik (allgemein)===
 
  
 
'''Wikimedia Statistics'''
 
'''Wikimedia Statistics'''
Zeile 130: Zeile 171:
 
<small>Diese Seite '''vereint zahlreiche statistische Analysen, Visualisierungen und Links und stellt umfangreiche Datensätze zur Verfügung'''. Auf der Start- beziehungsweise Übersichtsseite lassen sich die Statistiken nach den jeweiligen Projekten (Wikipedia, Wiktionary etc.) getrennt anzeigen, in der Monatsübersicht lassen sich entweder alle Projekte oder aber jeweils einzelne mit Übersichtsinformationen anzeigen. Diese sind unterteilt in die Kategorien Aufrufe, Beiträge und Inhalt. Bei den Aufrufen wird die Gesamtzahl in allen Sprachversionen (sofern im Projekt in Sprachversionen unterschieden wird) mit dem jeweiligen Monats- und Jahrestrend im Vergleich angezeigt. In absteigender Anordnung wird ebenfalls eine Liste der Länder mit den meisten Aufrufen dargeboten, bei einem Klick auf die jeweiligen Übersichten wird man zu detaillierteren Darstellungen weitergeleitet. In der Kategorie der Beiträge wird wie bei den Aufrufen die Gesamtzahl der Beiträge angegeben, darüber hinaus die Anzahl der neu registrierten Nutzer (ebenfalls mit vergleichendem Monats- und Jahrestrend) sowie die meisteditierenden Benutzer. Beim Inhalt wird lediglich die Entwicklung der Datenmenge (in Gigabyte) im Differenzvergleich angegeben.  
 
<small>Diese Seite '''vereint zahlreiche statistische Analysen, Visualisierungen und Links und stellt umfangreiche Datensätze zur Verfügung'''. Auf der Start- beziehungsweise Übersichtsseite lassen sich die Statistiken nach den jeweiligen Projekten (Wikipedia, Wiktionary etc.) getrennt anzeigen, in der Monatsübersicht lassen sich entweder alle Projekte oder aber jeweils einzelne mit Übersichtsinformationen anzeigen. Diese sind unterteilt in die Kategorien Aufrufe, Beiträge und Inhalt. Bei den Aufrufen wird die Gesamtzahl in allen Sprachversionen (sofern im Projekt in Sprachversionen unterschieden wird) mit dem jeweiligen Monats- und Jahrestrend im Vergleich angezeigt. In absteigender Anordnung wird ebenfalls eine Liste der Länder mit den meisten Aufrufen dargeboten, bei einem Klick auf die jeweiligen Übersichten wird man zu detaillierteren Darstellungen weitergeleitet. In der Kategorie der Beiträge wird wie bei den Aufrufen die Gesamtzahl der Beiträge angegeben, darüber hinaus die Anzahl der neu registrierten Nutzer (ebenfalls mit vergleichendem Monats- und Jahrestrend) sowie die meisteditierenden Benutzer. Beim Inhalt wird lediglich die Entwicklung der Datenmenge (in Gigabyte) im Differenzvergleich angegeben.  
 
Hinsichtlich der einzelnen Projekte (Wikipedia etc.) sind verschiedene Übersichtsstatistiken beispielsweise zu den Sprachversionen in einer Tabelle zusammengefasst, in welcher Informationen zu den Regionen, der Beteiligung, den Bearbeitungen, Aufrufen usw. zu finden sind. Über Links sind zu jeder Ergebniszeile entsprechende detailliertere Zusammenfassungen, Tabellen und Diagramm verfügbar. In einer weiteren Tabelle finden sich Vergleichsstatistiken, beispielsweise die Anzahl der Wörter in der Wikipedia im Ländervergleich im Zeitverlauf (dies ist jedoch nur eine von zahlreichen Statistiken zu den verschiedensten Themengebieten im Vergleich).  
 
Hinsichtlich der einzelnen Projekte (Wikipedia etc.) sind verschiedene Übersichtsstatistiken beispielsweise zu den Sprachversionen in einer Tabelle zusammengefasst, in welcher Informationen zu den Regionen, der Beteiligung, den Bearbeitungen, Aufrufen usw. zu finden sind. Über Links sind zu jeder Ergebniszeile entsprechende detailliertere Zusammenfassungen, Tabellen und Diagramm verfügbar. In einer weiteren Tabelle finden sich Vergleichsstatistiken, beispielsweise die Anzahl der Wörter in der Wikipedia im Ländervergleich im Zeitverlauf (dies ist jedoch nur eine von zahlreichen Statistiken zu den verschiedensten Themengebieten im Vergleich).  
In einem themenbezogenen Bereich, der von der Übersichtsseite aus erreichbar ist, sind umfangreiche Linksammlungen zu verschiedensten Anwendungen (beispielsweise fortgeschrittene dynamische Visualisierungsangebote) zu finden, wobei durch Symbole neben den Links erkennbar gemacht wird, ob dieser Link auf eine Seite der Wikimedia Foundation (Host der Seite), eines speziellen Toolserver, der Wikipedia oder eines externen Anbieters weiterleitet. Ein Suchfunktion auf der Übersichtsseite erlaubt ein konzentrierteres Suchen nach Informationen (Statistiken, Visualisierungen etc.) eines spezifischen Interesses (Aufrufe, Bearbeitungen, Nutzer, Bots etc.).</small>
+
In einem themenbezogenen Bereich, der von der Übersichtsseite aus erreichbar ist, sind umfangreiche Linksammlungen zu verschiedensten Anwendungen (beispielsweise fortgeschrittene dynamische Visualisierungsangebote) zu finden, wobei durch Symbole neben den Links erkennbar gemacht wird, ob dieser Link auf eine Seite der Wikimedia Foundation (Host der Seite), eines speziellen Toolserver, der Wikipedia oder eines externen Anbieters weiterleitet. Ein Suchfunktion auf der Übersichtsseite erlaubt ein konzentrierteres Suchen nach Informationen (Statistiken, Visualisierungen etc.) eines spezifischen Interesses (Aufrufe, Bearbeitungen, Nutzer, Bots etc.).</small><small>http://stats.wikimedia.org/</small>
 
 
<small>http://stats.wikimedia.org/</small>
 
 
 
 
 
 
 
 
 
  
<big>Statistik (Bearbeitungsverlauf)</big>
 
  
  
Zeile 159: Zeile 193:
 
<small>http://cosmiclattes.github.io/wikireplay/player.html</small>
 
<small>http://cosmiclattes.github.io/wikireplay/player.html</small>
  
 
'''X!'s Edit Counter'''
 
 
[[Datei:Edit Counter.png|rahmenlos|Edit Counter|left|frameless|border]]
 
<small>Dieses Tool erstellt eine '''umfangreiche Zusammenfassung von Aktivitäten eines bestimmten Nutzers'''. In der Eingabemaske kann neben dem entsprechenden Projekt und dem Nutzernamen anhand verschiedener vordefinierter Kriterien die Ergebnispräsentation eingeschränkt werden, indem bestimmte Betrachtungskategorien ausgelassen werden. Die Kategorien beinhalten eine Übersichtsstatistik, eine Zusammenfassung der Aktivität nach Namensräumen, nach Jahren, nach Monaten, die am meisten bearbeiteten Seiten, eine Historie der erworbenen/verlorenen Bearbeitungsrechte, und die jüngsten Bearbeitungen. Die Ergebnispräsentation kann unter Umständen manche Kategorien nicht berücksichtigen, wenn der Nutzer die Freigabe für die entsprechenden Daten nicht erteilt hat.
 
Die Übersichtsstatistik beinhaltet neben Basisinformationen wie der Gesamtzahl der Bearbeitungen etc. eine genauere Betrachtung der Bearbeitungen (durchschnittliche Bearbeitungen pro Tag etc.), eine genauere Betrachtung der bearbeiteten Seiten (durchschnittliche Bearbeitungen pro Seite), der Dateien, der Blocks, der Aktionen (Danken etc.), der Administratorenaktivitäten (Schützen eines Beitrags etc.) und der Aktivität in unterschiedlichen Sprachversionen und Projekten. Die Darstellung der Aktivitäten nach Namensräumen erfolgt tabellarisch absteigend (absolut, prozentual) und tortendiagrammisch. Alle angezeigten Daten können über einen Link heruntergeladen werden. Die Ladezeit nach erfolgter Anfrage variiert stark je nach vorhandener Datenmenge bei den Ergebnissen.</small>
 
 
<small>http://tools.wmflabs.org/xtools-ec/?uselang=en</small>
 
<br>
 
 
<br>
 
<br>
<br>
 
<br>
 
'''xContribs'''
 
[[Datei:Single User Contributions.png|left|frameless|border]]
 
<small>Dieses Tool gibt einen '''Überblick über die ‚xWikiness‘ eines Benutzers''', beispielsweise über die Verteilung der Beiträge in verschiedenen Projekten. Verschiedene numerische Werte, darunter der Theil-Index (Ungleichverteilungsmaß) sollen Rückschlüsse darüber erlauben, wie engagiert der betrachtete Nutzer auch projektübergreifend agiert.</small>
 
  
<small>https://tools.wmflabs.org/erwin85/xcontribs.php</small>
+
===Analyse von Seitenaufrufen===
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 
 
 
<br>
 
 
 
===Seitenaufrufe===
 
  
 
'''Pageview Analysis'''
 
'''Pageview Analysis'''
 
[[Datei:Pageview Analysis.png|left|frameless|border]]
 
[[Datei:Pageview Analysis.png|left|frameless|border]]
<small> Pageview Analysis ermöglicht den '''Vergleich der Abrufstatistiken mehrerer Artikelseiten'''. Dabei können in einem Dialogfeld mehrere Artikelseitennamen eingegeben werden, welche vergleichend in einem Diagramm zusammengefasst werden. Der darzustellende Zeitraum lässt sich tagesgenau definieren, zudem lässt sich das spezifische Projekt, beziehungsweise eine spezifische Sprachversion, angeben. Zusätzlich kann über ein Dropdown-Menü zwischen Plattformen (Desktop, Mobile App, etc.) und Agenten (User, Bot, etc.) unterschieden werden. Eine tabellarische Auflistung gibt zudem Auskunft über Bearbeitungen, Autoren usw. der untersuchten Artikelseiten. Hinsichtlich der diagrammischen Darstellungen können verschiedene Diagrammtypen (Linie, Säule, Netz, etc.) zur Veranschaulichung ausgewählt werden. Über Zusatzoptionen kann das jeweilige Diagramm zudem die Werte ausgeschrieben einbeziehen, logarithmieren oder die Y-Achse beim Nullwert beginnen lassen. Ist das Diagramm erst einmal erstellt, kann es über einen Permanentlink oder Download gesichert werden. Die Daten des Tools reichen bis Anfang 2015 zurück, Diagramme für vorige Zeiträume können nicht erstellt werden.</small> <small>http://www.wikipediatrends.com/</small>
+
<small> Pageview Analysis ermöglicht den '''Vergleich der Abrufstatistiken mehrerer Artikelseiten'''. Dabei können in einem Dialogfeld mehrere Artikelseitennamen eingegeben werden, welche vergleichend in einem Diagramm zusammengefasst werden. Der darzustellende Zeitraum lässt sich tagesgenau definieren, zudem lässt sich das spezifische Projekt, beziehungsweise eine spezifische Sprachversion, angeben. Zusätzlich kann über ein Dropdown-Menü zwischen Plattformen (Desktop, Mobile App, etc.) und Agenten (User, Bot, etc.) unterschieden werden. Eine tabellarische Auflistung gibt zudem Auskunft über Bearbeitungen, Autoren usw. der untersuchten Artikelseiten. Hinsichtlich der diagrammischen Darstellungen können verschiedene Diagrammtypen (Linie, Säule, Netz, etc.) zur Veranschaulichung ausgewählt werden. Über Zusatzoptionen kann das jeweilige Diagramm zudem die Werte ausgeschrieben einbeziehen, logarithmieren oder die Y-Achse beim Nullwert beginnen lassen. Ist das Diagramm erst einmal erstellt, kann es über einen Permanentlink oder Download gesichert werden. Die Daten des Tools reichen bis Anfang 2015 zurück, Diagramme für vorige Zeiträume können nicht erstellt werden.</small> <small>https://meta.wikimedia.org/wiki/Pageviews_Analysis/</small>
 
<br>
 
<br>
 
<br>
 
<br>
Zeile 195: Zeile 205:
  
 
'''Page Views for Wikipedia (Non-mobile, Normalized)'''
 
'''Page Views for Wikipedia (Non-mobile, Normalized)'''
 
+
[[Datei:Bildschirmfoto 2019-01-24 um 13.58.30.png|left|frameless|border]]
 
<small>Diese Seite präsentiert eine '''detaillierte, tabellarische Übersicht der monatlichen Aufrufzahlen verschiedener Sprachversionen und ihrer Trends im Vergleich'''. Zahlreiche statistische Angaben reichern die einzelnen Zellen der Tabelle an und betten den angezeigten Wert orientierend in den Kontext der Entwicklungen ein. Die angezeigten Werte sind dabei normalisiert (optional kann auf die Rohdaten zugegriffen werden) und werden nach Angaben der Seite stündlich aktualisiert. Die Daten der Seite beziehen sich dabei jedoch lediglich auf die nicht-mobilen Seiten, zudem ist die Kopfzeile mit generellen Trendinformationen aktuell nicht funktionsfähig (05.01.19). Für Langzeituntersuchungen sollte beachtet werden, dass im Mai 2015 eine Anpassung des Algorithmus’ zur Zählung stattgefunden hat, was dieses Datum umfassende Untersuchungen in ihrer Aussagekraft einschränken könnte. Alle präsentierten Daten können heruntergeladen werden.</small>
 
<small>Diese Seite präsentiert eine '''detaillierte, tabellarische Übersicht der monatlichen Aufrufzahlen verschiedener Sprachversionen und ihrer Trends im Vergleich'''. Zahlreiche statistische Angaben reichern die einzelnen Zellen der Tabelle an und betten den angezeigten Wert orientierend in den Kontext der Entwicklungen ein. Die angezeigten Werte sind dabei normalisiert (optional kann auf die Rohdaten zugegriffen werden) und werden nach Angaben der Seite stündlich aktualisiert. Die Daten der Seite beziehen sich dabei jedoch lediglich auf die nicht-mobilen Seiten, zudem ist die Kopfzeile mit generellen Trendinformationen aktuell nicht funktionsfähig (05.01.19). Für Langzeituntersuchungen sollte beachtet werden, dass im Mai 2015 eine Anpassung des Algorithmus’ zur Zählung stattgefunden hat, was dieses Datum umfassende Untersuchungen in ihrer Aussagekraft einschränken könnte. Alle präsentierten Daten können heruntergeladen werden.</small>
  
 
<small>https://stats.wikimedia.org/EN/TablesPageViewsMonthly.htm</small>
 
<small>https://stats.wikimedia.org/EN/TablesPageViewsMonthly.htm</small>
  
 
+
<br>
 +
<br>
 
'''Wikitrends'''
 
'''Wikitrends'''
 +
[[Datei:Wikitrends.png|left|frameless|border]]
 +
<small>Diese Seite '''fasst die Suchtrends für Artikelseiten für die jeweils verschiedenen Sprachversionen zusammen'''. Dabei wird unterschieden in aufsteigende Trends, absteigende Trends und die meistgesuchten Artikelseiten, wobei die angezeigte Auswahl auf zehn Ergebnisse beschränkt ist. Hinsichtlich der zu berücksichtigenden Zeitspanne kann zwischen dem aktuellen Tag, der aktuellen Woche oder des aktuellen Monats gewählt werden. Hinter den Titeln der Ergebnisse werden in Klammern die Aufrufzahlen angezeigt, beziehungsweise der prozentuale Anstieg/Abfall. Durch einen Klick auf den Titel gelangt man zur entsprechenden Artikelseite.</small>http://www.wikitrends.net
 +
<br>
 +
<br>
 +
<br>
 +
<br>
  
<small>Diese Seite '''fasst die Suchtrends für Artikelseiten für die jeweils verschiedenen Sprachversionen zusammen'''. Dabei wird unterschieden in aufsteigende Trends, absteigende Trends und die meistgesuchten Artikelseiten, wobei die angezeigte Auswahl auf zehn Ergebnisse beschränkt ist. Hinsichtlich der zu berücksichtigenden Zeitspanne kann zwischen dem aktuellen Tag, der aktuellen Woche oder des aktuellen Monats gewählt werden. Hinter den Titeln der Ergebnisse werden in Klammern die Aufrufzahlen angezeigt, beziehungsweise der prozentuale Anstieg/Abfall. Durch einen Klick auf den Titel gelangt man zur entsprechenden Artikelseite.</small>
+
===Suche nach enzyklopädischen "Leerstellen"===
 
 
 
 
<big>Suche nach enzyklopädischen "Leerstellen"</big>
 
  
 
'''Missing Topics'''
 
'''Missing Topics'''
Zeile 235: Zeile 249:
 
<small>http://tools.wmflabs.org/wikidata-terminator/</small>
 
<small>http://tools.wmflabs.org/wikidata-terminator/</small>
  
===Andere Tools===
 
 
'''Global User Search'''
 
 
<small>Diese Seite ermöglicht es, '''nach globalen Nutzern der Wikimedia-Wikis zu suchen'''.  Hierzu kann der Name angegeben werden, optional kann die Anzeige blockierter oder versteckter aktiviert werden ebenso wie beispielsweise die Verwendung regulärer Ausdrücke zur Suche. Verschiedene Suchoptionen erlauben zudem, mit unvollständigen Nutzernamen zu suchen (über Platzhalter). Die Ergebnisse werden tabellarisch dargestellt und zeigen die globalen Gruppen an, denen der jeweilige Nutzer angehört. Über einen Link gelangt man zur globalen Benutzerkonteninformation des jeweiligen Nutzers.</small>
 
 
<small>https://tools.wmflabs.org/meta/gusersearch/</small>
 
 
 
'''Histropedia'''
 
 
<small>Histropedia nutzt Daten aus Wikipedia und Wikidata, um automatisiert '''interaktive Zeitstrahlen''' zu generieren mit Ereignissen, die auf Wikipedia-Artikel verweisen. Es bietet die Möglichkeit, Zeitstrahlen und Ereignisse zu kombinieren, um eigene benutzerdefinierte Zeitstrahlen zu erzeugen. Über die Suchbox von Histropedia im Zeitstrahl-Verzeichnis können tausende von Zeitstrahlen zu hunderten von Themen entdeckt werden. Auf dem Zeitstrahl erscheinen Pop-Up-Boxen mit Informationen zum Thema in Form von YouTube-Videos, Twitter-Erwähnungen oder Bücher auf Amazon zu ähnlichen Themen. Die Seite bezieht zurzeit nur englischsprachige Wikipedia-Artikel mit ein. Eine Liste der beliebtesten Zeitstrahlen bietet zwanzig verschiedene Zeitstrahlen zum Erkunden an.</small>
 
 
<small>http://www.histropedia.com/</small>
 
 
 
'''Wikidata Translate'''
 
[[Datei:Wikipedia Translate.png|left|frameless|border]]
 
<small>Dieses Tool ermöglicht eine '''sprachübergreifende Suche nach bestimmten Übersetzungen, beziehungsweise Artikelseiten'''. Nach der Wahl der Ausgangssprache über ein Dropdown-Menü kann in einem Eingabefenster der zu suchende Begriff eingegeben werden. Sofern vorhanden, erscheinen dann die entsprechenden Übersetzungen mit Verlinkungen zur Artikelseite der jeweiligen Sprachversion. Insgesamt arbeitet dieses Tool mit den Sprachen Deutsch, Englisch, Französisch, Niederländisch und Spanisch.</small> <small>http://tools.wmflabs.org/hay/wdtranslate/</small>
 
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 
 
<br>
 
<br>
 +
===Multimodale Analysen===
 
'''Wikipedia Cross-Lingual Image Analysis'''
 
'''Wikipedia Cross-Lingual Image Analysis'''
 
[[Datei:Cross-lingual image analysis.jpg|left|frameless|border]]
 
[[Datei:Cross-lingual image analysis.jpg|left|frameless|border]]
Zeile 268: Zeile 257:
 
<small>https://tools.digitalmethods.net/beta/wikipediaCrosslingualImageAnalysis/</small>
 
<small>https://tools.digitalmethods.net/beta/wikipediaCrosslingualImageAnalysis/</small>
 
<br>
 
<br>
<br>
 
<br>
 
<br>
 
<br>
 
 
'''Wikipedia TOC Scraper'''
 
 
<small>Dieses Tool '''durchforstet die ‚Table of Contents‘ nach Bearbeitungen eines Artikels und zeigt die Ergebnisse anhand chronologisch geordneter TOCs an'''. Dabei kann die Sprachversion ausgewählt und die Ergebnisliste auf bis zu fünfhundert Ergebnisse begrenzt werden. Ist die Suche abgeschlossen, werden die Ergebnisse einzeln durchklickbar (‚TOC Browser’) mit dem jeweiligen Bearbeiter, Zeitstempel und einem Kommentar zum Bearbeitungsvorgang angezeigt.</small> <small>https://tools.digitalmethods.net/beta/wikitoc/</small>
 
<br>
 
<br>
 
<br>
 
<br>
 
 
'''Community Health Initiative | Interaction Timeline'''
 
  
<small>Dieses Tool '''erstellt einen chronologischen, vergleichenden Überblick über die Aktivität zweier Bearbeiter einer Seite'''. Dies soll ermöglichen, im Konfliktfall den Verlauf der Aktivitäten beider Disputbeteiligter besser nachvollziehen zu können. Dazu können die beiden zu vergleichenden Bearbeiter sowie das zu durchsuchende Wiki angegeben werden. Die Anfrage kann zeitlich tagesgenau eingeschränkt werden. Die erstellte Zeitleiste zeigt dann im angegeben Zeitfenster jene Artikelbearbeitungen an, welche die angegeben Benutzer gemeinsam an einem Artikel durchgeführt haben. Damit lassen sich auch artikelübergreifende Entwicklungen nachvollziehen und ein Konflikt einer Artikelseite kann somit besser in einem gegebenenfalls größerem Konfliktkontext verstanden werden. Dem Anspruch der Sichtbarmachung von Konfliktdynamiken folgt auch die farbliche Markierung zur Veranschaulichung der Zeitabstände zwischen den Bearbeitungen – dies soll Aufschluss darüber geben, ob sogenannte ‚Edit-Wars’ intensiver stattfinden.</small> <small>https://tools.wmflabs.org/interaction-timeline/</small>
 
<br>
 
 
<br>
 
<br>
 
<br>
 
<br>
<big>Kategorien</big>
+
===Analyse von Kategorien===
 
 
 
'''Category Analysis'''
 
'''Category Analysis'''
  
Zeile 305: Zeile 277:
 
'''PetScan'''
 
'''PetScan'''
  
<small>Diese Seite kann '''Listen von Wikipedia-Seiten (und verwandten Projekten) oder Wikidata-Elementen erstellen, die bestimmte Kriterien erfüllen''', beispielsweise alle Seiten in einer bestimmten Kategorie oder alle Elemente mit einer bestimmten Eigenschaft. PetScan kann einige temporäre Listen (hier als "Quellen" bezeichnet) auf verschiedene Arten kombinieren, um eine neue Liste zu erstellen. Für längerfristige Beobachtungen können die erstellten Anfragen auch über eine URL gespeichert werden, wobei die Anfrage dann die möglicherweise neuen aktualisierten Projektinhalte ebenfalls berücksichtigt. Zahlreiche einstellbare Parameter ermöglichen äußerst präzise Anfragen, darunter beispielsweise Namensräume, Kategorien, Größe (Byte), aber auch Mindestanzahl der Verlinkungen, letzte Änderungen oder Bot-Aktivität. Das Ausgabeformat der Ergebnisse kann ebenfalls variiert werden, eine ausführliche Anleitung zur Einstellung der Suchparameter ist ebenfalls vorhanden (auch eine vereinfachte deutschsprachige Version).</small>
+
<small>Diese Seite kann '''Listen von Wikipedia-Seiten (und verwandten Projekten) oder Wikidata-Elementen erstellen, die bestimmte Kriterien erfüllen''', beispielsweise alle Seiten in einer bestimmten Kategorie oder alle Elemente mit einer bestimmten Eigenschaft. PetScan kann einige temporäre Listen (hier als "Quellen" bezeichnet) auf verschiedene Arten kombinieren, um eine neue Liste zu erstellen. Für längerfristige Beobachtungen können die erstellten Anfragen auch über eine URL gespeichert werden, wobei die Anfrage dann die möglicherweise neuen aktualisierten Projektinhalte ebenfalls berücksichtigt. Zahlreiche einstellbare Parameter ermöglichen äußerst präzise Anfragen, darunter beispielsweise Namensräume, Kategorien, Größe (Byte), aber auch Mindestanzahl der Verlinkungen, letzte Änderungen oder Bot-Aktivität. Das Ausgabeformat der Ergebnisse kann ebenfalls variiert werden, eine ausführliche Anleitung zur Einstellung der Suchparameter ist ebenfalls vorhanden (auch eine vereinfachte deutschsprachige Version).</small><small>http://tools.wmflabs.org/catscan2/catscan2.php?interface_language=de&project=wikipedia&language=de</small>
 
 
<small>http://tools.wmflabs.org/catscan2/catscan2.php?interface_language=de&project=wikipedia&language=de</small>
 
  
  
Zeile 335: Zeile 305:
  
 
<small>http://tools.wmflabs.org/magnustools/herding_sheep.php</small>
 
<small>http://tools.wmflabs.org/magnustools/herding_sheep.php</small>
 
+
<br>
 +
<br>
 
'''Wikipedia Page History Statistics'''
 
'''Wikipedia Page History Statistics'''
  
 
<small>Dieses Tool '''zeigt die Menge an Änderungen an einem Artikel im Zeitverlauf sowie die Autoren eines Artikels nach der Anzahl ihrer anteiligen Bearbeitungen an'''. Eine Übersichtsstatistik liefert Informationen über die Gesamtzahl der Bearbeitungen, der ersten und jüngsten Bearbeitung, der durchschnittlichen Zeit zwischen einzelnen Bearbeitungen sowie die durchschnittlichen Bearbeitungen pro Monat und pro Jahr innerhalb der gesamten Lebensdauer des betrachteten Artikels. Zusätzlich wird eine Gesamtzahl beteiligter Nutzer und die durchschnittliche Bearbeitungszahl pro Nutzer angegeben. Der Aktualität wird durch die Angabe der Bearbeitungen innerhalb des letzten Tages, der letzten Woche, des letzten Monats und des letzten Jahres angegeben. Eine tabellarische Jahres- und Monatsübersicht erlaubt den Zeitvergleich der Bearbeitungsintensität. Eine tabellarische Präsentation der beteiligten Nutzer, angeordnet nach absteigender Bearbeitungszahl, erlaubt Rückschlüsse auf die wichtigsten Beteiligten der Artikelbearbeitungen.</small><small>http://vs.aka-online.de/cgi-bin/wppagehiststat.pl</small>
 
<small>Dieses Tool '''zeigt die Menge an Änderungen an einem Artikel im Zeitverlauf sowie die Autoren eines Artikels nach der Anzahl ihrer anteiligen Bearbeitungen an'''. Eine Übersichtsstatistik liefert Informationen über die Gesamtzahl der Bearbeitungen, der ersten und jüngsten Bearbeitung, der durchschnittlichen Zeit zwischen einzelnen Bearbeitungen sowie die durchschnittlichen Bearbeitungen pro Monat und pro Jahr innerhalb der gesamten Lebensdauer des betrachteten Artikels. Zusätzlich wird eine Gesamtzahl beteiligter Nutzer und die durchschnittliche Bearbeitungszahl pro Nutzer angegeben. Der Aktualität wird durch die Angabe der Bearbeitungen innerhalb des letzten Tages, der letzten Woche, des letzten Monats und des letzten Jahres angegeben. Eine tabellarische Jahres- und Monatsübersicht erlaubt den Zeitvergleich der Bearbeitungsintensität. Eine tabellarische Präsentation der beteiligten Nutzer, angeordnet nach absteigender Bearbeitungszahl, erlaubt Rückschlüsse auf die wichtigsten Beteiligten der Artikelbearbeitungen.</small><small>http://vs.aka-online.de/cgi-bin/wppagehiststat.pl</small>
  
=='''Ressourcen'''==
 
 
<br>
 
<br>
'''Wikipedia-Korpora im Deutschen Referenzkorpus (DeReKo)'''
 
 
<br>
 
<br>
[[Datei:Maulwurf gross1.gif|left|frameless|border]]
+
===Andere Tools===
<small>Die Wikipedia steht unter freien Lizenzen zur Verfügung und bietet damit der Forschung die Möglichkeit, die Daten in linguistisch aufbereitete Korpora zu überführen. Das Institut für Deutsche Sprache (IDS) bietet seit 2005 über seine Korpusinfrastruktur Zugriff auf linguistisch aufbereitete Korpora u.a. zu Wikipedia-Artikeln, Wikipedia-Diskussionen und Wikipedia-Benutzerdiskussionen zu verschiedenen Jahrgängen und in mehreren Sprachen. Der Bestand wird laufend erweitert und ausgebaut: Seit 2011 erscheint alle zwei Jahre eine neue Konvertierung der deutschsprachigen Wikipedia (vgl. Lüngen/Kupietz 2017). Die Wikipedia-Korpora sind Bestandteil des deutschen Referenzkorpus (DeReKo), das mit 42 Milliarden Wörtern (Release vom 23.02.2018) das größte Archiv von Korpora geschriebener Gegenwartssprache darstellt. Über das Corpus Search, Management and Analysis System (COSMAS II) sind zudem Wikipedia-Korpora in acht weiteren Sprachen verfügbar (Englisch, Französisch, Spanisch, Kroatisch, Polnisch, Italienisch, Ungarisch, Norwegisch). Weitere Hinweise zur Korpusressource finden sich unter: http://www1.ids-mannheim.de/kl/projekte/korpora/archiv/wp.html</small>
+
<br>
 +
<br>
 +
'''Histropedia'''
 +
[[Datei:Bildschirmfoto 2019-01-21 um 14.16.42.png|rahmenlos|left|border]]
 +
<small>Histropedia nutzt Daten aus Wikipedia und Wikidata, um automatisiert '''interaktive Zeitstrahlen''' zu generieren mit Ereignissen, die auf Wikipedia-Artikel verweisen. Es bietet die Möglichkeit, Zeitstrahlen und Ereignisse zu kombinieren, um eigene benutzerdefinierte Zeitstrahlen zu erzeugen. Über die Suchbox von Histropedia im Zeitstrahl-Verzeichnis können tausende von Zeitstrahlen zu hunderten von Themen entdeckt werden. Auf dem Zeitstrahl erscheinen Pop-Up-Boxen mit Informationen zum Thema in Form von YouTube-Videos, Twitter-Erwähnungen oder Bücher auf Amazon zu ähnlichen Themen. Die Seite bezieht zurzeit nur englischsprachige Wikipedia-Artikel mit ein. Eine Liste der beliebtesten Zeitstrahlen bietet zwanzig verschiedene Zeitstrahlen zum Erkunden an.</small><small>http://www.histropedia.com/</small>
 +
<br>
 +
<br>
 +
<br>
 +
'''Wikidata Translate'''
 +
[[Datei:Wikipedia Translate.png|left|frameless|border]]
 +
<small>Dieses Tool ermöglicht eine '''sprachübergreifende Suche nach bestimmten Übersetzungen, beziehungsweise Artikelseiten'''. Nach der Wahl der Ausgangssprache über ein Dropdown-Menü kann in einem Eingabefenster der zu suchende Begriff eingegeben werden. Sofern vorhanden, erscheinen dann die entsprechenden Übersetzungen mit Verlinkungen zur Artikelseite der jeweiligen Sprachversion. Insgesamt arbeitet dieses Tool mit den Sprachen Deutsch, Englisch, Französisch, Niederländisch und Spanisch.</small> <small>http://tools.wmflabs.org/hay/wdtranslate/</small>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
'''Global Wikipedia Article Search'''
 +
[[Datei:Global Search.png|left|frameless|border]]
 +
<small>Diese Seite erlaubt es, '''alle Wikipedia-Hauptseiten nach Artikeln zu durchsuchen, welche den eingegebenen Begriff in den unterschiedlichen Sprachen im Titel tragen'''. Dadurch werden fehlende Verbindungen zwischen den (verschiedensprachigen) Wikipedia-Artikelseiten offenbart. Dabei leistet die Seite weder eine wörtliche Übersetzung noch eine Volltextsuche, sondern prüft lediglich, ob ein Artikel mit dem eingegebenen Namen existiert. Die Ergebnisse werden in einer Liste mit Angaben zu Land, Größe, Zeitstempel, Mitwirkenden und Weiterleitungen der Artikel angezeigt. Da die Daten von Servern auf der ganzen Welt abgerufen werden, kann die Suche einige Zeit in Anspruch nehmen. http://vs.aka-online.de/globalwpsearch/</small>
 +
<br>
 
<br>
 
<br>
 
<br>
 
<br>
Zeile 352: Zeile 343:
 
<br>
 
<br>
 
<br>
 
<br>
'''Use Case auf YouTube zu COSMAS und den Wikipedia-Korpora in DeReKo'''
+
'''Wikipedia TOC Scraper'''
[[Datei:Clarin-D.png|left|frameless|border]]
 
  
<small>In diesem Video im YouTube-Kanal des CLARIN-D-Infrastrukturprojekts zeigt Eva Gredel, wie die oben beschriebenen Wikipedia-Korpora im Deutschen Referenzkorpus (DeReKo) mithilfe von COSMAS II für Sprach-Analysen am Beispiel von „-itis“- Kombinationen als Wortbildungsprodukte auf den Diskussionsseiten der Wikipedia genutzt werden können.  
+
<small>Dieses Tool '''durchforstet die ‚Table of Contents‘ nach Bearbeitungen eines Artikels und zeigt die Ergebnisse anhand chronologisch geordneter TOCs an'''. Dabei kann die Sprachversion ausgewählt und die Ergebnisliste auf bis zu fünfhundert Ergebnisse begrenzt werden. Ist die Suche abgeschlossen, werden die Ergebnisse einzeln durchklickbar (‚TOC Browser’) mit dem jeweiligen Bearbeiter, Zeitstempel und einem Kommentar zum Bearbeitungsvorgang angezeigt.</small> <small>https://tools.digitalmethods.net/beta/wikitoc/</small>
https://www.youtube.com/watch?v=bKw1yaf_imk</small>
 
<br>
 
 
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 
<br>
 +
'''Community Health Initiative | Interaction Timeline'''
 +
 +
<small>Dieses Tool '''erstellt einen chronologischen, vergleichenden Überblick über die Aktivität zweier Bearbeiter einer Seite'''. Dies soll ermöglichen, im Konfliktfall den Verlauf der Aktivitäten beider Disputbeteiligter besser nachvollziehen zu können. Dazu können die beiden zu vergleichenden Bearbeiter sowie das zu durchsuchende Wiki angegeben werden. Die Anfrage kann zeitlich tagesgenau eingeschränkt werden. Die erstellte Zeitleiste zeigt dann im angegeben Zeitfenster jene Artikelbearbeitungen an, welche die angegeben Benutzer gemeinsam an einem Artikel durchgeführt haben. Damit lassen sich auch artikelübergreifende Entwicklungen nachvollziehen und ein Konflikt einer Artikelseite kann somit besser in einem gegebenenfalls größerem Konfliktkontext verstanden werden. Dem Anspruch der Sichtbarmachung von Konfliktdynamiken folgt auch die farbliche Markierung zur Veranschaulichung der Zeitabstände zwischen den Bearbeitungen – dies soll Aufschluss darüber geben, ob sogenannte ‚Edit-Wars’ intensiver stattfinden.</small> <small>https://tools.wmflabs.org/interaction-timeline/</small>
 
<br>
 
<br>
 
<br>
 
<br>
 +
 +
 
<br>
 
<br>
 
<br>
 
<br>
 
<small>*<small>Angesichts der komprimierten Beschreibungen wurde zur leichteren Lesbarkeit die (generisch) maskuline Form verwendet. Es sei ausdrücklich darauf hingewiesen, dass trotzdessen '''alle Geschlechter''' gemeint – und entsprechend mitzudenken – sind.</small></small>
 
<small>*<small>Angesichts der komprimierten Beschreibungen wurde zur leichteren Lesbarkeit die (generisch) maskuline Form verwendet. Es sei ausdrücklich darauf hingewiesen, dass trotzdessen '''alle Geschlechter''' gemeint – und entsprechend mitzudenken – sind.</small></small>

Aktuelle Version vom 22. Oktober 2019, 12:58 Uhr

Zur (sprachwissenschaftlichen und diskursanalytischen) Untersuchung der Wikipedia gibt es zahlreiche Tools und Ressourcen, die im Folgenden beschrieben werden.*

Cover sonderband 3 sw final.jpg
Dieser Artikel in der Zeitschrift für digitale Geisteswissenschaften erläutert für einige der aufgeführten Tools, wie diese in Diskursanalysen eingesetzt werden können:

Gredel, Eva (2018): Digitale Methoden und Werkzeuge für Diskursanalysen am Beispiel Wikipedia. In: Zeitschrift für digitale Geisteswissenschaft (= Sonderband 3: Wie Digitalität die Geisteswissenschaften verändert. Neue Forschungsgegenstände und Methoden. Hrsg. von Martin Huber/ Sybille Krämer). URL: http://zfdg.de/sonderbaende




Ressourcen


Wikipedia-Korpora im Deutschen Referenzkorpus (DeReKo)

Maulwurf gross1.gif

Die Wikipedia steht unter freien Lizenzen zur Verfügung und bietet damit der Forschung die Möglichkeit, die Daten in linguistisch aufbereitete Korpora zu überführen. Das Institut für Deutsche Sprache (IDS) bietet seit 2005 über seine Korpusinfrastruktur Zugriff auf linguistisch aufbereitete Korpora u.a. zu Wikipedia-Artikeln, Wikipedia-Diskussionen und Wikipedia-Benutzerdiskussionen zu verschiedenen Jahrgängen und in mehreren Sprachen. Der Bestand wird laufend erweitert und ausgebaut: Seit 2011 erscheint alle zwei Jahre eine neue Konvertierung der deutschsprachigen Wikipedia (vgl. Lüngen/Kupietz 2017). Die Wikipedia-Korpora sind Bestandteil des deutschen Referenzkorpus (DeReKo), das mit 42 Milliarden Wörtern (Release vom 23.02.2018) das größte Archiv von Korpora geschriebener Gegenwartssprache darstellt. Über das Corpus Search, Management and Analysis System (COSMAS II) sind zudem Wikipedia-Korpora in acht weiteren Sprachen verfügbar (Englisch, Französisch, Spanisch, Kroatisch, Polnisch, Italienisch, Ungarisch, Norwegisch). Weitere Hinweise zur Korpusressource finden sich unter: http://www1.ids-mannheim.de/kl/projekte/korpora/archiv/wp.html





Use Case auf YouTube zu COSMAS und den Wikipedia-Korpora in DeReKo

Clarin-D.png

In diesem Video im YouTube-Kanal des CLARIN-D-Infrastrukturprojekts zeigt Eva Gredel, wie die oben beschriebenen Wikipedia-Korpora im Deutschen Referenzkorpus (DeReKo) mithilfe von COSMAS II für Sprach-Analysen am Beispiel von „-itis“- Kombinationen als Wortbildungsprodukte auf den Diskussionsseiten der Wikipedia genutzt werden können. https://www.youtube.com/watch?v=bKw1yaf_imk








Tools


Analyse und Visualisierung von Beteiligung


WhoVisual und WhoVIS

WhoVIS.png

Whovisual ermöglicht interaktive Visualisierungen zur Erforschung der Artikelgenese, welches sich in die Projekte WhoColor (Alphaversion) und whoVIS (Alphaversion) aufteilt.


WhoVIS ist der Prototyp einer Netzwerk-Visualisierung der Interaktion zwischen Editoren für einzelne Artikel. Er basiert auf den Wörtern/Tokens, welche von Editoren entfernt und wiedereingeführt worden sind. Da sich die Anwendung noch in der Anfangsphase befindet, dauert das Laden der Seite mitunter länger.
http://www.f-squared.org/whovisual/



WhoColor

WikiWho.jpg

WhoColor ermöglicht ein Color-Markup der Originalautoren einzelner Textelemente. Es ist ein JavaScript für die Tamper-/Greasemonkey-Browsererweiterung für Chrome und Firefox. Öffnet man einen englischsprachigen Wikipedia-Artikel, zeichnet es den Text farbig aus und zeigt dadurch die Autoren des Inhaltes auf. Zudem erscheint eine Liste der Autoren, geordnet nach deren prozentualem Textanteil am Artikel sowie (bald) zusätzliche Provenienzinformationen. Es ist damit zum einen möglich, die Diskussion um bestimmte Wörter aufzuzeigen, zum anderen lässt sich der Bearbeitungsverlauf eines Wortes nachvollziehen (Extras nur als Demoversion erhältlich).
https://www.f-squared.org/whovisual/#color


Contributors

frameless

Dieses Tool erstellt eine Liste aller Mitwirkenden an einem bestimmten Artikel eines bestimmten Projekts als Wikitext-Aufzählung der Versionsgeschichte. Start- und Enddatum des zu untersuchenden Zeitraums können dabei auf den Tag genau festgelegt werden.

http://tools.wmflabs.org/inkowik/contributors.php





Global User Contributions

Global User Contributions.png

Dieses Tool erlaubt die Nachverfolgung aller Beiträge eines bestimmten Nutzers in allen Wikimedia-Wikis. Hierzu kann im Suchfenster sowohl der Nutzername als auch die IP-Adresse angegeben werden. Über eine zusätzliche Option lässt sich eine Präfixsuche aktivieren, ein Dropdown-Menü ermöglicht die Eingrenzung der Ergebnisse von allen Beiträgen auf nur jene der vergangenen dreißig Tage oder der vergangenen letzten Stunde. Die Sortierung der Ergebnisse kann wahlweise nach Wiki oder nach Datum geordnet werden. Bei der Ergebnisdarstellung wird nach Projekten, beziehungsweise Sprachversionen, unterschieden und die Auswahl auf die letzten zwanzig Beiträge begrenzt. Absteigend nach Aktualität sortiert werden dabei sowohl der Vorgang als auch der entsprechende Artikel (oder Ähnliches) angegeben. Über entsprechende Links kann zu jeder Aktivität eine Differenzdarstellung der Bearbeitungen oder aber die nutzerbezogene Versionsgeschichte aufgerufen werden.

https://tools.wmflabs.org/guc/index.php


X!’s AdminStats

Admin Stats 2.png

Dieses Tool erstellt Statistiken von Admin-Aktivitäten. Hierbei kann bei der Eingabemaske neben dem Projekt und einer entsprechenden Sprachversion auch der Betrachtungszeitraum auf den Tag genau eingestellt werden. In den Ergebnissen wird zunächst eine Übersichtsstatistik dargeboten, welche beispielsweise die Gesamtzahl der aktiven Admins im betrachteten Zeitraum angibt. In der tabellarischen Anordnung (absteigend nach absoluter Zahl der Aktivitäten) werden nur solche Admins aufgeführt, welche im Betrachtungszeitraum mindestens eine Aktivität aufweisen. Es wird darauf verwiesen, dass einige der aufgeführten Akteure keine Admins mehr sind oder noch nie welche waren, jedoch Aktionen durchgeführt haben, welche gewisser Admin-Rechte bedürfen. Die einzelnen Admins werden mit Informationen dargestellt, welche unter anderem Lösch- oder Wiederherstellungsvorgänge in absoluten Zahlen angeben. Klickt man auf den Namen des angeführten Admins, gelangt man zu dessen Benutzerseite. Je nach Anfrage kann die Bearbeitungsdauer variieren und entsprechend lange Ladezeiten nach sich ziehen.http://tools.wmflabs.org/xtools/adminstats/?uselang=en

X!'s Edit Counter

frameless

Dieses Tool erstellt eine umfangreiche Zusammenfassung von Aktivitäten eines bestimmten Nutzers. In der Eingabemaske kann neben dem entsprechenden Projekt und dem Nutzernamen anhand verschiedener vordefinierter Kriterien die Ergebnispräsentation eingeschränkt werden, indem bestimmte Betrachtungskategorien ausgelassen werden. Die Kategorien beinhalten eine Übersichtsstatistik, eine Zusammenfassung der Aktivität nach Namensräumen, nach Jahren, nach Monaten, die am meisten bearbeiteten Seiten, eine Historie der erworbenen/verlorenen Bearbeitungsrechte, und die jüngsten Bearbeitungen. Die Ergebnispräsentation kann unter Umständen manche Kategorien nicht berücksichtigen, wenn der Nutzer die Freigabe für die entsprechenden Daten nicht erteilt hat. Die Übersichtsstatistik beinhaltet neben Basisinformationen wie der Gesamtzahl der Bearbeitungen etc. eine genauere Betrachtung der Bearbeitungen (durchschnittliche Bearbeitungen pro Tag etc.), eine genauere Betrachtung der bearbeiteten Seiten (durchschnittliche Bearbeitungen pro Seite), der Dateien, der Blocks, der Aktionen (Danken etc.), der Administratorenaktivitäten (Schützen eines Beitrags etc.) und der Aktivität in unterschiedlichen Sprachversionen und Projekten. Die Darstellung der Aktivitäten nach Namensräumen erfolgt tabellarisch absteigend (absolut, prozentual) und tortendiagrammisch. Alle angezeigten Daten können über einen Link heruntergeladen werden. Die Ladezeit nach erfolgter Anfrage variiert stark je nach vorhandener Datenmenge bei den Ergebnissen.

http://tools.wmflabs.org/xtools-ec/?uselang=en


xContribs

Single User Contributions.png

Dieses Tool gibt einen Überblick über die ‚xWikiness‘ eines Benutzers, beispielsweise über die Verteilung der Beiträge in verschiedenen Projekten. Verschiedene numerische Werte, darunter der Theil-Index (Ungleichverteilungsmaß) sollen Rückschlüsse darüber erlauben, wie engagiert der betrachtete Nutzer auch projektübergreifend agiert.

https://tools.wmflabs.org/erwin85/xcontribs.php








Analyse und Visualisierung von Kontroversen

Contropedia

Contropedia.png

Diese Plattform ermöglicht die Echtzeit-Analyse und Visualisierung von Kontroversen in Wikipedia-Artikeln. Anhand der Versionsgeschichte und der Diskussionen über einen Artikel bzw. miteinander verwandten Artikeln wird ein Aktivitätenprotokoll generiert, aus welchem die Ausprägung der Kontroversen (‚controversy score‘) extrahiert wird. Momentan können nur englischsprachige Artikel analysiert werden, eine Erweiterung für andere Sprachen ist in Planung.

http://contropedia.net/



Analysen von Artikel-Historien

WikiHistory

Krimkrise.png

Dieses Tool visualisiert Artikelstatistiken einzelner Artikelseiten übersichtlich. Nach Eingabe des zu untersuchenden Artikels wird in übersichtlichen Angaben nach allgemeinen Informationen, zeitlicher Entwicklung und Benutzern unterschieden. Die allgemeinen Informationen beinhalten die Gesamtzahl der Artikelbearbeitungen unter Berücksichtigung kleiner oder anonymer Bearbeitungen (durch ein Tortendiagramm dargestellt). Ebenfalls werden beteiligte unterschiedliche Benutzer angegeben sowie anonym Benutzer und durchschnittliche Bearbeitungen pro Benutzer. Ebenfalls im Durchschnitt werden Bearbeitungen pro Tag, pro Monat und pro Jahr sowie die aktuelle Artikelgröße zusammengefasst (die zeitliche Entwicklung der Bearbeitungen wird durch ein Histogramm dargestellt). Schließlich werden die beteiligten Benutzer nach absteigendem Textanteil, samt absoluter Bearbeitungszahlen, sowie Erst- und Letztbearbeitung tabellarisch aber auch prozentual in einem Tortendiagramm präsentiert. Nach Entwicklerangaben erfolgt die Bestimmung der Autorenanteile basierend auf WikiHistory. Die Zeitangaben erfolgen in UTC. http://tools.wmflabs.org/wikihistory/


Recent Changes Statistic

Recent Change Statistic.png

Dieses Tool erstellt eine statistische Übersicht der letzten Änderungen einer ausgewählten Wikipedia-Sprachversion. Der zu berücksichtigende Zeitraum kann über ein Dropdown-Menü von der letzten Minute bis hin zu den letzten vierundzwanzig Stunden eingestellt werden. Die Länge der anzuzeigenden Ergebnisse kann festgelegt werden, ebenso kann ein spezieller Nutzer über ein Eingabefenster in der Ergebnispräsentation hervorgehoben werden. Die Ergebnispräsentation erfolgt in drei Kategorien, den Nutzern, den Seiten und einer Übersichtsstatistik. Die Nutzer und Seiten sind absteigend nach Anzahl der Bearbeitungen im definierten Zeitraum angezeigt. Die Übersichtsstatistik liefert eine sekundengenaue Angabe der ersten sowie letzten Bearbeitung im definierten Zeitraum, die absolute Zahl der Bearbeitungen und einen ‚Bearbeitungen pro Minute’-Quotienten. Schließlich werden die absoluten Zahlen der bearbeiteten Seiten und der bearbeitenden Nutzer des untersuchten Zeitraums angegeben. http://vs.aka-online.de/rchiststat/

WikiBlame

Wiki Blame.png

WikiBlame kann die Versionen eines Artikels auf eine bestimmte Zeichenkette hin untersuchen. Dieses Tool dient vor allem der Qualitätssicherung von Artikeln hinsichtlich ihrer jeweiligen Quellenlage. So ermöglicht WikiBlame, die Version des ersten Vorkommens von Textelementen zu identifizieren, um so die jeweiligen Urheber (beziehungsweise die jeweiligen Quellen) sichtbar zu machen. Gemäß der Nutzerseite zum Tool können diese Ergebnisse zum Nachtragen von Einzelnachweisen, zum Nachfragen bei Autoren oder zum lizenzkonformen Kopieren genutzt werden. Durchsucht wird nach Angabe der Sprachversion, des Projekts, des Artikels und des entsprechenden Suchbegriffs. Wird innerhalb eines Projekts nicht zwischen Sprachversionen unterschieden, kann das entsprechende Feld freigelassen werden. Bei der Suchanfrage kann entweder einfacher Text oder aber auch Interwikitags und ähnliches definiert werden. http://wikipedia.ramselehof.de/wikiblame.php



Wikidata Recent Changes

WikiBlame.png

Hierbei handelt es sich um eine konzentrierte Darstellung der jüngsten Änderungen in der Wikipedia, in welcher nur die bislang ungeprüften Änderungen angezeigt werden. Die Ergebnisse können nach Art der Bearbeitung und nach Items unterschieden werden, ebenfalls kann die Anzahl der präsentierten Ergebnisse von fünfundzwanzig bis zweihundertfünfzig eingestellt werden. Zusätzlich kann eine automatische Aktualisierung der Ergebnisse nach vordefinierten Zeiträumen eingerichtet werden, das dem Anspruch der Unmittelbarkeit der Ergebnisse Rechnung trägt. Jedes Einzelergebnis ist mit dem jeweils betroffenen Namensraum, beziehungsweise der Artikelseite vermerkt, dem dortigen Vorgang (Änderung, Löschung etc.), der IP-Adresse, beziehungsweise dem Nutzernamen, und der entsprechenden Uhrzeit. Zwar ist prinzipiell über entsprechende Links hinter jedem angezeigten Vorgang eine Direktreaktion (zum Beispiel eine Löschung) möglich, dazu ist jedoch eine vorige Authentifizierung über einen entsprechenden Login notwendig. http://tools.wmflabs.org/pltools/rech/


X!’s Page History

frameless

Dieses Tool fasst Bearbeitungsinformationen über eine Artikelseite zusammen und erstellt verschiedene Visualisierungen der Bearbeitungen. Die Darstellung der Ergebnisse wird unterteilt in einführende Übersichtsstatistiken, die wichtigsten Bearbeiter, eine Bot-Liste, eine Autorenschaftsübersicht sowie Jahres- und Monatsübersichten (außerdem gibt es eine Tabelle zur Darstellung semi-automatisierter Bearbeitungen). Neben den absoluten Zahlen der Bearbeitungen und beteiligten Bearbeiter fasst die Übersichtsstatistik außerdem die Seitenaufrufe zusammen, liefert Informationen zu Verlinkungen der Artikelseite und Textoberflächeninformationen (Anzahl der Wörter etc.). Die zeitbezogene Analyse der Bearbeitungen gibt einen Überblick über die durchschnittlich vergangene Zeit zwischen Bearbeitungen, die durchschnittlichen Bearbeitungen pro Nutzer, pro Tag, pro Monat und pro Jahr. Zur Veranschaulichung der Aktualität der Artikelbearbeitungen werden ebenfalls die Bearbeitungen innerhalb der letzten vierundzwanzig Stunden, der letzten sieben Tage, der letzten dreißig Tage und der letzten 365 Tage angegeben. Die tabellarische wie tortendiagrammische Darstellung der wichtigsten Bearbeiter unterscheidet nach Anzahl der Bearbeitungen und beigetragenem Textanteil. Die Bot-Liste ordnet die beteiligten Bots absteigend nach Anzahl der Bearbeitungen, über Links können dabei die größten Bearbeitungen Einzelübersichten der Bearbeitungen eines Bots angezeigt werden lassen. Bei der Übersicht der Autorschaft sind die wichtigsten Autoren absteigend nach Textanteil am Artikel (gemessen anhand der Buchstabenzahl) tabellarisch, aber auch in einem Tortendiagramm dargestellt. Die Jahres- und Monatsübersichten (tabellarisch, diagrammisch) ermöglichen einen zeitbezogenen Überblick über die Bearbeitungsintensität. Die angezeigten Statistiken können über einen Link heruntergeladen werden.

http://tools.wmflabs.org/xtools-articleinfo/index.php?&uselang=en


Statistische Auswertungen

Wikimedia Statistics

Wikimedia Stats.png

Diese Seite vereint zahlreiche statistische Analysen, Visualisierungen und Links und stellt umfangreiche Datensätze zur Verfügung. Auf der Start- beziehungsweise Übersichtsseite lassen sich die Statistiken nach den jeweiligen Projekten (Wikipedia, Wiktionary etc.) getrennt anzeigen, in der Monatsübersicht lassen sich entweder alle Projekte oder aber jeweils einzelne mit Übersichtsinformationen anzeigen. Diese sind unterteilt in die Kategorien Aufrufe, Beiträge und Inhalt. Bei den Aufrufen wird die Gesamtzahl in allen Sprachversionen (sofern im Projekt in Sprachversionen unterschieden wird) mit dem jeweiligen Monats- und Jahrestrend im Vergleich angezeigt. In absteigender Anordnung wird ebenfalls eine Liste der Länder mit den meisten Aufrufen dargeboten, bei einem Klick auf die jeweiligen Übersichten wird man zu detaillierteren Darstellungen weitergeleitet. In der Kategorie der Beiträge wird wie bei den Aufrufen die Gesamtzahl der Beiträge angegeben, darüber hinaus die Anzahl der neu registrierten Nutzer (ebenfalls mit vergleichendem Monats- und Jahrestrend) sowie die meisteditierenden Benutzer. Beim Inhalt wird lediglich die Entwicklung der Datenmenge (in Gigabyte) im Differenzvergleich angegeben. Hinsichtlich der einzelnen Projekte (Wikipedia etc.) sind verschiedene Übersichtsstatistiken beispielsweise zu den Sprachversionen in einer Tabelle zusammengefasst, in welcher Informationen zu den Regionen, der Beteiligung, den Bearbeitungen, Aufrufen usw. zu finden sind. Über Links sind zu jeder Ergebniszeile entsprechende detailliertere Zusammenfassungen, Tabellen und Diagramm verfügbar. In einer weiteren Tabelle finden sich Vergleichsstatistiken, beispielsweise die Anzahl der Wörter in der Wikipedia im Ländervergleich im Zeitverlauf (dies ist jedoch nur eine von zahlreichen Statistiken zu den verschiedensten Themengebieten im Vergleich). In einem themenbezogenen Bereich, der von der Übersichtsseite aus erreichbar ist, sind umfangreiche Linksammlungen zu verschiedensten Anwendungen (beispielsweise fortgeschrittene dynamische Visualisierungsangebote) zu finden, wobei durch Symbole neben den Links erkennbar gemacht wird, ob dieser Link auf eine Seite der Wikimedia Foundation (Host der Seite), eines speziellen Toolserver, der Wikipedia oder eines externen Anbieters weiterleitet. Ein Suchfunktion auf der Übersichtsseite erlaubt ein konzentrierteres Suchen nach Informationen (Statistiken, Visualisierungen etc.) eines spezifischen Interesses (Aufrufe, Bearbeitungen, Nutzer, Bots etc.).http://stats.wikimedia.org/


Listen to Wikipedia

frameless

Dieses Tool kreiert eine audiovisuelle Echtzeit-Repräsentation von Veränderungsvorgängen in der Wikipedia. Hierbei stehen Glockentöne für Ergänzungen der Wikipedia und Saitentöne für Löschvorgänge. Die jeweilige Tonhöhe variiert entsprechend des Umfangs des jeweiligen Vorgangs (je umfangreicher die Bearbeitung, desto tiefer der entsprechende Ton). Während die reguläre visuelle Darstellung mittels hellgrauer Kreise (in der Größe entsprechend des Umfangs der Bearbeitung) erfolgt, sind Aktivitäten nicht registrierter Nutzer grün und jene von Bots violett. Bei der visuellen Darstellung wird ebenfalls der entsprechende Titel des bearbeiteten Artikels angezeigt. Neuregistrierungen von Nutzern werden auditiv durch einen länger andauernden Saitenton repräsentiert sowie visuell über ein Banner oberhalb der Kreisdarstellung. Unterhalb dieser Kreisdarstellung befindet sich eine tabellarische Zusammenfassung der Vorgänge, wobei auch die Zahl der bereits gehörten/gesehenen Änderungen angezeigt wird. Über verschiedene Optionen können bestimmte Aspekte der Darstellung ausgeschlossen werden, so zum Beispiel die Neuregistrierung. Es kann ebenfalls die zu betrachtende/belauschende Sprachversion ausgewählt werden, wobei vierzig Sprachen zur Auswahl stehen. Es können mehrere Sprachversionen gleichzeitig berücksichtigt werden. http://listen.hatnote.com/


Simple Edit Counter

frameless

Dieses Tool ermöglicht die schnelle und einfache numerische Zusammenfassung der Bearbeitungsvorgänge eines bestimmten Nutzers. In der Eingabemaske kann neben der Angabe des zu betrachtenden Projekts und Nutzernamens (optional auch die IP-Adresse) ein spezifischer Namensraum für die Zählung definiert werden. Der Betrachtungszeitraum kann auf den Tag genau eingegrenzt werden. In der Ergebnisdarstellung finden sich dann die Nutzergruppen des Nutzers, die Gesamtzahl der Bearbeitungen im Betrachtungszeitraum, Live-Bearbeitungen und gelöschte Bearbeitungen. Über Links sind die beispielsweise die Benutzerkonteninformationen oder das Benutzersperr-Logbuch auf der Wikipedia zu erreichen.

http://tools.wmflabs.org/xtools/sc/?project=de.wikipedia.org&uselang=en


Replay Edits

Replay Edits.png

Dieses Tool erstellt eine Videorepräsentation der Versionsgeschichte eines Artikels. Dabei werden Änderungen farblich hervorgehoben. Das Abspieltempo kann eingestellt werden, ebenso ist es möglich zu pausieren. Die Darstellung des Artikels erfolgt wie im Originalartikel, lediglich die Umgebung (Artikeldiskussion, Werkzeuge etc.) ist nicht vorhanden. Das Tool zielt darauf ab, dabei zu helfen, eine Vielzahl von Revisionen einfacher und in kürzerer Zeit als mit der aktuellen Benutzeroberfläche zu überprüfen und durchzuarbeiten. Es zeigt dem Benutzer, wie sich die Änderungen auf einer Seite visuell entwickelt haben. Auf diese Weise kann der Benutzer die auf der Seite vorgenommenen Änderungen auf animierte Weise besser nachvollziehen. Die Seite zum Vergleichen der aktuellen Version hat nur eine Dimension, die Zeilennummer. Die Zeilen werden nebeneinander dargestellt und zeigen auf der linken Seite die ältere Version und auf der rechten Seite die neuere Version. Die vorgeschlagenen Änderungsideen werden direkt in ihrer vorgesehenen Position im Artikel angezeigt und entsprechend markiert.

http://cosmiclattes.github.io/wikireplay/player.html


Analyse von Seitenaufrufen

Pageview Analysis

Pageview Analysis.png

Pageview Analysis ermöglicht den Vergleich der Abrufstatistiken mehrerer Artikelseiten. Dabei können in einem Dialogfeld mehrere Artikelseitennamen eingegeben werden, welche vergleichend in einem Diagramm zusammengefasst werden. Der darzustellende Zeitraum lässt sich tagesgenau definieren, zudem lässt sich das spezifische Projekt, beziehungsweise eine spezifische Sprachversion, angeben. Zusätzlich kann über ein Dropdown-Menü zwischen Plattformen (Desktop, Mobile App, etc.) und Agenten (User, Bot, etc.) unterschieden werden. Eine tabellarische Auflistung gibt zudem Auskunft über Bearbeitungen, Autoren usw. der untersuchten Artikelseiten. Hinsichtlich der diagrammischen Darstellungen können verschiedene Diagrammtypen (Linie, Säule, Netz, etc.) zur Veranschaulichung ausgewählt werden. Über Zusatzoptionen kann das jeweilige Diagramm zudem die Werte ausgeschrieben einbeziehen, logarithmieren oder die Y-Achse beim Nullwert beginnen lassen. Ist das Diagramm erst einmal erstellt, kann es über einen Permanentlink oder Download gesichert werden. Die Daten des Tools reichen bis Anfang 2015 zurück, Diagramme für vorige Zeiträume können nicht erstellt werden. https://meta.wikimedia.org/wiki/Pageviews_Analysis/


Page Views for Wikipedia (Non-mobile, Normalized)

Bildschirmfoto 2019-01-24 um 13.58.30.png

Diese Seite präsentiert eine detaillierte, tabellarische Übersicht der monatlichen Aufrufzahlen verschiedener Sprachversionen und ihrer Trends im Vergleich. Zahlreiche statistische Angaben reichern die einzelnen Zellen der Tabelle an und betten den angezeigten Wert orientierend in den Kontext der Entwicklungen ein. Die angezeigten Werte sind dabei normalisiert (optional kann auf die Rohdaten zugegriffen werden) und werden nach Angaben der Seite stündlich aktualisiert. Die Daten der Seite beziehen sich dabei jedoch lediglich auf die nicht-mobilen Seiten, zudem ist die Kopfzeile mit generellen Trendinformationen aktuell nicht funktionsfähig (05.01.19). Für Langzeituntersuchungen sollte beachtet werden, dass im Mai 2015 eine Anpassung des Algorithmus’ zur Zählung stattgefunden hat, was dieses Datum umfassende Untersuchungen in ihrer Aussagekraft einschränken könnte. Alle präsentierten Daten können heruntergeladen werden.

https://stats.wikimedia.org/EN/TablesPageViewsMonthly.htm



Wikitrends

Wikitrends.png

Diese Seite fasst die Suchtrends für Artikelseiten für die jeweils verschiedenen Sprachversionen zusammen. Dabei wird unterschieden in aufsteigende Trends, absteigende Trends und die meistgesuchten Artikelseiten, wobei die angezeigte Auswahl auf zehn Ergebnisse beschränkt ist. Hinsichtlich der zu berücksichtigenden Zeitspanne kann zwischen dem aktuellen Tag, der aktuellen Woche oder des aktuellen Monats gewählt werden. Hinter den Titeln der Ergebnisse werden in Klammern die Aufrufzahlen angezeigt, beziehungsweise der prozentuale Anstieg/Abfall. Durch einen Klick auf den Titel gelangt man zur entsprechenden Artikelseite.http://www.wikitrends.net



Suche nach enzyklopädischen "Leerstellen"

Missing Topics

Dieses Tool ermöglicht die Zusammenfassung fehlender Artikel (‚redlinks’) innerhalb bestimmter Kategorien oder Artikelseiten. Neben dem entsprechenden Projekt, beziehungsweise der entsprechenden Sprachversion, und der jeweiligen Artikelseite oder der Kategorie kann auch die Tiefe numerisch angegeben werden, also der Wert der angibt, wie viele Unterkategorien bei der Analyse berücksichtigt werden sollen. Die Ergebnisse werden schließlich absteigend nach der Zahl ihrer Vorkommen aufgelistet, durch das Klicken auf das jeweilige Ergebnis wird man zur entsprechenden Seite weitergeleitet. Entsprechend eignet sich dieses Tool vor allem zur Identifikation von Erweiterungsbedarf spezifischer Projekte/Kategorien.

http://tools.wmflabs.org/missingtopics/


Most wanted

Diese Seite listet die meistgewünschten Artikel für verschiedene Sprachversionen anhand der Zahl roter Wikilinks (‚redlinks’). Diese Auflistung ist derzeit für zwölf verschiedene Sprachversionen verfügbar, darunter auch die deutsche. Die Anzahl der angezeigten Ergebnisse lässt sich von zwanzig bis tausend variieren, womit aber auch entsprechende Ladezeiten einhergehen. Die Ergebnisse werden absteigend nach der Zahl der ‚redlinks’ angeordnet und stellen gleichzeitig Links zur entsprechenden Seite im jeweiligen Projekt dar, ebenso kann optional die jeweilige Kategorie des Ergebnisses eingeblendet werden. Zusätzlich lassen sich ebenfalls über einen Direktlink die einzelnen Verlinkungen einsehen oder auch eine Internet-Recherche starten. Somit scheint diese Seite explizit zur Erweiterung des jeweiligen Projekts animieren zu wollen. Die Seite wird täglich aktualisiert.

http://tools.wmflabs.org/most-wanted/


Not in the Other Language

Dieses Tool gibt Seiten einer bestimmten Sprache an, zu denen es keine entsprechende Seite in anderen Sprachversionen gibt. Dazu kann die Ausgangssprache festgelegt werden und die Sprache der voraussichtlich fehlenden Seite. Dabei besteht die Auswahl zwischen vier Projekten: Wikipedia, Wikisource, Wikivoyage und Wiktionary. Optional kann auch ein Kategorienbaum mit entsprechender Tiefe (zu berücksichtigende Subkategorien) definiert oder ein Teil des Titels angegeben werden. Das Ergebnis selbst ist ein Link zu einer entsprechend zusammenfassenden WikiData-Seite.

http://tools.wmflabs.org/not-in-the-other-language/


Wikidata Terminator

Dieses Tool kann Wikidata-Elemente suchen, denen eine Bezeichnung, Beschreibung oder ein Artikel in einer bestimmten Sprache fehlt. In der Eingabemaske kann hierzu zunächst über ein Dropdown-Menü zwischen einer Suche nach fehlenden Bezeichnungen (‚labels’), fehlenden Beschreibungen (‚descriptions’) oder fehlenden Artikeln (‚articles’) gewählt werden. Anschließend können eine oder auch mehrere Sprachversionen zur Anfrage angegeben werden. Zur Präsentation der Ergebnisse stehen verschiedene Optionen zur Sortierung zur Verfügung, ebenso kann die Anzahl der anzuzeigenden Ergebnisse zwischen fünfzig und fünfhundert variiert werden. Eine SPARQL-Anfrage kann ebenfalls formuliert werden. Direktverlinkungen bei den Ergebnissen ermöglichen eine unmittelbare Ergänzung der fehlenden Elemente.

http://tools.wmflabs.org/wikidata-terminator/


Multimodale Analysen

Wikipedia Cross-Lingual Image Analysis

Cross-lingual image analysis.jpg

Dieses Tool stellt zu einer angegebenen Artikelseite die hierbei in anderen Sprachversionen verwendeten Bilder vergleichend gegenüber. Hierzu genügt es, im Eingabefeld die URL des Ausgangsartikels anzugeben. Das Tool durchsucht alle Sprachversionen und stellt schließlich die jeweils verwendeten Bilder tabellarisch dar. Die Ergebnisliste lässt sich dabei nach Sprachen oder Bildern anordnen. Die Anordnung nach Bildern gibt einen Überblick über etwaige Verwendung identischer Bilder in verschiedenen Sprachversionen. Über Links in der Kopfleiste gelangt man direkt zur Artikelseite der ausgewählten Sprachversion. Die können über einen Download gesichert werden (hierbei handelt es sich jedoch nur um eine Zusammenstellung der entsprechenden Links, die Bilder werden als solche nicht gesichert).

https://tools.digitalmethods.net/beta/wikipediaCrosslingualImageAnalysis/



Analyse von Kategorien

Category Analysis

Diese Seite listet Benutzerbeiträge innerhalb einer Kategorie (Betaversion) hinsichtlich verschiedener Parameter auf. Dazu zählen beispielsweise die betroffenen Seiten, die Benutzer und schließlich die jeweiligen Bearbeitungen. Zudem wird eine monatige Auswertung erstellt, welche hinzugefügte und entfernte Bytes zu allen Artikeln, die Neuanlage von Artikeln, beteiligte Benutzer und deren jeweilige Anteile an den Bearbeitungen enthält. Es kann mit Kategoriennamen nach Artikeln einer Kategorie oder mit Präfixen nach Artikeln einer Unterkategorie gesucht werden. Zur besseren Anwendbarkeit werden Bots und Benutzer mit weniger als zehn Beiträgen in den dargestellten Daten nicht berücksichtigt.

https://tools.wmflabs.org/meta/catanalysis/


CatNap

Diese Seite listet alle Wikipedia-Artikel einer bestimmten Kategorie auf, gruppiert nach anderen Kategorien, in welche sie ebenfalls eingeordnet sind. Eine Gruppe bilden die Artikel der Kategorie, eine andere Gruppe entsteht durch die Auflistung aller anderen Kategorien, in die diese Artikel eingeordnet sind. Dadurch ist auch eine Mehrfachnennung von Artikeln in der Ergebnisliste möglich. Es lassen sich verschiedene Sprachversionen vorauswählen, wobei bei den Ergebnissen immer auch auf Ergebnisse anderer Sprachversionen verwiesen wird. Sollen bestimmte Kategorien bei der Analyse ausgelassen werden, können diese auszulassenden Kategorien in einem Dialogfenster vermerkt werden.

http://tools.wmflabs.org/catnap/


PetScan

Diese Seite kann Listen von Wikipedia-Seiten (und verwandten Projekten) oder Wikidata-Elementen erstellen, die bestimmte Kriterien erfüllen, beispielsweise alle Seiten in einer bestimmten Kategorie oder alle Elemente mit einer bestimmten Eigenschaft. PetScan kann einige temporäre Listen (hier als "Quellen" bezeichnet) auf verschiedene Arten kombinieren, um eine neue Liste zu erstellen. Für längerfristige Beobachtungen können die erstellten Anfragen auch über eine URL gespeichert werden, wobei die Anfrage dann die möglicherweise neuen aktualisierten Projektinhalte ebenfalls berücksichtigt. Zahlreiche einstellbare Parameter ermöglichen äußerst präzise Anfragen, darunter beispielsweise Namensräume, Kategorien, Größe (Byte), aber auch Mindestanzahl der Verlinkungen, letzte Änderungen oder Bot-Aktivität. Das Ausgabeformat der Ergebnisse kann ebenfalls variiert werden, eine ausführliche Anleitung zur Einstellung der Suchparameter ist ebenfalls vorhanden (auch eine vereinfachte deutschsprachige Version).http://tools.wmflabs.org/catscan2/catscan2.php?interface_language=de&project=wikipedia&language=de


Items by Cat

Dies ist ein Tool, um vorhandene oder fehlende Elemente anhand einer Wikipedia-Kategorie zu finden. Es gibt drei Eingabefelder, die als Offset, Limit und Rekursionsebene bezeichnet werden, wobei entweder die ersten beiden oder das dritte verwendet werden können. Ein gesetztes Limit überschreibt die Rekursionsebene, entsprechende Limits ergeben dabei vor allem deshalb Sinn, wenn besonders umfangreiche Kategorien untersucht werden, was gemäß der Nutzerseite zum Tool ohne entsprechendes Limit des Öfteren zu Fehlern der Anwendung führt. Das Eingabefenster der Rekursionsebene ermöglicht die Berücksichtigung von Unterkategorien, wobei der eingegebene Wert die Anzahl der zu berücksichtigenden Unterkategorien (also die ‚Tiefe’) definiert. Gerade hierbei kommt es jedoch ebenfalls aufgrund größerer Datenmengen vermehrt zu Fehlern bei der Anwendung, auf der Nutzerseite zum Tool wird daher eine gewisse Vorsicht bei dieser Funktion empfohlen. Diese Nutzerseite fasst ebenfalls weitere Probleme des Tools zusammen und liefert gleichzeitig eine rudimentäre Anleitung. Das Ausgabeformat der Ergebnisse kann zwischen HTML, Wiki-Markup und einfachem Text variiert werden. Das Tool ist in elf verschiedenen Sprachen verfügbar.

http://tools.wmflabs.org/bene/itemsbycat/


TreeViews

Dieses Tool erstellt eine monatliche Abrufstatistik für Kategorienbäume. Dabei können Start- und Enddatum vom Nutzer eingestellt werden, ebenso wie weitere Parameter, darunter die Sprachversion oder die Untersuchungstiefe. Zusätzlich aktivierbare Optionen erweitern die Suchmöglichkeiten, beispielsweise die automatische Suche in anderen Sprachversionen, die Abfrage der Entstehungszeitpunkte jeder einzelnen Seite oder ein Einbezug jeglicher Seiten, die in nur einer Kategorie vorzufinden sind (standardgemäß werden nur jene Seiten berücksichtigt, die in allen angegebenen Kategorien vorzufinden sind). Verwiesen wird bei diesen Zusatzoptionen auf die möglicherweise stark erhöhte Bearbeitungszeit bei entsprechender Aktivierung. Bei den vom Nutzer angegebenen Kategorien kann ebenfalls durch entsprechende Optionen auch die Diskussionsseite berücksichtigt werden, oder aber die Seiten, welcher in einer bestimmten Kategorie zu finden sind, ausgeschlossen werden. Die Darstellung der Ergebnisse erfolgt tabellarisch mit absteigender Abrufhäufigkeit.

http://tools.wmflabs.org/glamtools/treeviews/

Get Distinct Authors

Erstellte eine Liste aller beteiligten Autoren verschiedener, definierter Seiten. Das Ergebnis wird als reiner Text, also ohne Formatierungen angezeigt, und ist dazu gedacht, in andere Seiten oder zur Weiterverarbeitung kopiert zu werden. Die Darstellung erfolgt dabei tabellarisch anhand absteigender Bearbeitungen der jeweiligen Autoren (in Klammern).

http://tools.wmflabs.org/magnustools/get_distinct_authors.php


Herding Sheep

Dieses Tool ermöglicht es, die gemeinsamen Bearbeitungen einer Autorengruppe innerhalb einer Kategorie, oder aber die von Bearbeitungen einer bestimmten Autorengruppe betroffenen Kategorien nachzuverfolgen. Entsprechend kann entweder eine Kategorie zur Untersuchung definiert werden oder aber eine Liste von Autoren. Die Einstellung des zu untersuchenden Zeitfensters kann dabei bis auf die Sekunde genau vorgenommen werden. Ebenfalls kann ein Limit der anzuzeigenden Ergebnisse definiert werden.

http://tools.wmflabs.org/magnustools/herding_sheep.php

Wikipedia Page History Statistics

Dieses Tool zeigt die Menge an Änderungen an einem Artikel im Zeitverlauf sowie die Autoren eines Artikels nach der Anzahl ihrer anteiligen Bearbeitungen an. Eine Übersichtsstatistik liefert Informationen über die Gesamtzahl der Bearbeitungen, der ersten und jüngsten Bearbeitung, der durchschnittlichen Zeit zwischen einzelnen Bearbeitungen sowie die durchschnittlichen Bearbeitungen pro Monat und pro Jahr innerhalb der gesamten Lebensdauer des betrachteten Artikels. Zusätzlich wird eine Gesamtzahl beteiligter Nutzer und die durchschnittliche Bearbeitungszahl pro Nutzer angegeben. Der Aktualität wird durch die Angabe der Bearbeitungen innerhalb des letzten Tages, der letzten Woche, des letzten Monats und des letzten Jahres angegeben. Eine tabellarische Jahres- und Monatsübersicht erlaubt den Zeitvergleich der Bearbeitungsintensität. Eine tabellarische Präsentation der beteiligten Nutzer, angeordnet nach absteigender Bearbeitungszahl, erlaubt Rückschlüsse auf die wichtigsten Beteiligten der Artikelbearbeitungen.http://vs.aka-online.de/cgi-bin/wppagehiststat.pl



Andere Tools



Histropedia

Bildschirmfoto 2019-01-21 um 14.16.42.png

Histropedia nutzt Daten aus Wikipedia und Wikidata, um automatisiert interaktive Zeitstrahlen zu generieren mit Ereignissen, die auf Wikipedia-Artikel verweisen. Es bietet die Möglichkeit, Zeitstrahlen und Ereignisse zu kombinieren, um eigene benutzerdefinierte Zeitstrahlen zu erzeugen. Über die Suchbox von Histropedia im Zeitstrahl-Verzeichnis können tausende von Zeitstrahlen zu hunderten von Themen entdeckt werden. Auf dem Zeitstrahl erscheinen Pop-Up-Boxen mit Informationen zum Thema in Form von YouTube-Videos, Twitter-Erwähnungen oder Bücher auf Amazon zu ähnlichen Themen. Die Seite bezieht zurzeit nur englischsprachige Wikipedia-Artikel mit ein. Eine Liste der beliebtesten Zeitstrahlen bietet zwanzig verschiedene Zeitstrahlen zum Erkunden an.http://www.histropedia.com/


Wikidata Translate

Wikipedia Translate.png

Dieses Tool ermöglicht eine sprachübergreifende Suche nach bestimmten Übersetzungen, beziehungsweise Artikelseiten. Nach der Wahl der Ausgangssprache über ein Dropdown-Menü kann in einem Eingabefenster der zu suchende Begriff eingegeben werden. Sofern vorhanden, erscheinen dann die entsprechenden Übersetzungen mit Verlinkungen zur Artikelseite der jeweiligen Sprachversion. Insgesamt arbeitet dieses Tool mit den Sprachen Deutsch, Englisch, Französisch, Niederländisch und Spanisch. http://tools.wmflabs.org/hay/wdtranslate/







Global Wikipedia Article Search

Global Search.png

Diese Seite erlaubt es, alle Wikipedia-Hauptseiten nach Artikeln zu durchsuchen, welche den eingegebenen Begriff in den unterschiedlichen Sprachen im Titel tragen. Dadurch werden fehlende Verbindungen zwischen den (verschiedensprachigen) Wikipedia-Artikelseiten offenbart. Dabei leistet die Seite weder eine wörtliche Übersetzung noch eine Volltextsuche, sondern prüft lediglich, ob ein Artikel mit dem eingegebenen Namen existiert. Die Ergebnisse werden in einer Liste mit Angaben zu Land, Größe, Zeitstempel, Mitwirkenden und Weiterleitungen der Artikel angezeigt. Da die Daten von Servern auf der ganzen Welt abgerufen werden, kann die Suche einige Zeit in Anspruch nehmen. http://vs.aka-online.de/globalwpsearch/






Wikipedia TOC Scraper

Dieses Tool durchforstet die ‚Table of Contents‘ nach Bearbeitungen eines Artikels und zeigt die Ergebnisse anhand chronologisch geordneter TOCs an. Dabei kann die Sprachversion ausgewählt und die Ergebnisliste auf bis zu fünfhundert Ergebnisse begrenzt werden. Ist die Suche abgeschlossen, werden die Ergebnisse einzeln durchklickbar (‚TOC Browser’) mit dem jeweiligen Bearbeiter, Zeitstempel und einem Kommentar zum Bearbeitungsvorgang angezeigt. https://tools.digitalmethods.net/beta/wikitoc/


Community Health Initiative | Interaction Timeline

Dieses Tool erstellt einen chronologischen, vergleichenden Überblick über die Aktivität zweier Bearbeiter einer Seite. Dies soll ermöglichen, im Konfliktfall den Verlauf der Aktivitäten beider Disputbeteiligter besser nachvollziehen zu können. Dazu können die beiden zu vergleichenden Bearbeiter sowie das zu durchsuchende Wiki angegeben werden. Die Anfrage kann zeitlich tagesgenau eingeschränkt werden. Die erstellte Zeitleiste zeigt dann im angegeben Zeitfenster jene Artikelbearbeitungen an, welche die angegeben Benutzer gemeinsam an einem Artikel durchgeführt haben. Damit lassen sich auch artikelübergreifende Entwicklungen nachvollziehen und ein Konflikt einer Artikelseite kann somit besser in einem gegebenenfalls größerem Konfliktkontext verstanden werden. Dem Anspruch der Sichtbarmachung von Konfliktdynamiken folgt auch die farbliche Markierung zur Veranschaulichung der Zeitabstände zwischen den Bearbeitungen – dies soll Aufschluss darüber geben, ob sogenannte ‚Edit-Wars’ intensiver stattfinden. https://tools.wmflabs.org/interaction-timeline/




*Angesichts der komprimierten Beschreibungen wurde zur leichteren Lesbarkeit die (generisch) maskuline Form verwendet. Es sei ausdrücklich darauf hingewiesen, dass trotzdessen alle Geschlechter gemeint – und entsprechend mitzudenken – sind.