Ressourcen und Werkzeuge
Version vom 24. Januar 2017, 18:12 Uhr von Lherzberg (Diskussion | Beiträge)
Internetwörterbücher, Korpora und Werkzeuge
Internetwörterbücher
- Canoo: Wörterbücher und Grammatik: http://www.canoo.net/
- Duden-Online: http://www.duden.de/
- OWID/elexiko: https://www.owid.de/
- Wiktionary: https://de.wiktionary.org/
- Deutsches Wörterbuch von Jacob und Wilhelm Grimm: http://dwb.uni-trier.de
Internetenzyklopädie
- Wikipedia: https://de.wikipedia.org/
Korpusportale
- Die COSMAS-II-Webapplikation ermöglicht die Suche in den umfangreichen Korpusbeständen des Instituts für deutsche Sprache in Mannheim. NutzerInnen können die zu durchsuchenden Korpora selbst wählen und werden schrittweise bis zur Suchabfrage geführt. Die Suchergebnisse können vielfältig sortiert, z. B. nach Erscheinungsjahr, Themen oder Textsorten und im Anschluss ebenfalls exportiert werden.
- Institution: Institut für deutsche Sprache (IDS), Mannheim
- URL: http://www.ids-mannheim.de/cosmas2-web
- Zugang: nach kostenloser Registrierung nutzbar
- Korpora:
- Das Deutsche Referenzkorpus (DeReKo) umfasst derzeit insgesamt 366 Korpora im Umfang von zusammen 40,1 Milliarden Textwörtern, dies entspricht 100,3 Millionen Buchseiten. Es wird fortlaufend ausgebaut. Das DeReKo beinhaltet verschiedene Korpora, u. a. Zeitungskorpora, die bspw. Artikel der Süddeutschen Zeitung oder der Frankfurter Allgemeine enthalten. Ebenfalls über DeReKo zugänglich sind auch die Wikipedia-Korpora, die ein Abbild der Artikel- und Diskussionsseiten beinhalten.
- Die Korpora sind linguistisch aufbereitet: Flexionsformen eines Wortes sind über die Suche nach der Grundform auffindbar; Wortarten und z. T. auch Morphologie/Syntax können bei der Suche berücksichtigt werden. Darüber hinaus ist auch eine Beschränkung auf bestimmte Textbereiche (z. B. Überschriften) möglich.
- Werkzeuge:
- In das Abfragesystem ist auch die Möglichkeit einer Kookkurrenzanalyse integriert, die das Auffinden statistisch signifikanter Verbindungen zu Suchwörtern ermöglicht. Allgemeine Erläuterungen zur Kookkurrenzanalyse sind hier zu finden. Weiterführende Beschreibungen zur Durchführung einer solchen Analyse sowie von einzelnen Einstellungen stehen in einem Tutorial zur Verfügung.
- Die Kookkurrenzdatenbank CCDB (Corpus-Linguistic Research & Development Workbench) stellt ein weiteres nützliches Werkzeug dar. Die Datenbank ist eine korpuslinguistische Denk- und Experimentierplattform, ein transparentes Labor zur Erforschung, Entwicklung und Evaluierung einer Methodik zur datengeleiteten Exploration und Modellierung des Sprachgebrauchs. Sie basiert auf einem Ausschnitt von über 2,2 Milliarden Textwörtern aus dem DeReKo und umfasst reichhaltige Kookkurrenzprofile für ca. 220.000 Bezugswörter, die syntagmatische Muster und andere Informationen zum Gebrauch dieser Wörter beinhalten.
- Neben dem Nachschlagen in verschiedenen Wörterbüchern ermöglicht das Portal die Suche in Korpora sowie die Nutzung verschiedener statistischer Analysewerkzeuge über eine einheitliche Benutzerschnittstelle. Die vorhandenen Ressourcen werden während der Suche in einem Korpus ebenfalls angezeigt, sodass direkt ersichtlich wird, wie häufig das gesuchte Phänomen in anderen Korpora auftritt.
- Institution: Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)
- URL: http://www.dwds.de
- Zugang: ohne Registrierung nutzbar
- Korpora:
- Im DWDS enthalten ist u. a. das DWDS-Kernkorpus des 20 Jh. Dies ist ein zeitlich und nach Textsorten (Belletristik, Zeitung, Gebrauchsliteratur und Wissenschaft) ausgewogenes Referenzkorpus im Umfang von ca. 100 Millionen Textwörtern. Auch Zeitungskorpora, wie bspw. das ZEIT-Korpus, das alle Ausgaben der Zeitung Die Zeit von 1946 bis 2016 (ca. 548 Millionen Textwörter) sind im DWDS vorhanden und durchsuchbar.
- Die Korpora sind linguistisch aufbereitet: Flexionsformen eines Wortes sind über die Suche nach der Grundform auffindbar; Wortarten können bei der Suche berücksichtigt werden. Mögliche Suchabfragen sind ausführlich unter dem Menüpunkt "Hilfe zur Suche" dokumentiert. Über Darstellungsoptionen lassen sich die Sortierung der Treffer (nach Erscheinungsdatum, Satzlänge, Dokumentlänge oder Zufallsauswahl) und die Darstellung (als Keywords-in-Context (KWIC) oder Volltextanzeige) wählen. Ein Suchfilter ermöglicht, sich Treffer einer Textsorte oder eines Zeitabschnittes bzw. bestimmten Autors oder Werkes ausgeben zu lassen.
- Wörterbücher:
- Im DWDS kann man nicht nur in Korpora, sondern auch in Wörterbüchern recherchieren. So ist Das Etymologische Wörterbuch des Deutschen enthalten. Es gibt Antwort auf Fragen nach Alter, Herkunft und Verwandtschaft der Wörter und enthält Informationen zur Grammatik, Bedeutung und vor allem zur Wortgeschichte von über 22 000 Stichwörtern. Weiterhin gibt es Das Wörterbuch der deutschen Gegenwartssprache (WDG). Dies umfasst über 4 500 Seiten in sechs Druckbänden und enthält 60 000 bzw. unter Hinzunahme der Komposita 90 000 Stichwörter.
- Werkzeuge:
- Ein Beispiel für ein Analysewerkzeug im DWDS ist das Wortprofil. NutzerInnen erhalten einen Überblick über die statistisch signifikanten Verbindungen eines gesuchten Wortes (Korpusbasis: DWDS-Kernkorpus sowie verschiedene verbreitete Zeitungen). Die Suche lässt sich auf bestimmte syntaktische Relationen (z. B. Attribute, Dativ-/Akkusativobjekte etc.) eingrenzen.
- Beschreibung
- Institution: Projekt von Lothar Lemnitzer
- URL: http://www.wortwarte.de/
- Zugang: ohne Registrierung nutzbar