Wie diskursivieren deutschsprachige literarische Texte die abnehmende Luftqualität im 19. Jahrhundert? Eine Fallstudie
Dieses interaktive Lehrbuch ist im Rahmen des Projekts QUADRIGA als 3. Fallstudie des Datentyps Text entstanden.
QUADRIGA ist das Berlin-Brandenburgische Datenkompetenzzentrum für Digital Humanities, Verwaltungswissenschaften, Informatik und Informationswissenschaft. Es wird gefördert im Rahmen der Richtlinie zur Förderung von Projekten zum Aufbau von Datenkompetenzzentren in der Wissenschaft des Bundesministeriums für Bildung und Forschung. Anhand modellhafter Forschungsfragen werden für die drei Datentypen Bewegtes Bild, Tabelle und Text Fallstudien entworfen, die Forschenden der angesprochenen Fachrichtungen Kompetenzen im Bereich der Datenanwendung disziplinspezifisch näher bringen.
Sie können dieses JupyterBook zu Lehr- und Lernzwecken verwenden. Sie können sie zudem teilen und bearbeiten unter der Bedingung der Nennung der Autor:innen und der gleichen Lizenzierung. Weitere Informationen dazu entnehmen Sie bitte den Lizenzhinweisen.
Dieses interaktive Lehrbuch vermittelt Methoden für die Zusammenstellung, Aufbereitung und quantitative Analyse eines literarischen Textkorpus. Im Zentrum steht eine ökokritische Frage aus der digitalen Literaturwissenschaft: Lassen sich in der deutschsprachigen Literatur des 19. Jahrhunderts Reaktionen auf die zunehmende Luftverschmutzung durch die Industrialisierung ausmachen? Der Fokus des Lehrbuchs liegt auf der Operationalisierung dieser Forschungsfrage, der metadatenbasierten Zusammenstellung eines Korpus aus dem Corpus of German-Language Fiction sowie auf der linguistischen Annotation und Auswertung des Korpus mit NLP-Methoden (Tokenisierung, Lemmatisierung, Part-of-Speech-Tagging und Dependenzparsing). Das Lehrbuch ist in vier Kapiteln aufgeteilt. Es wird zuerst in die Fragestellung und deren Operationalisierung eingeführt, dann werden Strategien für den metadatenbasierten Korpusaufbau beschrieben. Danach wird in die für die Analyse benötigten NLP-Methoden eingeführt und das Korpus entsprechend annotiert. Schließlich werden auf dem annotierten Korpus zwei Analysen durchgeführt: eine Häufigkeitsanalyse von Wörtern aus dem semantischen Feld „Luft" sowie eine Analyse syntaktischer N-Gramme des Typs „Adjektiv–Substantiv". Eine abschließende Reflexion ordnet Vorgehen und Ergebnisse methodisch ein.
QUADRIGA ist ein Verbundprojekt mehrerer Institutionen, das von der Universität Potsdam koordiniert wird. Partner sind die Fachhochschule Potsdam, die Filmuniversität Babelsberg, das Fraunhofer FOKUS, die Freie Universität Berlin, die Humboldt-Universität zu Berlin, die Technische Universität Berlin und die Gesellschaft für Informatik.
Fragen und Feedback zu dieser OER können Sie uns sowohl über GitHub Issues als auch über Email zukommen lassen.