Franco Morettis „distant reading“ -Ansatz [1] ist zu einem zentralen Konzept in den digitalen Geisteswissenschaften – den Digital Humanities – geworden. Dabei werden informatische Methoden aus den Bereichen natural language processing, text mining und Visualisierung eingesetzt, um umfangreiche Textkorpora zu untersuchen und so größere Zusammenhänge und Muster zu identifizieren.  

Das Seminar beschäftigt sich mit unterschiedlichen Techniken computergestützter Literaturanalyse, dazu zählen u.a. Stilometrie, Text Reuse, Sentiment Analysis, Netzwerkanalyse und Topic Modeling. Auch Möglichkeiten der Analyse von Film und Serien anhand vorhandener Untertitel und Drehbücher werden thematisiert.


[1] https://newleftreview.org/II/1/franco-moretti-conjectures-on-world-literature


This course aims to impart basic knowledge of linguistic annotation and XQuery. No previous knowledge in the field is required.
 
Goals:

1) provide the student with the basics of Linguistics that are necessary to perform and properly understand linguistic annotation. This also includes knowledge of a selection of computational resources that are widely used to study morphosyntax and semantics

2) learn the basics of XQuery to manipulate XML documents, using BaseX

Content:

1) Layers of linguistic annotation: morphology, syntax, and semantics

2) The Ancient Greek and Latin Dependency Treebank, and Stanford Dependency

3) Verbnet, Framenet, and Wordnet

4) XQuery: how to navigate an XML document

5) XQuery: FLWOR expression

Die Studenten erwerben Kenntnisse über grundlegende Methoden digitaler Texteditionstechnik am Beispiel historischer Sprachen. Dabei können die Studenten entweder an im Seminar vorgestellten Texten arbeiten oder eigene Texteditionsmikroprojekte verfolgen. In Verbindung mit zwei Blockveranstaltungen (Hackfests), in denen studentische Teams gebildet werden, die zusammen an einem Projekt arbeiten, werden diese Kenntnisse direkt in die Praxis umgesetzt.