Das Thema dieses Seminars ist die Korpuslinguistik. Ein Korpus ist eine Textsammlung, die digital vorliegt und zu wissenschaftlichen Zwecken durchsucht werden kann: Die Bandbreite reicht dabei von klassischen Zeitungskorpora - wie die auf der taz basierende TüBa-D/Z -, über Korpora zur gesprochenen Sprache, in denen mündliche Äußerungen transkribiert vorliegen und wie sie gebündelt über die Datenbank für gesprochenes Deutsch (DGD) zugänglich sind, bis hin zur Sammlung von What's App-Nachrichten, wie in der Mobile Communication Database (MoCoDa 2). Linguistische Korpora sind in der Regel repräsentativ, mit Metadaten versehen und linguistisch annotiert (vgl. Lemnitzer & Zinsmeister, 2015).
Die Arbeit mit Korpora wird in der Linguistik immer wichtiger, auch um Theorien an konkreten, tatsächlich produzierten Sprachdaten empirisch zu überprüfen. In diesem Seminar erwerben Sie Fähigkeiten, die Sie benötigen, um eigenständig korpuslinguistische Untersuchungen durchzuführen, z.B. im Rahmen einer Abschlussarbeit.
Sie werden verschiedene Typen von Korpora, entsprechende Metadaten und linguistische Annotationen kennenlernen. Sie werden lernen, korpuslinguistische Fragestellungen und Hypothesen zu entwickeln, diese im Korpus zu untersuchen, indem Sie Suchanfragen erstellen und ausführen, die entsprechenden Ergebnisse zu interpretieren und statistisch auszuwerten. Wir benutzen die Statistiksoftware R, Sie benötigen aber keinerlei Vorkenntnisse, sondern erlernen alles Notwendige im Kurs.
Sie werden im Seminar in Gruppen an einem eigenen Projekt arbeiten, für das Sie über das Semester verteilt regelmäßig kleinere Aufgaben erledigen.
- DozentIn: Lisa Schäfer