Das Proseminar "Korpuslinguistik" bietet einen Überblick über die Grundlagen und Methoden der Korpuslinguistik. Korpora, große Sammlungen von authentischen Sprachdaten, sind zu einem unverzichtbaren Werkzeug in der empirisch orientierten linguistischen Forschung geworden. In diesem Seminar werden Sie einerseits einen Einblick in die theoretischen Grundlagen der Korpuslinguistik erhalten, etwa welche Arten von Korpora es gibt und wie diese linguistisch annotiert werden können. Gleichzeitig werden Sie durch praktische semesterbegleitende Übungsaufgaben erlernen, wie Sie eigene Korpusstudien durchführen und die Ergebnisse statistisch auswerten. Das Proseminar richtet sich besonders an Studierende, die sich für linguistische Forschung interessieren und ihre Fähigkeiten im Umgang mit empirischen Sprachdaten erweitern möchten. Am Ende des Seminars werden Sie ein grundlegendes Verständnis der Korpuslinguistik erworben haben sowie die Fähigkeit besitzen, eigenständig Korpusstudien durchzuführen und zu präsentieren.

Kommunikation kann viele unterschiedliche Ebenen umfassen, aber eine, wenn nicht die zentrale Ebene ist die Kommunikation von Information. Sprechen wir mit anderen, dann tauschen wir Neuigkeiten aus oder wir verabreden uns auf eine Tasse Kaffee oder wir schmieden Pläne für den Sommerurlaub. Damit das klappt und wir uns tatsächlich zu einem bestimmten Zeitpunkt an einem bestimmte Ort treffen, müssen wir Informationen austauschen. Aber was ist eigentlich Information? Und wie wird Information sprachlich kommuniziert? Tatsächlich ist das gar nicht so einfach zu beantworten. In diesem Seminar werden wir uns diesen Fragen nähern, indem wir uns mit klassischen Texten zum Informationsbegriff, zu Kommunikation und zu Informationsstruktur auseinandersetzen. Das Seminar wird also in der Art eines Lektüreseminars konzipiert sein, wobei nicht unbedingt die Quantität der gelesenen Arbeiten im Vordergrund steht, sondern die Kompetenz, Texte systematisch zu lesen, Argumente nachzvollziehen und in einen größeren Zusammenhang einordnen zu können. Es liegt dabei in der Natur der Sache, dass wir auch (und vor allem) englische Texte lesen werden. Die Bereitschaft, sich mit englischen Texten auseinanderzusetzen, wird in diesem Seminar daher vorausgesetzt.

Das Thema dieses Seminars ist die Korpuslinguistik. Ein Korpus ist eine Textsammlung, die digital vorliegt und zu wissenschaftlichen Zwecken durchsucht werden kann: Die Bandbreite reicht dabei von klassischen Zeitungskorpora - wie die auf der taz basierende TüBa-D/Z -, über Korpora zur gesprochenen Sprache, in denen mündliche Äußerungen transkribiert vorliegen und wie sie gebündelt über die Datenbank für gesprochenes Deutsch (DGD) zugänglich sind, bis hin zur Sammlung von What's App-Nachrichten, wie in der Mobile Communication Database (MoCoDa 2). Linguistische Korpora sind in der Regel repräsentativ, mit Metadaten versehen und linguistisch annotiert (vgl. Lemnitzer & Zinsmeister, 2015).

Die Arbeit mit Korpora wird in der Linguistik immer wichtiger, auch um Theorien an konkreten, tatsächlich produzierten Sprachdaten empirisch zu überprüfen. In diesem Seminar erwerben Sie Fähigkeiten, die Sie benötigen, um eigenständig korpuslinguistische Untersuchungen durchzuführen, z.B. im Rahmen einer Abschlussarbeit.

Sie werden verschiedene Typen von Korpora, entsprechende Metadaten und linguistische Annotationen kennenlernen. Sie werden lernen, korpuslinguistische Fragestellungen und Hypothesen zu entwickeln, diese im Korpus zu untersuchen, indem Sie Suchanfragen erstellen und ausführen, die entsprechenden Ergebnisse zu interpretieren und statistisch auszuwerten. Wir benutzen die Statistiksoftware R, Sie benötigen aber keinerlei Vorkenntnisse, sondern erlernen alles Notwendige im Kurs.

Sie werden im Seminar in Gruppen an einem eigenen Projekt arbeiten, für das Sie über das Semester verteilt regelmäßig kleinere Aufgaben erledigen.