Introduction to Linguistic Data Science with R

NUMMER: 050826
KÜRZEL: IntroLDS
MODULBEAUFTRAGTE:R: Prof. Dr. Tibor Kiss
DOZENT:IN: Prof. Dr. Tibor Kiss
FAKULTÄT: Sprachwissenschaftliches Institut
SPRACHE: Englisch
SWS: 4
CREDITS: 5
ANGEBOTEN IM: jedes Wintersemester

LINK ZUM VORLESUNGSVERZEICHNIS

Hier entlang.

LINK ZUM MOODLE-KURS

Hier entlang.

VERANSTALTUNGSART

Vorlesung mit Übung

LERNFORM

Die Veranstaltung setzt sich aus einer Präsenzkomponente (Vortrag der Lehrenden im Plenum mit anschließender Diskussion, gemeinsames Lösen von Aufgaben) und Übungen zum Kurs zusammen. Dabei können insbesondere die Übungen als eLearning-Einheiten angeboten werden.

LERNZIELE

* Die Studierenden erwerben grundlegende Modelle und Methoden der Linguistic Data Science und können sie kritisch auf Fragestellungen und Probleme anwenden.
* Sie werden mit der Fachsprache vertraut und können sich gut schriftlich und mündlich zu den behandelten Themen ausdrücken.
* Sie verstehen die Position von Linguistic Data Science in Abgrenzung zu verwandten Fächern wie reiner Linguistik oder allgemeiner Data Science und haben einen ersten Überblick über mögliche Vertiefungen in Abgrenzung zu
Computerlinguistik und theoretischer Linguistik.
* Sie verstehen einige grundlegende Evaluationsmethoden und können sie auf kleine Beispielfälle anwenden.
* Sie vollziehen den Einfluss von Entscheidungen bei der Wahl von Datensätzen, Datentypen oder der Struktur von Experimenten auf Daten in einfachen Beispielen nach.
* Sie können sich über kleine fachspezifische Problemstellungen mit andere austauschen und diese gemeinsam lösen.
* Sie erwerben den Umgang mit der Programmiersprache R und können Programme schreiben, die einzelne Funktionen erfüllen, sowie Programme, die mehrere Module/Funktionen kombinieren.

INHALT

Das Modul bietet eine Einführung in die Verfahren, Methoden und Modelle sowie Theorien aus dem Bereich Linguistic Data Science. Es werden zunächst diejenigen Konzepte der Programmiersprache R vorgestellt, die eine Repräsentation und Manipulation linguistischer Daten (Rohdaten, Annotationen, experimentell erhobene Daten, Datenübersichten) ermöglichen. Anschließend erfolgt die Einführung in grundlegende lineare Modelle, sowie deren Grundannahmen und Verfahren zur Evaluation.
Darüber hinaus werden Entwicklungsverfahren und Projektkonzeption vorgestellt.

In den Übungen werden kleine Aufgaben von den Studierenden in Gruppen oder allein bearbeitet.

VORAUSSETZUNGEN CREDITS

Bestandene schriftliche Modulabschlussprüfung

EMPFOHLENE VORKENNTNISSE

Idealerweise Vorkenntnisse in Linguistik (kann auch durch Literaturlektüre angeeigenet werden) , Programmierung und Mathematik

LITERATUR

1. Introductory Linguistics by Bruce P. Hayes
2. Winter, Bodo. 2020. Statistics for Linguists. An Introduction using R. New York/London: Routledge.
3. Levshina, Natalia. 2015. How to do Linguistics with R - Data exploration and statistical analysis. Amsterdam: John Benjamins.
(siehe auch https://ldsl.rub.de/study-linguistic-data-science/for-students/academic-advisory-office#tools-literature)

SONSTIGE INFORMATIONEN

Die fristgerechte Anmeldung zur Veranstaltung über eCampus ist erforderlich.