Der Band leistet eine theoretisch begründete und empirisch validierte Entwicklung einer
automatisierten Wortartenannotation (Part-of-Speech-Tagging) für Transkripte
spontansprachlicher Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) das über
die Datenbank für Gesprochenes Deutsch der Forschungsgemeinschaft öffentlich zugänglich ist.
Dabei setzt er zwei Schwerpunkte: erstens die theoretische Aufarbeitung von Unterschieden von
Transkripten gesprochener Sprache zu schriftsprachlichen Daten in Hinblick auf die Entwicklung
eines Tagsets für das gesprochene Deutsch zweitens die Darstellung der empirischen
Arbeitsschritte zur Erstellung des automatisierten Part-of-Speech-Taggings d. h. die
Implementierung und Evaluierung für die Annotation des FOLK-Korpus. Der Band ist eine kritische
Reflexion der Wortartentheorien im Spannungsfeld zwischen Theorie und datengeleiteter Arbeit.
Er gibt Einblicke über die Korpusaufbereitung von Transkripten gesprochener Sprache und stellt
diese in Bezug zu Theorien über die Eigenheiten gesprochener Sprache.Die Autorin hat für ihre
Arbeit 2020 den Peter-Roschy-Preis des Vereins der Freunde des Leibniz-Instituts für Deutsche
Sprache erhalten.