Prof. Dr. Melanie Siegel

Computerlinguistin und Sprachtechnologin



h_da
Hochschule Darmstadt
University of Applied Sciences


Information Science
Max-Planck-Str. 2,
64807 Dieburg

melanie.siegel@h-da.de





Die Sprache – unser wichtigstes Kommunikationsmittel – ist das Thema, das meine Forschungen, meine praktischen Arbeiten und meine Hochschullehre bestimmt. Es hat mich immer fasziniert, Sprachen zu analysieren und festzustellen, wie die Unterschiede im Denken und Handeln der Kulturen sich in der Sprache niederschlagen und wie der interkulturelle Austausch dadurch spannend wird. Als Studentin bin ich ein Jahr zum Sprachkurs nach Japan gegangen (und habe dafür mein Studium unterbrochen). Dieses Jahr hat meine persönliche Entwicklung, aber auch meine Forschungsinteressen erheblich beeinflusst. Als ich wieder an der Universität Bielefeld war, gab mir Prof. Dr. Metzing die Möglichkeit, die neu erworbenen Sprachkenntnisse direkt in einem Forschungsprojekt zur automatischen Generierung von Wegbeschreibungen einzusetzen (damals gab es noch kein Google Maps).

Die Computerlinguistik hat mich fasziniert. Indem wir versuchen, sprachliche Phänomene nachzubilden, entwickeln wir ein tiefes Verständnis der Sprache und letztlich auch des Denkens dahinter. So habe ich für meine Dissertation an sogenannten „Translation Mismatches“ in der maschinellen Übersetzung gearbeitet und z.B. dabei festgestellt, dass der außersprachliche Kontext im Japanischen viel wichtiger für das Verständnis ist als im Deutschen. So spiegelt sich z.B. die soziale Beziehung von Sprecher, Adressat und Dritten, über die gesprochen wird, direkt in den japanischen Wortformen. Das in der maschinellen Übersetzung nachzubilden erfordert erheblich mehr als die reine Analyse des Satzes – und dieses Problem ist noch längst nicht gelöst.

Meine Forschungsarbeiten zur Grammatik der japanischen Sprache waren immer vom Gedanken geprägt, wie man die Ergebnisse so nutzen kann, dass sie Menschen in ihrer Kommunikation und ihrer Arbeit unterstützen können. Das Buch, das diese Arbeiten zusammenfasst, ist 2016 unter dem Titel „Jacy: An Implemented Grammar of Japanese“ beim CSLI Stanford erschienen. Gleich nach der Einleitung beschreiben wir darin, wie die Grammatik in unterschiedlichen Projekten angewendet wurde, bevor wir auf die Einzelheiten der Grammatik eingehen.

Im Jahr 2006 bin ich zunächst vollends in die Anwendung gegangen. Ich habe als Sprachtechnologin bei der Berliner Firma Acrolinx Technologie für die Grammatik-, Rechtschreib-, Stil- und Terminologieprüfung entwickelt, die Autoren dabei unterstützt, gute technische Dokumentation zu schreiben. Aber auch hier tauchten bald die „alten“ Themen wieder auf: Ich habe der Firma dabei geholfen, Sprachressourcen für die japanische Sprache zu entwickeln, Kontakte nach Japan zu knüpfen und in Tokyo eine weitere Niederlassung aufzubauen. Anschließend habe ich mich mit automatischem Preediting für die Maschinelle Übersetzung beschäftigt und in einem Forschungsprojekt mitgearbeitet. Schließlich bin ich auf das Thema „Leichte Sprache“ – Texte für Menschen mit eingeschränktem Sprachverständnis – gestoßen und habe auch dort Technologien entwickelt, um die Produktion dieser Texte wirksam zu unterstützen.

Seit 2012 bin ich nun Professorin an der Hochschule Darmstadt. Bis 2024 habe ich im Bachelor und im Master Informationswissenschaft unterrichtet. Seit dem Wintersemester 2024/2025 bin ich nun in der Informatik und in Data Science unterwegs. Es macht unwahrscheinlich viel Spaß, den Studierenden von meinen Erfahrungen zu berichten und sie für Sprache und Technik zu begeistern. Ich beschäftige mich von Anfang an mit Lehrmethoden in der Präsenz und im E-Learning, in Vorlesungen, Seminaren und Projekten und versuche, mindestens ein Seminar im Jahr neu zu entwickeln. In der Forschung kam das Thema Sentimentanalyse wieder auf den Tisch, mit dem ich mich 2005 schon beschäftigt, aber es wieder aus den Augen verloren hatte. Dies auch, weil die Studierenden großes Interesse an diesem Thema gezeigt haben. Meine Erfahrungen in der technischen Dokumentation haben sich als ein gutes Lehrthema herausgestellt. Kooperationen mit anderen Studiengängen (z.B. BWL, Informatik und Journalismus) haben zur Forschungsideen und gemeinsamen Lehrveranstaltungen geführt. Seit einigen Jahren beschäftige ich mich mit den Themen der Erkennung und Bekämpfung von Hasskommentaren und Desinformation.

Aktuelles:
Im November 2017 haben wir das Promotionszentrum Angewandte Informatik der hessischen Hochschulen gegründet. Ich bin Mitglied im Promotionsausschuss. Aktuell betreue ich - zusammen mit KollegInnen - diese Doktorarbeiten:
  • Mina Schütz: Disinformation Detection: A Visual and Explainable Semi-Supervised Transfer Learning Approach
  • Jian Xi: Detektion und Bewertung semantischer Inhalte in Bildern für eine erweiterte Kommunikationsanalyse
  • Midhad Blazevic: Visual Collaborative Research Platform Based on Data Analytics and Natural Language Processing
  • Fabian Sturm: Human Action Recognition in Assembly Lines
  • Lennart Sina:Visual Analytics for Corporate Foresight through Automatic Detection and Forecasting of Emerging Trends
  • Margot Madina: Easy-to-Read Language: Development of Linguistic Resources and Automatic Text Adaptation Tools
  • Christina Barz: From Ingroup to Intergroup Cooperation: A Mixed Methods and Interdisciplinary Investigation of what Motivates Cooperation between Environmental Movement Organizations
  • Anne Kathrin Berg: Bedeutung und Akzeptanz öffentlich-rechtlicher Nachrichten in "Leichter Sprache“
  • Sabine Richter: Automatisierte Erstellung eines personenspezifischen Rigs zum Vergleich einer Person im Videomaterial mit Personen einer Vergleichsgruppe
  • Florian Meyer: Ausbreitung von Hass in sozialen Netzen und die Bestimmung der dynamischen Toxizität
  • Uliana Eliseeva: A Modular Approach to Orchestrate Data Pipelines for Visual Analytics


Das Forschungsprojekt DeTox untersucht die automatische Klassifikation von toxischen Äußerungen in sozialen Netzwerken. Es ist eine Zusammenarbeit zwischen der Hochschule Darmstadt, des Fraunhofer SIT und des Hessen Cyber Competence Centers, gefördert vom Hessischen Ministerium des Inneren und für Sport. Ein Video eines Vortrags dazu ist hier.
Das Forschungsprojekt BoTox widmet sich der Erforschung automatisierter Methoden zur Bot- und Kontexterkennung von Hasskommentaren im Netz. Das Ziel ist der Schutz sozialer Diskurse und die Identifikation strafrechtlich relevanter Inhalte, denn in einem zunehmend vernetzten digitalen Raum stellen die Auswirkungen von Hassrede und manipulativen Bots auf unsere Gesellschaft eine große Herausforderung dar. Dieses Projekt ist eine Zusammenarbeit zwischen der Hochschule Darmstadt, der Hochschule Fresenius und dem Hessen Cyber Competence Center. BoTox wird über die Forschungsförderung Cybersicherheit des Hessischen Ministeriums des Innern, für Sicherheit und Heimatschutz gefördert.


Hochschullehre:
SoSe 2024, SoSe 2022, SoSe 2021, SoSe 2020:Sentiment-Analyse (Hochschule Darmstadt, Studiengang Informationswissenschaft)

WiSe 2019/20:Informationsqualität (Hochschule Darmstadt, Studiengang Informationswissenschaft)

September 2019: Introduction to Natural Language Processing (Ulyanovsk State Technical University)

SoSe 2019: Chancen und Risiken der Digitalisierung (Hochschule Darmstadt, Studiengang Informationswissenschaft, zusammen mit Prof. Dr. Stefan Schmunk)

WiSe 2022/23, WiSe 2020/21, WiSe 2018/19, SoSe 2018: Angewandte Methoden der Sprachverarbeitung (Hochschule Darmstadt, Studiengang Informationswissenschaft)

SoSe 2023, SoSe 2022, SoSe 2020, SoSe 2017: Grundlagen der Sprachverarbeitung (Hochschule Darmstadt, Studiengang Informationswissenschaft)

SoSe 2017: Roboterjournalismus und Social Bots (Hochschule Darmstadt, Studiengang Informationswissenschaft, zusammen mit Prof. Dr. Lorenz Lorenz-Meier)

SoSe 2016: Maschinelle Übersetzung (Hochschule Darmstadt, Studiengang Informationswissenschaft)

WiSe 2020/21, SoSe 2019, WiSe 2015/16: Text Mining (Hochschule Darmstadt, Studiengang Informationswissenschaft)

WiSe 2014/15, SoSe 2016, SoSe 2018: Texttechnologie (Hochschule Darmstadt, Studiengang Informationswissenschaft)

WiSe 2018/19, SoSe 2017, WiSe 2015/16, SoSe 2014, SoSe 2013: Opinion Mining (Hochschule Darmstadt, Studiengang Informationswissenschaft)

SoSe 2024, SoSe 2023, SoSe 2022, SoSe 2021, SoSe 2020, SoSe 2019, SoSe 2018, SoSe 2017,SoSe 2015, SoSe 2014, SoSe 2013: Semantik II (Hochschule Darmstadt, Studiengang Informationswissenschaft)

WiSe 2023/24, WiSe 2022/23, WiSe 2021/22, WiSe 2020/21, WiSe 2019/20, WiSe 2018/19, WiSe 2016/17, WiSe 2015/16, WiSe 2014/15, WiSe 2013/2014, WiSe 2012/2013: Semantik I (Hochschule Darmstadt, Studiengang Informationswissenschaft)

WiSe 2019/20, WiSe 2016/17, WiSe 2015/16, WiSe 2013/2014: Methoden der Technischen Dokumentation (Hochschule Darmstadt, Studiengang Informationswissenschaft)

SoSe 2011, SoSe 2010: Technische Dokumentation für den Internationalen Markt (Hochschule Karlsruhe, Studiengang Technische Redaktion)

SoSe 2011, SoSe 2010, SoSe 2009, SoSe 2008: Maschinelle Übersetzung (Universität Bielefeld, Linguistik)

WiSe 2009/2010: Wissensbasierte Systeme (Fachhochschule Hannover, Masterstudiengang Informations- und Wissensmanagement)

WiSe 2009/2010: Language Checking (Universität Saarbrücken, Fakultät für Computerlinguistik)

WiSe 2008/2009: Multimodale Integration von Wissen (Fachhochschule Hannover, Masterstudiengang Informations- und Wissensmanagement)

WiSe 2005/2006: Python for Computational Linguistics (Universität Saarbrücken, Fakultät für Computerlinguistik)

SoSe 2004, SoSe 2002: Practical Grammar Engineering Using HPSG (Universität Saarbrücken, Fakultät für Computerlinguistik)

SoSe 2001: Probleme der Verarbeitung des Japanischen (Universität Saarbrücken, Fakultät für Computerlinguistik)

WiSe 1998/1999: HPSG für das Japanische (Universität Saarbrücken, Fakultät für Computerlinguistik)

WiSe 1997/1998: Phänomene der Topikalisierung (Universität Saarbrücken, Fakultät für Computerlinguistik)