Dies ist eine kleine Anekdote aus meiner Praktikumserfahrung am Ankara University Brain Research Center und der Arbeit an verschiedenen Projekten am Neuroscience and Neurotechnology Center of Excellence. Sie zeigt, wie wichtig es sein kann, ein bisschen was über computergestützte Methoden in der Linguistik zu wissen – das kann die Forschung viel einfacher und effizienter machen.
Seitdem ich den Vortrag „Linguistik und Software“ auf dem Linguistik-Studentenforum (DilbilimOP) gehalten habe, der eine grundlegende Einführung in die Computerlinguistik war, bekomme ich viele E-Mails mit Fragen zu den alltäglichen Anwendungen dieses faszinierenden Bereichs.
Mein Hauptargument in dem Vortrag war: Selbst wenn du kein riesiges Interesse an Computerlinguistik hast, die Techniken, die wir in der CL nutzen, können extrem nützlich für deine eigene Forschung sein. Kurz gesagt: Als Linguist sollte man keine Angst davor haben, ein bisschen Programmieren zu lernen!
Wie hat mir Programmierkenntnis in der Laborlinguistik geholfen?
Bevor ich loslege, ein kurzer Hintergrund: Ich bin Linguist, und meine Hauptforschungsinteressen liegen in der Phonologie & Phonetik sowie der Kognitiven Linguistik. Kürzlich wurde ich als Praktikant am Ankara University Brain Research Center ausgewählt und lerne jetzt mehr über Laborlinguistik sowie die Geräte und Methoden, die sie in ihrer (wirklich sehr spannenden) forschung verwenden. Hauptsächlich helfe ich bei größeren Projekten – Datenerfassung, -analyse und so weiter – und arbeite auch an meinem eigenen Projekt über Pupillenerweiterungsreaktionen auf unerwartete morphologische Einheiten (mehr dazu später).
Meine Mentorin und Professorin leitet eines dieser größeren Projekte, bei dem sie sich mit riesigen Sprachaufnahmen beschäftigt. Sie analysiert Aufnahmen von bis zu 20 Minuten Länge für dieses kognitionslinguistische Experiment – und das Phonem für Phonem in Praat. Ich wiederhole: PHONEM FÜR PHONEM.
Sie erzählte mir von dieser wahnsinnig zeitaufwendigen Aufgabe und bot mir ein Stipendium an, wenn ich ihr helfen würde – was super großzügig war. Aber sie wusste nicht, dass ich einen kleinen Hintergedanken hatte, als ich zustimmte, diese Aufgabe zu übernehmen, die bis zu zwei Stunden pro Aufnahme dauern kann.
Vor einiger Zeit hatte ich nämlich ein kleines Programm namens „praanscribe“ geschrieben. Es ist eine Anwendung zur automatischen Transkription von Audioaufnahmen und zur Erstellung von TextGrid-Dateien, die in Praat verwendet werden können. Ich fand es ziemlich praktisch und habe es deshalb auf GitHub hochgeladen, damit es jeder nutzen kann. Es verwendet im Grunde die Whisper-API von OpenAI, um „Untertitel“ mit Zeitstempeln für Aufnahmen zu erstellen und sie in Praats TextGrid zu integrieren. Das übernimmt im Prinzip schon die Hälfte der Arbeit.
Ich teilte das Programm mit meiner Professorin und hatte zum Glück nicht das zweifelhafte Vergnügen, der erste Linguist zu sein, dessen Job von seiner eigenen KI übernommen wurde.
War das Glück? Absolut. Ich hätte nie gedacht, dass mir ein Programm, das ich vor vier Monaten geschrieben habe, so nützlich sein würde.
Lernt etwas Programmieren Leute!
13.10.24
Leave a Reply