Im Mai 2021 haben die Fachhochschule Nordwestschweiz FHNW und die Zürcher Hochschule für Angewandte Wissenschaften ZHAW zu einer Datensammlung aufgerufen, um Schweizer Dialekte zu digitalisieren. Wie Manfred Vogel, Leiter Information Processing am Institut für Data Science der FHNW, erzählt, haben sie nach der der ersten Datensammlung noch eine zweite gemacht, bei der gezielter Aufnahmen gesammelt wurden: «Wir haben längere Aufnahmen von weniger Leuten gesammelt. Teilweise sind es auch Aufnahmen von gleichen Sätzen, die in verschiedenen Dialekten gesprochen wurden.» Mittlerweile habe man ziemlich gut funktionierende Modelle, die alle Deutschschweizer Dialekte verstehen.
Google und Co zeigen kein Interesse
Die Daten braucht die FHNW vor allem, um die eigenen Modelle zu trainieren. Für die grossen Anbieter wie Google und Apple sei die Schweiz nicht rentabel, weshalb diese sich bisher auch nicht bemüht hätten, einen Schweizerdeutschen Sprachassistenten zu entwickeln. Zudem sei dies wegen der verschiedenen Dialekte auch relativ schwierig. Die Schweiz werde für die grossen Unternehmen erst interessant, wenn die rentableren Gebiete abgedeckt sind.
Einzig Microsoft hat einen Dienst, der Schweizerdeutsch versteht. «Wir haben diesen auch ausgiebig getestet und mit unserer Lösung verglichen und er ist um einiges schlechter. Aber immerhin haben sie Bestrebungen, so einen Dienst anzubieten», sagt Vogel weiter.
Verschiedene Anwendungsmöglichkeiten
Dass Sprachassistenten wie der Google Assistant, Siri oder Alexa in naher Zukunft Schweizerdeutsch tadellos verstehen, ist also nicht zu erwarten. Und auch selbst entwickelt die FHNW laut Vogel keine Produkte. «Es gibt aber Firmen, auch Spin-Offs von uns, die nachher Produkte anbieten können, die einen Mehrwert auf vielen Ebenen bieten.»
Aktuell werde ihre Lösung bereits von diversen Kantons-, Stadt- und Gemeindeparlamenten verwendet, um die Debatten, die auf Schweizerdeutsch geführt werden, ins Hochdeutsche zu transkribieren. In Zukunft könne die Spracherkennung zum Beispiel auch in Callcentern verwendet werden, um die anrufende Person zu verstehen und danach eine automatisierte Antwort zu geben.
Sogar im medizinischen Bereich könnte die Spracherkennung Unterstützung leisten, wie Vogel weiter erzählt: «Es gibt Krankheiten wie ALS, durch welche Patienten ihre Stimme verlieren können. Mit der Spracherkennung könnte man deren Stimmen konservieren, so dass sie später immer noch mit ihrer eigenen Stimme kommunizieren können.»