Ein Zug der SBB auf der Gotthardstrecke. Foto: SBB
Von Daniel Bernock
Heidelberg. Die Durchsagen in Schweizer Zügen sind in Zukunft "Made in Heidelberg". Die Firma Aristech, eine Software-Firma mit Spezialisierung auf Sprachtechnologien, hat den Auftrag bekommen, für die Schweizerischen Bundesbahnen (SBB) das Programm zu liefern, das die Durchsagen in den Zügen künstlich generiert.
Die Neuheit dabei: Nicht mehr jede Haltestelle und jede mögliche Durchsage im Bahnhof muss individuell eingesprochen werden. Die Software des Heidelberger Unternehmers Michael Mende baut aus kleinen Sprachfetzen zusammenhängende Wörter. Am Ende soll dabei ein natürlich klingender Satz entstehen. Nach Aussage des Firmengründers soll das System in den nächsten zwei bis drei Jahren flächendeckend in der Schweiz eingeführt werden, in vier Sprachen. Im März 2019 sollen die ersten deutschsprachigen Bahnhöfe ausgestattet sein.
Das sogenannte Text-to-Speech-System der Firma kommt bereits bei der Österreichischen Bundesbahn (ÖBB) zum Einsatz. Die Ansagen dort erklingen mit der Stimme der Schauspielerin Chris Lohner. Bisher musste sie dafür mehrmals im Jahr ins Tonstudio, um etwa die Namen neuer Bahnhöfe einzusprechen. Durch den Einsatz der Software von Aristech kann sie sich diese Wege sparen, ihre Stimme erklingt dennoch weiterhin in den Zügen. Nach Angaben des Geschäftsführers Mende sei bereits die Hälfte aller Bahnhöfe mit der Technologie aus Heidelberg ausgestattet.
Die Software der Heidelberger klont die Stimme einer Person und kann so jeden beliebigen Satz wiedergeben. In der Praxis können Bahn-Mitarbeiter im Bahnhof oder im Zug dann jeden beliebigen Text in den Computer eingeben. Am Ende ertönt er mit der Stimme von Chris Lohner mit der typisch österreichischen Intonation und der Stimmfarbe der Schauspielerin.
Das System der Firma ist auch in Luxemburg und bei den Verkehrsbetrieben Freiburg im Einsatz. Die Entscheidung über den möglicherweise größten Auftrag der Firma steht aber noch aus. Nach Aussage des Geschäftsführers Mende hat sich das Unternehmen bei der Deutschen Bahn beworben, die ebenfalls ein solches System einführen will. Eine Entscheidung wolle die Deutsche Bahn im Oktober fällen. "Wir haben ein gutes Gefühl", sagte Mende. Im Vergleich mit der Schweiz hätte eine Einführung des Systems bei der Deutschen Bahn ein "fünf bis sechs Mal so großes Volumen", so der Heidelberger.
Bis die Software einwandfrei funktioniert, sind viele intensive Aufnahmesessions notwendig. Zwei Wochen lang muss der Stimmenlieferant jeden Tag ausgewählte Satzkonstruktionen einsprechen. Aus den Bruchteilen legt die Software eine Bibliothek an, mit deren Hilfe sie dann die geschriebenen Texte "zum Leben erweckt."
Nach Aussage der Firma, die in Heidelberg 20 Mitarbeiter beschäftigt, ist das Geheimnis hinter der natürlich klingenden Stimme die Zusammensetzung der Wörter aus einzelnen Sprachschnipseln, den sogenannten Diphonen. Demnach wird nicht zwischen den Lauten geschnitten, sondern mitten im Laut. Das Ergebnis sei von einer menschlichen Stimme kaum zu unterscheiden - sodass am Ende niemand mehr in der Schweiz oder sonst wo wegen einer schlecht verständlichen Ansage im Zug seinen Ausstieg verpasst.