Hintergrund Alexa

21.11.2017 UPDATE: 24.11.2017 06:00 Uhr 1 Minute, 44 Sekunden

Warum man mit Freunden anders redet als mit Computern

Antje Meyer (59) kennt sich mit dem Nachahmen von Gesprächssituationen aus. Sie erforscht, welche Aspekte in einem Gespräch neben den Lauten eine Rolle spielen.

Frau Meyer, stellen wir uns ein Gespräch zwischen zwei Menschen und ein Gespräch zwischen Mensch und Maschine vor. Wo liegen die Unterschiede?

Das hängt von den Menschen, der Maschine und der Situation ab. Wenn ich bei der Bahn eine Auskunft erfrage, ist das etwas ganz anderes als ein Gespräch zwischen zwei Freundinnen bei einer Tasse Kaffee. In einem Gespräch zwischen zwei Menschen sind die schnellen Antworten zwischendurch meist sehr kurz, ziemlich inhaltsleer und nicht besonders gut getimt: Etwa 40 Prozent der Äußerungen sind "Mhmh", "Aha" oder "Ja". Die einzige Funktion, die diese Äußerungen haben, sind zu signalisieren: Ich höre zu. Das kann man einer Maschine auch beibringen.

Wenn ich einem Menschen gegenüber sitze, kann ich in seinem Gesicht ablesen, dass er bei einer Antwort überlegt. Wie ließe sich dieses Signal bei Maschinen umsetzen?

Auch interessant
Zukunft ist jetzt!: Alexa, wir müssen reden!

Satzteile wie "Warte mal, ich denke", oder "Mh, ja" ließen sich relativ einfach davor schalten, wenn man die Kommunikation natürlich machen möchte. Es gibt zwar Avatare, künstliche Figuren, deren Mimik angepasst werden kann: die Lippenbewegung, hochgezogene Augenbrauen oder ein Lächeln. Richtig gut sind sie aber noch nicht. Das größere Problem ist allerdings, genau zu verstehen, was der andere meint: eine Bahnauskunft oder ein Kochrezept? Das geht noch. Aber der emotionale Inhalt einer Äußerung muss ankommen.

Zum Beispiel?

Stellen Sie sich vor, ich stehe an einem heißen Tag auf einer Brücke, darunter ist ein See und ich sage: "Ich würde jetzt am liebsten von der Brücke springen." Das ist prima. Ich könnte aber auch abends beim Roten Kreuz anrufen und sagen: "Ich würde jetzt am liebsten von der Brücke springen." Sprachassistenten geben in so einem Fall eine Routenbeschreibung zur nächsten Brücke, aber das ist natürlich nicht gemeint. Eine Maschine kann nicht einsehen, was in der Person vorgeht. Das wird zum Teil über die Stimmlage, aber vor allem aus der Situation heraus transportiert.

Gespräche dienen ja nicht nur dem Inhalt, sondern haben auch eine soziale Funktion. Welche ist das genau?

Sie dienen dazu, füreinander da zu sein. Bestätigungssätze sind ein Teil davon: "Das findest du auch, oder?" Oder Phrasen, mit denen man Wiederholungen anbietet: "Wirklich? Hat sie das gesagt?" Der Inhalt ist in der Situation klar, aber durch das Nachfragen wird Nähe erzeugt. Mit meiner Mutter spreche ich anders als mit meinem Mann oder meiner Tochter. Da gibt es gemeinsames Wissen zwischen den Personen, das lässt sich mit einer Maschine nicht nachmachen. Diese Art von Gesprächen ist sehr wichtig für Menschen. Ohne sie fühlt man sich einsam.