Übersetzungsunternehmen Kocarek GmbH
Facebook LinkedIn GooglePlus Besuchen Sie uns auf Twitter YouTube

+49 201 24 69 90-0 | info@kocarek-gmbh.com

Übersetzungsunternehmen Kocarek GmbH
Home » News
16.03.2016

Im unheimlichen Tal der fast menschlichen Stimmen

Momentan schaut Deutschland wieder nach Hannover: Hier findet gerade die CeBIT statt. Roboter und menschliche Computerstimmen sind natürlich auch vertreten. Doch wie menschlich sollte ein sprechender Computer eigentlich klingen? Mit dieser Frage befassen sich Softwareentwickler im Bereich "Human-Computer-Interaction Design", der Gestaltung der Mensch-Computer-Interaktion. Bei der Entwicklung einer möglichst menschlichen Stimme ist zu viel Menschlichkeit kontraproduktiv – man läuft Gefahr, im Uncanny Valley zu landen.

HRP-4C Roboter

Die Crux des "fast"

Wenn Linguisten und Softwareentwickler sich auf die Suche nach der perfekten Computerstimme begeben, führt noch immer kein Weg am sogenannten Uncanny Valley vorbei: Hier klingen künstlich generierte, fast menschliche Stimmen irgendwie störend, misstönend, einfach nicht harmonisch. Laut der Unncanny-Valley-Hypothese liegt das daran, dass die Stimme nur fast menschlich ist und dadurch für den Zuhörer regelrecht abscheulich und abstoßend klingt. Den Bereich, der dem gesunden Menschen sehr nah liegt, hat der japanische Robotiker Masahiro Mori  1970 auf den Namen "Uncanny Valley" getauft (bzw. auf "bukimi no tani genshō").

Fast menschlich = horrorfilmreif

Das Wort "Tal" kommt daher, dass die subjektiv empfundene Menschenähnlichkeit kurz vor dem Auftauchen des gesunden Menschen stark einbricht. In diesen Bereich fallen zum Beispiel Zombies, Handprothesen und Leichname. Auch Computerspieler akzeptieren künstlich aussehende Figuren eher als realistisch aussehende. Während technisch aussehende Roboter für gewisse menschliche Eigenschaften viel Beifall erhalten, weil sie irgendwie putzig wirken, betrachten Zuschauer zu menschenähnlich gestaltete Exemplare argwöhnisch: Erwachsene verhalten sich zurückhaltend, Kinder beginnen manchmal zu weinen, wenn ein sehr menschenähnlicher Roboter auf sie zukommt. Auf uns wirkt ein solcher Roboter wie ein Mensch, der sich sehr merkwürdig gebärdet.

Die Kunst der Künstlichkeit

Das Uncanny Valley gilt auch für Sprache: Die künstliche Stimme muss die Wörter nicht nur korrekt aussprechen, sondern auch menschliche Qualitäten wie Tonfall und Emotionen passend verwenden. Die sogenannte Prosodie muss stimmen. Bis heute ist es mit künstlicher Intelligenz nicht möglich, alle Emotionen komplett in eine menschliche Stimme einfließen zu lassen – obwohl viele qualitativ hochwertige künstliche Stimmen auf einer Database menschlicher Tonaufnahmen basieren.

Um sich nicht im unheimlichen Tal zu verirren, kreieren die Sprachspezialisten daher Stimmen, die deutlich wie Computerstimmen klingen, sich dabei aber optimistisch und ein kleines bisschen schwungvoll anhören. Die Kreation einer solchen Stimme ist neben all der Wissenschaft eine hohe Kunst.

 

Kocarek GmbH | Kronprinzenstraße 5-7 | 45128 Essen | Tel.: +49 201 24 69 90-0 | Fax: +49 201 24 69 90-10 | info@kocarek-gmbh.com