Vorläufer von Alexa, Siri und Co.
Eine Hand hält den Trichter, die andere drückt Knöpfe um die Stimmlippen anzupassen, während der freie Arm den Blasebalg drückt – ein „A“ ertönt. Das „M“ sitzt auch ganz gut, wenn der Gummitrichter richtig geformt wird. Ein „I“ ist schon schwieriger, denn die Zunge fehlt im Kempelenschen Sprechapparat, und mit dem Finger ist es gar nicht so leicht, die richtige Zungenstellung nachzuahmen. Wie gut eine solche Sprechmaschine Wörter wie „Mama“ oder „Mami“ sagen kann, hängt sehr von der Virtuosität der Spielerin oder des Spielers ab, erklärt Michael Pucher vom Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: “Die Sprechmaschinen sind schon stark eingeschränkt in der Aussprache. Bei ganzen Sätzen ist es gut, wenn man vorher schon den Satz weiß, dann versteht man ihn vielleicht.“
Ein Kind der Aufklärung
Die Maschine beeindruckt also weniger durch ihre Natürlichkeit als durch ihre Leistung in der Wissenschaftsgeschichte. 1791 legt der Österreicher Wolfgang von Kempelen mit der Sprechmaschine und einem Begleitbuch die Ursprünge des Forschungsfeldes der Sprachsynthese. Seine Sprechmaschine bildete das erste Mal den menschlichen Sprechapparat nach, mit einem Quasi-Mund und Lippen aus Gummi, Stimmlippen aus Kupfer oder Elfenbein in einem Kehlraum und einem Blasebalg als Lunge.
Konferenz
„Meeting of Kempelen machines“: 12.9., ab 16h, Angewandte, Expositur Heiligenkreuzerhof, Schönlaterngasse 5, 1. Stock, 1010 Wien
Ö1-Sendungshinweis
Dem Thema widmet sich auch ein Beitrag in Wissen aktuell: 12.9., 13:55 Uhr.
Dass der menschlichen Sprache Universalien zugrunde liegen, dass ein Mund alle Töne aller Sprachen machen können sollte, das war kein selbstverständlicher Gedanke – die Sprechmaschine und die wissenschaftlich-rationale Ideologie dahinter ist ein Kind der Aufklärung. Kempelen stützt sich auf Physiologie und Eigenexperimente, um die Maschine zu entwerfen. Ein bisschen wohl auch um sich zu rehabilitieren, meint Pucher, nachdem von Kempelens „Schachtürke“ - ein Automat, der angeblich eigenständig Schach spielen können sollte - als trickreiche Täuschung entlarvt worden war.

Deutsches Museum
Nachbau der Sprechmaschine
Quellefilter, mechanisch oder digital
Erstmals kommen nun fünf Nachbauten der Kempelenschen Sprechmaschine aus ganz Europa in Wien zusammen, im Vorfeld einer sehr modern ausgerichteten Tagung , bei der man sich über digitale Sprachsynthese im Zeitalter von Alexa und Siri austauscht. Das, was sich vielleicht noch ähnelt, meint Michael Pucher, ist, dass heute wie damals ein Quellefilter zur Anwendung kommt.
Die Quelle ist bei Kempelen wohl der Blasebalg, bei digitalen Stimmen eher die Sinuswelle. Die Filter, mechanisch oder digital, verändern dann das Ursprungssignal so, dass es nach Sprache klingt. Probleme macht beiden Modellen die sogenannte Ko-Artikulation, also der Übergang von einem Ton zum nächsten.
Und so wie Wolfgang von Kempelen mit besseren Materialien vielleicht bessere „Filter“ hätte bauen können – wie das einige der Nachbauten versucht haben -, so ist die Wissenschaft auch daran, mehr Daten zum Sprechen zu sammeln, um die digitalen Modelle zur Sprachsynthese zu verfeinern.
Michael Pucher sucht mit seinen Kolleginnen und Kollegen vom Institut für Schallforschung beispielsweise derzeit die Zungenbewegungen beim Sprechen mit Ultraschall, auch um die digitalen Filter weiter verbessern zu können. So oder so, meint er, sehe man vom 18. Jahrhundert an, wie lange es dauert, von der Theorie zur Praxis zu kommen.
Isabella Ferenci, Ö1-Wissenschaft