
Voice Cloning ist eine spezielle Form der Sprachsynthese. Die Sprachsynthese im Allgemeinen ist der Oberbegriff für die künstliche Erzeugung von Sprache aus Text (Text to Speech oder kurz TTS). Beim klassischen TTS werden oft allgemeine Sprachmodelle verwendet, die auf vielen verschiedenen Sprechern trainiert wurden. Das Ergebnis kann zwar verständlich sein, klingt aber oft nicht sehr persönlich oder natürlich. Voice Cloning geht einen Schritt weiter. Es nutzt die Prinzipien der Sprachsynthese, aber anstatt eines allgemeinen Modells wird ein individuelles Modell einer Stimme erstellt.
Der Stimmklon ist also eine hochpersonalisierte Form der Sprachsynthese. Den Ausgangspunkt bildet dabei immer eine menschlische Stimme. Um das Potential von Text to Speech voll ausreizen zu können, bedarf es jedoch bestimmter Voraussetzungen. Zum einen sind das perfekte Aufnahmebedingungen in Studioqualität und zum anderen braucht es erfahrene Profisprecher. Denn der KI-Output ist am Ende immer nur so gut, wie sein menschlicher "Input". Wir arbeiten mit den besten und erfahrensten Profisprechern in über 50 Sprachen zusammen um die bestmöglich Basis für Dein TTS-Projekt zu schaffen. Für weitere Infos sprich uns einfach persönlich an.