Kann ChatGPT vorlesen & sprechen?

Die Zukunft ist da – zumindest, wenn es nach OpenAI geht. Der beliebte Chatbot des Unternehmens spricht jetzt buchstäblich mit fünf verschiedenen Stimmen, die so echt klingen, dass man meinen könnte, es handle sich um einen echten Menschen.

Der Chatbot von OpenAI kann sprechen und laut vorlesen. Das Unternehmen kündigte kürzlich ein Update für seine iOS- und Android-Apps an, das dem künstlich intelligenten Bot ermöglicht, laut zu sprechen. Die Sprachfunktionen werden in den nächsten Wochen für Abonnenten von ChatGPT Plus für 20 US-Dollar im Monat verfügbar sein.

ChatGPT-Voice-Sprache

Wie gut kann ChatGPT sprechen?

Stellt euch Siri oder Alexa vor, aber anders. Die natürliche Stimme, der kommunikative Ton und die eloquenten Antworten sind manchmal kaum von einem echten Menschen zu unterscheiden. Erinnert ihr euch an den Film „Her“? Der, in dem Joaquin Phoenix sich in ein KI-Betriebssystem verliebt, das eigentlich eine gesichtslose Scarlett Johansson ist? Genau diese Vibes meine ich.

„Es geht nicht nur darum, dass das Tippen mühsam ist“, erklärte Joanne Jang, Produktleiterin bei OpenAI, in einem Interview. „Jetzt können Sie zweigleisige Gespräche führen.“

Während das System nur eine ChatGPT-Textantwort vorliest, handelt es sich nicht um die robotischen, steifen Text-zu-Sprache-Systeme, mit denen wir aufgewachsen sind. Es gibt fünf verfügbare Stimmen, und jede klingt wie ein echter Mensch – mit Betonung, Intonation und Persönlichkeit.

Diese Stimmen wurden aus „nur wenigen Sekunden Sprechprobe“ von professionellen Synchronsprechern generiert, erklärte mir Jang. Diese Proben werden dann durch die Computermodelle von OpenAI geleitet, um Text-zu-Sprache-Stimmen zu erstellen.

OpenAI sagt, dass sie mit anderen Organisationen zusammenarbeiten, um synthetische Stimmen zu entwickeln. Sie arbeiten mit Spotify an einem Tool, das die Stimmen von Podcastern in andere Sprachen übersetzt. Angesichts der Tatsache, wie einfach es sein könnte, eine Stimme mit nur wenigen Sekunden Audio zu klonen, betont das Unternehmen aus Sicherheitsgründen für das gesamte Internet – und wirklich die ganze Welt – dass dies derzeit nur für Geschäftspartner verfügbar ist.

 

Wie kann ich einstellen, dass ChatGPT mit mir spricht?

Anders als bei Siri oder Alexa gibt es kein Aktivierungswort, um ChatGPT zu rufen.

  1. Hat man Zugriff auf die Funktion, findet man oben in der Übersicht der Chat-Verläufe ein Kopfhörer-Symbol.
  2. Einmal angetippt, sieht man eine kurze Lade-Animation.
  3. Sobald ein Kreis zu sehen ist, kann man die Spracheingabe aktivieren, indem man draufdrückt.
  4. Kleinere Kreise zeigen an, dass ChatGPT zuhört. Dann kann man seinen Prompt einsprechen.
  5. Eine animierte Sprechblase zeigt an, dass der Befehl verarbeitet wird.
  6. Anschließend wird die Antwort von ChatGPT vorgelesen.
  7. Tippt man auf die entsprechende Funktion, kann man sich die Antwort zusätzlich auch wie gewohnt in Textform anzeigen lassen.

 

Wichtig: Die Sprachfunktionen werden in den nächsten Wochen für Abonnenten von ChatGPT Plus für 20 US-Dollar im Monat verfügbar sein.

Quelle: https://openai.com/blog/chatgpt-can-now-see-hear-and-speak