von Dirk Behrens | 3,0 / 5,0 | Geschätzte Lesezeit: 3 Minuten
Uberduck AI Text-to-Speech-System

Uberduck AI Text-to-Speech-System  ·  Quelle: Uberduck AI

ANZEIGE

Software, die Texte in Sprache synthetisiert, gibt es schon seit den ersten Computern. Mittlerweile funktioniert das auch webbasiert und aktuell kommen immer mehr Algorithmen aus dem Bereich der künstlichen Intelligenz zum Einsatz. Die Website Uberduck macht sich das zunutze, um Texte in die Stimmen von Rappern, Politikern, Cartoon-Figuren und vielen weiteren Prominenten zu verwandeln. Eingegebene Texte klingen plötzlich so, als ob sie von Yoda, Mickey Mouse, John F. Kennedy, Eminem, Biggie, Duke Nukem oder wem auch immer gesprochen oder gerappt werden. Das macht tierisch viel Spaß, ist aber auch ein bisschen gruselig.

ANZEIGE

Uberduck Sprachsynthesizer

Auf der Website wird Uberduck als „synthetisches Sprachspielzeug“ beschrieben. Und im Prinzip ist das schon sehr treffend. Das Text-to-Speech-System macht mit dem Bild einer Gummiente einen sehr lieben Eindruck und das Interface lässt sich ganz einfach bedienen.

Mit eurem Google- oder Discord-Konto loggt ihr euch ein und schon kann es losgehen. Über zwei Pull-down-Menüs wählt ihr die gewünschte Sprache aus. Auf der linken Seite gibt es eine breite Auswahl verschiedener Kategorien, rechts findet ihr die zugehörigen Stimmen. Ihr findet Stimmen von Stars aus Film, Musik, Politik, dem öffentlichen Leben und jeder Menge Games.

Uberduck Web-Interface

Uberduck Web-Interface

In dem Textfeld müsst ihr nur noch einen Text eingeben, sobald ihr auf den Synthesize-Button klickt, berechnet der Server recht zügig die Sprachausgabe. Das Ergebnis hört ihr euch direkt im Browser an, ihr könnt aber auch ein WAV-File downloaden. Optimal!

Das 2020 gestartete Projekt wird mit von den Usern generierten Deepfake-Modellen gefüttert. Die Datensätze dürften also beständig wachsen, aber auch jetzt ist die Auswahl schon riesig. Die Idee für das Projekt kam eigentlich auf, nachdem TikTok das eigene Text-to-Speech-System nach einem Copyright-Anspruch ändern musste. Und klar, dass bei der TikTok-Community Uberduck schnell zu einem Hit wurde.

Klicken Sie auf den unteren Button, um den Inhalt von www.tiktok.com zu laden.

Inhalt laden

Hip-Hop-Legenden rappen eure Texte

Dass sich die „sprechende Ente“ auch kreativ nutzen lässt, beweisen schon etliche Videos. So lässt Mike Shinoda bereits einen seiner Songs von einem künstlichen Notorious B.I.G. rappen.

ANZEIGE

Je überzeugender Deepfakes werden, desto brisanter werden die Streits über Urheberrechte ausfallen. Das wird noch richtig spannend. Und gruselig authentisch hören sich einige der Stimmen bereits jetzt an. Teilweise ist die synthetische Natur noch an einigen Glitches zu erkennen, mit besseren Algorithmen und mehr Training der KI dürfte die Qualität aber noch weiter zulegen.

Zukünftig sollen die Modelle nach Wahl sprechen, singen, rappen oder dramatisch vortragen. Phoneme sollen sich außerdem besser kontrollieren lassen und sogar Sprache soll als Eingabe dienen. Eine Discord-Integration existiert übrigens schon jetzt, diese wird noch weiter verbessert.

So genug geschrieben, ich muss jetzt für den Rest des Tages Sprache synthetisieren.

Weitere Infos über Uberduck

Videos zu Uberduck

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

 

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Bildquellen:
  • Uberduck Web-Interface: Uberduck AI
Uberduck AI Text-to-Speech-System

Wie findest du diesen Beitrag?

Bewertung: Deine: | ø:
ANZEIGE

9 Antworten zu “Uberduck: Kostenloser Sprachsynthesizer mit vielen prominenten Stimmen”

    Samira sagt:
    0

    Warum funktioniert das denn nur, wenn man einen Google- oder Discord-Account hat? Hab weder das eine noch das andere…

    Hagbard Celine sagt:
    0

    ..ich habe mich heute mit Mr. Spocks Stimme in der Arbeit verabschiedet!
    Goofy war leider nicht verständlich genug, da hätten die Kollegen eher die Rettung gerufen…

    Thomas Martin sagt:
    0

    Nette Idee, aber leider völlig verbuggt und praktisch nicht zu gebrauchen. Unausgereiftes Spielzeug…

    The Real Truth sagt:
    0

    „Software, die Texte in Sprache synthetisiert, gibt es schon seit den ersten Computern.“
    Mit Sicherheit nicht.

      Dirk Behrens sagt:
      0

      Kannst du das ein bisschen näher erläutern?

        The Real Truth sagt:
        0

        Als erster Computer der Welt wird meistens der Z3 genannt.
        Der stammt aus dem Jahr 1941 und ist/war mit Sicherheit nicht in der Lage Text in Sprache umzuwandeln.

          Dirk Behrens sagt:
          0

          Das ist jetzt aber echt mal Haarspalterei. Aber meinetwegen, du hast recht.
          Ich habe auch nicht so sehr an Großrechner gedacht, sondern eher an Computer, die normale Menschen kaufen und benutzen konnten. Wie konnte ich nur?

            Ragnar sagt:
            0

            laut Wikipedia „Die ersten computerbasierten Sprachsynthesesysteme wurden in den späten 1950ern entwickelt‘, kommt für mich daher schon in den Bereich der ersten kommerziell erhältlichen Computer. Ob auf experimentellen Rechnern (erfolglose und daher nicht erwähnte) Versuche unternommen wurden wissen wir einfach nicht, unwahrscheinlich erscheint es nicht, wenn man sich die Historie der Spachsynthese auf Wikipedia anschaut.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert