Geschätzte Lesezeit: 3 Minuten
Cleanvoice

Cleanvoice  ·  Quelle: Cleanvoice

Heute ist eine kostenlose Testwoche bei Cleanvoice. Damit können hochgeladene und  sehr lange Audiofiles von störenden Sprecherlauten und unnötigem Stottern befreit werden. Die Berechnung dauert nur wenige Minuten.

ANZEIGE
ANZEIGE

Cleanvoice – Die Äh’Lösung

Wenn du Sprecher, Podcaster, Videocaster oder Ersteller von Tutorials bist, kennst du das Problem. Besonders in Live eingesprochenen Texten und freier Rede befinden sich oft zu viele Störgeräusche und „Äh“-Laute durch das sprechende Denken. Das ist anstrengend für deine Hörer. Deshalb gibt es den neuen Webservice von Cleanvoice. Hochgeladen werden können MP3 oder WAV-Dateien. Nach etwa 5-10 Minuten bekommt man bereits die bereinigte und fertige Datei zum Download und wird per E-Mail benachrichtigt.

Beeindruckender Selbsttest

Mit meinem letzten Videocast SequencerTalk habe ich diesen Service testweise auf die fertige Livesendung angewendet. Eine Sendung von knapp 2 Stunden. Die Uploadgrenze ist mit 400 MB sehr großzügig bemessen. Solange eine MP3 reicht, können mehrere Stunden Material verarbeitete werden. Das Ergebnis kann sich hören lassen. Ich fand die komplette Audiodatei wesentlich besser und es fehlte nichts an „Sprachwitz“. Spektakuläre 14 Minuten kürzer ist das errechnete Audiofile, welches allerdings einige Minuten Stille aus der Pre-Show enthielt. Somit handelt es sich nicht vollständig um „Äh“-Material“, was die Berechnung entfernt hat. Das Ergebnis wirkt dennoch nicht beschnitten, mitten in Pausen, im Fluss oder mit Sprachwitz gewürzten Teilen als „zu künstlich“.

Cleanvoice funktioniert auf Deutsch und Englisch und offenbar auch in anderen Sprachen aktuell brauchbar. Ich habe jedoch nur deutsche Sprach-Files geprüft. Die Technik basiert auf Machine Learning und Big-Data-Erkennung durch den Scan einer Vielzahl von Audiofiles (KI). Es werden Mundschmatzen, Äh’s und „Nachdenkgeräusche“ bereits jetzt gut ausgefiltert. Angekündigt sind auch Stotterbereinigung und sogar unsinnige Floskeln und Füllworte „ohne Sinn“ sollen in Zukunft erkannt werden. Im Text steht dazu „I think, I mean …“, also „ich denke…“, was in einigen US-Podcasts wirklich sehr oft zu hören ist. Ebenso sind Mehrspuraufnahmen für Mitte Juli vorgesehen.

Videosynchronität

Da das Audiofile nicht nur von „Äh’s“ befreit, sondern auch verkürzt wird, lässt sich das Ergebnis nicht auf Videosendungen anwenden, denn die Synchronität würde verloren gehen. Es soll aber eine zeitsouveräne Timestamp-Version geben, die aktuell in der Betaversion vorliegt. Dann könnten die Audiodateien wieder unterlegt werden.

Diese konnte ich aber nicht prüfen. Es wäre der größte Wunsch, Videoversionen mit gleich langen Varianten zu versorgen, die lediglich unschöne Geräusche und „Äh’s“ ausblendet, denn dann würden auch „Youtuber“ davon profitieren können. Die Qualität der Bearbeitungen ist nämlich ist hervorragend. Vermutlich ist das schwerer, da Restgeräusche des Hintergrundes nicht entfernt werden sollten, da sonst die Störwirkung eher wieder vergrößert werden müsste.

Mehr über Cleanvoice

Der Service wird als Festpreis und Monatsabo angeboten werden und bietet dann per Code einen Zugang für eine bestimmte Anzahl von Wandlungen in einem bestimmten Zeitraum. Nach diesen werden die Preise gestaltet. Aktuell gibt es noch keine Preise, da der Service neu ist. Der Service wird aktuell auch ständig verbessert. Es kommen auch weitere Funktionen hinzu.

Wer noch ein paar Hintergründe in einem Podcast hören möchte, kann sich dazu eine Viertausend Hertz Folge anhören.

ANZEIGE
ANZEIGE

10 Antworten zu “Löschung von Äh’s, stottern und Atemgeräuschen mit Cleanvoice”

  1. Larifari sagt:

    ..praktisch fürs nächste Boris Becker Interview…

  2. Levit sagt:

    ich bezweifele stark, dass es an iZotope RX ran kommt. In deren Demo sind die umm und uhh ja teils noch drin.

    • moogulator sagt:

      Hast du es mal mit „realistischem“ Material ausprobiert – ich habe das gemacht und es klappt gut, es ist jedenfalls deutlich besser. Nicht alles, aber sehr vieles. Es ist auch nicht „unnatürlich“. Deshalb ist es offenbar brauchbar und gerade erst neu – es wird wohl verbessert werden, auf deren Site ist der Plan was wann passieren soll.

    • moogulator sagt:

      Soweit ich weiss, kann Isotope nur Vocals hervorheben und Geräusche wie Vogelzwitschern entfernen – nicht aber Äh’s und eigene Atemgeräusche, die genau das sind, was live entsteht und auch nervt – das macht I. nicht schlechter – aber das ist meiner Ansicht das große Ding hier – wäre es zeitsouverän würde ich es nachträglich auf Videoton ansetzen („Laberpodcast“)

  3. Falk sagt:

    Da werde ich mal die Tonspur von „Voll Normal“ durchjagen :)

  4. Thomas sagt:

    Das würde ich mir als Handyapp beim Telefonieren wünschen, aber dann hätte mein Schwiegervater gar nichts mehr zu sagen :D

  5. Tim sagt:

    Gleich mal ausprobiert, das könnte mich einen Teil meines Jobs kosten :D Ist aber tatsächlich noch nicht wirklich gut nutzbar. Ich würde mich nicht darauf verlassen, dass das Ergebnis natürlich klingt. Man fällt sich immer wieder selbst ins Wort und der natürliche Redefluss ist nicht mehr gegeben, deutlich hektischer. Das könnte ich mir nicht lange anhören. Ist aber erschreckend, was schon möglich ist.

    • moogulator sagt:

      Probier es bitte mal aus – jetzt wo es noch kostenlos ist und sag deine ehrliche Meinung anhand eines Podcastes oder eines Sprecherbeitrages eines Non-Pro-Sprechers zB Radiogast oder eben in Gesprächsrunden. Eine andere Meinung ist da interessant mit anderem Material. Freu mich über Feedback.

  6. Dean sagt:

    Gut unser SequencerTalk ist ja nun extra live und ungeschnitten. Da Hilft dann doch nur Sprachtraining. Aber völlig verrückt was mittlerweile machbar ist. Ich habe für den letzten Exploding Shed Livestream einen Shortcut gemacht wo ich fast eine Stunde an Material händisch gekürzt habe, da wäre sowas für komplette Videos echt toll gewesen.

    • moogulator sagt:

      Deshalb fand ich ihn auch als perfekten Test für das Tool – ich würde es als Neu-Upload nutzen, wenn es in der Länge gleich bliebe. Ist viel angenehmer – dann. Per Hand ist das nicht zu schaffen – für 2,5h Material in der Woche. Dh – schon – aber dann fehlt sie für andere Dinge.

      Für Exploding Shed würde es sich lohnen, so es denn im Video keine zeitlichen Veränderungen bringen würde. Denke aber, die möchten anbieten, dass der Podcast insgesamt kürzer ist und Atempausen kürzer sein können – das wäre auch für einen Player sehr gut. Aber das mit dem Videosync wäre meine Wunschvorstellung – ich würde das Tool dann beschicken und die Nachgucker hätten mehr Freude.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.