Musik und Gesang trennen: Die besten Webseiten mit KI-Unterstützung
Kostenlose und Premium-Angebote für Karaoke-Versionen und den Musikunterricht!
Musik und Gesang trennen – so geht’s! Schnell mal ein Instrumental erstellen, mit einem Acapella einen Remix machen oder ein Schlagzeug- oder Gitarren-Play-along erstellen. Vor ein paar Jahren wäre das Trennen von Vocals und Musik unmöglich gewesen. Mittlerweile wächst die Anzahl der Seiten, die genau das KI-gesteuert anbieten. Auch bieten immer mehr DAWs Stem Separation nativ an. Der große Überblick!
Die wichtigsten Tools zum Musik und Gesang trennen
Musik und Gesang trennen – wie und wofür?

Für alle, die Gesang oder ein Instrument unterrichten, sind diese Services ein Segen. Ob man bei der Celine-Dion-Ballade die Vocals entfernt, beim AC/DC-Brecher die Gitarre oder beim Dream-Theater-Epos das Schlagzeug – zum Nachspielen und Nachsingen muss man nun endlich nicht mehr auf MIDI-Karaoke-Versionen zurückgreifen. Und was die Qualität der Trennung betrifft, wurden in den letzten Jahren hier große Fortschritte erzielt.
Mithilfe von neuronalen Netzen sind KI-Algorithmen mittlerweile in der Lage, in einer einzelnen Audiodatei die verschiedenen musikalischen Elemente zu identifizieren und zu extrahieren. Die Algorithmen erkennen, was Gesang, was Schlagzeug, was Bass und was Begleitung ist. Das ist wie Photoshop für Audio!
Softwareseitig führte iZotope das Feature „Music Re-Balance“ in RX7 ein und verbesserte es in den nachfolgenden Versionen stetig. Mit diesem konnte insbesondere die Lautstärke des Gesangs in einer fertig gerenderten WAV-Datei noch nachträglich geändert werden.
2019 stellte der Streaming-Dienst Deezer den Open-Source-Algorithmus „Spleeter“ zum Musik- und Gesang-Trennen vor. Mit diesem war es kostenlos möglich, was vorher nur Ozone ermöglichte. Viele Vocal-Trenn-Seiten haben diesen Algorithmus implementiert. Aber einige gehen auch noch weiter und setzen eigene Technologien ein. Grundsätzlich gilt: Im Vergleich zu noch vor wenigen Jahren sind die Ergebnisse oft erstaunlich gut, gerade bei Drums und Vocals. Aber häufig sind noch Artefakte zu hören. Testet also ausgiebig!
Musik und Gesang trennen direkt in deiner DAW
Als ich den Artikel Anfang 2024 verfasste, war die Welt beim Thema „Musik und Gesang trennen“ noch eine andere. Heute haben immer mehr DAWs die sogenannte Stem Separation direkt integriert. Damit braucht es nicht unbedingt mehr eine Website dafür. Diese DAWs bieten bereits Stem Separation:
- Cubase 15 und höher
- Ableton Live 12.3 und höher
- FL Studio 21.2 und höher
- Logic Pro 11 und höher
- Studio One 7 und höher
Der Vorteil: So gut wie immer passiert die Stem Separation offline in der DAW. Sprich, man verlässt den Musikproduktions-Workflow nicht und benötigt auch nicht zwingend eine Internetverbindung.
Der Nachteil: Oft dauert die Offline-Stem-Separation, gerade wenn es nicht der neueste Rechner ist, erschreckend lange, teilweise 1 Stunde und mehr für einen 3- bis 5-minütigen Song. Dabei variiert die Qualität der aufgetrennten Stems je nach DAW relativ stark. Übrigens ist auch im kostenlosen Audioeditor Audacity seit einiger Zeit ein Stem-Separator integriert.
Musik und Gesang trennen: Software
Wenn es offline sein soll, aber in besserer Qualität oder mit mehr Optionen, dann kann eine speziell dafür gemachte Software sinnvoll sein. Hier sind die SpectraLayers von Steinberg und Hitnmix RipX meist die ersten, die empfohlen werden. Beide bieten sehr detaillierte Eingriffsmöglichkeiten in fertig gerenderte Audiodateien und extrem hohe Splitting-Qualität. Auch Serato Sample bringt seit Kurzem einen qualitativ sehr guten Stem Separator mit.
Aber auch gibt es eine Reihe von tollen Freeware-Tools, die ebenfalls offline arbeiten. Da wären unter anderem der beliebte, aber ziemlich komplexe Universal Vocal Remover und das etwas einfacher zu bedienende Stem Roller. Auch in den meisten DJ-Software-Tools wie NI Traktor, Rekordbox, Virtual DJ, Serato DJ Pro oder Algoriddim Djay Pro ist mittlerweile oft sogar ein Echtzeit-Stem-Splitter integriert.
Moises.ai mit dem Deluxe-Paket
Moises.ai bietet ein Rundum-Sorglos-Paket an: Auftrennung von Musik in die einzelnen Elemente, Apps für iOS und Android, sogar ein KI-basierter Mastering-Service ist dabei. Auch ein smartes Metronom, das das Songtempo erkennt, und eine Akkorderkennung sind eingebaut. Der Service ist also ideal für den Musikunterricht!

Beim Export könnt ihr auswählen, ob Schlagzeug oder Bass entfernt werden soll oder ob Gesang, Begleitung, Schlagzeug oder Bass einzeln herausgerechnet werden soll. In der kostenlosen Version können fünf Songs pro Monat getrennt werden.
Dazu gibt es die einzelnen Teile (Stems) nur als MP3 zum Download. Zudem können fünf Songs über den KI-Mastering-Service klanglich verbessert werden. Das Premium-Abo kostet 6,99 Euro monatlich oder 49,99 Euro pro Jahr. Hier könnt ihr unbegrenzt Songs hochladen und trennen lassen.
Lalal.ai auch bei Videodateien
Auch bei Lalal.ai ist die Grundfunktion zum Musik und Gesang trennen kostenlos. Song hochladen, ein paar Minuten warten, fertig ist das Instrumental. Auch einzelne Instrumente lassen sich mittlerweile aus fertigen Songs mit Lalal.ai extrahieren. Neben üblichen Verdächtigen wie nur den Vocals oder den Drums, gibt es hier sogar die Möglichkeit, nur die Synths oder Blasinstrumente aus einem Song herauszutrennen.

Im Test war Lalal.ai eine der schnellsten Seiten beim Musik- und Gesang-Trennen. In der kostenlosen Version könnt ihr bis zu zehn Minuten Audiomaterial im Monat trennen. Dann gibt es zwei Abostufen: Beim Lite-Modell bekommt man monatlich 90 Minuten in der Fast-Queue (besonders schnelles trennen) und unbegrenzte Zeit in der normalen Queue für 8,99 Euro im Monat oder 81,00 Euro im Jahr.
Bei der großen Pro-Version sind es dann 250 Minuten im Monat in der Fast-Queue, ebenfalls mit unbegrenzt vieler Zeit in der normalen Queue, für 17,99 Euro im Monat oder 162 Euro im Jahr.
LandR Stems – mit Algorithmus von Audio Shake
In der früheren Version dieser Liste habe ich am Ende Audio Shake aufgeführt, einem Stem-Separation-Service, der über mehrere Jahre quasi alle Vergleiche gewonnen hat. Nur gab es das große Manko, dass man als Normalsterblicher nicht in den Genuss dieser herausragenden Auftrennung kam, nur für die Industrie, hieß es immer.
Hier scheinen sich die Zeiten geändert zu haben, denn in LandR Stems ist genau dieser „Award Winning“-Algorithmus integriert. Rein vom Workflow her bietet LandR Stems beim Musik und Gesang trennen eine Mischung aus Plugin und Online-Anbindung. Denn über das Stems-Plugin könnt ihr direkt in eurer DAW den gewünschten Track auftrennen. Da dieser aber auf den Servern von LandR aufgetrennt wird, ist hier eine Internetverbindung Pflicht, wie bei allen anderen Webseiten dieser Liste.
LandR Stems können alle die nutzen, die entweder das Paket Studio Standard (9,99 Euro monatlich) oder Studio Pro (19,99 Euro monatlich) abonnieren, dann aber in unbegrenztem Umfang.
Vocalremover.org mit Karaokefunktion
Hier ist fast schon eine ganze DAW am Werk. Neben dem Trennen von Vocals und Musik können Tonhöhe und Geschwindigkeit von Songs verändert werden. Außerdem könnt ihr sogar direkt auf der Seite Vocals aufnehmen, diese bearbeiten und mit dem Instrumental mischen! Auch Tempo- und Tonarterkennung ist mit dabei.

Vocalremover.org kann auch mobil im Browser auf dem Smartphone genutzt werden. Zudem gibt es eine deutsche Sprachversion. Und das alles ist kostenlos und sogar verlustfrei mit WAV-Dateien! Die Nachteile: Ihr könnt immer nur einen Song gleichzeitig hochladen und bearbeiten. Ein Archiv an Songs wie bei Fadr oder Moises kann man sich hier also nicht anlegen. Wer mehr als 10 Minuten Musik pro Tag trennen und die Songs auch auf der Seite speichern möchte, für den gibt es ein Abo: 12,95 Euro monatlich oder 99 Euro im Jahr.
AI Vocal Remover ganz ohne Schnickschnack
Der simpelste aller hier gelisteten KI-Dienste zum Musik und Gesang trennen: AI Vocal Removal. Kein Abo, keine extra Features, nur das Trennen von Vocal und Musik ist möglich. Und das geht schnell und ohne Probleme. Ihr wählt die Audiodatei aus, ladet sie hoch; die Seite benötigt (laut Eigenaussage) ca. fünfzehn Sekunden zum Trennen – fertig! Die Resultate könnt ihr dann als MP3 herunterladen.

Die einzige Besonderheit neben dem simplen Aufbau ist eine App nur für Android-Smartphones. Nach den Bewertungen im Play Store zu urteilen, sind deren Qualität und Benutzbarkeit allerdings eher durchwachsen.
Mehr Infos über KI und Musik und Gesang trennen
- iZotope bei Gearnews
- Mehr über KI
- Moises
- Audioshake
*Hinweis: Dieser Artikel über Musik und Gesang trennen enthält Widgets und Werbelinks, die uns bei der Finanzierung unserer Seite helfen. Keine Sorge: Der Preis für euch bleibt immer gleich! Wenn ihr etwas über diese Links kauft, erhalten wir eine kleine Provision. Danke für eure Unterstützung!
3 Antworten zu “Musik und Gesang trennen: Die besten Webseiten mit KI-Unterstützung”
RIPX ist auch noch eine Empfehlung. Klappt gut und falsche Töne kann man direkt im Editor korrigieren oder auch weiteren Instrumenten zuweisen. Der Editor macht es zu einer kleinen DAW. Und wenn der Sänger aus der Band wieder eine Aufnahme vom Iphone schickt, dann kann man damit die Stimme nochmals von den Umgebungsgeräuschen trennen und hat eine saubere Gesangsspur. RipX ist für mich eine preiswerte Methode um Spuren zu trennen, Stücke zu analysieren und auch Sachen zu machen, zu denen andere dann vermutlich Melodyne verwenden würden.
RipX ist als Software für das Trennen von Musik und Stimme definitiv vorne dabei, siehe meine Tests für Bonedo! Hier auf der Liste ging es in diesem Fall allerdings rein um Webseiten, die das anbieten. Trotzdem danke für den Tipp und die Workflow-Idee! :)
In der Auflistung fehlt noch Demix Pro von AudiosourceRe. Wenn ich mich nicht täusche, arbeitet das inzwischen ohne Server-Anbindung und prozessiert lokal. Alle diese Tools sind super, wenn man einfach nur mal ein Demo in Gesang und anderes auftrennen will, um einen neuen Backing-Track zu erstellen. Dann hat man schon so etwas wie eine Pilotspur für die Stimme.