Meta macht Audio-Editing per KI kinderleicht

Leopold Hirschberg
Autor Dr. Web
Aktualisiert:
2 Min. Lesezeit
Meta macht Audio-Editing per KI kinderleicht

SAM Audio segmentiert Töne aus komplexen Aufnahmen mit nur einem Klick oder Textbefehl. Das erste einheitliche KI-Modell für Audio-Trennung ist ab sofort kostenlos verfügbar und könnte Workflows in Podcast-Produktion, Filmschnitt und Musikbearbeitung grundlegend vereinfachen.

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

Das Ende fragmentierter Audio-Tools

Kommt Ihnen das bekannt vor? Sie haben ein Video mit perfektem Bild, aber im Hintergrund bellt ein Hund. Oder Sie möchten aus einem Live-Mitschnitt nur die Gitarre extrahieren. Bisher brauchten Sie dafür spezialisierte Software, technisches Know-how und vor allem Zeit. Meta adressiert genau diese Workflow-Lücke mit SAM Audio.

Das Modell ist Teil der Segment Anything Familie und erweitert deren Fähigkeiten erstmals auf den Audio-Bereich. Anders als bisherige Tools, die jeweils nur einen Anwendungsfall abdecken, vereint SAM Audio drei Steuerungsmethoden in einem System. Sie tippen „Hundegebell“ ein und das Modell entfernt es. Sie klicken auf eine Person im Video und isolieren deren Stimme. Oder Sie markieren einen Zeitabschnitt, in dem der gewünschte Sound vorkommt.

Drei Wege zur perfekten Tonspur

Die Text-Prompts funktionieren intuitiv. Beschreiben Sie einfach, was Sie extrahieren oder entfernen möchten. „Singing voice“, „traffic noise“ oder „guitar solo“ reichen als Anweisung. Die visuelle Steuerung geht noch einen Schritt weiter. Ein Klick auf das Objekt oder die Person im Videobild genügt, um deren Audio-Spur zu isolieren.

Die dritte Methode ist laut Meta eine Branchenneuheit. Span Prompting erlaubt das Markieren von Zeitabschnitten, in denen der Zielsound auftritt. Alle drei Methoden lassen sich kombinieren. Für Produktionsteams bedeutet das präzise Kontrolle ohne steile Lernkurve.

Lesehunger?

Kostenlos und Open Source

Meta stellt SAM Audio im Segment Anything Playground bereit. Dort können Sie eigene Audio- und Videodateien hochladen oder mit vorhandenen Assets experimentieren. Das Modell steht zusätzlich zum Download zur Verfügung. Für Unternehmen, die Audio-Bearbeitung in eigene Produkte integrieren möchten, öffnet sich damit ein direkter Entwicklungspfad.

Die Einsatzgebiete reichen von Podcast-Produktion über Filmschnitt bis zu wissenschaftlicher Forschung und Barrierefreiheit. Meta nutzt SAM Audio bereits intern für die Entwicklung der nächsten Generation kreativer Medientools.

Jetzt testen

SAM Audio ist ab sofort im Segment Anything Playground verfügbar. Das Modell kann dort direkt ausprobiert oder für eigene Projekte heruntergeladen werden.

Mehr #Meta News

4,2 10 Bewertungen

Wie hat Ihnen dieser Artikel gefallen?

Leopold Hirschberg
Autor
Leopold Hirschberg ist ein Big Lebowski-Typ, der dank jahrzehntelangem Selbststudium ganz gechillt jedes Thema inhalieren kann. Michael Dobler bedient sich manchmal bei diesem Alter Ego, wenn er es satt hat, immer seinen Namen zu lesen und auch mal andere Schreibstile ausprobieren möchte.
61 Artikel veröffentlicht
Alle Artikel

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Newsletter

Mehr solcher Artikel?
Jetzt kostenlos abonnieren.

Jeden Dienstag die besten Artikel aus dem Dr. Web-Magazin direkt in Ihr Postfach – kein Spam, jederzeit abmeldbar.

Einmal pro Woche, kein täglicher Spam
Jederzeit mit einem Klick abmeldbar
DSGVO-konform via Brevo