
Meta macht Audio-Editing per KI kinderleicht
SAM Audio segmentiert Töne aus komplexen Aufnahmen mit nur einem Klick oder Textbefehl. Das erste einheitliche KI-Modell für Audio-Trennung ist ab sofort kostenlos verfügbar und könnte Workflows in Podcast-Produktion, Filmschnitt und Musikbearbeitung grundlegend vereinfachen.
Das Ende fragmentierter Audio-Tools
Kommt Ihnen das bekannt vor? Sie haben ein Video mit perfektem Bild, aber im Hintergrund bellt ein Hund. Oder Sie möchten aus einem Live-Mitschnitt nur die Gitarre extrahieren. Bisher brauchten Sie dafür spezialisierte Software, technisches Know-how und vor allem Zeit. Meta adressiert genau diese Workflow-Lücke mit SAM Audio.
Das Modell ist Teil der Segment Anything Familie und erweitert deren Fähigkeiten erstmals auf den Audio-Bereich. Anders als bisherige Tools, die jeweils nur einen Anwendungsfall abdecken, vereint SAM Audio drei Steuerungsmethoden in einem System. Sie tippen „Hundegebell“ ein und das Modell entfernt es. Sie klicken auf eine Person im Video und isolieren deren Stimme. Oder Sie markieren einen Zeitabschnitt, in dem der gewünschte Sound vorkommt.
Drei Wege zur perfekten Tonspur
Die Text-Prompts funktionieren intuitiv. Beschreiben Sie einfach, was Sie extrahieren oder entfernen möchten. „Singing voice“, „traffic noise“ oder „guitar solo“ reichen als Anweisung. Die visuelle Steuerung geht noch einen Schritt weiter. Ein Klick auf das Objekt oder die Person im Videobild genügt, um deren Audio-Spur zu isolieren.
Die dritte Methode ist laut Meta eine Branchenneuheit. Span Prompting erlaubt das Markieren von Zeitabschnitten, in denen der Zielsound auftritt. Alle drei Methoden lassen sich kombinieren. Für Produktionsteams bedeutet das präzise Kontrolle ohne steile Lernkurve.
Lesehunger?
- Google zeigt KI-Bilanz 2025: Das hat sich verändert
- Kleine Windräder, große Wirkung
- Google Translate hört jetzt in Echtzeit mit
- Google greift an: Gemini 3 Flash macht KI-Speed bezahlbar
- Humanoide Roboter: Selbst Hersteller warnen vor dem Hype
Kostenlos und Open Source
Meta stellt SAM Audio im Segment Anything Playground bereit. Dort können Sie eigene Audio- und Videodateien hochladen oder mit vorhandenen Assets experimentieren. Das Modell steht zusätzlich zum Download zur Verfügung. Für Unternehmen, die Audio-Bearbeitung in eigene Produkte integrieren möchten, öffnet sich damit ein direkter Entwicklungspfad.
Die Einsatzgebiete reichen von Podcast-Produktion über Filmschnitt bis zu wissenschaftlicher Forschung und Barrierefreiheit. Meta nutzt SAM Audio bereits intern für die Entwicklung der nächsten Generation kreativer Medientools.
Jetzt testen
SAM Audio ist ab sofort im Segment Anything Playground verfügbar. Das Modell kann dort direkt ausprobiert oder für eigene Projekte heruntergeladen werden.
Mehr #Meta News
Zum Newsletter anmelden
Kommen Sie wie über 6.000 andere Abonnenten in den Genuss des Dr. Web Newsletters. Als Dankeschön für Ihre Anmeldung erhalten Sie das große Dr. Web Icon-Set: 970 Icons im SVG-Format – kostenlos.







Schreiben Sie einen Kommentar