Klare Sache: EU AI Act und Synthesizer V
Mit dem im Juni 2024 verabschiedeten EU AI Act („Gesetz über Künstliche Intelligenz“) tritt erstmals ein umfassender Rechtsrahmen für den Einsatz von KI in der Europäischen Union in Kraft. Für Musiker und Produzenten besonders relevant ist die Vorschrift, dass KI-generierte Inhalte kenntlich gemacht werden müssen, um Täuschung zu vermeiden.
Doch wie setzen Entwickler von Gesangs-Synthesizern diese Regeln praktisch um? Auf Nachfrage von MOM hat Dreamtonics, die Macher von Synthesizer V Studio 2, nun ihre Lösung erklärt.
Nutzer sind die „natürlichen Personen“
Der Gesetzestext schreibt vor, dass eine Interaktion mit einer „natürlichen Person“ sichergestellt sein muss. Dreamtonics stellt klar: Gemeint sind damit die Anwender der Software, nicht die Hörer der fertigen Musik.
Produzenten, die mit Synthesizer V arbeiten, "wissen eindeutig, dass sie mit Software und KI-Stimmen arbeiten" – eine Täuschung über menschliche Sänger findet hier nicht statt.
Keine hörbaren Hinweise – stattdessen Audio-Wasserzeichen
Ein zentraler Punkt ist die Frage, ob KI-Gesang für das Publikum hörbar gekennzeichnet werden muss. Dreamtonics verneint:
-
Hörbare Hinweise wie ein eingesprochenes „Dies ist eine KI-Stimme“ werden nicht eingefügt, da dies das Hörerlebnis verfälschen würde.
-
Stattdessen nutzt das Unternehmen unhörbare Audio-Wasserzeichen. Diese sind für Menschen nicht wahrnehmbar, ermöglichen es aber, jede generierte Gesangsspur eindeutig einem Nutzerkonto zuzuordnen.
Balance zwischen Transparenz und Praxis
Mit dieser Lösung erfüllt Dreamtonics die Anforderungen des AI Acts, ohne den kreativen Einsatz von Synthesizer V einzuschränken:
-
Rechtlich ist die Nachvollziehbarkeit der Inhalte gegeben.
-
Künstlerisch bleibt die Musik unverfälscht.
-
Praktisch können Missbrauch und Urheberfragen über die Wasserzeichen überprüft werden.
Für Musiker heißt das: Synthesizer V bleibt ein vollwertiges Kreativwerkzeug, das den neuen EU-Vorgaben entspricht. Dreamtonics setzt damit ein Signal, dass KI-Technologien und rechtliche Transparenz durchaus miteinander vereinbar sind – solange die Lösung mit Augenmaß umgesetzt wird.
Damit ist auch klar, das Dreamtonics mit dem Audio-Wasserzeichen die KI-Kennzeichnungspflicht des EU AI Acts voll erfüllt. Somit können Songs die mit Synthesizer V gemacht wurden, eindeutig identifiziert werden und als "KI" bzw. "anteilig KI" dargestellt werden.
Wir von MyOwnMusic arbeiten derzeit an verschiedenen Konzepten, wie wir das zukünftig im Regelwerk berücksichtigen werden.
Die akutellen Regeln bleiben erstmal so bestehen, wie sie sind.
Kommentare
Davon mal abgesehen, wenn man KI nutzt, sollte man auch dazu stehen. ;-)
Es gibt scheinbar viele Verfahren:
(hab eine KI gefragt) :-)
1. Spektrale Verfahren (Frequenzdomäne)
Hier werden kleine Veränderungen im Frequenzspektrum vorgenommen.
Beispiel: ganz leichte Verstärkung/Abschwächung bestimmter Obertöne, die für das menschliche Ohr unhörbar bleiben.
Vorteil: sehr stabil gegenüber MP3-Kompression und Equalizing.
Nachteil: Starke Verfremdungen (z. B. extreme Filter oder Resampling) können das Muster zerstören.
2. Zeitbasierte Verfahren (Time Domain)
Manipulation von Signalphasen oder Amplituden direkt in der Zeitreihe.
Beispiel: winzige Änderungen im Abstand zwischen Peaks, die ein digitales Muster tragen.
Vorteil: relativ leicht zu implementieren.
Nachteil: weniger robust gegen Störungen (Kompression, Rauschen).
3. Echo Hiding
Ein unhörbares, sehr kurzes Echo wird in den Ton eingebaut, das ein binäres Muster kodiert.
Vorteil: ziemlich robust, da Echo-Strukturen schwer zu entfernen sind, ohne das Signal hörbar zu beschädigen.
Nachteil: kann unter extremen Audioanalysen auffallen.
4. Spread-Spectrum (verwandt mit Funktechnik)
Ein schwaches Signal mit sehr breitem Frequenzspektrum wird über das Audiomaterial gelegt.
Vorteil: extrem robust, da es wie „Rauschen“ wirkt und schwer von den eigentlichen Audioinhalten zu trennen ist.
Nachteil: aufwändig und energieintensiv, sowohl beim Einbetten als auch beim Erkennen.
5. Phase Coding
Hier wird die Phase bestimmter Frequenzkomponenten minimal verändert.
Menschen hören das nicht, aber ein Decoder kann das Muster erkennen.
Vorteil: sehr unauffällig.
Nachteil: empfindlich gegen Signaltransformationen.
Kategorien
Anzeige
270 
















