Es gibt einen Konflikt, der mich gerade nicht loslässt. Sprecher lehnen sich gegen Netflix auf. Sprachaufnahmen werden KI zugeführt. Ohne saubere Verträge. Ohne Kompensation. Stimmen, die für eine Produktion eingesprochen wurden, landen als Trainingsmaterial in einer Maschine, die später dieselbe Stimme ersetzen könnte. Existenzgrundlage in einem Algorithmus. Ohne Aushandlung.
Menschlich verstehe ich die Empörung. Da ist Lebensleistung. Da ist Stimme – im wörtlichen wie im übertragenen Sinn. Da sind Menschen, die ihr Handwerk Jahrzehnte verfeinert haben und plötzlich feststellen, dass dieses Handwerk in eine Maschine wandert, die niemand gefragt hat.
Das verdient eine Reaktion. Und es verdient Verträge, die diesen Vorgang regeln. Da bin ich auf der Seite der Sprecher.
Aber.
Ich war selbst über zwanzig Jahre Sprecher. Und ich muss eine zweite Frage stellen. Eine, die in der aktuellen Debatte fast nicht vorkommt.
Wie echt war das Vorher eigentlich?
Synchronaufnahmen. Imagefilme. Hörfunkwerbespots. Wie viel von dem, was da entstanden ist, war wirklich Mensch – und wie viel war schon längst Funktion?
Ich sage das aus Erfahrung. Meine Lieblingsgattung waren immer Moods. Idealerweise mit Austausch. Mit einem Produzenten, der sagte: „Versuch das mal eine Spur trockener.” „Geh da rein, aber halt dich zurück.” „Lass die Pause stehen, die ist die halbe Aussage.” Da entstand etwas. Da hatte meine Stimme Einfluss auf die Emotion eines Gewerks. Das war kein Abspulen. Das war ein Dialog, der ein Ergebnis produzierte, das ohne diesen Dialog nicht entstanden wäre.
Aber das war nicht der Alltag. Der Alltag war oft etwas anderes. Der Sprecher als reine Sprechmaschine. Eine Tonalität liefern. Eine Anmutung erfüllen. Knetmasse sein für eine Agentur, einen Studiochef, einen Toningenieur, die alle ihre Vorstellung hatten, wie das am Ende klingen muss. Mein Beitrag war: Druck auf den Aufnahmeknopf bei einer halbwegs spezifischen Klangfarbe.
Wer vermisst diesen Vorgang emotional? Das Geld vermisst man. Natürlich. Aber den Vorgang selbst – das Abspulen einer Tonalität ohne Varianz, das Liefern einer austauschbaren Anmutung – den vermisst nüchtern betrachtet niemand.
Und deswegen muss man auch hier unterscheiden. Kritik an Netflix ist berechtigt, wo Verträge fehlen. Aber Kritik an KI als solcher wird unehrlich, wenn sie ein Bild verteidigt, das mit der Realität wenig zu tun hatte. Wenn sie so tut, als wäre das, was die KI ersetzt, pure Kunst gewesen. Vieles davon war keine Kunst. Vieles davon war schon vorher Funktion.
Ich werfe nicht alles in einen Topf
Werbung ist nicht Synchron. Nicht umsonst bewerten Finanzämter Werbung nicht als Kunst. Das ist keine Geringschätzung. Das ist eine Klassifikation. Und sie hat ihren Grund.
Bei Synchron ist das Handwerk ein anderes. Ich will die großen Sprecher nicht missen, die aus einem Schauspieler teilweise mehr herausgeholt haben als das Original selbst. Wenn man hört, wie eine deutsche Stimme einer Figur eine Tiefe gibt, die im englischen Original gar nicht angelegt war – dann ist das nicht Knetmasse. Das ist eine Übersetzungsleistung, die einen eigenen Wert hat. Da darf Empörung sein, wenn das ohne Weiteres ersetzt wird.
Aber selbst dieser legitime Streit verkennt etwas Entscheidendes. Die eigentliche Bewegung passiert auf einer anderen Ebene.
Die Bewegung, die niemand benennen will
Die Medien zerfasern. Content wird massiger. Wertloser. Und damit auch alles, was an diesem Content hängt. Das Honorar. Die Aufmerksamkeit. Die Würdigung. Die Möglichkeit, von dem Handwerk zu leben.
Das ist eine Bewegung, die schmerzt. Natürlich schmerzt sie. Es ist die Erfahrung, dass etwas, wofür du jahrelang ausgebildet warst, wofür du gestanden hast, wofür du dein Handwerk verfeinert hast – dass das alles im Wert sinkt. Nicht weil du schlechter geworden bist. Sondern weil sich darunter die ganze Logik verändert hat.
Und in diese Situation hinein kommt die KI. Sie ist nicht die Ursache. Sie ist der Beschleuniger. Sie macht sichtbar, was vorher schon im Gang war. Aber sie wird wahrgenommen als die Ursache. Weil sie das sichtbarste Symptom ist. Weil sie greifbarer ist als die langsame Erosion eines ganzen Mediensystems.
Wer gegen KI demonstriert, demonstriert in Wahrheit gegen eine Verschiebung, die viel größer ist und viel länger läuft. Aber KI hat ein Gesicht. Die Verschiebung hat keins. Also wird gegen das Gesicht protestiert.
Wo der Protest gefährlich wird
Ich will nicht missverstanden werden. Protest ist legitim. Verträge sind wichtig. Standards müssen gesetzt werden. Wo Unternehmen Stimmen ohne Einwilligung verwenden, gehört das beklagt, vor Gericht gebracht, reguliert.
Aber irgendwann kippt der Protest in eine Logik, die mich misstrauisch macht. Die Logik lautet: Gemeinsam können wir das ändern.
Und an dieser Stelle muss ich, so unbequem es ist, ehrlich sein.
Können wir nicht.
Wir können einzelne Verträge erkämpfen. Wir können einzelne Standards durchsetzen. Wir können bei einzelnen Produktionen die menschliche Beteiligung verteidigen. Das ist viel wert. Das ist nicht nichts.
Aber wir können die zugrundeliegende Bewegung nicht aufhalten. Die ist größer als wir. Die ist größer als Netflix. Die ist die strukturelle Verschiebung eines ganzen Mediensystems in eine Form, in der Menge billig wird und Aufmerksamkeit das knappe Gut. Diese Verschiebung läuft seit Jahrzehnten. KI ist nicht ihr Anfang. KI ist ihre Konsequenz.
Wer das nicht ausspricht, verkauft Hoffnung, die nicht eingelöst werden kann. Und das ist, wenn man es genau nimmt, eine zweite Form von Entwertung. Nicht die der Arbeit. Sondern die der politischen Selbstwirksamkeit. Man verspricht Menschen, dass kollektives Handeln eine Bewegung umkehren wird, die kollektiv nicht umkehrbar ist. Das ist gut gemeint. Aber es ist auch eine Form von Beschönigung.
Was bleibt
Was bleibt, ist anstrengender. Es bleibt die Frage: Wie positioniere ich mich, wenn die alte Logik nicht mehr trägt? Wo finde ich einen Wert, der nicht in Masse liegt? Wo entsteht das, was nicht skaliert werden kann?
Ich glaube, das ist die eigentliche Aufgabe. Nicht gegen KI zu kämpfen. Sondern herauszufinden, wo Menschen unersetzlich sind. Und das dann auch zu zeigen.
Und das ist mehr Arbeit, als ein Protestschild zu halten. Es bedeutet, sein eigenes Handwerk so zu schärfen, dass es nicht mehr austauschbar ist. Es bedeutet, sich nicht damit zu trösten, dass man früher gebraucht wurde, sondern Antworten darauf zu finden, wofür man heute gebraucht wird. Und es bedeutet, sich von der Illusion zu verabschieden, dass die Welt für einen selbst stehen bleibt.
Das ist eine bittere Botschaft. Aber sie ist, glaube ich, die einzige, die trägt.
Mein Verhältnis zu meinem alten Beruf
Ich habe das Sprechen nicht aufgegeben. Aber ich habe es neu verstanden.
Ich biete heute eine hybride Lösung an. Das heißt: Ich spreche nicht mehr alles selbst. Den Großteil macht meine Maschine – ein KI-Klon meiner eigenen Stimme. Sie liefert, was vorher das Brot-und-Butter-Geschäft war: das Abspulen einer Tonalität in skalierbarer Menge. Das funktioniert. Es funktioniert sogar erstaunlich gut.
Was die Maschine nicht kann, mache ich.
Und hier ist der Punkt, den ich erst durch viele Cases verstanden habe. Meine Stimme hat einen Wert, der nicht im fertigen Audiofile liegt. Sie hat einen Wert als Steuerung anderer Stimmen. Im Speech-to-Speech-Modus wird meine Aufnahme nicht zum Endprodukt. Sie wird zur Regieanweisung, die einer anderen Stimme die Emotion, das Tempo, die Pausensetzung, die mikrofeine Intonation überträgt. Meine Stimm-DNA ist nicht mehr der Klang, der am Ende rauskommt. Sie ist die Partitur, nach der die Maschine die andere Stimme zum Klingen bringt.
Das ist etwas, das ich vor zwei Jahren nicht hätte vorhersehen können. Mein Beruf hat sich nicht verkleinert. Er hat sich verschoben. Vom Liefern einer Tonalität zum Dirigieren einer Tonalität. Vom Sprecher zum Regisseur einer Maschine, die wiederum andere Stimmen produziert.
Das verändert auch, was ich überhaupt verkaufen kann. Früher verkaufte ich Sprechzeit. Heute verkaufe ich eine Kombination aus Stimm-DNA, Regieleistung und einer Maschine, die beides skaliert. Wer mich heute bucht, bekommt nicht mehr nur das, was mein Mund liefert. Er bekommt ein System, in dem mein Mund die Steuerung übernimmt – und die Maschine die Vervielfältigung.
Das ist keine Resignation. Das ist eine Neusortierung – und sie war für mich eine gute Nachricht. Sie hat mir gezeigt, dass der Wert eines geübten Sprechers nicht in der Anzahl der gesprochenen Worte liegt. Sondern in einer Tiefe, die plötzlich, im KI-Kontext, eine ganz neue Funktion bekommt.
Ich glaube, jeder, der in einem Medienberuf arbeitet, wird in den nächsten Jahren eine ähnliche Neusortierung machen müssen. Nicht im Sinne von: Was lasse ich los? Sondern im Sinne von: Wo bin ich plötzlich wertvoller, als ich vorher dachte? Wo macht meine Erfahrung etwas möglich, was die Maschine alleine nicht hinbekommt – aber auch ein Anfänger nicht?
Genau dort liegt die Antwort. Nicht im Gegen-die-Maschine. Sondern im Mit-der-Maschine, in einer Position, die nur ein Mensch mit Tiefe einnehmen kann.
Die zwei Bewegungen, die wir trennen müssen
Es gibt zwei Dinge, die in der aktuellen Debatte vermischt werden. Und das schadet uns.
Das eine ist die berechtigte Forderung nach fairen Verträgen, sauberer Einwilligung, transparenter Datenverwendung. Hier kann man kämpfen. Hier muss man kämpfen. Hier sind Erfolge möglich, und sie sind wichtig.
Das andere ist die Trauer über eine Welt, in der ein bestimmter Beruf einen bestimmten Wert hatte – und in der dieser Wert nicht mehr selbstverständlich ist. Diese Trauer ist menschlich. Sie ist berechtigt. Aber sie lässt sich nicht durch Protest auflösen. Sie lässt sich nur durch eine Veränderung der eigenen Position auflösen. Durch das Finden dessen, was am eigenen Tun unersetzlich ist – und durch die Bereitschaft, alles andere abzugeben.
Wer diese beiden Bewegungen vermischt, kämpft den falschen Kampf. Er versucht, die Trauer mit politischen Mitteln zu heilen. Das funktioniert nicht. Trauer braucht andere Werkzeuge.
Schluss
Wir können die strukturelle Bewegung nicht aufhalten. Wir können einzelne Vorgänge regulieren. Das ist wichtig, und es ist nicht wenig. Aber wer den Eindruck erweckt, dass wir gemeinsam die alte Welt zurückholen, lügt sich und anderen etwas vor.
Was bleibt, ist die eigene Arbeit. Die Schärfung dessen, was unersetzlich ist. Und manchmal das Erkennen, dass das Unersetzliche eine andere Gestalt annimmt, als man dachte. Dass die Stimme, die man jahrzehntelang verkauft hat, plötzlich nicht mehr als Klang gefragt ist, sondern als Regie. Dass das Handwerk weiterlebt – nur an einer anderen Stelle der Wertschöpfungskette.
Nicht durch Protest. Sondern durch Arbeit.
Und manchmal durch das überraschende Geschenk, dass die eigene Erfahrung in einem Kontext plötzlich gebraucht wird, in dem man sie nie erwartet hätte.