Cyberlink MyEdit Audio: Stimmengenerator mit KI

Stimmengenerator Aufmacher
Stimmengenerator von Cyberlink: Preise
Den KI-Stimmengenerator kann man kostenlos ausprobieren.

Ob für Social Media, Video-Content oder gar ein Hörbuch: Profi-Sprecher sind teuer und gesucht. Doch mit Cyberlink MyEdit Audio haben Content Creators einen Stimmengenerator mit KI zur Verfügung, der menschliche Vorleser ersetzen kann. Wir zeigen, wie es funktioniert, welche Vorteile und Limitierungen es gibt, und für wen sich das Abo lohnt.

MyEdit Audio Editor: Mehr als nur vorlesen

Cyberlink kennt man vor allem ans Anbieter von Software und Apps für Videobearbeitung. Das taiwanesische Unternehmen setzt nun aber voll auf KI für Content Creators. In der Myedit-Suite kann man deshalb im Browser eine ganze Reihe nützlicher Effekte zur Content-Erstellung nutzen. Das ist zur Probe sogar kostenlos. Denn wer sich mit einer E-Mail-Adresse registriert, bekommt pro Tag drei Credits für die KI. Pro Credit kann man 1.000 Zeichen Text einsprechen lassen.

Stimmengenerator MyEdit benutzen

16 deutschsprachige Stimmen im Stimmengenerator.
Es gibt 16 deutschsprachige Stimmen im Stimmengenerator.

Der Stimmengenerator von MyEdit hat eine große Auswahl von männlichen und weiblichen Stimmen verschiedenen Alters und Nationalität, darunter 16 deutschsprachige. Zusätzlich kann soll man auch den Sprachstil auswählen können. Derzeit gibt es allerdings nur „Konrad“ auch in „fröhlicher“ Stimmlage.

Den Text, den man gerne als Audio-Datei haben möchte, kann man direkt im Testfenster eingeben oder als TXT-Datei importieren. Beim Konvertieren des Scripts muss man daher aufpassen, dass Umlaute und andere Sonderzeichen richtig abgespeichert werden. Am besten kontrolliert man das noch einmal, bevor der Text zum Einlesen geladen wird, damit man keine kostbaren Credits verschwendet.

Die Audio-Datei zu erstellen, dauert zwischen ein paar Sekunden für wenige Sätze und ein bis zwei Minuten bei längeren Texten. Man kann sie sich online anhören sowie im MP3-Format herunterladen.  Dabei fällt die hohe Qualität des eingesprochenen Textes auf: Kein Vergleich etwa zur „Vorlesen“-Funktion in Word. Die Stimme senkt sich am Satzende, Gedankenstriche und Klammern ergeben eine kleine Pause. Umlaute und komplizierte deutsche Wörter bekommt die KI überraschend gut hin.

Was der Stimmen-Generator kann

Stimme generieren: Text-to-Speech
Der Text zum Vorlesen muss als TXT-Datei gespeichert werden.

Für einzelne Sätze und klar strukturierte, eher einfache Texte mit einer guten Lesbarkeitsstufe (z.B. Grade 8) und simplen Reimen funktioniert der KI-Stimmengenerator ziemlich gut. Selbst lange Fachbegriffe werden oft richtig ausgesprochen.

Wer nicht ganz genau hinhört, meint einen muttersprachlichen Profi-Sprecher oder ein Profi-Sprecherin zu erkennen. Alle deutschsprachigen KI-Stimmen des Generators sprechen „Hannoveraner Hochdeutsch“.

Womit die KI Schwierigkeiten hat

Mit vielen fremdsprachigen Wörtern im Text hat die KI so ihre liebe Not. Geläufige Wörter wie „Cappuccino“ klappen gut. Schon bei der „Melange“ wird es aber schwierig, englischsprachige Bandnamen sind hoffnungslos.  Zudem muss der Text in deutscher Standardsprache sein. Denn geschriebener Dialekt, etwa Berlinerisch oder Bayerisch, führt zu einem lustigen Kauderwelsch.

Auch das Vorlesen von Lyrik und Theaterstücken sollte man zunächst noch den menschlichen Profis überlassen. Denn die KI-Stimmen tragen natürlich emotionslos vor.

Für wen sich der MyEdit-Stimmengenerator lohnt

KI generiert Geräusche
MyEdit kann auch Geräusche aus einer Beschreibung generieren.

Wenn die drei Gratis-Credits pro Tag nicht ausreichen, kann man sich für 4 Euro das Audio-Abo mit 300 Credits pro Monat holen. Das reicht für ein paar flotte Sprüche oder zum Einsprechen von einigen Reels und Kurzvideos locker aus. Allerdings kostet jedes wiederholte Einsprechen Credits. Deshalb werden Tippfehler schnell teuer.

Mit den Audio-Credits kann man sich auch die anderen KI-Optionen im Portal ansehen. Beispielsweise gibt es ein einfaches Schnittprogramm für Audiodateien. Und auch einen Harmonizer,  mit dem man eine Stimmaufnahme verbessern kann. Oder die Möglichkeit, mit KI Geräusche zu erzeugen. Für ambitionierte Content-Creators bietet der MyEdit Audio Editor von Cyberlink also ein spannendes und kostengünstiges Experimentierfeld. Vorerst sollte man das Einlesen eines Podcasts oder Hörbuchs noch den Profis überlassen. Aber sie haben schon harte Konkurrenz.

Text: Sonja Angerer

Transparenzhinweis: Für den Artikel nutzten wir einen temporären Premium-Account, der uns von Cyberlink für die Berichterstattung zur Verfügung gestellt wurde. 

Über Sonja Angerer 1008 Artikel
Fachautorin und Redakteur. Bei Techsonar vor allem zuständig für die Bereiche Smartphone, Smart Home und Gadgets. Mit viel Erfahrung in Fachmagazinen, u.a Macwelt, Digifoto, Sign Pro Europe, Large Format und Fespa.com.