Modellierung der Sprachverständlichkeit von Audiomischungen

Veranstalter/Thema
FKTG e.V. - Verein für elektronische Medien
Ort und Zeitpunkt der Veranstaltung
Dienstag, 24. November 2020 - 16:00 to 17:15
Über die Veranstaltung

Bereits in 2014 gab die ARD/ZDF Fernsehbetriebsleiterkonferenz die Broschüre „Sprachverständlichkeit im Fernsehen" in Auftrag. Doch mangelnde Sprachverständlichkeit von Broadcast-Inhalten ist häufig ein Problem.

Das Fraunhofer IDMT stellt einen auf neuronalen Netzen basierenden Ansatz vor, um die Sprachverständlichkeit eines O-Tons oder einer Mischung objektiv messbar und sichtbar zu machen. Dabei wird ein System zur automatischen Spracherkennung verwendet, dessen „Unsicherheit" bei der Erkennung von gestörter Sprache durch ein geeignetes Maß quantifiziert wird. Das Modellmaß zeigt eine hohe Korrelation mit den gemittelten subjektiven Bewertungen aus Probandenversuchen.

Die Methode ist referenzsignalfrei und beruht auf der Auswertung von Phonem-Wahrscheinlichkeiten bzw. Posteriorgrammen, die bei Spracherkennersystemen erzeugt werden. Das potentielle Einsatzgebiet des Algorithmus liegt nicht nur im Bereich der Postproduktion zur Visualisierung und Überwachung der Sprachverständlichkeit von Audiomischungen, auch bei der Aufnahme am Set kann der/ die TonmeisterIn von einem objektiven Analyseinstrument für Sprachverständlichkeit profitieren - zum Beispiel, wenn es gilt, die Audio-Experten-Einschätzung der Aufnahme gegen „Pro Nuscheln"-Regie-Entscheidungen zu verteidigen.

Der Vortrag veranschaulicht die Theorie und Funktionsweise des Verfahrens anhand von Hörbeispielen und einer Live-Demo. Referentin: Frau Hannah Baumgartner - Fraunhofer IDMT Nach der Anmeldung erhalten Sie eine Bestätigungs-E-Mail mit Informationen zur Teilnahme am Webinar. Systemanforderungen anzeigen