Mehr Content - Matching und Anreicherung von Mediendaten

Vortrag 45: Magnus Niemann - Condat AG

Das Problem der Medienwelt ist nicht, dass es keinen Content gäbe - er ist nur nicht erreichbar. Die Welt ist voll mit Programminformationen, Mediendaten, Thumbnails, Transkriptionen und anderen Metadaten. Leider nur ist es ein mühseliges Geschäft für eine Medienredaktion, zu den vorhandenen Artikeln und Beiträge im Web entsprechendes Zusatzmaterial zu suchen.

Wir stellen Möglichkeiten vor, wie durch linguistische, statistische und semantische Methoden vorhandene Medienmetadaten mit Daten aus externen Quellen nahezu beliebiger Herkunft (Datenbanken, Webseiten etc.) gematcht und angereichert werden können. Auf Basis der Suchmaschinentechnologie Elasticsearch und einer umfassenden, mehrsprachlichen Wissensbasis (DBPedia) zeigen wir, wie eine solche Anreicherung in verschiedenen Medienprojekten realisiert wurde.


Über Magnus Niemann

 

Magnus Niemann arbeitet als Softwareentwickler und -architekt seit 2001 mit semantischen Technologien.

Für die Condat AG entwirft und entwickelt er seit 2013 Such- und Empfehlungssysteme, die vor allem im öffentlich-rechtlichen Rundfunk eingesetzt werden.