Automatische Kamerapfadgenerierung aus 360°- Video mit Deep-Learning-Methoden

Hannes Fassold: Deep Learning ist eine disruptive Technologie und sehr wertvoll für die Extraktion semantischer Informationen aus Videoinhalten. In diesem Beitrag beschreiben wir einen neuartigen Algorithmus zur automatischen Erzeugung eines konventionellen Videos (für den passiven Konsum, ohne Interaktion) aus einem 360°-Video basierend auf semantischer Information, die mit Deep-Learning- Methoden gewonnen wurde. Des Weiteren wird die Deep-Learning-basierte Methode zur automatischen Extraktion der Szenenobjekte (Personen, Tiere, Autos usw.) beschrieben, die im Algorithmus verwendet wird.

Zum Artikel >>

Deep learning is a disruptive technology and particularly valuable for extracting semantic information from video content. In this contribution, we are describing a new algorithm which allows automatic generation of a conventional video (for passive consumption, without interaction) from a 360° video. This is based on semantic information obtained using deep learning methods. Furthermore, the deep learning based method for automatic extraction of scene objects (people, animals, cars, etc.) used in the algorithm is described.