1-Chip- oder 3-Chip: „Oft büßt das Gute ein, wer Besseres sucht“


 

Bericht: Norbert Bolewski

 


Exakter als mit diesem weisen Satz von William Shakespeare kann man die Richtung des informativen Vortrags von Klaus Weber (Grass Valley) nicht auf den Punkt bringen. Er trug das Referat am 13. Oktober 2014 vor der FKTG-Regionalgruppe Berlin vor und behandelte die vorhandene und kommende Technik der Videokameras auch für höhere Auflösungsstandards. Es werden CCD- und CMOS-Bildsensoren sowie 1-Chip- und 3-Chip-Kameras gegenüberstellend verglichen.

Mehr Pixel sind zu wenig

Es ist davon auszugehen, dass eine künftige Fernsehnorm mehr bieten sollte als nur „mehr Pixel“. Grundsätzlich unbestritten ist die nur noch anzuwendende progressive Abtastung. An wesentlichen Verbesserungen sollte sie gegenüber dem heutigen Standard

  • einen größeren Dynamikumfang,
  • eine höhere Bildwiederholrate und
  • einen erweiterten Farbraum
 

haben. Die heutigen Displays können sehr viel mehr, und es sind sogar noch weitere Verbesserungen zu erwarten. Dynamikumfang und Farbraum-Verbesserungen sind im Übrigen auflösungsunabhängig und kämen allen zugute, egal ob sie auf kleine oder große Displays schauen.

Höhere Bildwiederholrate

Wenn man die Auflösung verdoppelt, müsste man eigentlich auch eine Verdopplung der Bildwiederholrate bzw. eine entsprechend kürzere Belichtungszeit verwenden, um bei Bewegung eine vergleichbare Bildschärfe zu erhalten. Bei den diskutierten 4K-Formaten kommt man dann allerdings sehr schnell zu Bandbreiten, die auch heute noch nicht oder nur sehr schwer zu beherrschen sind.

Farbraumerweiterung

Der heutige Farbraum basiert immer noch auf der Rec. 709 und wurde festgelegt für die Phosphore, die wir in den alten Bildröhren hatten bzw. erreichen konnten. Die heutigen Displays bieten einen sehr viel größeren möglichen Farbraum, den wir aber nicht nutzen können, weil es eben der Standard nicht erlaubt.

Praktisch alle heutigen 3-Chip-Kameras, können schon seit längerem einen sehr viel größeren Farbraum abbilden. Genau genommen brauchen wir also, was diesen Punkt anbelangt, gar keine neueren Kameras, sondern nur einen neuen Standard. Und auch die so oft beschworene höhere Bittiefe von mehr als 8 bit ist eine Folge des Übertragungsstandards. Die meisten Fernsehstudios arbeiten bereits mit 10 bit, und auch 12 bit wären kein grundsätzliches Problem, denn intern laufen viele Kameras schon mit 30 bit Abtasttiefe.

Was muss die Kamera leisten?

Welche der genannten Punkte betreffen nun die Kamera selbst:

  • Progressive Abtastung.
    Hier fordert man eine gleich hohe Bildqualität (Auflösung) bei progressiver Abtastung wie bei einer Abtastung mit Zeilensprung.

  • Größerer Dynamikumfang.
    Das bedeutet eine Verbesserung der Bildelemente oder ihrer Möglichkeiten, einen erweiterten Dynamikbereich zu berechnen.

  • Höhere Bildwiederholrate.
    Hier gilt es, die Bildinformationen schneller auszulesen ohne deutliche Vergrößerung der Verlustleistung und einer Verschlechterung der Transfereffizienz.

Kameratypen

CCD vs. CMOS

Im professionellen Bereich der 3-Chip-Kameras unterscheidet man zwischen CCD- und CMOS-Bildwandlern. Betreibt man zum Beispiel eine CCD-Kamera bei den üblichen 2000 lx Szenenbeleuchtungsstärke bei Blende 11 statt im Progressiv-Mode im Interlace-Betrieb (also mit Zeilensprung), so reduziert sich die Lichtempfindlichkeit um eine Stufe auf Blende 8 (oder ­– des besseren Verständnisses wegen – auf die halbe Lichtempfindlichkeit, was eine höhere Öffnung des Objektivs um eine Blendenstufe nötig werden lässt). Der Grund dafür ist, dass der CCD-Sensor im Interlace-Betrieb zwei benachbarte vertikale Zellen zusammen ausliest. Das heißt, es werden die Ladungen von einem Pixel mit dem benachbarten Pixel zusammengeführt. Beim CMOS-Wandler wird innerhalb der Pixelzelle das Signal von einer Ladung in eine Signalspannung umgewandelt und für Interlace umgerechnet, denn der CMOS-Sensor selbst läuft überhaupt nicht im Interlace-Betrieb sondern immer progressiv. Die Lichtempfindlichkeit eines FT-CMOS-Sensors bleibt also immer gleich, unabhängig davon, ob er bei Interlace- oder Progressiv-Betrieb eingesetzt wird.

Das allein bewirkt, dass der CMOS-Sensor im Progressiv-Betrieb eine deutliche Verbesserung bietet. Aber auch beim Dynamikumfang liegen die Vorteile beim CMOS-Sensor. Denn der Dynamikumfang reduziert sich beim CCD-Sensor im Progressiv-Betrieb auf die Hälfte gegenüber dem Interlace-Betrieb, während der CMOS-Sensor die gleiche Dynamik bei beiden Betriebsarten bietet. Wenn man nun noch bedenkt, dass man ja bestrebt ist, in Zukunft mit höheren Dynamikumfängen zu arbeiten, kann man sich vorstellen, dass der CCD-Sensor dafür absolut ungeeignet ist.

22 Blendenstufen mit einem „Trick“

Der heutige FT-CMOS-Sensor von Grass Valley bietet einen Dynamikumfang von 13,5 Blendenstufen. Bedingt aber durch eine besondere Methode des Auslesens und Berechnens lässt sich sogar ein sehr stark erweiterter Dynamikumfang erreichen. Bild 1 zeigt zum Beispiel die Aufnahme mit einer solchen Testkamera mit einer starken Lichtquelle im Bild.

[caption align=left]Bild 1. Testbild eines Studioaufbaus mit im Bild sichtbarem Halogenscheinwerfer und damit rund 22 Blenden Belichtungsumfang[/caption]

Es ergab sich eine Dynamik, also ein Belichtungsumfang, von etwa 22 Blendenstufen. Besonderheit eines FT-CMOS-Sensors ist, dass er im Gegensatz zu einem CCD-Bildwandler ein sogenanntes „non-distructive readout“ bietet, also ein nicht zerstörbares Auslesen. Damit wird es möglich, bei jedem einzelnen Pixel aus der Anstiegszeit der Spannung die Dynamik zu errechnen. Am einfachsten wird das im Diagramm im Bild 2 veranschaulicht.

[caption align=left]Bild 2. Durch die bei CMOS-Sensoren gegebene Mehrfachauslesung während einer Belichtungsphase lässt sich aus der Geschwindigkeit (dem Winkel) des Anstiegs der Signalspannung bis zur Sättigung ein Maß für die Dynamik ableiten, die über den inhärenten Belichtungsumfang des Sensors selbst hinausgeht[/caption]

Wird die Spannung innerhalb einer Bildperiode mehrmals abgetastet und erreicht ihren maximalen Wert (Sättigung) bereits in kürzerer Zeit, so ist die Anstiegszeit als Maß zu bewerten, wie hoch die Dynamik wäre, wenn der Sensor selbst diese hohe Dynamik erfassen könnte. Oder etwas vereinfachter dargestellt: Wird bereits in der Hälfte der Belichtungszeit festgestellt, dass die maximale Sättigung erreicht ist, so läge die tatsächliche Dynamik bei dem Doppelten dessen, was der Sensor selbst in der Lage ist, zu messen.

Bildwiederholrate

Vergleicht man die beiden Technologien, ergibt sich bei einer höheren Bildwiederholrate, dass beim CCD-Bildwandler alle Ladungen innerhalb des Bildwandlers selbst verschoben und sequenziell in einer Ausgangsstufe in eine Signalspannung gewandelt werden. Eine höhere Bildwiederholrate bedeutet demzufolge höhere Abtastraten und damit verbunden eine höhere Verlustleistung und schlechtere Transfereffizienz. Bei CMOS-Bildwandlern befindet sich innerhalb jedes einzelnen Bildelements ein eigener Ausgangsverstärker. Die Bildwiederholrate ist abhängig von der Bandbreite des Verstärkers, aber unabhängig von der Anzahl an Bildelementen. Das limitierende Element bei diesen CMOS-Bildwandlern ist das Processing bei der A/D-Wandlung, die aber durch Aufteilung der Signale auf mehrere parallele A/D-Wandler bewältigt werden kann.

1-Chip vs. 3-Chip

Im letzten Teil des Vortrags ging der Referent vor allem darauf ein, Lösungsmöglichkeiten vorzustellen, um auch über 2K Auflösung hinaus gehende Kameras zu entwickeln. Im Grunde genommen gibt es ja nur die beiden Varianten der Verwendung von 1-Chip-Bildwandlern mit aufgedampften Farbfiltern oder die Verwendung von Kameras mit 3-Chip-Sensoren mit einem Strahlenteiler.

Erst einmal sind die sich beim 1-Chip durch die Farbfilter und den De-Bayering-Prozess ergebenden Nachteile keineswegs trivial und führen dazu, dass eine echte 4K-Auflösung im Luminanzbereich kaum erreicht werden kann. Ein weiterer Nachteil ist das große Bildformat und die sich daraus für die Objektive ergebenden Besonderheiten. Die Möglichkeit, Objektive mit sehr großem Zoombereich bei hoher Qualität herzustellen sind deutlich geringer und wenn realisierbar extrem teuer. Die sich aus der größeren Brennweite ergebende geringere Tiefenschärfe mag bei szenischen Anwendungen vielleicht von Vorteil sein, ist bei Live-Produktionen – man denke zum Beispiel bei Aufnahmen in Sportstadien – aber vollkommen unakzeptabel. Hinzu kommt noch, dass die starke Moiré-Wirkung durch Interferenzen an feinen Bilddetails zu deutlichen Bildartefakten führen, was insbesondere im Sport- und Eventbereich durch die Zunahme von LED-Beleuchtungstableaus häufig der Fall und deutlich erkennbar ist.

Die Verwendung von drei 2/3-inch-Bildwandlern an einem RGB-Strahlenteilerprisma, wie es heute bei 2K-Kameras praktiziert wird, bietet auch im Progressivmode eine durchgängige Signalverarbeitung mit 4:4:4 und eine gegenüber dem heutigen Verfahren wirklich volle 2K-Qualität. Es gibt ferner keine eingeschränkte Auflösung durch Interlace. Es ließen sich darüber hinaus fehlende Bildanteile in der Ebene durch optimal angepasste Algorithmen berechnen. Das bringt im Übrigen deshalb noch eine deutliche Verbesserung, weil ja die volle Farbauflösung (4:4:4) in der Kamera vorhanden ist, die aber am Ausgang normalerweise bisher auf 4:2:2 reduziert wird. Insgesamt lassen sich aufgrund der hohen Farbauflösung aus der Kamera dreimal 2K „herausziehen“, was zwar im Endergebnis auch keine volle 4K-Auflösung bringt, aber gegenüber der 1-Chip-Kamera sind doch deutlich mehr Informationen im Bild vorhanden. Hinzu kommt, dass die spektrale Farbreinheit aufgrund der gewählten dichroitischen Filter in den Strahlengängen der 3-Chip-Kamera deutlich besser ist, als bei den aufgedampften Tröpfchen-Filtern bei der 1-Chip-Lösung.

Fazit des Referenten

Der große Vorteil der 3-Chip-Kamera mit CMOS-Sensor ist, dass es eine „normale“ 2/3-inch-Kamera mit normaler Lichtempfindlichkeit ist. Es stehen viele auch hochgeöffnete Zoom-Objektive mit sogar extrem großen Zoom-Faktoren und mit den heute üblichen Anschlusssockeln zur Verfügung. Der Kameramann kann mit seinen bewährten Objektiven mit großen Zoombereich und trotzdem relativ großem Tiefenschärfebereich weiter arbeiten.

Aus all diesen Gründen sah der Referent diese 3-Chip-Lösung als beste Alternative für die Liveproduktion selbst in einer kommenden 4K-Welt an.


Text: © Norbert Bolewski
Foto: © Joachim Dickmais
Bilder 1 und 2. Originalfolien aus dem Vortrag: © Klaus Weber