Bewegungsentschädigung

Bewegungsentschädigung ist eine algorithmische Technik, die in der Verschlüsselung von Videodaten für die Videokompression zum Beispiel in der Generation von MPEG-2 Dateien verwendet ist. Bewegungsentschädigung beschreibt ein Bild in Bezug auf die Transformation eines Bezugsbildes zum aktuellen Bild. Das Bezugsbild kann rechtzeitig oder sogar von der Zukunft vorherig sein. Wenn Images davon genau aufgebaut werden können, vorher hat Images übersandt/versorgt, die Kompressionsleistungsfähigkeit kann verbessert werden.

Wie es arbeitet

Bewegungsentschädigung nutzt die Tatsache aus, dass, häufig, für viele Rahmen eines Films, des einzigen Unterschieds zwischen einem Rahmen und ein anderer das Ergebnis entweder des Kamerabewegens oder eines Gegenstands im Rahmenbewegen ist. In der Verweisung auf eine Videodatei bedeutet das viel von der Information, die einen Rahmen vertritt, wird dasselbe als die im folgenden Rahmen verwendete Information sein.

Mit der Bewegungsentschädigung wird ein Videostrom einen voll (Verweisung) Rahmen enthalten; dann würde die einzige Information, die für die Rahmen zwischen versorgt ist, die Information sein musste den vorherigen Rahmen in den folgenden Rahmen umgestalten.

Illustriertes Beispiel

Der folgende ist eine vereinfachte illustrierte Erklärung dessen, wie Bewegungsentschädigung arbeitet. Zwei aufeinander folgende Rahmen wurden vom Filmelefantentraum gewonnen. Wie von den Images gesehen werden kann, der Boden (hat Bewegung ersetzt) der Unterschied zwischen zwei Rahmen enthält bedeutsam weniger Detail als die vorherigen Images, und so Kompressen viel besser als der Rest.

Bewegungsentschädigung in MPEG

In MPEG werden Images von vorherigen Rahmen (P Rahmen) oder bidirektional von vorherigen und zukünftigen Rahmen (B Rahmen) vorausgesagt. B Rahmen sind komplizierter, weil die Bildfolge in Unordnung übersandt/versorgt werden muss, so dass der zukünftige Rahmen verfügbar ist, um die B-Rahmen zu erzeugen.

Nach dem Voraussagen von Rahmen mit der Bewegungsentschädigung findet der Codierer den Fehler (restlich), der ist

dann zusammengepresst und übersandt.

Globale Bewegungsentschädigung

In der globalen Bewegungsentschädigung widerspiegelt das Bewegungsmodell grundsätzlich Kamerabewegungen wie:

  • Püppchen - das Weitergehen der Kamera oder umgekehrt
  • Spur - das Bewegen der Kamera ist abgereist oder Recht
  • Boom - die Kamera oder unten heranbringend
  • Pfanne - das Drehen der Kamera um seine Y Achse, die Ansicht bewegend, ist abgereist oder Recht
  • Neigung - das Drehen der Kamera um seine X Achse, die Ansicht oder unten heranbringend
  • Rolle - das Drehen der Kamera um die Ansicht-Achse

Es arbeitet am besten für noch Szenen, ohne Gegenstände zu bewegen.

Es gibt mehrere Vorteile der globalen Bewegungsentschädigung:

  • Es modelliert die dominierende Bewegung, die gewöhnlich in Videofolgen mit gerade einigen Rahmen gefunden ist. Der Anteil in der Bit-Rate dieser Rahmen ist unwesentlich.
  • Es verteilt die Rahmen nicht. Das vermeidet Kunsterzeugnisse an Teilungsgrenzen.
  • Eine Gerade (in der Zeitrichtung) Pixel mit gleichen Raumpositionen im Rahmen entspricht einem unaufhörlich bewegenden Punkt in der echten Szene. Andere Festordner-Schemas führen Diskontinuitäten in der Zeitrichtung ein.

MPEG-4 NATTER unterstützt GMC mit drei Bezugspunkten, obwohl einige Durchführungen nur von einer Gebrauch machen können. Ein einzelner Bezugspunkt berücksichtigt nur Übersetzungsbewegung, die für seine relativ großen Leistungskosten wenig Vorteil gegenüber der gestützten Bewegungsentschädigung des Blocks zur Verfügung stellt.

Bewegende Gegenstände innerhalb eines Rahmens werden durch die globale Bewegungsentschädigung nicht genug vertreten.

So ist lokale Bewegungsbewertung auch erforderlich.

Block-Bewegungsentschädigung

In der Block-Bewegungsentschädigung (BMC) werden die Rahmen in Blöcken von Pixeln (z.B Makroblöcke 16×16 Pixel in MPEG) verteilt.

Jeder Block wird von einem Block der gleichen Größe im Bezugsrahmen vorausgesagt.

Die Blöcke werden in jedem Fall abgesondert vom auswechseln zur Position des vorausgesagten Blocks nicht umgestaltet.

Diese Verschiebung wird durch einen Bewegungsvektoren vertreten.

Um die Überfülle zwischen benachbarten Block-Vektoren (z.B für einen einzelnen bewegenden Gegenstand auszunutzen, der durch vielfache Blöcke bedeckt ist), ist es üblich, nur den Unterschied zwischen dem aktuellen und vorherigen Bewegungsvektoren im Bit-Strom zu verschlüsseln. Das Ergebnis dieses Differencing-Prozesses ist zu einer globalen zum Schwenk fähigen Bewegungsentschädigung mathematisch gleichwertig.

Weiter unten die Verschlüsselungsrohrleitung, ein Wärmegewicht-Codierer wird den resultierenden statistischen Vertrieb der Bewegungsvektoren um den Nullvektoren ausnutzen, um die Produktionsgröße zu reduzieren.

Es ist möglich, einen Block durch eine Zahl der nichtganzen Zahl von Pixeln auszuwechseln, die Subpixel-Präzision genannt wird.

Die Zwischenpixel werden durch das Interpolieren benachbarter Pixel erzeugt. Allgemein, wird Halbpixel- oder Viertel-Pixel-Präzision (Qpel, der durch H.264 und MPEG-4/ASP verwendet ist), verwendet. Der rechenbetonte Aufwand der Subpixel-Präzision ist viel höher wegen der Extraverarbeitung, die für die Interpolation und auf der encoder Seite, einer viel größeren Zahl von potenziellen zu bewertenden Quellblöcken erforderlich ist.

Der Hauptnachteil der Block-Bewegungsentschädigung ist, dass sie Diskontinuitäten an den Block-Grenzen einführt (Kunsterzeugnisse blockierend).

Diese Kunsterzeugnisse erscheinen in der Form von scharfen horizontalen und vertikalen Rändern, die durch das menschliche Auge leicht entdeckt werden und klingelnde Effekten erzeugen (große Koeffizienten in hohen Frequenzsubbändern) im Fourier-zusammenhängenden verwandeln sich verwendet dafür gestalten das Codieren der restlichen Rahmen um.

Block-Bewegungsentschädigung zerteilt den aktuellen Rahmen in die Nichtüberschneidung auf Blöcke, und der Bewegungsentschädigungsvektor erzählt, wohin jene Blöcke aus kommen

(ein häufiger Irrtum ist, dass der vorherige Rahmen in die Nichtüberschneidung auf Blöcke zerteilt wird, und die Bewegungsentschädigungsvektoren erzählen, wohin sich jene Blöcke zu bewegen).

Die Quellblöcke überlappen normalerweise im Quellrahmen.

Einige Videokompressionsalgorithmen sammeln den aktuellen Rahmen aus Stücken von mehreren verschiedenen vorher übersandten Rahmen.

Rahmen können auch von zukünftigen Rahmen vorausgesagt werden.

Die zukünftigen Rahmen müssen dann verschlüsselt werden vor den vorausgesagten Rahmen und so vergleicht die Verschlüsselungsordnung die echte Rahmenordnung nicht notwendigerweise.

Solche Rahmen werden gewöhnlich von zwei Richtungen, d. h. vom I- oder den P-Rahmen vorausgesagt, die sofort vorangehen oder dem vorausgesagten Rahmen folgen.

Diese bidirektional vorausgesagten Rahmen werden B-Rahmen genannt.

Ein Codierschema konnte zum Beispiel IBBPBBPBBPBB sein.

Variable Bewegungsentschädigung der Block-Größe

Variable Bewegungsentschädigung der Block-Größe (VBSMC) ist der Gebrauch von BMC mit der Fähigkeit zum encoder, um die Größe der Blöcke dynamisch auszuwählen. Wenn er Video codiert, kann der Gebrauch von größeren Blöcken die Anzahl von Bit vermindern musste die Bewegungsvektoren vertreten, während der Gebrauch von kleineren Blöcken auf einen kleineren Betrag der Vorhersage restliche Information hinauslaufen kann, um zu verschlüsseln. Ältere Designs wie H.261 und MPEG-1 Video verwenden normalerweise eine feste Block-Größe, während neuere wie H.263, MPEG-4 Teil 2, H.264/MPEG-4 AVC und VC-1 dem encoder die Fähigkeit geben dynamisch zu wählen, welche Block-Größe verwendet wird, um die Bewegung zu vertreten.

Übergegriffene Block-Bewegungsentschädigung

Übergegriffene Block-Bewegungsentschädigung (OBMC) ist eine gute Lösung dieser Probleme, weil sie nicht nur Vorhersagegenauigkeit vergrößert sondern auch vermeidet, Kunsterzeugnisse zu blockieren. Wenn man OBMC, verwendet

Blöcke sind normalerweise zweimal in jeder Dimension und mit allen 8 benachbarten Blöcken mit dem Quadranten klugem Übergreifen so groß.

So gehört jedes Pixel 4 Blöcken. In solch einem Schema gibt es 4 Vorhersagen für jedes Pixel, die zu einem belasteten bösartigen summiert werden.

Für diesen Zweck werden Blöcke mit einer Fensterfunktion vereinigt, die das Eigentum hat, dass die Summe von 4 übergegriffenen Fenstern 1 überall gleich ist.

Studien von Methoden, für die Kompliziertheit von OBMC zu reduzieren, haben gezeigt, dass der Beitrag zur Fensterfunktion für den diagonal angrenzenden Block am kleinsten ist. Das Reduzieren des Gewichts für diesen Beitrag zur Null und die Erhöhung der anderen Gewichte durch einen gleichen Betrag führen zur wesentlichen Verminderung der Kompliziertheit ohne eine große Strafe qualitativ. In solch einem Schema gehört jedes Pixel dann 3 Blöcken aber nicht 4, und anstatt 8 benachbarte Blöcke zu verwenden, nur 4 werden für jeden zu ersetzenden Block verwendet. Solch ein Schema wird im H.263 Anhang F Fortgeschrittene Vorhersageweise gefunden

Viertel-Pixel (QPel) und Hälfte der Pixel-Bewegungsentschädigung

In der Bewegungsentschädigung sind Viertel oder Hälfte von Proben wirklich interpolierte durch Bruchbewegungsvektoren verursachte Subproben. Gestützt auf den Vektoren und vollen Proben können die Subproben durch das Verwenden bicubic oder bilineare 2. Entstörung berechnet werden. Sieh Subklausel 8.4.2.2" Bruchbeispielinterpolationsprozess" des H.264 Standards.

3D-Bildcodierungstechniken

Bewegungsentschädigung wird im Stereoskopischen Video verwertet, das Codiert

Im Video wird Zeit häufig als die dritte Dimension betrachtet. Noch können Bildcodierungstechniken zu einer Extradimension ausgebreitet werden.

JPEG2000 verwendet Elementarwellen, und diese können auch verwendet werden, um Bewegung ohne Lücken zwischen Blöcken auf eine anpassungsfähige Weise zu verschlüsseln. Bruchpixel affine Transformationen führt zu Blutung zwischen angrenzenden Pixeln. Wenn keine höhere innere Entschlossenheit verwendet wird, kämpfen die Delta-Images größtenteils gegen das Image, das schmiert. Das Delta-Image kann auch als Elementarwellen verschlüsselt werden, so dass die Grenzen der anpassungsfähigen Blöcke zusammenpassen.

2D+Delta verwertet Verschlüsselung von Techniken H.264 und das MPEG-2 vereinbare Codieren und kann Bewegungsentschädigung zur Kompresse zwischen stereoskopischen Images verwenden.

Wenn er

sich 8x8 ausbreitet, blockiert JPEG in die dritte Dimension, die in 8x8x8 ist, ermöglichen Würfel und das Ändern des DCT mehr in einen DFT Kompression von geradlinigen Übersetzungen mit Geschwindigkeiten unten und ungefähr einem Pixel pro Rahmen (Subpixel-Präzision).

Siehe auch

  • HDTV verschmieren
  • Fernsehstandardkonvertierung
  • VidFIRE
  • X-Videobewegungsentschädigung

Außenverbindungen

Anwendungen

Garnham, N. W., Bewegung hat das Videocodieren, die Universität der Nottinghamer Doktorarbeit, Oktober 1995, internationale Standardbuchnummer X763409714 Ersetzt

Außenverbindungen


James Ussher / Istria
Impressum & Datenschutz