JPEG

In der Computerwissenschaft, JPEG ([ausgesprochen weil ist Eichelhäher-Haken] eine allgemein verwendete Methode der lossy Kompression für die Digitalfotografie (Image). Der Grad der Kompression kann angepasst werden, einen selectable Umtausch zwischen Lagerungsgröße und Bildqualität erlaubend. JPEG erreicht normalerweise 10:1 Kompression mit wenig wahrnehmbarem Verlust in der Bildqualität.

JPEG Kompression wird in mehreren Bilddateiformaten verwendet. JPEG/Exif ist das allgemeinste Bildformat, das durch Digitalkameras und andere fotografische Bildfestnahme-Geräte verwendet ist; zusammen mit JPEG/JFIF ist es der grösste Teil des Standardformates, um fotografische Images im World Wide Web zu versorgen und zu übersenden. Diese Format-Schwankungen sind häufig nicht bemerkenswert, und werden einfach JPEG genannt.

Der Begriff "JPEG" ist ein Akronym für Joint Photographic Experts Group, die den Standard geschaffen hat. Das PANTOMIME-Sektorformat für JPEG ist image/jpeg (definiert RFC 1341), außer in Internet Explorer, der einen Typ MIME von image/pjpeg zur Verfügung stellt, wenn er JPEG Images lädt.

Es unterstützt eine maximale Bildgröße 65535×65535.

Der JPEG Standard

Der Name "JPEG" tritt für Joint Photographic Experts Group, den Namen des Komitees ein, das den JPEG Standard und auch anderen noch Bild geschaffen hat, das Standards codiert. Das "Gelenk" ist für ISO TC97 WG8 und CCITT SGVIII eingetreten. 1987 ist ISO TC 97 ISO/IEC JTC1 geworden, und 1992 ist CCITT ITU-T geworden. Zurzeit auf der JTC1 Seite ist JPEG eine von zwei Untergruppen des ISO/IEC-Gelenks Technisches Komitee 1, Unterausschuss 29, Arbeitsgruppe 1 (ISO/IEC JTC 1/SC 29/WG 1) - betitelt als das Codieren von noch Bildern.. Auf der ITU-T Seite ITU-T ist SG16 der jeweilige Körper. Die ursprüngliche JPEG Gruppe wurde 1986 organisiert, den ersten JPEG Standard 1992 ausgebend, der im September 1992 als ITU-T Empfehlung T.81 und 1994 als ISO/IEC 10918-1 genehmigt wurde.

Der JPEG Standard gibt den codec an, der definiert, wie ein Image in einen Strom von Bytes zusammengepresst wird und zurück in ein Image dekomprimiert hat, aber nicht das Dateiformat hat gepflegt, diesen Strom zu enthalten.

Der Exif und die JFIF Standards definieren die allgemein verwendeten Dateiformate für den Austausch von JPEG-komprimierten Images.

JPEG Standards werden als Informationstechnologie - Digitalkompression und das Codieren des Halbtons noch Images formell genannt. ISO/IEC 10918 besteht aus den folgenden Teilen:

Ecma International/98 gibt JPEG File Interchange Format (JFIF) an; die Erstausgabe wurde im Juni 2009 veröffentlicht.

Typischer Gebrauch

Der JPEG Kompressionsalgorithmus ist an seinem besten auf Fotographien und Bildern von realistischen Szenen mit glatten Schwankungen des Tons und der Farbe. Für den Webgebrauch, wo die für ein Image verwendete Datenmenge wichtig ist, ist JPEG sehr populär. JPEG/Exif ist auch der grösste Teil des durch Digitalkameras gesparten Standardformates.

Andererseits darf JPEG nicht ebenso für Linienzeichnungen und andere textliche oder ikonische Grafik angepasst werden, wo die scharfen Unähnlichkeiten zwischen angrenzenden Pixeln erkennbare Kunsterzeugnisse verursachen können. Solche Images können in einem lossless Grafikformat wie ZANK, GIF, PNG oder ein rohes Bildformat besser gespart werden. Der JPEG Standard schließt wirklich einen lossless das Codieren der Weise ein, aber diese Weise wird in den meisten Produkten nicht unterstützt.

Da der typische Gebrauch von JPEG eine lossy Kompressionsmethode ist, die etwas die Bildtreue reduziert, sollte es nicht in Drehbüchern verwendet werden, wo die genaue Fortpflanzung der Daten (wie einige wissenschaftliche und medizinische Bildaufbereitungsanwendungen und bestimmte technische Bildverarbeitungsarbeit) erforderlich ist.

JPEG wird auch Dateien nicht gut angepasst, die vielfach erleben werden, editiert, weil etwas Bildqualität gewöhnlich jedes Mal verloren wird, wenn das Image dekomprimiert und besonders wiederzusammengepresst wird, wenn das Image abgeschnitten oder ausgewechselt wird, oder wenn verschlüsselnde Rahmen geändert werden - sieh Digitalgenerationsverlust für Details. Um das zu vermeiden, kann ein Image, das modifiziert wird oder in der Zukunft modifiziert werden kann, in einem Lossless-Format, mit einer Kopie exportiert als JPEG für den Vertrieb gespart werden.

JPEG Kompression

Die Kompressionsmethode ist gewöhnlich lossy, bedeutend, dass etwas ursprüngliche Bildinformation verloren wird und nicht wieder hergestellt werden kann, vielleicht Bildqualität betreffend. Es gibt eine fakultative lossless im JPEG Standard definierte Weise; jedoch wird diese Weise in Produkten nicht weit unterstützt.

Es gibt auch einen verflochtenen "Progressiven JPEG" Format, in denen Daten in vielfachen Pässen des progressiv höheren Details zusammengepresst wird. Das ist für große Images ideal, die gezeigt werden, während man über eine langsame Verbindung herunterladen wird, eine angemessene Vorschau nach dem Empfang nur eines Teils der Daten erlaubend. Jedoch werden progressive JPEGs nicht so weit unterstützt, und sogar eine Software, die sie wirklich (unterstützt wie Versionen von Internet Explorer vor Windows 7) zeigt nur, das Image, nachdem es völlig heruntergeladen worden ist.

Es gibt auch viele medizinische Bildaufbereitungs- und Verkehrssysteme, die schaffen und JPEG 12-Bit-Images, normalerweise grayscale Images bearbeiten. Das JPEG 12-Bit-Format ist ein Teil der JPEG Spezifizierung für einige Zeit gewesen, aber wieder wird dieses Format nicht als weit unterstützt.

Das Redigieren von Lossless

Mehrere Modifizierungen zu einem JPEG Image können losslessly (d. h. ohne Wiederkompression und den verbundenen Qualitätsverlust) als lange durchgeführt werden, weil die Bildgröße ein Vielfache von 1 MCU-Block (Minimale Codierte Einheit) (gewöhnlich 16 Pixel in beiden Richtungen, für 4:2:0 chroma Probenteilung) ist. Dienstprogramme, die das durchführen, schließen mit der Benutzerschnittstelle Jpegcrop und den Steck-zu IrfanView ein.

Blöcke können in 90 Grad-Zunahme rotieren gelassen werden, haben in den horizontalen, vertikalen und diagonalen Äxten geschnipst und haben sich im Image bewegt. Nicht alle Blöcke vom ursprünglichen Image müssen im modifizierten verwendet werden.

Der oberste und linke Rand eines JPEG Images muss auf einer Block-Grenze liegen, aber der Boden und richtige Rand brauchen so nicht zu tun. Das beschränkt die möglichen Lossless-Getreide-Operationen, und verhindert auch Flips und Folgen eines Images, dessen Boden oder richtiger Rand auf einer Block-Grenze für alle Kanäle nicht liegen (weil der Rand auf der Spitze oder verlassen enden würde, wo - als oben erwähnt - eine Block-Grenze obligatorisch ist).

Wenn

er lossless Saatbestellung verwenden wird, wenn der Boden oder die richtige Seite des Getreide-Gebiets nicht an einer Block-Grenze dann sind, wird der Rest der Daten von den teilweise verwendeten Blöcken noch in der abgeschnittenen Datei da sein und kann wieder erlangt werden.

Es ist auch möglich, sich zwischen Grundlinie und progressiven Formaten ohne jeden Verlust der Qualität zu verwandeln, da der einzige Unterschied die Ordnung ist, in der die Koeffizienten in die Datei gelegt werden.

JPEG Dateien

Das Dateiformat bekannt als "JPEG Austausch-Format" (JIF) wird im Anhang B des Standards angegeben. Jedoch wird dieses "reine" Dateiformat in erster Linie wegen der Schwierigkeit selten verwendet, encoders und Decoder zu programmieren, die völlig alle Aspekte des Standards und wegen bestimmter Mängel des Standards durchführen:

  • Färben Sie Raumdefinition
  • Teilprobenteilungsregistrierung
  • Pixel-Aspekt-Verhältnis-Definition.

Mehrere zusätzliche Standards haben sich entwickelt, um diese Probleme zu richten. Der erste von diesen, veröffentlicht 1992, war JPEG Dateiaustausch-Format (oder JFIF), gefolgt in den letzten Jahren vom Austauschbaren Bilddateiformat (Exif) und den ICC-Farbenprofilen. Beide dieser Formate verwenden das wirkliche JIF Byte-Lay-Out, aus verschiedenen Anschreibern bestehend, aber verwenden außerdem einen der Erweiterungspunkte des JIF Standards, nämlich die Anwendungsanschreiber: JFIF verwenden APP0, während Exif APP1 verwenden. Innerhalb dieser Segmente der Datei, die für den zukünftigen Gebrauch im JIF Standard verlassen wurden und dadurch nicht gelesen werden, fügen diese Standards spezifischen metadata hinzu.

So in mancher Hinsicht ist JFIF eine cutdown Version des JIF Standards, in dem er bestimmte Einschränkungen angibt (wie, alle verschiedenen Verschlüsselungsweisen zu nicht erlauben), während auf andere Weisen es eine Erweiterung von JIF wegen des zusätzlichen metadata ist. Die Dokumentation für die ursprünglichen JFIF Standardstaaten:

:JPEG-Dateiaustausch-Format ist ein minimales Dateiformat, das JPEG bitstreams ermöglicht, zwischen einem großen Angebot an Plattformen und Anwendungen ausgetauscht zu werden. Dieses minimale Format schließt keine der fortgeschrittenen Eigenschaften ein, die im ZANK JPEG Spezifizierung oder jede Anwendung spezifisches Dateiformat gefunden sind. Noch wenn es, zum einzigen Zweck dieses vereinfachten Formats ist, den Austausch von zusammengepressten Images von JPEG zu erlauben.

Bilddateien, die JPEG Kompression verwenden, werden "JPEG Dateien" allgemein genannt, und werden in Varianten des JIF Bildformats versorgt. Der grösste Teil des Images gewinnt Geräte (wie Digitalkameras), dass Produktion JPEG schaffen wirklich Dateien im Format von Exif, das Format, auf dem die Kameraindustrie für den Metadata-Austausch standardisiert hat. Andererseits, da der Standard von Exif Farbenprofile nicht erlaubt, versorgt der grösste Teil des Images, Software editierend, JPEG im JFIF-Format, und schließen Sie auch das APP1 Segment von der Datei von Exif ein, um den metadata auf eine fast entgegenkommende Weise einzuschließen; der JFIF Standard wird etwas flexibel interpretiert.

Genau genommen sind die Standards von JFIF und Exif unvereinbar, weil sie jeder gibt an, dass ihr Anschreiber-Segment (APP0 oder APP1, beziehungsweise) erst scheint. In der Praxis enthalten die meisten JPEG Dateien ein JFIF Anschreiber-Segment, das dem Kopfball von Exif vorangeht. Das erlaubt älteren Lesern, das ältere Format JFIF Segment richtig zu behandeln, während neuere Leser auch das folgende Segment von Exif decodieren, über das Verlangen davon weniger streng seiend, erst zu scheinen.

JPEG Dateiformate

Die allgemeinsten Dateiformate für Dateien, die JPEG Kompression verwenden, sind.jpg und.jpeg, obwohl.jpe.jfif und.jif auch verwendet werden. Es ist auch für JPEG Daten möglich, in anderen Dateitypen eingebettet zu werden - ZANK hat Dateien verschlüsselt häufig betten ein JPEG Image als ein Daumennagel des Hauptimages ein; und MP3 Dateien können einen JPEG der Deckel-Kunst im ID3v2 Anhängsel enthalten.

Farbenprofil

Viele JPEG Dateien betten ein ICC-Farbenprofil ein (färben Sie Raum). Allgemein verwendete Farbenprofile schließen sRGB und Adobe RGB ein. Weil diese Farbenräume eine nichtlineare Transformation verwenden, ist die dynamische Reihe einer JPEG 8-Bit-Datei ungefähr 11 Halt; sieh Gamma sich biegen.

Syntax und Struktur

Ein JPEG Image besteht aus einer Folge von Segmenten, jeder, mit einem Anschreiber beginnend, von denen jeder mit einem 0xFF Byte beginnt, das von einem Byte gefolgt ist, das anzeigt, welcher Anschreiber es ist. Einige Anschreiber bestehen aus gerade jenen zwei Bytes; anderen wird von zwei Bytes gefolgt, die die Länge von mit dem Anschreiber spezifischen Nutzlast-Daten anzeigen, die folgt. (Die Länge schließt die zwei Bytes für die Länge, aber nicht die zwei Bytes für den Anschreiber ein.) Einigen Anschreibern wird von Wärmegewicht-codierten Daten gefolgt; die Länge solch eines Anschreibers schließt die Wärmegewicht-codierten Daten nicht ein. Bemerken Sie, dass 0xFF Konsekutivbytes verwendet werden, wie Bytes füllen, um Zwecke auszupolstern (sieh JPEG Spezifizierungsabschnitt B.1.1.2 für Details).

Innerhalb der Wärmegewicht-codierten Daten, nach jedem 0xFF Byte, wird ein 0x00 Byte durch den encoder vor dem folgenden Byte eingefügt, so dass es nicht scheint, einen Anschreiber zu geben, wo niemand beabsichtigt ist, sich entwickelnde Fehler verhindernd. Decoder müssen dieses 0x00 Byte auslassen. Diese Technik, genannt Byte-Füllung (sieh JPEG Spezifizierungsabschnitt F.1.2.3), wird nur auf die Wärmegewicht-codierten Daten angewandt, nicht auf Anschreiber-Nutzlast-Daten.

Es gibt anderen Anfang Von Rahmenanschreibern, die andere Arten von JPEG encodings einführen.

Seitdem mehrere Verkäufer denselben APPn Anschreiber-Typ verwenden könnten, beginnen anwendungsspezifische Anschreiber häufig mit einem Standard oder Verkäufer-Namen (z.B, "Exif" oder "Adobe") oder eine andere sich identifizierende Schnur.

An einem Wiederanfang-Anschreiber werden Block-zu-Block-Prophet-Variablen neu gefasst, und der bitstream wird zu einer Byte-Grenze synchronisiert. Fangen Sie wiederan Anschreiber stellen Mittel für die Wiederherstellung danach bitstream Fehler, wie Übertragung über ein unzuverlässiges Netz oder Dateibestechung zur Verfügung. Da die Läufe von Makroblöcken zwischen Wiederanfang-Anschreibern unabhängig decodiert werden können, können diese Läufe in der Parallele decodiert werden.

JPEG codec Beispiel

Obwohl eine JPEG Datei auf verschiedene Weisen verschlüsselt werden kann, meistens wird sie mit der JFIF-Verschlüsselung getan. Der Verschlüsselungsprozess besteht aus mehreren Schritten:

  1. Die Darstellung der Farben im Image wird von RGB umgewandelt bis, aus einem luma Bestandteil (Y') bestehend, Helligkeit und zwei chroma Bestandteile, (C und C) vertretend, Farbe vertretend. Dieser Schritt wird manchmal ausgelassen.
  2. Die Entschlossenheit der chroma Daten, wird gewöhnlich durch einen Faktor 2 reduziert. Das widerspiegelt die Tatsache, dass das Auge zu feinen Farbendetails weniger empfindlich ist als zu feinen Helligkeitsdetails.
  3. Das Image wird in Blöcke 8×8 Pixel, und für jeden Block, jeden der Y, C gespalten, und C Daten erleben einen getrennten Kosinus verwandelt sich (DCT). Ein DCT ist einem Fourier ähnlich verwandeln sich im Sinn, dass er eine Art Raumfrequenzspektrum erzeugt.
  4. Die Umfänge der Frequenzbestandteile werden gequantelt. Menschliche Vision ist zu kleinen Schwankungen in der Farbe oder Helligkeit über große Gebiete viel empfindlicher als zur Kraft von Hochfrequenzhelligkeitsschwankungen. Deshalb werden die Umfänge der Hochfrequenzbestandteile mit einer niedrigeren Genauigkeit versorgt als die niederfrequenten Bestandteile. Die Qualitätseinstellung des encoder (zum Beispiel 50 oder 95 auf einer Skala 0-100 in der Bibliothek von Independent JPEG Group) betrifft, inwieweit die Entschlossenheit jedes Frequenzbestandteils reduziert wird. Wenn eine übermäßig niedrige Qualitätseinstellung verwendet wird, werden die Hochfrequenzbestandteile zusammen verworfen.
  5. Die resultierenden Daten für alle 8×8 Blöcke werden weiter mit einem lossless Algorithmus, einer Variante von Huffman zusammengepresst, der verschlüsselt.

Der Entzifferungsprozess kehrt diese Schritte um außer dem quantization, weil es irreversibel ist. Im Rest dieser Abteilung werden die Verschlüsselung und Entzifferung von Prozessen ausführlicher beschrieben.

Verschlüsselung

Viele der Optionen im JPEG Standard, werden und wie oben erwähnt nicht allgemein verwendet, der grösste Teil der Bildsoftware verwendet das einfachere JFIF-Format, wenn sie eine JPEG Datei schafft, die unter anderem die Verschlüsselungsmethode angibt. Hier ist eine kurze Beschreibung von einer von mehr üblicher Methodik, wenn angewandt, auf einen Eingang zu verschlüsseln, der 24 Bit pro Pixel (acht jeder von roten, Grün, und blau) hat. Diese besondere Auswahl ist eine lossy Datenkompressionsmethode.

Färben Sie Raumtransformation

Erstens sollte das Image von RGB in einen verschiedenen Farbenraum genannt (oder, informell, YCbCr) umgewandelt werden. Es hat drei Bestandteile Y', C und C: Der Y' Bestandteil vertritt die Helligkeit eines Pixels, und der C und die C Bestandteile vertreten das Farbsignal (Spalt in blaue und rote Bestandteile). Das ist grundsätzlich derselbe Farbenraum, wie verwendet, durch das digitale Farben-Fernseh-sowie Digitalvideo einschließlich Video-DVDs, und ist der Weise ähnlich, wie Farbe im analogen FREUND-Video und MAC vertreten wird (aber nicht durch analogen NTSC, der den YIQ-Farbenraum verwendet). Die Farbenraumkonvertierung erlaubt größere Kompression ohne eine bedeutende Wirkung auf die perceptual Bildqualität (oder größere perceptual Bildqualität für dieselbe Kompression). Die Kompression ist effizienter, weil die Helligkeitsinformation, die für die schließliche perceptual Qualität des Images wichtiger ist, auf einen einzelnen Kanal beschränkt wird. Das entspricht näher der Wahrnehmung der Farbe im menschlichen Sehsystem. Die Farbentransformation verbessert auch Kompression durch statistischen decorrelation.

Eine besondere Konvertierung dazu wird im JFIF Standard angegeben, und sollte für die resultierende JPEG Datei durchgeführt werden, um maximale Vereinbarkeit zu haben. Jedoch wenden einige JPEG Durchführungen in der Weise "der höchsten Qualität" diesen Schritt nicht an und behalten stattdessen die Farbeninformation im RGB-Farbenmodell, wo das Image in getrennten Kanälen für rote, grüne und blaue Helligkeitsbestandteile versorgt wird. Das läuft auf weniger effiziente Kompression hinaus, und würde wahrscheinlich nicht verwendet, wenn Dateigröße besonders wichtig ist.

Downsampling

Wegen der Dichten der Farbe - und mit der Helligkeit empfindliche Empfänger im menschlichen Auge können Menschen beträchtlich feineres Detail in der Helligkeit eines Images (der Y' Bestandteil) sehen als im Farbton und Sättigung eines Images (die Bestandteile von Cb und Cr) färben. Mit diesen Kenntnissen kann encoders entworfen werden, um Images effizienter zusammenzupressen.

Die Transformation ins Farbenmodell ermöglicht den folgenden üblichen Schritt, der ist abzunehmen, die Raumentschlossenheit der Bestandteile von Cb und Cr (hat "downsampling" oder "chroma Probenteilung" genannt). Die Verhältnisse, an denen der downsampling normalerweise für JPEG Images getan wird, sind (kein downsampling), (die Verminderung durch einen Faktor 2 in der horizontalen Richtung), oder (meistens) (die Verminderung durch einen Faktor 2 sowohl im horizontalen als auch in den vertikalen Richtungen). Für den Rest des Kompressionsprozesses, Y' werden Cb und Cr getrennt und auf eine sehr ähnliche Weise bearbeitet.

Das Block-Aufspalten

Nach der Probenteilung muss jeder Kanal in 8×8 Blöcke gespalten werden. Je nachdem chroma Probenteilung, das gibt (Minimale Codierte Einheit) MCU Blöcke der Größe 8×8 (4:4:4 - keine Probenteilung), 16×8 (4:2:2), oder meistens 16×16 (4:2:0) nach. In der Videokompression werden MCUs Makroblöcke genannt.

Wenn die Daten für einen Kanal keine Zahl der ganzen Zahl von Blöcken dann vertreten, muss der encoder das restliche Gebiet der unvollständigen Blöcke mit einer Form von Scheindaten füllen. Die Füllung der Ränder mit einer festen Farbe (zum Beispiel, schwarz) kann klingelnde Kunsterzeugnisse entlang dem sichtbaren Teil der Grenze schaffen;

das Wiederholen der Rand-Pixel ist eine allgemeine Technik, die abnimmt (aber beseitigt nicht notwendigerweise völlig) solche Kunsterzeugnisse, und hoch entwickeltere Grenzfüllungstechniken auch angewandt werden können.

Getrennter Kosinus verwandelt sich

Dann wird jeder 8×8 Block jedes Bestandteils (Y, CB, Cr) zu einer Frequenzgebiet-Darstellung mit einem normalisierten, zweidimensionalen getrennten Kosinus verwandelt sich (DCT) des Typs-II umgewandelt.

Als ein Beispiel ein solcher 8×8 könnte 8-Bit-Subimage sein:

:

\left [

\begin {Reihe} {rrrrrrrr }\

52 & 55 & 61 & 66 & 70 & 61 & 64 & 73 \\

63 & 59 & 55 & 90 & 109 & 85 & 69 & 72 \\

62 & 59 & 68 & 113 & 144 & 104 & 66 & 73 \\

63 & 58 & 71 & 122 & 154 & 106 & 70 & 69 \\

67 & 61 & 68 & 104 & 126 & 88 & 68 & 70 \\

79 & 65 & 60 & 70 & 77 & 68 & 58 & 75 \\

85 & 71 & 64 & 59 & 55 & 61 & 65 & 83 \\

87 & 79 & 69 & 68 & 65 & 76 & 78 & 94

\end {ordnen }\

\right].

</Mathematik>

Vor der Computerwissenschaft des DCT 8×8 Block werden seine Werte von einer positiven Reihe bis einen in den Mittelpunkt gestellten um die Null ausgewechselt. Für ein 8-Bit-Image fällt jeder Zugang im ursprünglichen Block in der Reihe. Der Mittelpunkt der Reihe (in diesem Fall, der Wert 128) wird von jedem Zugang abgezogen, um eine Datenreihe zu erzeugen, die um die Null in den Mittelpunkt gestellt wird, so dass die modifizierte Reihe ist. Dieser Schritt reduziert die dynamischen Reihe-Voraussetzungen im DCT in einer Prozession gehende Bühne, die folgt. (Beiseite vom Unterschied in der dynamischen Reihe innerhalb der DCT Bühne ist dieser Schritt zum Abziehen 1024 vom Gleichstrom-Koeffizienten nach dem Durchführen des Umgestaltens mathematisch gleichwertig - der eine bessere Weise sein kann, die Operation auf einigen Architekturen durchzuführen, da es das Durchführen nur einer Subtraktion aber nicht 64 von ihnen einschließt.)

Dieser Schritt läuft auf die folgenden Werte hinaus:

:

\begin {Reihe} {c }\

x\\

\longrightarrow \\

\left [\begin {Reihe} {rrrrrrrr }\

- 76 &-73 &-67 &-62 &-58 &-67 &-64 &-55 \\

- 65 &-69 &-73 &-38 &-19 &-43 &-59 &-56 \\

- 66 &-69 &-60 &-15 & 16 &-24 &-62 &-55 \\

- 65 &-70 &-57 &-6 & 26 &-22 &-58 &-59 \\

- 61 &-67 &-60 &-24 &-2 &-40 &-60 &-58 \\

- 49 &-63 &-68 &-58 &-51 &-60 &-70 &-53 \\

- 43 &-57 &-64 &-69 &-73 &-67 &-63 &-45 \\

- 41 &-49 &-59 &-60 &-63 &-52 &-50 &-34

\end {ordnen }\

\right]

\end {ordnen }\

\Bigg\downarrow y.

</Mathematik>

Der nächste Schritt soll den zweidimensionalen DCT nehmen, durch den gegeben wird:

:

\sum_ {x=0} ^7

\sum_ {y=0} ^7

\alpha (u)

\alpha (v)

g_ {x, y }\

\cos \left [\frac {\\Pi} {8} \left (x +\frac {1} {2 }\\Recht) u \right]

\cos \left [\frac {\\Pi} {8} \left (y +\frac {1} {2 }\\Recht) v \right]

</Mathematik>

wo

  • ist die horizontale Raumfrequenz für die ganzen Zahlen
  • ist die vertikale Raumfrequenz für die ganzen Zahlen

\alpha (u) =

\begin {Fälle }\

\sqrt {\frac {1} {8}}, & \mbox {wenn} u=0 \\

\sqrt {\frac {2} {8}}, & \mbox {sonst }\

\end {Fälle }\

</Mathematik> ist ein Normalisieren-Einteilungsfaktor, um die Transformation orthonormalen zu machen

  • ist der Pixel-Wert an Koordinaten
  • ist der DCT Koeffizient an Koordinaten

Wenn wir diese Transformation auf unserer Matrix oben durchführen, bekommen wir das folgende (rund gemacht zu den nächsten zwei Ziffern außer dem dezimalen Punkt):

:\begin {Reihe} {c }\

u \\

\longrightarrow \\\left [\begin {Reihe} {rrrrrrrr }\

- 415.38 &-30.19 &-61.20 & 27.24 & 56.13 &-20.10 &-2.39 & 0.46 \\

4.47 &-21.86 &-60.76 & 10.25 & 13.15 &-7.09 &-8.54 & 4.88 \\

- 46.83 & 7.37 & 77.13 &-24.56 &-28.91 & 9.93 & 5.42 &-5.65 \\

- 48.53 & 12.07 & 34.10 &-14.76 &-10.24 & 6.30 & 1.83 & 1.95 \\

12.12 &-6.55 &-13.20 &-3.95 &-1.88 & 1.75 &-2.79 & 3.14 \\

- 7.73 & 2.91 & 2.38 &-5.94 &-2.38 & 0.94 & 4.30 & 1.85 \\

- 1.03 & 0.18 & 0.42 &-2.42 &-0.88 &-3.02 & 4.12 &-0.66 \\

- 0.17 & 0.14 &-1.07 &-4.19 &-1.17 &-0.10 & 0.50 & 1.68

\end {ordnen }\\right]\end {ordnen }\

\Bigg\downarrow v.

</Mathematik>

Bemerken Sie den spitzenlinken Eckzugang mit dem ziemlich großen Umfang. Das ist der Gleichstrom-Koeffizient. Die restlichen 63 Koeffizienten werden die AC Koeffizienten genannt. Der Vorteil des DCT ist seine Tendenz, den grössten Teil des Signals an einer Ecke des Ergebnisses anzusammeln, wie oben gesehen werden kann. Die quantization gehen, um zu folgen, akzentuiert diese Wirkung, während man gleichzeitig die gesamte Größe der DCT Koeffizienten reduziert, auf ein Signal hinauslaufend, das zur Kompresse effizient in der Wärmegewicht-Bühne leicht ist.

Der DCT vergrößert provisorisch die Bit-Tiefe der Daten, seit den DCT Koeffizienten 8-bit/component Image nimmt bis zu 11 oder mehr Bit (abhängig von Treue der DCT Berechnung), um zu versorgen. Das kann den codec zwingen, 16-Bit-Behälter provisorisch zu verwenden, um diese Koeffizienten zu halten, die Größe der Bilddarstellung an diesem Punkt verdoppelnd; sie werden normalerweise zurück auf 8-Bit-Werte durch den Quantization-Schritt reduziert. Die vorläufige Zunahme in der Größe in dieser Bühne ist nicht eine Leistungssorge für die meisten JPEG Durchführungen, weil normalerweise nur ein sehr kleine Teil des Images in der vollen DCT-Form zu jeder vorgegebenen Zeit während der Bildverschlüsselung oder Entzifferung des Prozesses versorgt wird.

Quantization

Das menschliche Auge kann gut kleine Unterschiede in der Helligkeit über ein relativ großes Gebiet, aber nicht so gut im Unterscheiden der genauen Kraft einer hohen Frequenzhelligkeitsschwankung sehen. Das erlaubt demjenigen, den Betrag der Information in den hohen Frequenzbestandteilen außerordentlich zu reduzieren. Das wird durch das einfache Teilen jedes Bestandteils im Frequenzgebiet durch eine Konstante für diesen Bestandteil, und dann das Runden zur nächsten ganzen Zahl getan. Diese sich rundende Operation ist die einzige lossy Operation im ganzen Prozess, wenn die DCT Berechnung mit der genug hohen Präzision durchgeführt wird. Infolge dessen ist es normalerweise der Fall, dass viele der höheren Frequenzbestandteile zur Null rund gemacht werden, und viele vom Rest kleine positive oder negative Zahlen werden, die viele weniger Bit nehmen, um zu vertreten.

Eine typische quantization Matrix, wie angegeben, im ursprünglichen JPEG Standard, ist wie folgt:

:

\begin {bmatrix }\

16 & 11 & 10 & 16 & 24 & 40 & 51 & 61 \\

12 & 12 & 14 & 19 & 26 & 58 & 60 & 55 \\

14 & 13 & 16 & 24 & 40 & 57 & 69 & 56 \\

14 & 17 & 22 & 29 & 51 & 87 & 80 & 62 \\

18 & 22 & 37 & 56 & 68 & 109 & 103 & 77 \\

24 & 35 & 55 & 64 & 81 & 104 & 113 & 92 \\

49 & 64 & 78 & 87 & 103 & 121 & 120 & 101 \\

72 & 92 & 95 & 98 & 112 & 100 & 103 & 99

\end {bmatrix}.

</Mathematik>

Die gequantelten DCT Koeffizienten werden mit geschätzt

:

wo die ungequantelten DCT Koeffizienten ist; ist die quantization Matrix oben; und ist die gequantelten DCT Koeffizienten.

Das Verwenden dieser quantization Matrix mit der DCT mitwirkenden Matrix läuft von oben hinaus:

:\left [\begin {Reihe} {rrrrrrrr }\

- 26 &-3 &-6 & 2 & 2 &-1 & 0 & 0 \\

0 &-2 &-4 & 1 & 1 & 0 & 0 & 0 \\

- 3 & 1 & 5 &-1 &-1 & 0 & 0 & 0 \\

- 3 & 1 & 2 &-1 & 0 & 0 & 0 & 0 \\

1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\

0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\

0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\

0 & 0 & 0 & 0 & 0 & 0 & 0 & 0

\end {ordnen }\\right].</Mathematik>

Zum Beispiel, mit 415 (der Gleichstrom-Koeffizient) und sich zur nächsten ganzen Zahl rundend

:

\mathrm {Runde }\

\left (

\frac {-415.38} {16 }\

\right)

\mathrm {Runde }\\left (

- 25.96

\right)

- 26.

</Mathematik>

Das Wärmegewicht-Codieren

Das Wärmegewicht-Codieren ist eine spezielle Form der lossless Datenkompression. Es schließt das Ordnen der Bildbestandteile in eine "zickzackförmige" Ordnung ein, die Algorithmus der Verschlüsselung der Lauf-Länge (RLE) verwendet, dass Gruppen ähnliche Frequenzen zusammen, Länge-Codiernullen und dann das Verwenden von Huffman einfügend, der darauf codiert, was verlassen wird.

Der JPEG Standard erlaubt auch, aber, verlangt Decoder nicht, um den Gebrauch des arithmetischen Codierens zu unterstützen, das als Huffman mathematisch höher ist, der codiert. Jedoch ist diese Eigenschaft selten verwendet worden, weil sie durch Patente historisch bedeckt wurde, die Königtum tragende Lizenzen verlangen, und weil es langsamer ist, um zu verschlüsseln und im Vergleich zu Huffman zu decodieren, der codiert. Das arithmetische Codieren macht normalerweise Dateien um ungefähr 5-7 % kleiner.

Der vorherige gequantelte Gleichstrom-Koeffizient wird verwendet, um vorauszusagen, dass der Strom Gleichstrom-Koeffizienten gequantelt hat. Der Unterschied zwischen den zwei ist

verschlüsselt aber nicht der Ist-Wert. Die Verschlüsselung gequantelter AC Koeffizienten der 63 verwendet solche Vorhersage differencing nicht.

Die zickzackförmige Folge für die obengenannten gequantelten Koeffizienten wird unten gezeigt.

(Das gezeigte Format ist gerade für die Bequemlichkeit des Verstehens/Betrachtung.)

Wenn der I-Th-Block von Bi vertreten wird und Positionen innerhalb jedes Blocks dadurch vertreten werden (p, q), wo p = 0, 1..., 7 und q = 0, 1..., 7, dann kann jeder Koeffizient im DCT Image als Bi (p, q) vertreten werden. So, im obengenannten Schema, ist die Ordnung, Pixel (für den I-Th-Block) zu verschlüsseln, Bi (0,0), Bi (0,1), Bi (1,0), Bi (2,0), Bi (1,1), Bi (0,2), Bi (0,3), Bi (1,2) und so weiter.

Diese Verschlüsselungsweise wird Grundlinie folgende Verschlüsselung genannt. Grundlinie JPEG unterstützt auch progressive Verschlüsselung. Während folgende Verschlüsselung Koeffizienten eines einzelnen Blocks auf einmal verschlüsselt (auf eine zickzackförmige Weise), verschlüsselt progressive Verschlüsselung ähnlich eingestellte Koeffizienten aller Blöcke darin man, geht gefolgt von den folgenden eingestellten Koeffizienten aller Blöcke und so weiter. Also, wenn das Image in N 8×8 Blöcke {B0, B1, B2..., Milliarde 1} geteilt wird, dann verschlüsselt progressive Verschlüsselung Bi (0,0) für alle Blöcke, d. h., für alles ich = 0, 1, 2..., n-1. Dem wird durch die Verschlüsselung von Bi (0,1) Koeffizient aller Blöcke gefolgt, die von Bi (1,0)-th Koeffizient aller Blöcke, dann Bi (2,0)-th Koeffizient aller Blöcke und so weiter gefolgt sind. Es sollte hier bemerkt werden, dass sobald alle ähnlich eingestellten Koeffizienten verschlüsselt worden sind, ist die folgende Position, verschlüsselt zu werden, diejenige, die als nächstes im zickzackförmigen Traversal, wie angezeigt, in der Zahl oben vorkommt. Es ist gefunden worden, dass Grundlinie, die Progressiver JPEG, der gewöhnlich verschlüsselt, besserer Kompression verglichen mit der Grundlinie Folgend JPEG wegen der Fähigkeit gibt, verschiedene Tische von Huffman zu verwenden, die (sieh unten) für verschiedene Frequenzen auf jedem "Ansehen" oder "Pass" geschneidert sind (der ähnlich eingestellte Koeffizienten einschließt), obwohl der Unterschied nicht zu groß ist.

Im Rest des Artikels wird es angenommen, dass das mitwirkende erzeugte Muster wegen der folgenden Weise ist.

Um das obengenannte erzeugte mitwirkende Muster zu verschlüsseln, verwendet JPEG Huffman, der verschlüsselt. JPEG lässt einen speziellen Huffman Wort codieren, für die Folge vorzeitig zu beenden, wenn die restlichen Koeffizienten Null sind.

Das Verwenden dieses speziellen Codewortes: "EOB", die Folge wird:

Die anderen Codewörter von JPEG vertreten Kombinationen von (a) die Zahl von bedeutenden Bit eines Koeffizienten, einschließlich des Zeichens und (b) die Zahl von Konsekutivnullkoeffizienten, die ihm vorangehen. (Sobald Sie wissen, wie viele Bit, um zu erwarten, man 1 Bit braucht, um die Wahlen {-1, +1}, 2 Bit zu vertreten, um die Wahlen {-3, 2, +2, +3} und so weiter zu vertreten.) In unserem Beispiel-Block sind die meisten gequantelten Koeffizienten kleine Zahlen, denen sofort durch einen Nullkoeffizienten nicht vorangegangen wird. Diese mehr - häufige Fälle werden durch kürzere Codewörter vertreten.

Der JPEG Standard stellt Mehrzwecktische von Huffman zur Verfügung; encoders kann auch beschließen, Tische von Huffman zu erzeugen, die für den wirklichen Frequenzvertrieb in Images optimiert sind, die verschlüsseln werden.

Kompressionsverhältnis und Kunsterzeugnisse

Das resultierende Kompressionsverhältnis kann gemäß dem Bedürfnis geändert werden, indem es in den in der quantization Phase verwendeten Teilern mehr oder weniger aggressiv gewesen wird. Zehn zu einer Kompression läuft gewöhnlich auf ein Image hinaus, das nach Augenmaß aus dem Original nicht bemerkenswert sein kann. 100 zu einer Kompression ist gewöhnlich möglich, aber wird ausgesprochen artifacted im Vergleich zum Original schauen. Das passende Niveau der Kompression hängt vom Gebrauch ab, zu dem das Image gestellt wird.

Diejenigen, die das World Wide Web verwenden, können mit den Unregelmäßigkeiten vertraut sein, die als Kompressionskunsterzeugnisse bekannt sind, die in JPEG Images erscheinen, die die Form des Geräusches um sich abhebende Ränder (besonders Kurven und Ecken), oder blocky Images, allgemein bekannt als 'jaggies' annehmen können. Diese sind wegen des quantization Schritts des JPEG Algorithmus. Sie sind um scharfe Ecken zwischen dem Kontrastieren Farben besonders bemerkenswert (Text ist ein gutes Beispiel, weil es viele solche Ecken enthält). Die analogen Kunsterzeugnisse im MPEG Video werden Moskito-Geräusch genannt, weil die resultierende "Rand-Betriebsamkeit" und unechten Punkte, die sich mit der Zeit ändern, Moskitos ähneln, die um den Gegenstand schwärmen.

Diese Kunsterzeugnisse können durch die Auswahl einer niedrigeren Ebene der Kompression reduziert werden; sie können beseitigt werden, indem sie ein Image mit einem lossless Dateiformat sparen, obwohl für fotografische Images das gewöhnlich auf eine größere Dateigröße hinauslaufen wird. Die mit Strahlenaufzeichnungsprogrammen geschaffenen Images haben erkennbare Blocky-Gestalten auf dem Terrain. Bestimmte Kompressionskunsterzeugnisse der niedrigen Intensität könnten annehmbar sein, als sie einfach die Images angesehen haben, aber können betont werden, wenn das Image nachher bearbeitet wird, gewöhnlich auf unannehmbare Qualität hinauslaufend. Denken Sie das Beispiel unten, die Wirkung der lossy Kompression auf einem Flankenerkennungsverarbeitungsschritt demonstrierend.

Einige Programme erlauben dem Benutzer, den Betrag zu ändern, durch den individuelle Blöcke zusammengepresst werden. Stärkere Kompression wird auf Gebiete des Images angewandt, die weniger Kunsterzeugnisse zeigen. Auf diese Weise ist es möglich, JPEG Dateigröße mit weniger Verlust der Qualität manuell zu reduzieren.

JPEG Kunsterzeugnisse, wie pixelation, werden gelegentlich zu künstlerischen Zwecken, als in Jpegs vom deutschen Fotografen Thomas Ruff absichtlich ausgenutzt.

Da die quantization Bühne immer auf einen Verlust der Information hinausläuft, ist JPEG Standard immer eine lossy Kompression codec. (Information wird sowohl im Quanteln als auch in Runden der Schwimmpunkt-Zahlen verloren.), Selbst wenn die quantization Matrix eine Matrix von ist, wird Information noch im sich rundenden Schritt verloren.

Entzifferung

Die Entzifferung, um das Image zu zeigen, besteht daraus, das ganze obengenannte rückwärts zu tun.

Die Einnahme der DCT mitwirkenden Matrix (nach dem Hinzufügen des Unterschieds des Gleichstrom-Koeffizienten zurück in)

:\left [\begin {Reihe} {rrrrrrrr }\ - 26 &-3 &-6 & 2 & 2 &-1 & 0 & 0 \\ 0 &-2 &-4 & 1 & 1 & 0 & 0 & 0 \\ - 3 & 1 & 5 &-1 &-1 & 0 & 0 & 0 \\

- 4 & 1 & 2 &-1 & 0 & 0 & 0 & 0 \\

1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\end {ordnen }\\right]</Mathematik>

und die Einnahme des Zugang-für-Zugang-Produktes mit der quantization Matrix läuft von oben auf hinaus

:\left [\begin {Reihe} {rrrrrrrr }\

- 416 &-33 &-60 & 32 & 48 &-40 & 0 & 0 \\

0 &-24 &-56 & 19 & 26 & 0 & 0 & 0 \\

- 42 & 13 & 80 &-24 &-40 & 0 & 0 & 0 \\

- 42 & 17 & 44 &-29 & 0 & 0 & 0 & 0 \\

18 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\

0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\end {ordnen }\\right]</Mathematik>

der nah der ursprünglichen DCT mitwirkenden Matrix für den spitzenlinken Teil ähnelt.

Der nächste Schritt soll den zweidimensionalen umgekehrten DCT nehmen (ein 2. Typ-III DCT), durch den gegeben wird:

\sum_ {u=0} ^7

\sum_ {v=0} ^7

\alpha (u) \alpha (v) F_ {u, v }\

\cos \left [\frac {\\Pi} {8} \left (x +\frac {1} {2 }\\Recht) u \right] \cos \left [\frac {\\Pi} {8} \left (y +\frac {1} {2 }\\Recht) v \right]</Mathematik>wo
  • ist die Pixel-Reihe für die ganzen Zahlen
  • ist die Pixel-Säule für die ganzen Zahlen
  • wird als oben für die ganzen Zahlen definiert
  • ist der wieder aufgebaute ungefähre Koeffizient an Koordinaten
  • ist der wieder aufgebaute Pixel-Wert an Koordinaten

Das Runden der Produktion zu Werten der ganzen Zahl (seitdem das Original Werte der ganzen Zahl hatte) läuft auf ein Image mit Werten (noch ausgewechselt unten durch 128) hinaus

:\left [\begin {Reihe} {rrrrrrrr }\

- 66 &-63 &-71 &-68 &-56 &-65 &-68 &-46 \\

- 71 &-73 &-72 &-46 &-20 &-41 &-66 &-57 \\

- 70 &-78 &-68 &-17 & 20 &-14 &-61 &-63 \\

- 63 &-73 &-62 &-8 & 27 &-14 &-60 &-58 \\

- 58 &-65 &-61 &-27 &-6 &-40 &-68 &-50 \\

- 57 &-57 &-64 &-58 &-48 &-66 &-72 &-47 \\

- 53 &-46 &-61 &-74 &-65 &-63 &-61 &-45 \\

- 47 &-34 &-53 &-74 &-60 &-47 &-47 &-41

\end {ordnen }\\right]</Mathematik>

und 128 zu jedem Zugang beitragend

:\left [\begin {Reihe} {rrrrrrrr }\

62 & 65 & 57 & 60 & 72 & 63 & 60 & 82 \\

57 & 55 & 56 & 82 & 108 & 87 & 62 & 71 \\

58 & 50 & 60 & 111 & 148 & 114 & 67 & 64 \\

65 & 55 & 66 & 120 & 155 & 114 & 68 & 70 \\

70 & 63 & 67 & 101 & 122 & 88 & 60 & 78 \\

71 & 71 & 64 & 70 & 80 & 62 & 56 & 81 \\

75 & 82 & 67 & 54 & 63 & 65 & 66 & 83 \\

81 & 95 & 75 & 54 & 68 & 81 & 81 & 87

\end {ordnen }\\right].</Mathematik>

Das ist das dekomprimierte Subimage. Im Allgemeinen kann der Dekompressionsprozess Werte außerhalb der ursprünglichen Eingangsreihe dessen erzeugen. Wenn das vorkommt, muss der Decoder die Produktionswerte klammern behalten sie innerhalb dieser Reihe, um Überschwemmung zu verhindern, wenn man das dekomprimierte Image mit der ursprünglichen Bit-Tiefe versorgt.

Das dekomprimierte Subimage kann im Vergleich zum ursprünglichen Subimage sein (auch sehen Images nach rechts) durch die Einnahme des Unterschieds (ursprünglich  unkomprimiert) läuft auf die folgenden Fehlerwerte hinaus:

:\left [\begin {Reihe} {rrrrrrrr }\

- 10 &-10 & 4 & 6 & 2 & 2 & 4 &-9 \\

6 & 4 &-1 & 8 & 1 &-2 & 7 & 1 \\

4 & 9 & 8 & 2 &-4 &-10 &-1 & 8 \\

- 2 & 3 & 5 & 2 &-1 &-8 & 2 &-1 \\

- 3 &-2 & 1 & 3 & 4 & 0 & 8 &-8 \\

8 &-6 &-4 & 0 &-3 & 6 & 2 &-6 \\

10 &-11 &-3 & 5 &-8 &-4 &-1 & 0 \\

6 &-15 &-6 & 14 &-3 &-5 &-3 & 7

\end {ordnen }\\right]</Mathematik>

mit einem durchschnittlichen absoluten Fehler von ungefähr 5 Werten pro Pixel (d. h.,).

Der Fehler ist in der Ecke unten links am meisten bemerkenswert, wo unten links Pixel dunkler wird als das Pixel zu seinem unmittelbaren Recht.

Erforderliche Präzision

Die Verschlüsselungsbeschreibung im JPEG Standard befestigt die für das zusammengepresste Image der Produktion erforderliche Präzision nicht. Jedoch schließen der JPEG Standard (und die ähnlichen MPEG Standards) einige Präzisionsvoraussetzungen für die Entzifferung, einschließlich aller Teile des Entzifferungsprozesses (Entzifferung der variablen Länge, umgekehrter DCT, dequantization, Wiedernormalisierung von Produktionen) ein; die Produktion vom Bezugsalgorithmus muss nicht zu weit gehen:

  • ein maximales 1 Bit des Unterschieds für jeden Pixel-Bestandteil
  • meinen Sie niedrig, dass der Quadratfehler über jedes 8×8-Pixel blockiert
  • sehr niedrig blockiert der Mittelfehler über jedes 8×8-Pixel
  • haben Sie sehr niedrig Quadratfehler über das ganze Image vor
  • haben Sie äußerst niedrig Fehler über das ganze Image vor

Diese Behauptungen werden auf einem großen Satz von Randomized-Eingangsimages geprüft, um die Grenzfälle zu behandeln. Der ehemalige IEEE 1180-1990 Standard hat einige ähnliche Präzisionsvoraussetzungen enthalten. Die Präzision hat eine Folge auf der Durchführung von Decodern, und es ist kritisch, weil etwas Verschlüsselung in einer Prozession geht (namentlich verwendet, um Folgen von Images wie MPEG zu verschlüsseln), muss im Stande sein, auf der encoder Seite zu bauen, eine Verweisung hat Image decodiert. Um 8-Bit-Präzision pro Pixel-Teilproduktion, dequantization zu unterstützen und sich umgekehrter DCT verwandelt, werden normalerweise mit mindestens 14 Bit Präzision in optimierten Decodern durchgeführt.

Effekten der JPEG Kompression

JPEG Kompressionskunsterzeugnisse verschmelzen gut in Fotographien mit ausführlichen ungleichförmigen Texturen, höhere Kompressionsverhältnisse erlaubend. Bemerken Sie, wie ein höheres Kompressionsverhältnis zuerst die Hochfrequenztexturen an der ober verlassenen Ecke des Images betrifft, und wie die sich abhebenden Linien krauser werden. Das sehr hohe Kompressionsverhältnis betrifft streng die Qualität des Images, obwohl die gesamten Farben und Bildform noch erkennbar sind. Jedoch, die Präzision von Farben ertragen weniger (für ein menschliches Auge) als die Präzision von Konturen (gestützt auf der Klarheit). Das rechtfertigt die Tatsache, dass Images zuerst in einem Farbenmodell umgestaltet werden sollten, das die Klarheit von der chromatischen Information, vor der Probenteilung die chromatischen Flugzeuge trennt (der auch niedrigere Qualität quantization verwenden kann), um die Präzision des Klarheitsflugzeugs mit mehr Informationsbit zu bewahren.

Beispielfotographien

Für die Information würden die unkomprimierten 24 Bit RGB bitmap Image unten (73,242 Pixel) 219,726 Bytes verlangen (aller anderen Informationskopfbälle ausschließend). Die filesizes, die unten angezeigt sind, schließen die inneren JPEG Informationskopfbälle und einige Meta-Daten ein.

Für Images der höchsten Qualität (Q=100) ist Pixel von ungefähr 8.25 Bit pro Farbe erforderlich. Auf grayscale Images ist ein Minimum von 6.5 Bit pro Pixel genug (eine vergleichbare Q=100 Qualitätsfarbeninformation verlangt um ungefähr 25 % mehr verschlüsselte Bit). Das Image der höchsten Qualität unter (Q=100) wird an 9-Bit-ProFarbepixel verschlüsselt, das mittlere Qualitätsimage (Q=25) verwendet 1-Bit-ProFarbepixel. Für die meisten Anwendungen sollte der Qualitätsfaktor nicht unter 0.75 Bit pro Pixel (Q=12.5), wie demonstriert, durch das niedrige Qualitätsimage gehen. Das Image an der niedrigsten Qualität verwendet nur 0.13 Bit pro Pixel, und zeigt sehr schlechte Farbe, es konnte nur nach der Probenteilung zu einer viel niedrigeren Anzeigegröße verwendbar sein.

::

Das mittlere Qualitätsfoto verwendet nur 4.3 % des Abstellraums, der für das unkomprimierte Image erforderlich ist, aber hat wenig erkennbaren Verlust des Details oder der sichtbaren Kunsterzeugnisse. Jedoch, sobald eine bestimmte Schwelle der Kompression passiert wird, zeigen komprimierte Images immer mehr sichtbare Defekte. Sieh den Artikel über die Rate-Verzerrungstheorie für eine mathematische Erklärung dieser Schwellenwirkung. Eine besondere Beschränkung von JPEG ist in dieser Beziehung sein nichtübergegriffenes 8×8 Block gestaltet Struktur um. Modernere Designs wie JPEG 2000 und JPEG XR stellen eine anmutigere Degradierung der Qualität als die Bit-Gebrauch-Abnahmen - durch das Verwenden aus, verwandeln sich mit einem größeren Raumausmaß für die niedrigeren Frequenzkoeffizienten, und durch das Verwenden der Überschneidung gestalten Basisfunktionen um.

Lossless weitere Kompression

Von 2004 bis 2008 ist neue Forschung auf Wegen zur weiteren Kompresse die Daten erschienen, die in JPEG Images enthalten sind, ohne das vertretene Image zu modifizieren. Das hat Anwendungen in Drehbüchern, wo das ursprüngliche Image nur im JPEG-Format verfügbar ist, und seine Größe für den archivalischen oder die Übertragung reduziert werden muss. Standardmehrzweckkompressionswerkzeuge können JPEG Dateien nicht bedeutsam zusammenpressen.

Gewöhnlich nutzen solche Schemas Verbesserungen zum naiven Schema aus, um DCT Koeffizienten zu codieren, der scheitert in Betracht zu ziehen:

  • Korrelationen zwischen Umfängen von angrenzenden Koeffizienten in demselben Block;
  • Korrelationen zwischen Umfängen desselben Koeffizienten in angrenzenden Blöcken;
  • Korrelationen zwischen Umfängen desselben Koeffizienten/Blocks in verschiedenen Kanälen;
  • Die Gleichstrom-Koeffizienten, ähneln wenn genommen, zusammen einer downscale Version des ursprünglichen mit einem Skalenfaktor multiplizierten Images. Wohl bekannte Schemas für das Lossless-Codieren von Halbton-Images können angewandt werden, etwas bessere Kompression erreichend, als der Huffman in JPEG verwendeten DPCM codiert hat.

Einige normale, aber selten verwendete Optionen bestehen bereits in JPEG, um die Leistungsfähigkeit zu verbessern, DCT Koeffizienten zu codieren: Die Arithmetik-Codierauswahl und die progressive Codierauswahl (der tiefer bitrates erzeugt, weil Werte für jeden Koeffizienten unabhängig codiert werden, und jeder Koeffizient hat einen bedeutsam verschiedenen Vertrieb). Moderne Methoden haben diese Techniken durch Umstellungskoeffizienten übertroffen, um Koeffizienten des größeren Umfangs zusammen zu gruppieren; das Verwenden angrenzender Koeffizienten und Blöcke, um neue mitwirkende Werte vorauszusagen; das Zerteilen von Blöcken oder Koeffizienten unter einer kleinen Zahl von unabhängig codierten Modellen, die auf ihrer Statistik und angrenzenden Werten gestützt sind; und am meisten kürzlich, durch die Entzifferung von Blöcken, das Voraussagen nachfolgender Blöcke im Raumgebiet, und dann die Verschlüsselung von diesen, um Vorhersagen für DCT Koeffizienten zu erzeugen.

Gewöhnlich können solche Methoden vorhandene JPEG Dateien zwischen 15 und 25 Prozent, und für bei Einstellungen der niedrigen Qualität zusammengepressten JPEGs zusammenpressen, kann Verbesserungen von bis zu 65 % erzeugen.

Ein frei verfügbares Werkzeug hat gerufen packJPG basiert auf dem 2007-Papier "Hat die Überfülle-Verminderung für JPEG Dateien verbessert." Es gibt auch mindestens zwei Gesellschaften, die Eigentumswerkzeuge mit ähnlichen Fähigkeiten, dem JPACK von Infima und Schmied StuffIt der Mikrosoftware verkaufen, von denen beide behaupten, während Patente auf ihren jeweiligen Technologien zu haben.

Abgeleitete Formate für den 3D stereoskopischen

Stereoskopischer JPEG

JPEG Stereoskopisch (JPS, Erweiterung.jps) ist ein JPEG-basiertes Format für stereoskopische Images. Es hat eine Reihe von Konfigurationen, die im JPEG APP3 Anschreiber-Feld versorgt sind, aber enthält gewöhnlich ein Image der doppelten Breite, zwei Images der identischen Größe im schielenden (d. h. verlassener Rahmen auf der richtigen Hälfte des Images und umgekehrt) nebeneinander Einordnung vertretend. Dieses Dateiformat kann als ein JPEG ohne jede spezielle Software angesehen werden oder kann bearbeitet werden, um in anderen Weisen zu machen.

JPEG Mehrbildformat

JPEG Mehrbildformat (MPO, Erweiterung.mpo) ist ein JPEG-basiertes Format für Mehransicht-Images. Es enthält zwei oder mehr JPEG Dateien verkettet zusammen. Es gibt auch spezielle EXIF Felder, die seinen Zweck beschreiben. Das wird von Fujifilm FinePix Echte W1 3D-Kamera, Panasonic Lumix DMC-TZ20 & DMC-TS4 (FT4), Sony DSC-HX7V, HTC Evo 3D, der JVC GY-HMZ1U AVCHD/MVC Erweiterungskamera und von Nintendo 3DS für seine 3D-Kamera verwendet.

Offene Probleme

2002 hat Forgent Networks behauptet, dass es sich bekannt hat und offene Rechte bei der JPEG Technologie geltend machen würde, aus einem Patent entstehend, das am 27. Oktober 1986 abgelegt, und am 6. Oktober 1987 gewährt worden war. Die Ansage hat eine an die Versuche von Unisys erinnernde Modeerscheinung geschaffen, seine Rechte über den GIF Bildkompressionsstandard zu behaupten.

Das JPEG Komitee hat die offenen Ansprüche 2002 untersucht und war von der Meinung, dass sie durch die vorherige Kunst ungültig gemacht wurden. Andere haben auch beschlossen, dass Forgent kein Patent hatte, das JPEG bedeckt hat. Dennoch, zwischen 2002 und 2004 Forgent ist im Stande gewesen, ungefähr US$ 105 Millionen durch das Genehmigen ihres Patents ungefähr 30 Gesellschaften zu erhalten. Im April 2004 hat Forgent 31 andere Gesellschaften verklagt, um weitere Lizenzzahlungen geltend zu machen. Im Juli desselben Jahres hat ein Konsortium von 21 großen Computergesellschaften eine Gegenklage mit der Absicht abgelegt, das Patent ungültig zu machen. Außerdem hat Microsoft eine getrennte Rechtssache gegen Forgent im April 2005 gestartet. Im Februar 2006 ist das USA-Patent- und Handelsmarke-Büro bereit gewesen, das JPEG-Patent von Forgent auf Bitte vom Öffentlichen Offenen Fundament nochmals zu prüfen. Am 26. Mai 2006 hat der USPTO den offenen Invaliden gestützt auf der vorherigen Kunst gefunden. Der USPTO hat auch gefunden, dass Forgent über die vorherige Kunst gewusst hat, und dem Patentamt nicht erzählt hat, jede Bitte machend, das Patent wieder einzusetzen, um hoch kaum erfolgreich zu sein.

Forgent besitzt auch ein ähnliches Patent, das vom europäischen Patentamt 1994 gewährt ist, obwohl es unklar ist, wie durchsetzbar es ist.

Bezüglich am 27. Oktober 2006 scheint der 20-jährige Begriff des amerikanischen Patents, und im November 2006 abgelaufen zu sein, Forgent ist bereit gewesen, Erzwingung von offenen Ansprüchen gegen Gebrauch des JPEG Standards aufzugeben.

Das JPEG Komitee hat als eine seiner ausführlichen Absichten, dass ihre Standards (insbesondere ihre Grundlinie-Methoden), implementable ohne Zahlung von Lizenzgebühren sein, und sie passende Lizenzrechte für ihren kommenden JPEG 2000-Standard von mehr als 20 großen Organisationen gesichert haben.

Im August 2007, eine andere Gesellschaft beginnend, hat Global Patent Holdings, LLC behauptet, dass sein Patent ausgegeben 1993, durch das Herunterladen von JPEG Images entweder auf einer Website oder durch die E-Mail gebrochen wird. Wenn nicht ungültig gemacht konnte dieses Patent für jede Website gelten, die JPEG Images zeigt. Das Patent ist im Juli 2007 im Anschluss an eine siebenjährige Nachprüfung durch das amerikanische Patent- und Handelsmarke-Büro erschienen, in dem alle ursprünglichen Ansprüche des Patents widerrufen wurden, aber ein zusätzlicher Anspruch (Forderung 17) wurde bestätigt.

In seinen ersten zwei Rechtssachen im Anschluss an die Nachprüfung haben beide in Chicago, Illinois abgelegt, Global Patent Holdings hat die Grünen Kastanienbraunen Verpacker, CDW, Motorola, den Apfel, Orbitz, Officemax, die Raupe, Kraft und Peapod als Angeklagte verklagt. Eine dritte Klage wurde am 5. Dezember 2007 im Südlichen Florida gegen ADT Security Services, AutoNation, Florida Crystals Corp., HearUSA, MovieTickets.com, Ocwen Financial Corp. und Reifenkönigreich und eine vierte Rechtssache am 8. Januar 2008 im Südlichen Florida gegen Boca Raton Resort & Club eingereicht. Eine fünfte Klage wurde gegen Global Patent Holdings in Nevada eingereicht. Diese Klage wurde von Zappos.com, Inc. eingereicht, die von Global Patent Holdings angeblich bedroht wurde, und eine gerichtliche Behauptung sucht, dass das '341 Patent ungültig und nicht gebrochen ist.

Global Patent Holdings hatte auch das '341 Patent verwendet, um freimütige Kritiker von breiten Softwarepatenten, einschließlich Gregory Aharonians und des anonymen Maschinenbedieners einer Website blog bekannt als der "Offene Troll-Spurenleser zu verklagen oder ihnen zu drohen." Am 21. Dezember 2007 hat der offene Rechtsanwalt Vernon Francissen aus Chicago das amerikanische Patent- und Handelsmarke-Büro gebeten, den alleinigen restlichen Anspruch des '341 Patents auf der Grundlage von der neuen vorherigen Kunst nochmals zu prüfen.

Am 5. März 2008 ist das amerikanische Patent- und Handelsmarke-Büro bereit gewesen, das '341 Patent nochmals zu prüfen, findend, dass die neue vorherige Kunst wesentliche neue Fragen bezüglich der Gültigkeit des Patents aufgebracht hat. Im Licht der Nachprüfung haben die angeklagten Verletzer in vier der fünf während Rechtssachen Bewegungen abgelegt aufzuheben (bleiben) ihre Fälle bis zur Vollziehung der amerikanischen Patent- und Handelsmarke-Bürorezension des '341 Patents. Am 23. April 2008, ein Richter, der die zwei Rechtssachen in Chicago leitet, hat Illinois die Bewegungen in jenen Fällen gewährt. Am 22. Juli 2008 hat das Patentamt die erste "Bürohandlung" der zweiten Nachprüfung ausgegeben, den auf neunzehn getrenntem Boden gestützten Anspruch-Invaliden findend. Am 24. November 2009 wurde ein Nachprüfungszertifikat ausgegeben, alle Ansprüche annullierend.

Standards

Hier sind einige Beispiele von Standards, die durch ISO/IEC JTC1 SC29 Arbeitsgruppe 1 geschaffen sind (WG 1), der Joint Photographic Experts Group und Gemeinsame Bi-Niveau-Bildexperte-Gruppe einschließt:

  • JPEG (lossy und lossless): ITU-T T.81, ISO/IEC 10918-1
  • JPEG Erweiterungen: ITU-T T.84
  • JPEG-LS (lossless, verbessert): ITU-T T.87, ISO/IEC 14495-1
  • JBIG (lossless, Bi-Niveau-Bilder, Fax): ITU-T T.82, ISO/IEC 11544
  • JBIG2 (Bi-Niveau-Bilder): ITU-T T.88, ISO/IEC 14492
  • JPEG 2000: ITU-T T.800, ISO/IEC 15444-1
  • JPEG 2000-Erweiterungen: ITU-T T.801
  • JPEG XR (hat früher HD Foto vor der Standardisierung genannt): ITU-T T.832, ISO/IEC 29199-2

Siehe auch

  • C-Würfel ein früher implementer von JPEG im Span bildet
  • Der Vergleich der Grafikdatei formatiert
  • Vergleich von Lay-Out-Motoren (Grafik)
  • Filter von Deblocking (Video), die ähnlichen deblocking Methoden konnten auf JPEG angewandt werden
  • Designregel für das Kameradateisystem (DCF)
  • Austauschbares Bilddateiformat (Exif)
  • Dateierweiterungen
  • Generationsverlust
  • Grafikredigieren-Programm
  • Bildkompression
  • Bilddatei formatiert
  • JPEG 2000
  • JPEG File Interchange Format (JFIF)
  • JPEG XR
  • Lenna, das traditionelle Standardimage hat gepflegt, Bildverarbeitungsalgorithmen zu prüfen
  • Libjpeg von Independent JPEG Group
  • Lossless Image Codec FELICS
  • Bewegung JPEG
  • PGF
  • PNG

Links


Jerome / Joseph Severn
Impressum & Datenschutz