MPEG-4 Teil 3

MPEG-4 Teil 3 oder MPEG-4 Audio-(formell ISO/IEC 14496-3) ist der dritte Teil des ISO/IEC MPEG-4 internationaler von Moving Picture Experts Group entwickelter Standard. Es gibt Audiocodiermethoden an. Die erste Version von ISO/IEC 14496-3 wurde 1999 veröffentlicht.

Der MPEG-4 Teil 3 besteht aus einer Vielfalt von Audiocodiertechnologien - vom lossy Rede-Codieren (HVXC, CELP), das allgemeine Audiocodieren (AAC, TwinVQ, BSAC), lossless Audiokompression (MPEG-4 SLS, das Audiolossless-Codieren, die MPEG-4 Sommerzeit), Text-To-Speech Interface (TTSI), Strukturiertes Audio (SAOL, SASL, MIDI verwendend) und viele zusätzliche Audiosynthese und Techniken codierend.

Audio-MPEG-4 nimmt keine einzelne Anwendung wie Echtzeittelefonie oder Qualitätsaudiokompression ins Visier. Es gilt für jede Anwendung, die den Gebrauch von fortgeschrittener gesunder Kompression, Synthese, Manipulation oder Play-Back verlangt.

Audio-MPEG-4 ist ein neuer Typ des Audiostandards, der zahlreiche verschiedene Typen des Audiocodierens integriert: natürlicher gesunder und synthetischer Ton, niedrige bitrate Übergabe und Qualitätsübergabe, Rede und Musik, komplizierte Soundtracks und einfache, traditioneller zufriedener und interaktiver Inhalt.

Versionen

Subteile

MPEG-4 Teil 3 enthält folgende Subteile:

  • Subteil 1: Wichtig (Liste von Audioobjektarten, Profile, Niveaus, verbinden zu ISO/IEC 14496-1, MPEG-4 Audiotransportstrom, usw.)
  • Subteil 2: Das Rede-Codieren - HVXC (Das harmonische Vektor-Erregungscodieren)
  • Subteil 3: Das Rede-Codieren - CELP (Code Aufgeregte Geradlinige Vorhersage)
  • Subteil 4: Das Allgemeine Audiocodieren (GA) (Zeit/Frequenz Codierend) - AAC, TwinVQ, BSAC
  • Subteil 5: Structured Audio (SA)
  • Subteil 6: Text zur Rede-Schnittstelle (TTSI)
  • Subteil 7: Das Parametrische Audiocodieren - HILN (Harmonische und Individuelle Linie plus das Geräusch)
  • Subteil 8: Technische Beschreibung des parametrischen Codierens für die hohe Qualität Audio-(SSC, Parametrisches Stereo)
  • Subteil 9: MPEG-1/MPEG-2 Audio-in MPEG-4
  • Subteil 10: Technische Beschreibung des Lossless-Codierens des überprobierten Audios (MPEG-4 Sommerzeit - Direkte Strom-Übertragung)
  • Subteil 11: Audiolossless, der (ALS) Codiert
  • Subteil 12: Ersteigbarer Lossless, der (SLS) Codiert

MPEG-4 Audioobjektarten

Audio-MPEG-4 schließt ein System ein, für eine verschiedene Gruppe von Audioformaten in einer gleichförmigen Sache zu behandeln. Jedes Format wird eine einzigartige Audioobjektart zugeteilt, um es zu vertreten. Objektart wird verwendet, um zwischen verschiedenen Codiermethoden zu unterscheiden. Es bestimmt direkt die MPEG-4 Werkzeug-Teilmenge, die erforderlich ist, einen spezifischen Gegenstand zu decodieren. Die MPEG-4 Profile basieren auf den Objektarten, und jedes Profil unterstützt verschiedene Liste von Objektarten.

Audioprofile

Der MPEG-4 Audiostandard definiert mehrere Profile. Diese Profile basieren auf den Objektarten, und jedes Profil unterstützt verschiedene Liste von Objektarten. Jedes Profil kann auch mehrere Niveaus haben, die einige Rahmen der Werkzeug-Gegenwart in einem Profil beschränken. Diese Rahmen sind gewöhnlich die ausfallende Rate und die Zahl von Audiokanälen decodiert zur gleichen Zeit.

Audiolagerung und Transport

Es gibt keinen Standard für den Transport von elementaren Strömen über einen Kanal, weil die breite Reihe von MPEG-4 Anwendungen Liefervoraussetzungen hat, die zu breit sind, um mit einer einzelnen Lösung leicht zu charakterisieren.

Die Fähigkeiten zu einer Transportschicht und der Kommunikation zwischen dem Transport, Mehrfach-, und entschachteln Funktionen werden in Delivery Multimedia Integration Framework (DMIF) in ISO/IEC 14496-6 beschrieben. Ein großes Angebot an Liefermechanismen besteht unter dieser Schnittstelle, z.B, MPEG Transportstrom, Real-time Transport Protocol (RTP) usw.

Transport in Realtime Transportprotokoll wird in RFC 3016 (RTP Nutzlast-Format für MPEG-4 Audio/visuelle Ströme), RFC 3640 (RTP Nutzlast-Format für den Transport von MPEG-4 Elementaren Strömen), RFC 4281 (Der Codecs Parameter für "Eimer"-Sektorformate) und RFC 4337 (PANTOMIME-Typ-Registrierung für MPEG-4) definiert.

LATM und LOAS wurden für natürliche Audioanwendungen definiert, die das hoch entwickelte Gegenstand-basierte Codieren oder die anderen durch MPEG-4 Systeme zur Verfügung gestellten Funktionen nicht verlangen.

Gabelung im AAC technischen Standard

Das Fortgeschrittene Audiocodieren im MPEG-4 Teil 3 (MPEG-4 Audio-) Subteil 4 wurde hinsichtlich des MPEG-2 vorherigen normalen Teils 7 erhöht (das Fortgeschrittene Audiocodieren), um bessere gesunde Qualität für eine gegebene Verschlüsselung bitrate zur Verfügung zu stellen.

Es wird angenommen, dass irgendwelche Unterschiede des Teils 3 und Teils 7 durch den ISO Standardkörper in der nahen Zukunft gebügelt werden, um die Möglichkeit der Zukunft bitstream Inkompatibilitäten zu vermeiden. Zurzeit gibt es keinen bekannten Spieler oder codec Inkompatibilitäten wegen der Neuheit des Standards.

Der MPEG-2 Standard des Teils 7 (das Fortgeschrittene Audiocodieren) wurde zuerst 1997 veröffentlicht und bietet drei Verzug-Profile an: Niedriges Kompliziertheitsprofil (LC), Hauptprofil und Ersteigbares Ausfallendes Rate-Profil (SSR).

Der MPEG-4 Subteil 4 des Teils 3 (das Allgemeine Audiocodieren) hat die Profile vom MPEG-2 Teil 7 mit Perceptual Noise Substitution (PNS) verbunden und hat sie als Audioobjektarten (AAC LC, AAC Wichtig, AAC SSR) definiert.

ER-AAC

Hohe Leistungsfähigkeit das Fortgeschrittene Audiocodieren ist eine Erweiterung von AAC LC, geisterhafte Band-Erwiderung (SBR) und Parametric Stereo (PS) verwendend. Es wird entworfen, um Codierleistungsfähigkeit an niedrigem bitrates durch das Verwenden teilweiser parametrischer Darstellung des Audios zu vergrößern.

AAC-SSR

AAC Ersteigbare Beispielrate wurde von Sony in die MPEG-2 Standards des Teils 3 des Teils 7 und MPEG-4 eingeführt. Es wurde zuerst in ISO/IEC 13818-7, Teil 7 veröffentlicht: Advanced Audio Coding (AAC) 1997. Das Audiosignal wird zuerst in 4 Bänder gespalten, die eine 4 Band-Polyphase-Quadratur-Filterbank verwenden. Dann werden diese 4 Bänder weiter mit MDCTs mit einer Größe k 32 oder 256 Proben gespalten. Das ist normalem AAC LC ähnlich, der MDCTs mit einer Größe k 128 oder 1024 direkt auf dem Audiosignal verwendet.

Der Vorteil dieser Technik besteht darin, dass kurze Block-Schaltung getrennt für jedes PQF Band getan werden kann. So können hohe Frequenzen mit einem kurzen Block verschlüsselt werden, um zeitliche Entschlossenheit zu erhöhen, können niedrige Frequenzen noch mit der hohen geisterhaften Entschlossenheit verschlüsselt werden. Jedoch wegen aliasing zwischen den 4 PQF Bändern, die Wirksamkeit codieren, sind (ungefähr 1,2,3) * fs/8 schlechter als normaler MPEG-4 AAC LC.

MPEG-4 AAC-SSR ist ATRAC und ATRAC-3 sehr ähnlich.

Warum AAC-SSR eingeführt wurde

Die Idee hinter AAC-SSR war nicht nur der Vorteil, der oben, sondern auch die Möglichkeit verzeichnet ist, die Datenrate durch das Entfernen 1, 2 oder 3 der oberen PQF Bänder zu reduzieren. Ein sehr einfacher bitstream splitter kann diese Bänder entfernen und so den bitrate und die Beispielrate reduzieren.

Beispiel:

  • 4 Subbänder: bitrate = 128 kbit/s, Beispielrate = 48 Kilohertz, f_lowpass = 20 Kilohertz
  • 3 Subbänder: bitrate ~ 120 kbit/s, Beispielrate = 48 Kilohertz, f_lowpass = 18 Kilohertz
  • 2 Subbänder: bitrate ~ 100 kbit/s, Beispielrate = 24 Kilohertz, f_lowpass = 12 Kilohertz
  • 1 Subband: bitrate ~ 65 kbit/s, Beispielrate = 12 Kilohertz, f_lowpass = 6 Kilohertz

Zeichen: Obwohl möglich, ist die resultierende Qualität viel schlechter als typischer

für diesen bitrate. So für normale 64 kbit/s AAC LC eine Bandbreite von 14-16 Kilohertz ist

erreicht durch das Verwenden der Intensität reduzierter und Stereo-NMRs. Das erniedrigt hörbare Qualität

weniger als das Übertragen der 6-Kilohertz-Bandbreite mit der vollkommenen Qualität.

BSAC

Bit das Aufgeschnittene Arithmetische Codieren ist ein MPEG-4 Standard (ISO/IEC 14496-3 Subteil 4) für das ersteigbare Audiocodieren. BSAC verwendet ein alternatives geräuschloses Codieren an AAC mit dem Rest der Verarbeitung, die zu AAC identisch ist. Diese Unterstützung für die Skalierbarkeit berücksichtigt fast durchsichtige gesunde Qualität an 64 kbit/s und anmutige Degradierung an niedrigeren Bit-Raten. Das BSAC Codieren wird am besten im Rahmen 40 kbit/s für 64 kbit/s durchgeführt, obwohl es im Rahmen 16 kbit/s zu 64 kbit/s funktioniert. Der AAC-BSAC codec wird in Anwendungen von Digital Multimedia Broadcasting (DMB) verwendet.

Das Genehmigen

2002 hat das MPEG-4 Audiogenehmigen des Komitees Über Licensing Corporation als das Genehmigen des Verwalters für die MPEG-4 offene Audiolache ausgewählt.

Siehe auch

  • TwinVQ - eine der Objektarten, die in der MPEG-4 Audioversion 1 definiert sind
  • MPEG-4 Teil 2
  • MPEG-4 Behälterformat (MP4) des Teils 14
  • Digitalrecht-Management
  • Advanced Audio Coding (AAC)

Links


ISO 3166-2: AE / Haruhiko Mikimoto
Impressum & Datenschutz