MPEG-2

Ikke å forveksle med MPEG-1 Audio Layer 2

Moving Picture Experts Group 2 (MPEG-2) er betegnelsen for en gruppe video- og lydkodingsstandarder som er avtalt av Moving Picture Experts Group ( MPEG), og publisert som ISO 13818 -standarden. 2 brukes vanligvis for å kode lyd og video for kringkastingssignaler, inkludertdigital bakkenett, satellitt og kabel-TV. MPEG-2. Med noen modifikasjoner er det ogsåkodingsformatetbrukes avSVCD-og DVD-filmplater.

MPEG-2 ligner på MPEG-1 , men gir også støtte for interlaced video (formatet som brukes av fjernsyn.) MPEG-2-video er ikke optimalisert for lave bithastigheter (mindre enn 1 Mbit/s ), men den overgår ytelsen til MPEG-1 ved 3 Mbit/s og høyere.

MPEG-2 introduserer og definerer Transport Streams, som er designet for å transportere digital video og lyd over uforutsigbare og ustabile medier, og brukes i TV-sendinger. Med noen forbedringer er MPEG-2 også gjeldende standard for HDTV -sendinger . En dekoder som er i samsvar med MPEG-2-standarden skal kunne spille MPEG-1.

MPEG-2-lyd, definert i del 3 av standarden, forbedrer MPEG-1-lyd ved å tilpasse kodingen av lydprogrammer med mer enn to kanaler. Del 3 av standarden gjør det mulig å gjøre den bakoverkompatibel, slik at MPEG-1 lyddekodere kan dekode stereokomponenten til de to masterkanalene, eller på en ikke-bakoverkompatibel måte, noe som gjør at kodere kan utnytte tilgjengelig båndbredde bedre. . MPEG-2 støtter ulike lydformater, inkludert MPEG-2 AAC .

MPEG-2-standarden

Generell informasjon om MPEG-2 Video og MPEG-2 Audio unntatt modifikasjoner når de brukes på DVD/ DVB .

En typisk MPEG-2 System Stream består av to elementer:

videodata + tidsstempler lyddata + tidsstempler

MPEG-2 videokoding (forenklet)

MPEG-2 er for generisk koding av bevegelige bilder og tilhørende lyd som lager en videostrøm ved hjelp av tre typer rammedata (intrarammer, forutsigbare postrammer og forutsigbare toveisrammer) arrangert i en bestemt rekkefølge kalt "The structure GOP" (GOP = Group Of Pictures eller gruppe av bilder).

Generelt er kildematerialet en videosekvens med en pikseloppløsning forhåndsinnstilt på 25 eller 29,97 bilder per sekund med lyd.

MPEG-2 støtter både progressive og interlaced skannede videostrømmer. I progressive scan-strømmer er den grunnleggende kodingsenheten et felt. I diskusjonen nedenfor refererer de generiske begrepene "ramme" og "bilde" til enten felt eller rammer, avhengig av typen strøm.

MPEG-2-strømmen består av en serie kodede bilderammer. De tre måtene å kode et bilde på er: intra-kodet (I-ramme), bakre forutsigbar (P-ramme) og forutsigbar toveis (B-ramme).

Videobildet er delt i to deler: luminans (Y) og chroma (også kalt fargeforskjellssignaler U og V) på sin side er delt inn i "makroblokker" som er den grunnleggende enheten i et bilde. Hver makroblokk er delt inn i fire 8X8 luminansblokker. Antallet 8X8s chroma-blokker avhenger av fargeformatet til skriften. For eksempel i det vanlige 4:2:0-formatet er det én kromablokk per makroblokk for hver kanal, noe som utgjør totalt seks blokker per makroblokk.

I tilfellet med I-rammer, den faktiske bildeinformasjonen som sendes gjennom kodingsprosessen beskrevet nedenfor, blir P- og B-rammer først utsatt for en "bevegelseskompensasjonsprosess", der de korreleres med bildet. forrige (og i tilfelle av I-rammer) tabell B, følgende). Hver makroblokk i P- eller B-bildet er så assosiert med et område i forrige eller neste bilde som er godt korrelert med ett av disse. "Bevegelsesvektoren" som kartlegger makroblokken til dets kartlagte område, blir kodet, og deretter sendes forskjellen mellom de to områdene gjennom kodingsprosessen beskrevet nedenfor. Hver blokk behandles med en 8X8 diskret cosinustransformasjon ( DCT ). Den resulterende DCT -koeffisienten blir deretter kvantisert i henhold til et forhåndsdefinert skjema, omorganisert til en maksimal sannsynlighet for en lang rad med nuller og kodet. Til slutt brukes en Huffman-kodingsalgoritme med fast tabell.

I-rammer koder for romlig redundans, mens B- og P-rammer koder for tidsredundans. Fordi tilstøtende rammer ofte er godt korrelert, kan P-rammer være 10 % av størrelsen på en I-ramme, og B-ramme 2 % av størrelsen.

Sekvensen av ulike typer rammer kalles strukturen til bildegrupper (GOP). Det er mange mulige strukturer, men en vanlig er 15 bilder lang, og har sekvensen I_BB_P_BB_P_BB_P_BB_P_BB_. En lignende sekvens på 12 rammer er også vanlig. Forholdet mellom I-, P- og B-rammer i GOP-strukturen bestemmes av arten til videostrømmen og båndbredden som begrenser strømmen, og kodingstid kan være et viktig problem. Dette gjelder spesielt i direktesendinger og i sanntidsmiljøer med begrensede datakilder, en strøm som inneholder flere B-rammer kan ta tre ganger så lang tid å kode enn en fil som bare inneholder I-rammer.

Utgangsbithastigheten til en MPEG-2-koder kan være konstant (CBR) eller variabel (VBR), med et maksimum som bestemmes av spilleren – for eksempel er maksimalt mulig på en DVD-film 10,4 Mbit/s. For å oppnå en konstant bithastighet endres kvantiseringsgraden for å oppnå den nødvendige bithastigheten. Å øke kvantiseringen gjør en defekt synlig når videoen dekodes, vanligvis i form av "mosaicing", der diskontinuiteter i kantene av makroblokker blir mer synlige ettersom bithastigheten reduseres.

MPEG-2 lydkoding.

MPEG-2 introduserer også nye lydkodingsmetoder. Disse er:

Koding med lav bithastighet med delte samplingsfrekvenser (MPEG-1 lag 1/2/3 LSF) Flerkanalskoding opptil 6 kanaler (5.1)

Kompatibilitet

MPEG-2 gir både bakover (MPEG-2 dekoder MPEG-1) og fremover (MPEG-1 dekoder en del av MPEG-2) kompatibilitet.

MPEG-2 på SVCD

Ytterligere restriksjoner og modifikasjoner av MPEG-2 på SVCD:

MPEG-2 på DVD

Ytterligere restriksjoner og modifikasjoner av MPEG-2 på DVD:

Videooppløsning:

MPEG-2 på DVB

Ytterligere restriksjoner og modifikasjoner for DVB-MPEG .

Begrenset til en av følgende vedtak:

MPEG-2 i ATSC og ISDB-T

Begrenset til en av følgende vedtak

Merk: 1080i er kodet med 1920×1088 pikselrammer, men de siste 8 linjene forkastes før de vises.

Patentbeholdere

Omtrent 640 verdensomspennende patenter utgjør hele den intellektuelle eiendommen rundt MPEG-2, disse innehas av rundt 20 selskaper og ett universitet:

Se også