Maskeringsterskel

I psykoakustikk er terskelen eller maskeringsnivået lydtrykknivået (SPL) til en testlyd som er nødvendig for at den knapt skal kunne høres i nærvær av et maskeringssignal. Dette nivået er også svært avhengig av frekvensen og egenskapene til maskereren og maskeringen. Effekten vises vanligvis mellom toner veldig nærme i frekvens. At det ikke er hørbart innebærer visse fordeler i transmisjonsverdenen. Når det gjelder lydkoding, for eksempel, innebærer det muligheten for å ignorere nevnte tone, og dermed oppnå bedre komprimering eller, alternativt, koding med mindre vekt, det vil si færre biter og derfor redusere størrelsen på den resulterende filen. .

Vanligvis jobber man ikke med en enkelt tone men med flere samtidig. Så for en enkelt frekvens har du mer enn ett mulig maskeringssignal. For disse situasjonene beregnes det som er kjent som den globale maskeringsterskelen . Dette kvantiseres basert på et høyoppløselig spektrum av signalet (vanligvis lyd) fra en 512 eller 1024 punkters Fast Fourier Transform (FFT). I første omgang beregnes de individuelle tersklene under hensyntagen til signalnivået, typen maskering (det være seg signal eller støy) og frekvensbåndet (det er frekvenser som er uhørbare for det menneskelige øret). Deretter legges alle tersklene sammen med den stille terskelen, og sikrer dermed at den totale maskeringsterskelen aldri vil være under sistnevnte. Til slutt kan SMR (Signal to Mask Ratio) beregnes. Den forrige operasjonen er den som utføres i lydkoding.

Følgende graf viser tilfellet med å ha en tone ved 1kHz. Terskelen for ro eller stillhet under hvilken ingen lyd er merkbar kan observeres. Nå, når tonen er overlagret, varierer dette nivået rundt den sentrale frekvensen til maskereren, noe som gjør det vanskeligere å høre de mulige frekvensene i nærheten av den.

App. Den psykoakustiske modellen

En anvendelse av maskeringsterskelen finnes i lydkodingene som brukes av MPEG . Disse diagrammene inkluderer blokken kalt 'psykoakustisk modell'. Dette er koblet til filterbanken og kvantiserings- (eller bitallokeringsblokken). Den psykoakustiske modellen er ansvarlig for å analysere prøvene som kommer fra filterbanken, og beregne maskeringsnivået for hvert bånd. Prosedyren, som allerede nevnt i forrige avsnitt, utføres ved hjelp av en FFT. Avhengig av MPEG-laget vi jobber med, brukes flere eller færre punkter. Fra alle de forskjellige nivåene beregnes SMR og sendes til kvantiseringsapparatet. Kvantiseringsapparatet er ansvarlig for å tilordne flere eller færre biter til hver av frekvensblokkene under hensyntagen til SMR. Blokken med høyest signalmaskeringsforhold vil bli kodet med maksimalt antall biter som er mulig, mens blokken med dårligst forhold vil bli kodet med minimum, og når null biter.

Kort sagt, beregningen av maskeringsterskelen tas i betraktning av visse lydkodeker for ikke å kode prøver som tross alt, hvis de er kodet, ville være like uhørbare for det menneskelige øret. På denne måten brukes færre biter og følgelig reduseres størrelsen på lydfilen, og dermed oppnås bedre komprimering .

Se også