Gotovi Seminarski Diplomski Maturalni Master ili Magistarski
Video standard i procesi - Verzija za štampu

+- Gotovi Seminarski Diplomski Maturalni Master ili Magistarski (https://www.maturskiradovi.net/forum)
+-- Forum: Obrazovanje (/Forum-obrazovanje)
+--- Forum: Društvene nauke (/Forum-dru%C5%A1tvene-nauke)
+---- Forum: Informatika (/Forum-informatika)
+---- Tema: Video standard i procesi (/Thread-video-standard-i-procesi)


Video standard i procesi - Vesnica - 17-06-2010 08:06 PM

Maturski, seminarski i diplomski radovi iz informatike.

Metoda MPEG video kompresije se danas koristi u velikom broju novih proizvoda. Temeljem je digitalne televizije, HDTV dekodera, DVD tehnologije, video konferencija, internet videa i mnogih drugih aplikacija. Odgovor na pitanja zašto se MPEG standard primjenjuje u tako velikom broju raznih proizvoda i tehnologija, potražite u nastavku stranice...

MPEG standard

MPEG (Moving Pictures Experts Group) je grupa ljudi oformljena u svibnju 1988 godine unutar organizacija ISO (International Standards Organization) i IEC (International Electro-technical Commission) kako bi se osmislio novi standard za kompresiju (kodiranje) digitalnog videa i audia te njihovo pohranjivanje na digitalne medije (npr. CD-ROM). Službeni naziv grupe je ISO/IEC JTC1/SC29/WG11.
Kad su MPEG standardizaciski napori počinjali negdje 1988, nekoliko različitih industrija prebacivalo se na digitalnu video tehnologiju. Kompjuterska industrija tražila je prostor prema širenju iznad samo tradiconalnih tekstualnih i grafičkih kapaciteta prema interaktivnoj multimediji sa audio, video i nepokretnim slikama.
Kupci elektroničke industrije vidjeli su digitalni video kao alat s kojim će unaprijediti mogućnosti video igara i zabavnih medija. Kompakt diskovi su se već koristili za spremanje digitalnih podataka čiji je kapacitet bio dovoljan za komprimirani digitalni video. Telekomunikacijska tehnologija iskoristila je razvoj kompresijske tehnologije za standardizaciju telekonferencije, i po preporuci CCITT H.261 digitalni video standard bio je već u razvoju. Rasprava o digitalnoj TV distribuciji u odnosu na analogni signal za televiziju visoke rezolucije HDTV (high-definition television) započela je, također se razmatrala distribucija digitalnog videa preko satelita. Kabelske televizijske kompanije istraživale su korištenje digitalnog videa za prijenos satelitskim vezama prema dolje i gore, također su razmatrali i sami prijenos digitalnog videa do samog korisnika. Zajedno sa mikroprocesorima koji bi trebali kontrolirati kućne konvertore, direktna digitalna veza do same kuće povećali bi samu vjerojatnost uvođenja novih funkcija preko kabelske mreže. I ostale veze prema kući kao npr. videotex imale bi potencijalnu potrebu za korištenje pokretnih video sekvenci. Dijeljenje tehnologije između industrija sa različitim interesima dovelo je do prirodnog procesa standardizacije. Ako bi se standardizacija digitalnog videa mogla ostvariti, potencijalno veliki prodajni volumen kod korisničkog tržišta smanjio bi cijenu VLSI čipova za sve industrije. Samim smanjenjem troškova došlo bi do toga da bi svi bili u mogućnosti imati zajedničku digitalnu video tehnologiju, što je bila i zvijezda vodilja same standardizacije. Prožimanje različitih interesa i sama standardizacija smanjili su barijere i sami rizik koji se pojavljuje sa uvođenjem novih tehnologija.
Problem MPEG-1 je kako pohraniti sekvencu pokretne slike, uključujući audio informaciju, u komprimiranom formatu pogodnom za pohranu na digitalnom mediju kakav je npr. CD-ROM. Visoko kvalitetni stereo zvuk plus video informacija trebaju biti pohranjeni na otprilike istom prostoru koji se inače koristi samo za audio. Dalje trebalo bi omogućavati ponavljanje sa preciznom vremenskom kontrolom i sinkronizacijom audio i video toka bita. MPEG standardi (MPEG-1, MPEG-2, MPEG-4) su podjeljeni na više djelova. Osnovna 3 dijela su: Sistemski, Video te Audio. U nastavku teksta ćemo se baviti isključivo drugim dijelovima (Part 2Smile ovih standarda.
MPEG video standard
MPEG-1, MPEG-2, MPEG-4 se međusobno razlikuju po brzinama i po područjima primjene.
Tako je:
• MPEG-1: ~1.5 Mbit/s
"Information technology-Coding of moving pictures and associated audio for digital storage media up to about 1.5 Mbit/s-"
• MPEG-2: >10 Mbit/s
"Information technology - Generic coding of moving pictures and associated audio information"
• MPEG-4: <64 kbit/s
Internet Multimedia,Interactive Video Games, Interpersonal Communications (Videoconferencing, Videophone etc.),...
MPEG-1 su razvili ISO/IEC organizacije, dok se MPEG-2 i MPEG-4 potencijalno mogu upotrebiti u javnim telekomunikacijskim mrežama pa se stoga i ITU-T (International Telecommunications Union-Telecommunication sector) pridružila projektu i aktivno uključila u razvoj standarda.
Općenito govoreći, video sekvence u sebi sadrže veliku količinu statističke i subjektivne redudancije unutar pojedinih okvira(mirnih slika) kao i između pojedinih okvira. Cilj video kodiranja/kompresije je iskoristiti te redudancije kako bi se smanjila potrebna količina prijenosnog pojasa tj. potrebnog prostora za pohranjivanje i transmisiju kodiranog video signala. Performanse tehnike video kompresije ovise o količini redudancije sadržane u stvarnim podacima (videu) kao i o primjenjenoj tehnici kodiranja. Ovisno o zahtjevima aplikacije video kodiranje se može podijeliti na "lossless" i "lossy" kodiranje.
Cilj "lossless" tehnike kodiranja je reduciranje količine informacije sadržane u video signalu ali uz uvjet da se mora zadržati kvaliteta orginalnog video signala tj. dekodirana kvaliteta slike mora odgovarati izvornoj kvaliteti slika prije kodiranja. Dok je kod "lossy" kodne tehnike (koja se koristi u MPEG-u) cilj postići tražni prijenosni pojas za pohranu i transmisiju video signala uz dani parametar kvalitete koji nije jednak izvornoj kvaliteti slike. Kod ovakvog kodiranja visoki stupanj kompresije se postiže degradadcijom kvalitete video signala. ©to je manji prijenosni pojas to se mora postići veći stupanj kompresije a to obično znači i veću degradaciju kvalitete slike. Treba reći da stupanj degradacije slike ovisi o kompleksnosti same slike tj. same video sekvence kao i o sofisticiranosti tehnike komprimiranja (za video sekvence u kojima nema naglih promjena scena vrlo se lako postiže dobra kvaliteta slike).
Video sekvenca je jednostavno niz mirnih slika (okvira) koji se projiciraju jedna za drugom u kratkim vremenskim intervalima (20-30 okvira/s). Ovakav niz slika je međusobno koreliran (zavisan)-vremenska korelacija, ali isto tako, postoje zavisnosti i unutar same slike - prostorna korelacija. U MPEG-u postoje dva osnovna modela kodiranja/kompresije: Intraframe i non-intraframe kompresija. Intraframe kodni model koristi prostorne korelacije unutar jedne slike (okvira) da bi kompresirao danu sliku, dok non-intraframe kodni model koristi vremenske korelacije između okvira kako bi kompresirao informaciju sadržanu u promatranoj video sekvenci.
U MPEG video standardu slika je reprezentirana u YCbCr formatu (a ne u RGB formatu) gdje je Y "luminance" (luminencija ili osvjetljenost) slike je blok uzoraka koji određuje osvjetljenost slike tj. crno-bijelu verziju slike, dok su Cb i Cr komponente slike tj. uzorci koji određuju boju. Tako se kod MPEG-a slika razlaže na makroblokove, koji se dalje slažu u tzv. "slice", a više sliceova čini cijelu sliku. Struktura makrobloka može biti 4:4:4 (odgovara razini informacija kao u RGB modelu), 4:2:2, 4:2:0, što u slučaju 4:2:0 ,koji se najviše koristi, znači da se makroblok sastoji od 16x16 bloka uzoraka za osvjetljenost, 8x8 Cb bloka i 8x8 Cr bloka uzoraka. 16x16 blok osvjetljenja su u biti 4 8x8 bloka piksela koji se koriste kao osnovni blokovi u procesu kompresije tj. kao ulazni blok podataka u proces.

DCT-a (Discrete Cosine Transform) predstavlja temelj Intra i non-intra kodnih modela. DCT je, u osnovi, metoda koja (slično kao Fourierova transformacija) ulazni blok podataka, u vremenskoj domeni, transformira u blok podataka u frekvencijskoj domeni. U MPEG-u se kao osnovni ulazni blok koristi 8x8 blok piksela, koji se pomoću DCT-a može rastaviti na sumu određenih koeficijenata u frekvencijskoj domeni tj. ulazni 8x8 blok se razlaže na sumu unaprijed poznatih 8x8 blokova uzoraka (prostornih rasporeda piksela) slika 1.
Za svaki od tih 8x8 blokova poznat je koeficijent , tj. amplituda potrebna da se predstavi doprinos tog prostornog rasporeda u reprezentaciji analiziranog bloka podataka. Drugim rječima, svaki se prostorni raspored množi sa svojim koeficijentom i rezultirajuća 64 8x8 nizova amplituda se zbrajaju, svaki piksel posebno, da bi se rekonstruirao početni 8x8 blok. DCT zapravo kreira niz porstornih frekvencija (rasporeda) koje nam indiciraju koliko se brzo boja ili osvjetljenje mijenja kroz promatrani blok piksela. Tako DC koeficijent (gornji lijevi kut slike 1.) predstavlja srednju vrijednost od svih 64 prostrona rasporeda, a vodoravni AC koeficijenti predstavljaju brzinu promjene osvjetljenja/boje u vodoravnom smjeru a vertikalni AC koeficijenti u vertikalnom smjeru. Istraživanja su pokazala da su spore promjene u osvjetljenju/boji (male prostorne frekvencije) važnije za ljudsko oko tj. ove komponente su važnije za percepciju slike, dok su brze promjene u intenzitetu/boji manje uočljive pa se mogu zanemariti.
Nakon što se izračunaju DCT koeficijenti za blok pikslea poželjno je koeficijente na višim frekvencijama (donji lijevi kut) prikazati sa manje preciznosti, jer su oni manje bitini za kvalitetnu percepciju slike , dok je niže koeficijente, posebno DC koeficijent, potrebno prikazati sa više preciznosti. To se postiže procesom Kvantizacije.
U procesu kvantizacije se svaki DCT koeficijent dijeli sa pozitivnim cijelim brojem različitim od nule koji se zove kvantizacijski broj, i dobiveni kvocijent, kvantizirani DCT koeficijent, se zaokružuje na najbliži cijeli broj. ©to je veći kvantizacijski broj to je manja preciznost kvantiziranih DCT koeficijenata. Na takav način se može postići da se više prostorne frekvencije, koje su manje bitne za percepciju, postave u nulu ili se reprezentiraju sa manjim brojem bita, pa se dekoderu ne mora prenositi veliki broj nepotrebnih bita. Prenosi se samo kvantizacijski broj i DCT koeficijenti različiti od nule te se tako postiže velika ušteda, tj. kompresiranje informacije. DCT i proces kvantizacije su ključni dijelovi MPEG standarda.

Nakon procesa kvantizacije većina informacije je sadržana u dijelu matrice (slika 1.) sa nižim prostornim frekvencijama (kvantiziranim DCT koeficijentima), dok su više prostorne frekvencije uglavnom nule.
Da bi se postigla veća ušteda u kodiranju tih koeficijenata koristi se metoda Hoffman-ovog optimalnog kodiranja kod kojega se podacima sa većim vjerojatnostima pojavljivanja pridodjeljuju kodne kompleksije sa manjim brojem bita. Takvim načinom kodiranja kvantiziranih DCT koeficijenata postiže se ušteda u količini informacije potrebnoj za prijenos tj. rekonstrukciju slike. U intraframe kodiranju se pomoću DCT-a postiže skoro potpuna nezavisnost susjednih DCT koeficijenata i time se postiže njihovo međusobno neovisno kodiranje. U non-intraframe kodiranju, gdje se kodira razlika između promatrane slike i slike koje je prije nje poslana, DCT se također pokazao dobrim. Ukoliko video sekvenca sadrži promjene scena ili pokrete objekata, bolje predviđanje se postiže kodiranjem razlike između trenutne scene i scene koja slijedi ili prethodi promatranoj sceni u procesu koji nazivamo Kompezacija pokreta [Motion Compensation].
Proces određivanja vektora pokreta [motion vector] u samom encoderu nazivamo Predviđanje pokreta [Motion Estimation].
Vektor pokreta koji opisuje smjer i količinu promjene/pokreta u promatranom makrobloku, prenosi se do dekodera kao dio kodirane informacije. Dekoder tada, koristeći vektor pokreta, zna koji se dio referentne slike koristio za predviđanje, i zbrajajući dekodiranu razliku sa vektorom pokreta vrši rekonstrukciju orginalne slike.
Svaka se video sekvenca u MPEG standardu dijeli na jednu ili više grupa slika, a svaka se grupa sastoji od od jedne ili više slika koje mogu biti jednog od tri moguća tipa:
• I-slike:(intra-coded pictures) su slike koje su kodiraju nezavisno od ostalih slika, tj. kodiraju se intra-frame kodnim modelom koristeći samo porstorne korelacije unutat same slike, dok se P i B slike kompresiraju kodirajući razliku između promatrane slike i referentne I ili P slike, iskorištavajući sličnosti od jedne slike do druge.
• P-slike:(predictive-coded pictures) se kodiraju koristeći predviđenje pokreta iz prethodne I ili P slike u danoj video sekvenci
• B-slike:(bidirectionally predictive-coded pictures) se kodiraju koristeći predviđanje pokreta iz najbliže prethodne ili slijedeće I ili P slike.
Različiti dijelovi B-slike mogu koristiti različita predviđanja pokreta koristeći prethodnu ili slijedeću sliku ili nijednu. Isto tako i P-slike mogu koristi predikciju iz prethodne slike ili je opće ne koristiti. Ako se ne koristi predviđanje pokreta tada se taj dio P ili B slike kodira pomoću intraframe kodnog modela. Zbog takvog načina kodiranja jasno je da redosljed slika po kojem se prikazuju na ekranu i redosljed slika u procesu dekodiranja nije isti.