FMUSER Wirless Transmit video și audio mai ușor!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> Albaneză
ar.fmuser.org -> arabă
hy.fmuser.org -> Armeană
az.fmuser.org -> azeră
eu.fmuser.org -> bască
be.fmuser.org -> bielorusă
bg.fmuser.org -> Bulgarian
ca.fmuser.org -> catalană
zh-CN.fmuser.org -> Chineză (simplificată)
zh-TW.fmuser.org -> Chineză (tradițională)
hr.fmuser.org -> croată
cs.fmuser.org -> cehă
da.fmuser.org -> Daneză
nl.fmuser.org -> Dutch
et.fmuser.org -> estonă
tl.fmuser.org -> filipinez
fi.fmuser.org -> finlandeză
fr.fmuser.org -> Franceză
gl.fmuser.org -> Galeză
ka.fmuser.org -> Georgiană
de.fmuser.org -> germană
el.fmuser.org -> greacă
ht.fmuser.org -> Creole haitian
iw.fmuser.org -> ebraică
hi.fmuser.org -> Hindi
hu.fmuser.org -> Maghiară
is.fmuser.org -> islandeză
id.fmuser.org -> indoneziană
ga.fmuser.org -> irlandeză
it.fmuser.org -> Italiană
ja.fmuser.org -> japoneză
ko.fmuser.org -> coreeană
lv.fmuser.org -> letonă
lt.fmuser.org -> lituaniană
mk.fmuser.org -> macedoneană
ms.fmuser.org -> Malay
mt.fmuser.org -> malteză
no.fmuser.org -> norvegiană
fa.fmuser.org -> persană
pl.fmuser.org -> poloneză
pt.fmuser.org -> portugheză
ro.fmuser.org -> Română
ru.fmuser.org -> rusă
sr.fmuser.org -> sârbă
sk.fmuser.org -> slovacă
sl.fmuser.org -> Slovenă
es.fmuser.org -> spaniolă
sw.fmuser.org -> Swahili
sv.fmuser.org -> suedeză
th.fmuser.org -> Thai
tr.fmuser.org -> turcă
uk.fmuser.org -> ucraineană
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnameză
cy.fmuser.org -> galeză
yi.fmuser.org -> idiș
(1) Informații redundante ale semnalului video
Luând ca exemplu formatul componentei YUV de înregistrare a videoclipurilor digitale, YUV reprezintă luminozitatea și respectiv două semnale de diferență de culoare. De exemplu, pentru sistemul TV pal existent, frecvența de eșantionare a semnalului de luminanță este de 13.5 MHz; banda de frecvență a semnalului cromatic este, de obicei, la jumătate sau mai puțin din semnalul de luminozitate, care este de 6.75 MHz sau 3.375 MHz. Luând ca exemplu frecvența de eșantionare de 4: 2: 2, semnalul Y adoptă 13.5 MHz, semnalele cromate U și V sunt eșantionate de 6.75 MHz și semnalul de eșantionare este cuantificat cu 8 biți, atunci se poate calcula rata codului video digital după cum urmează:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216Mbit / s
Dacă o cantitate atât de mare de date este stocată sau transmisă direct, va fi dificil de utilizat tehnologia de compresie pentru a reduce rata de biți. Semnalul video digital poate fi comprimat în conformitate cu două condiții de bază:
L. redundanță de date. De exemplu, redundanța spațială, redundanța timpului, redundanța structurii, redundanța entropiei informaționale etc., adică există o corelație puternică între pixelii imaginii. Eliminarea acestei redundanțe nu duce la pierderea informațiilor și este o comprimare fără pierderi.
L. redundanță vizuală. Unele caracteristici ale ochilor umani, precum pragul de discriminare a luminozității, pragul vizual, sunt diferite în sensibilitate la luminozitate și cromă, ceea ce face imposibilă introducerea unor erori adecvate în codare și nu vor fi detectate. Caracteristicile vizuale ale ochilor umani pot fi folosite pentru schimbul de comprimare a datelor cu anumite distorsiuni obiective. Această compresie are pierderi.
Comprimarea semnalului video digital se bazează pe cele două condiții de mai sus, ceea ce face ca datele video să fie foarte comprimate, ceea ce favorizează transmisia și stocarea. Metodele obișnuite de compresie video digitală sunt codarea mixtă, care este de a combina codificarea transformării, estimarea mișcării și compensarea mișcării și codificarea entropiei pentru a comprima codarea. De obicei, codarea transformării este utilizată pentru a elimina redundanța intra cadrului a imaginii, iar estimarea mișcării și compensarea mișcării sunt utilizate pentru a elimina redundanța inter cadrelor a imaginii, iar codarea entropiei este utilizată pentru a îmbunătăți în continuare eficiența compresiei. Următoarele trei metode de codificare prin compresie sunt introduse pe scurt.
(a) Metoda de codificare prin compresie
(b) Transformarea codării
Funcția codării transformării este de a transforma semnalul de imagine descris în domeniul spațial în domeniul frecvenței și apoi codifica coeficienții transformați. În general vorbind, imaginea are o corelație puternică în spațiu, iar transformarea în domeniul frecvenței poate realiza decorelarea și concentrația de energie. Transformarea ortogonală comună include transformată Fourier discretă, transformată discretă de cosinus și așa mai departe. Transformarea discretă a cosinusului este utilizată pe scară largă în compresia video digitală.
Transformarea discretă a cosinusului este denumită transformată DCT. Poate transforma blocul de imagine al lui L * l din domeniul spațial în domeniul frecvenței. Prin urmare, în procesul de compresie și codare a imaginii bazat pe DCT, imaginea trebuie împărțită în blocuri de imagini care nu se suprapun. Să presupunem că dimensiunea unei imagini este de 1280 * 720, este împărțită în blocuri de imagine de 160 * 90 cu dimensiunea de 8 * 8 fără suprapunere sub formă de grilă. Apoi, transformarea DCT poate fi efectuată pentru fiecare bloc de imagine.
După împărțirea blocului, fiecare bloc de imagine de 8 * 8 puncte este trimis codificatorului DCT, iar blocul de imagine de 8 * 8 este transformat din domeniul spațial în domeniul de frecvență. Figura de mai jos prezintă un exemplu de bloc de imagini de 8 * 8 în care numărul reprezintă valoarea luminozității fiecărui pixel. Din figură se poate observa că valorile luminozității fiecărui pixel din acest bloc de imagine sunt relativ uniforme, în special valoarea luminozității pixelilor adiacenți nu este foarte mare, ceea ce indică faptul că semnalul imaginii are o corelație puternică.
Un bloc de imagine real 8 * 8
Figura următoare prezintă rezultatele transformării DCT a blocului de imagine în figura de mai sus. Se poate observa din figură că, după transformarea DCT, coeficientul de frecvență joasă din colțul din stânga sus concentrează multă energie, în timp ce energia coeficientului de frecvență înaltă din colțul din dreapta jos este foarte mică.
Coeficienții blocului de imagine după transformarea DCT
Semnalul trebuie cuantificat după transformarea DCT. Deoarece ochii umani sunt sensibili la caracteristicile de frecvență joasă ale imaginilor, cum ar fi luminozitatea generală a obiectelor, și nu la detaliile de înaltă frecvență din imagine, astfel încât în procesul de transmisie, informațiile de înaltă frecvență pot fi transmise mai puțin sau nu, doar partea de joasă frecvență. Procesul de cuantificare reduce transmisia informației prin cuantificarea coeficienților regiunii de frecvență joasă și cuantificarea grosieră a coeficienților din regiunea de frecvență înaltă, ceea ce elimină informațiile de înaltă frecvență care nu sunt sensibile la ochii omului. Prin urmare, cuantificarea este un proces de compresie cu pierderi și principalul motiv pentru deteriorarea calității în codarea compresiei video.
Procesul de cuantificare poate fi exprimat prin următoarea formulă:
Dintre acestea, FQ (U, V) reprezintă coeficientul DCT după cuantificare; f (U, V) reprezintă coeficientul DCT înainte de cuantificare; Q (U, V) reprezintă matricea de ponderare a cuantizării; q este etapa de cuantificare; rundă se referă la consolidare, iar valoarea de ieșit este luată ca cea mai apropiată valoare întreagă.
Selectați în mod rezonabil coeficientul de cuantificare, iar rezultatul după cuantificarea blocului de imagine transformat este prezentat în figură.
Coeficientul DCT după cuantificare
Majoritatea coeficienților DCT sunt schimbați la 0 după cuantificare, în timp ce doar câțiva coeficienți sunt valori diferite de zero. În acest moment, numai aceste valori diferite de zero trebuie comprimate și codificate.
(b) Codificarea entropiei
Codificarea entropiei este denumită deoarece lungimea medie a codului după codare este apropiată de valoarea entropiei sursei. Codificarea entropiei este implementată prin VLC (codare cu lungime variabilă). Principiul de bază este de a da cod scurt simbolului cu probabilitate mare în sursă și de a da cod lung simbolului cu probabilitate mică de apariție, astfel încât să se obțină statistic o lungime medie mai scurtă a codului. Codificarea cu lungime variabilă include de obicei codul Hoffman, codul aritmetic, codul de rulare etc. Codificarea lungimii de rulare este o metodă de compresie foarte simplă, eficiența de compresie a acesteia nu este mare, dar viteza de codare și decodare este rapidă și este încă utilizată pe scară largă, în special după transformarea codificării, folosind codarea lungimii de rulare, are un efect bun.
În primul rând, coeficientul de curent alternativ imediat după coeficientul de curent continuu de ieșire al cuantificatorului va fi scanat în tip Z (așa cum se arată în linia săgeții). Scanarea Z transformă coeficientul de cuantificare bidimensională într-o secvență unidimensională și apoi continuă codarea lungimii de rulare. În cele din urmă, un alt cod de lungime variabilă este utilizat pentru a codifica datele după codarea rulării, cum ar fi codarea Hoffman. Prin acest tip de codare cu lungime variabilă, eficiența codificării este îmbunătățită în continuare.
(c) Estimarea mișcării și compensarea mișcării
Estimarea mișcării și compensarea mișcării sunt metode eficiente pentru a elimina corelația direcției în timp a secvențelor de imagine. Transformarea DCT, cuantificarea și metodele de codificare a entropiei descrise mai sus se bazează pe o singură imagine cadru. Prin aceste metode, corelația spațială dintre pixeli din imagine poate fi eliminată. De fapt, pe lângă corelația spațială, semnalul de imagine are corelație temporală. De exemplu, pentru videoclipurile digitale cu fundal static, cum ar fi transmisia de știri și mișcarea mică a corpului principal al imaginii, diferența dintre fiecare imagine este foarte mică, iar corelația dintre imagini este foarte mare. În acest caz, nu trebuie să codificăm fiecare imagine cadru separat, ci putem codifica doar părțile modificate ale cadrelor video adiacente, astfel încât să reducem și mai mult cantitatea de date. Această lucrare este realizată prin estimarea mișcării și compensarea mișcării.
Tehnologia de estimare a mișcării împarte în general imaginea curentă de intrare în mai multe subblocuri mici de imagine care nu se suprapun între ele, de exemplu, dimensiunea unei imagini cadru este de 1280 * 720. În primul rând, este împărțită în blocuri de imagine 40 * 45 cu 16 * 16 dimensiuni care nu se suprapun reciproc sub formă de grilă și apoi, în cadrul unei ferestre de căutare a imaginii anterioare sau a celei din urmă imagini, găsiți un bloc pentru fiecare bloc de imagine pentru a găsi un bloc de imagine în cadrul unui fereastra de căutare Cel mai similar bloc de imagini. Procesul de căutare se numește estimarea mișcării. Prin calcularea informațiilor de poziție între cel mai similar bloc de imagine și blocul de imagine, se poate obține un vector de mișcare. În acest fel, blocul de imagine curent poate fi scăzut din cel mai similar bloc de imagine indicat de vectorul de mișcare a imaginii de referință și se poate obține un bloc de imagine rezidual. Deoarece fiecare valoare a pixelilor din blocul de imagine reziduală este foarte mică, un cod de compresie mai mare poate fi obținut în codarea compresiei. Acest proces de scădere se numește compensarea mișcării.
Deoarece imaginea de referință este necesară pentru a fi utilizată pentru estimarea mișcării și compensarea mișcării în procesul de codare, este foarte important să selectați imaginea de referință. În general, codificatorul împarte fiecare imagine de cadru introdusă în trei tipuri diferite în funcție de diferitele imagini de referință: cadru I (intra), cadru B (predicție de ghidare) și cadru P (predicție). Așa cum se arată în figură.
Secvența tipică a structurii cadrelor I, B, P
Așa cum se arată în figură, cadrul I utilizează doar datele din cadru pentru codare și nu are nevoie de estimarea mișcării și compensarea mișcării în timpul procesului de codificare. Evident, întrucât cadrul nu elimină corelația direcției timpului, raportul de compresie este relativ scăzut. În procesul de codificare, cadrul P utilizează un cadru frontal I sau un cadru P ca imagine de referință pentru compensarea mișcării, de fapt, codifică diferența dintre imaginea curentă și imaginea de referință. Modul de codificare al cadrului B este similar cu cadrul P, singura diferență este că trebuie să utilizeze un cadru I frontal sau un cadru P și un cadru I ulterior sau un cadru P pentru a prezice în timpul procesului de codare. Astfel, fiecare codare a cadrelor P trebuie să utilizeze o imagine cadru ca imagine de referință, în timp ce cadrul B are nevoie de două cadre ca referință. În schimb, cadrul B are un raport de compresie mai mare decât cadrul P.
(d) Codificare mixtă
Lucrarea introduce mai multe metode importante în compresia și codarea video. În aplicația practică, aceste metode nu sunt separate și sunt de obicei combinate pentru a obține cel mai bun efect de compresie. Următoarea figură arată modelul de codificare hibridă (adică codificarea transformării + estimarea mișcării și compensarea mișcării + codificarea entropiei). Modelul este utilizat pe scară largă în MPEG1, MPEG2, H.264 și alte standarde. Din figură, putem vedea că imaginea curentă de intrare trebuie împărțită mai întâi în blocuri, blocul imaginii obținute de bloc trebuie scăzut din imaginea prezisă după compensarea mișcării pentru a obține diferența de imagine x, iar apoi transformarea și cuantificarea DCT sunt efectuate pentru blocul de imagine de diferență. Datele de ieșire cuantificate au două locuri diferite: una este să le trimiteți la codificatorul de entropie pentru codificare, iar fluxul de cod codat este trimis într-o memorie cache Salvați în dispozitiv și așteptați transmisia. O altă aplicație este de a contracara cuantificarea și inversarea schimbării la semnalul x ', care adaugă ieșirea blocului de imagine cu compensarea mișcării pentru a obține un nou semnal de imagine de predicție și trimite un nou bloc de imagine de predicție în memoria cadru.
|
Introduceți adresa de e-mail pentru a primi o surpriză
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> Albaneză
ar.fmuser.org -> arabă
hy.fmuser.org -> Armeană
az.fmuser.org -> azeră
eu.fmuser.org -> bască
be.fmuser.org -> bielorusă
bg.fmuser.org -> Bulgarian
ca.fmuser.org -> catalană
zh-CN.fmuser.org -> Chineză (simplificată)
zh-TW.fmuser.org -> Chineză (tradițională)
hr.fmuser.org -> croată
cs.fmuser.org -> cehă
da.fmuser.org -> Daneză
nl.fmuser.org -> Dutch
et.fmuser.org -> estonă
tl.fmuser.org -> filipinez
fi.fmuser.org -> finlandeză
fr.fmuser.org -> Franceză
gl.fmuser.org -> Galeză
ka.fmuser.org -> Georgiană
de.fmuser.org -> germană
el.fmuser.org -> greacă
ht.fmuser.org -> Creole haitian
iw.fmuser.org -> ebraică
hi.fmuser.org -> Hindi
hu.fmuser.org -> Maghiară
is.fmuser.org -> islandeză
id.fmuser.org -> indoneziană
ga.fmuser.org -> irlandeză
it.fmuser.org -> Italiană
ja.fmuser.org -> japoneză
ko.fmuser.org -> coreeană
lv.fmuser.org -> letonă
lt.fmuser.org -> lituaniană
mk.fmuser.org -> macedoneană
ms.fmuser.org -> Malay
mt.fmuser.org -> malteză
no.fmuser.org -> norvegiană
fa.fmuser.org -> persană
pl.fmuser.org -> poloneză
pt.fmuser.org -> portugheză
ro.fmuser.org -> Română
ru.fmuser.org -> rusă
sr.fmuser.org -> sârbă
sk.fmuser.org -> slovacă
sl.fmuser.org -> Slovenă
es.fmuser.org -> spaniolă
sw.fmuser.org -> Swahili
sv.fmuser.org -> suedeză
th.fmuser.org -> Thai
tr.fmuser.org -> turcă
uk.fmuser.org -> ucraineană
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnameză
cy.fmuser.org -> galeză
yi.fmuser.org -> idiș
FMUSER Wirless Transmit video și audio mai ușor!
Contact
Adresa:
Nr. 305 Clădirea HuiLan nr. 273 Huanpu Road Guangzhou China 510620
Categorii
Stiri lunare via e-mail