FMUSER бездротовий передавати відео та аудіо простіше!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> африкаанс
sq.fmuser.org -> албанська
ar.fmuser.org -> арабська
hy.fmuser.org -> Вірменська
az.fmuser.org -> азербайджанська
eu.fmuser.org -> баскська
be.fmuser.org -> білоруська
bg.fmuser.org -> болгарська
ca.fmuser.org -> Каталонська
zh-CN.fmuser.org -> китайська (спрощена)
zh-TW.fmuser.org -> китайська (традиційна)
hr.fmuser.org -> хорватська
cs.fmuser.org -> чеська
da.fmuser.org -> данська
nl.fmuser.org -> Голландська
et.fmuser.org -> естонська
tl.fmuser.org -> філіппінська
fi.fmuser.org -> фінська
fr.fmuser.org -> французька
gl.fmuser.org -> галицький
ka.fmuser.org -> грузинський
de.fmuser.org -> німецька
el.fmuser.org -> грецька
ht.fmuser.org -> гаїтянський креольський
iw.fmuser.org -> іврит
hi.fmuser.org -> хінді
hu.fmuser.org -> Угорська
is.fmuser.org -> ісландська
id.fmuser.org -> індонезійська
ga.fmuser.org -> ірландський
it.fmuser.org -> італійська
ja.fmuser.org -> японська
ko.fmuser.org -> корейська
lv.fmuser.org -> латиська
lt.fmuser.org -> литовська
mk.fmuser.org -> македонська
ms.fmuser.org -> малайська
mt.fmuser.org -> мальтійська
no.fmuser.org -> Норвезька
fa.fmuser.org -> Перська
pl.fmuser.org -> польська
pt.fmuser.org -> португальська
ro.fmuser.org -> румунська
ru.fmuser.org -> російська
sr.fmuser.org -> сербська
sk.fmuser.org -> словацька
sl.fmuser.org -> словенська
es.fmuser.org -> іспанська
sw.fmuser.org -> суахілі
sv.fmuser.org -> шведська
th.fmuser.org -> Тайська
tr.fmuser.org -> турецька
uk.fmuser.org -> український
ur.fmuser.org -> урду
vi.fmuser.org -> в'єтнамська
cy.fmuser.org -> валлійська
yi.fmuser.org -> Ідиш
(1) Надлишкова інформація відеосигналу
Беручи для прикладу формат компонента YUV для запису цифрового відео, YUV представляє відповідно яскравість та два різницеві сигнали кольору. Наприклад, для існуючої системи pal TV, частота дискретизації сигналу яскравості становить 13.5 мГц; смуга частот кольорового сигналу зазвичай становить половину або менше сигналу яскравості, що становить 6.75 мГц або 3.375 мГц. Беручи для прикладу частоту дискретизації 4: 2: 2, сигнал Y приймає 13.5 мГц, сигнал кольоровості U і V дискретизується на 6.75 мГц, а сигнал дискретизації квантується на 8 біт, тоді можна розрахувати швидкість кодування цифрового відео наступним чином:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216 Мбіт / с
Якщо такий великий обсяг даних зберігається або передається безпосередньо, буде важко використовувати технологію стиснення для зменшення швидкості передачі даних. Цифровий відеосигнал можна стискати відповідно до двох основних умов:
Л. надмірність даних. Наприклад, просторова надмірність, надмірність у часі, надмірність структури, надмірність інформаційної ентропії тощо, тобто існує сильна кореляція між пікселями зображення. Усунення цієї надмірності не призводить до втрати інформації, а це стиснення без втрат.
Л. візуальна надмірність. Деякі характеристики людських очей, такі як поріг дискримінації яскравості, візуальний поріг, відрізняються чутливістю до яскравості та кольоровості, що унеможливлює введення відповідних помилок у кодуванні і не буде виявлено. Візуальні характеристики людських очей можуть бути використані для обміну для стиснення даних з певними об'єктивними спотвореннями. Це стиснення є втратним.
Стиснення цифрового відеосигналу базується на двох вищевказаних умовах, що робить відеодані сильно стиснутими, що сприяє передачі та збереженню. Поширеними методами цифрового стиснення відео є змішане кодування, яке полягає у поєднанні кодування перетворення, оцінки руху та компенсації руху та кодування ентропії для стиснення кодування. Зазвичай кодування перетворення використовується для усунення внутрішньокадрової надмірності зображення, а оцінка руху та компенсація руху використовуються для видалення міжкадрової надмірності зображення, а ентропійне кодування використовується для подальшого підвищення ефективності стиснення. Наступні три методи кодування стиснення представлені коротко.
(а) Метод стиснення кодування
(b) Трансформувати кодування
Функція кодування перетворення полягає в перетворенні сигналу зображення, описаного в космічній області, в частотну область, а потім кодуванні трансформованих коефіцієнтів. Взагалі кажучи, зображення має сильну кореляцію в просторі, і перетворення в частотну область може реалізувати декореляцію та концентрацію енергії. Загальне ортогональне перетворення включає дискретні перетворення Фур'є, дискретні косинусні перетворення тощо. Дискретне косинусне перетворення широко використовується при цифровому стисненні відео.
Дискретне косинусне перетворення називається перетворенням DCT. Він може перетворити блок зображення L * l із космічного домену в частотний. Отже, в процесі стиснення зображення та кодування на основі DCT зображення потрібно розділити на блоки, що не перекриваються. Припустимо, розмір зображення становить 1280 * 720, воно розділене на 160 * 90 блоків зображення розміром 8 * 8 без перекриття у вигляді сітки. Тоді перетворення DCT можна виконати для кожного блоку зображення.
Після поділу блоку кожен блок зображення 8 * 8 точок надсилається кодеру DCT, а блок зображення 8 * 8 трансформується з просторової області в частотну область. На малюнку нижче наведено приклад блоку зображення 8 * 8, в якому число представляє значення яскравості кожного пікселя. З малюнка видно, що значення яскравості кожного пікселя в цьому блоці зображення відносно однакові, особливо значення яскравості сусідніх пікселів не дуже велике, що вказує на те, що сигнал зображення має сильну кореляцію.
Фактичний блок зображення 8 * 8
На наступному малюнку показано результати перетворення DCT блоку зображення на наведеному малюнку. З малюнка видно, що після перетворення DCT коефіцієнт низької частоти у верхньому лівому куті концентрує багато енергії, тоді як енергія на високочастотному коефіцієнті в правому нижньому куті дуже мала.
Коефіцієнти блоку зображення після перетворення DCT
Сигнал повинен бути кількісно визначений після перетворення DCT. Оскільки людські очі чутливі до низькочастотних характеристик зображень, таких як загальна яскравість об'єктів, а не до високочастотних деталей зображення, тому в процесі передачі високочастотна інформація може передаватися менше чи ні, лише низькочастотна частина. Процес квантування зменшує передачу інформації шляхом кількісного визначення коефіцієнтів низькочастотної області та грубого квантування коефіцієнтів у високочастотній області, що видаляє високочастотну інформацію, нечутливу до людських очей. Отже, квантування є процесом стиснення з втратами і основною причиною пошкодження якості в кодуванні стиснення відео.
Процес кількісного визначення можна виразити за такою формулою:
Серед них FQ (U, V) представляє коефіцієнт DCT після квантування; f (U, V) представляє коефіцієнт DCT перед квантуванням; Q (U, V) представляє матрицю зважування квантування; q - крок квантування; раунд відноситься до консолідації, і значення, яке виводиться, приймається як найближче ціле число.
Обґрунтовано виберіть коефіцієнт квантування, і результат після квантування перетвореного блоку зображення відображається на малюнку.
Коефіцієнт DCT після кількісного визначення
Більшість коефіцієнтів DCT змінюються на 0 після квантування, тоді як лише деякі коефіцієнти є ненульовими значеннями. Наразі лише ці ненульові значення потрібно стискати та кодувати.
(b) Ентропійне кодування
Кодування ентропії називається, оскільки середня довжина коду після кодування близька до значення ентропії джерела. Кодування ентропії реалізоване за допомогою VLC (кодування змінної довжини). Основним принципом є надання короткого коду символу з високою ймовірністю у джерелі та надання довгого коду символу з малою ймовірністю появи, щоб отримати статистично меншу середню довжину коду. Кодування змінної довжини зазвичай включає код Гофмана, арифметичний код, код виконання тощо. Кодування довжини циклу - це дуже простий метод стиснення, його ефективність стиснення не висока, але швидкість кодування та декодування є швидкою, і вона все ще широко використовується, особливо після перетворення кодування, що використовує кодування довжиною циклу, дає хороший ефект.
По-перше, коефіцієнт змінного струму, який безпосередньо слідує за вихідним коефіцієнтом постійного струму квантора, повинен бути відсканований у Z-типі (як показано в рядку стрілки). Z-сканування перетворює двовимірний коефіцієнт квантування в одновимірну послідовність, а потім продовжує кодування довжини циклу. Нарешті, інший код змінної довжини використовується для кодування даних після кодування циклу, такий як кодування Гофмана. Завдяки цьому виду кодування змінної довжини ефективність кодування ще більше покращується.
(c) Оцінка руху та компенсація руху
Оцінка руху та компенсація руху є ефективними методами для усунення кореляції часового напрямку послідовностей зображень. Описані вище методи перетворення DCT, квантування та ентропії базуються на одному кадрі зображення. За допомогою цих методів можна усунути просторову кореляцію між пікселями на зображенні. Насправді, окрім просторової кореляції, сигнал зображення має часову кореляцію. Наприклад, для цифрового відео зі статичним фоном, як спільне мовлення новин та невеликий рух основного тіла зображення, різниця між кожним зображенням дуже мала, а кореляція між зображеннями дуже велика. У цьому випадку нам не потрібно кодувати кожне зображення кадру окремо, а ми можемо кодувати лише змінені частини сусідніх відеокадрів, щоб додатково зменшити обсяг даних. Ця робота реалізується шляхом оцінки руху та компенсації руху.
Технологія оцінки руху зазвичай ділить поточне вхідне зображення на кілька невеликих підблоків зображення, які не перекривають один одного, наприклад, розмір кадрового зображення становить 1280 * 720. По-перше, воно ділиться на 40 * 45 блоків зображення з 16 * 16 розмірів, які не перекривають один одного у вигляді сітки, а потім, у межах вікна пошуку попереднього або останнього зображення, знайдіть блок для кожного блоку зображення, щоб знайти один блок зображення в межах області вікно пошуку Найбільш подібний блок зображень. Процес пошуку називається оцінкою руху. Обчислюючи інформацію про положення між найбільш подібним блоком зображення та блоком зображення, можна отримати вектор руху. Таким чином, поточний блок зображення можна відняти від найбільш подібного блоку зображення, на який вказує вектор руху опорного зображення, і можна отримати залишковий блок зображення. Оскільки значення кожного пікселя в блоці залишкового зображення дуже мало, при кодуванні стиснення можна отримати вищий ступінь стиснення. Цей процес віднімання називається компенсацією руху.
Оскільки еталонне зображення потрібно використовувати для оцінки руху та компенсації руху в процесі кодування, дуже важливо вибрати еталонне зображення. Як правило, кодер розділяє кожне введене зображення кадру на три різні типи відповідно до різних опорних зображень: I (внутрішній) кадр, B (прогнозування наведення) кадр і P (передбачення) кадр. Як показано на малюнку.
Типова послідовність структури кадру I, B, P
Як показано на малюнку, I кадр використовує лише дані в кадрі для кодування, і він не потребує оцінки руху та компенсації руху під час процесу кодування. Очевидно, оскільки I frame не усуває кореляцію часового напрямку, ступінь стиснення є відносно низькою. У процесі кодування P-кадр використовує передній I-кадр або P-кадр як еталонне зображення для компенсації руху, фактично він кодує різницю між поточним зображенням і еталонним зображенням. Режим кодування B-кадру подібний до P-кадру, єдина відмінність полягає в тому, що для прогнозування під час процесу кодування йому потрібно використовувати передній I-кадр або P-кадр і пізніший I-кадр або P-кадр. Таким чином, для кодування кожного кадру P потрібно використовувати одне зображення кадру як еталонне зображення, тоді як кадру B потрібно два кадри як еталон. На відміну від цього, кадр B має вищий ступінь стиснення, ніж кадр P.
(d) Змішане кодування
У статті представлено декілька важливих методів стиснення та кодування відео. У практичному застосуванні ці методи не розділяють, і їх зазвичай комбінують для досягнення найкращого ефекту стиснення. На наступному малюнку показана модель гібридного кодування (тобто кодування перетворення + оцінка руху та компенсація руху + кодування ентропії). Модель широко використовується в стандартах MPEG1, MPEG2, H.264 та інших. З рисунка ми бачимо, що поточне вхідне зображення спочатку потрібно розділити на блоки, а блок зображення, отриманий блоком, відняти від передбачене зображення після компенсації руху для отримання різницевого зображення x, а потім для блоку різницевого зображення проводяться перетворення і квантування DCT. Квантовані вихідні дані мають два різних місця: одне - надсилати їх кодеру ентропії для кодування, а потік закодованого коду виводиться в кеш, збережений у пристрої, і чекає передачі. Інша програма полягає в протидії кількісній оцінці та зворотному зміні сигналу х ', який додає вихідний сигнал блоку зображення з компенсацією руху для отримання нового сигналу передбачуваного зображення і посилає новий блок зображення передбачуваного зображення в пам'ять кадру.
|
Введіть електронну адресу, щоб отримати сюрприз
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> африкаанс
sq.fmuser.org -> албанська
ar.fmuser.org -> арабська
hy.fmuser.org -> Вірменська
az.fmuser.org -> азербайджанська
eu.fmuser.org -> баскська
be.fmuser.org -> білоруська
bg.fmuser.org -> болгарська
ca.fmuser.org -> Каталонська
zh-CN.fmuser.org -> китайська (спрощена)
zh-TW.fmuser.org -> китайська (традиційна)
hr.fmuser.org -> хорватська
cs.fmuser.org -> чеська
da.fmuser.org -> данська
nl.fmuser.org -> Голландська
et.fmuser.org -> естонська
tl.fmuser.org -> філіппінська
fi.fmuser.org -> фінська
fr.fmuser.org -> французька
gl.fmuser.org -> галицький
ka.fmuser.org -> грузинський
de.fmuser.org -> німецька
el.fmuser.org -> грецька
ht.fmuser.org -> гаїтянський креольський
iw.fmuser.org -> іврит
hi.fmuser.org -> хінді
hu.fmuser.org -> Угорська
is.fmuser.org -> ісландська
id.fmuser.org -> індонезійська
ga.fmuser.org -> ірландський
it.fmuser.org -> італійська
ja.fmuser.org -> японська
ko.fmuser.org -> корейська
lv.fmuser.org -> латиська
lt.fmuser.org -> литовська
mk.fmuser.org -> македонська
ms.fmuser.org -> малайська
mt.fmuser.org -> мальтійська
no.fmuser.org -> Норвезька
fa.fmuser.org -> Перська
pl.fmuser.org -> польська
pt.fmuser.org -> португальська
ro.fmuser.org -> румунська
ru.fmuser.org -> російська
sr.fmuser.org -> сербська
sk.fmuser.org -> словацька
sl.fmuser.org -> словенська
es.fmuser.org -> іспанська
sw.fmuser.org -> суахілі
sv.fmuser.org -> шведська
th.fmuser.org -> Тайська
tr.fmuser.org -> турецька
uk.fmuser.org -> український
ur.fmuser.org -> урду
vi.fmuser.org -> в'єтнамська
cy.fmuser.org -> валлійська
yi.fmuser.org -> Ідиш
FMUSER бездротовий передавати відео та аудіо простіше!
Контакти
Адреса:
No.305 Кімната HuiLan Будівля No273 Huanpu Road Гуанчжоу Китай 510620
Категорії
Інформаційний бюлетень