Predikce v rámci intra-frame komprese v kodeku HEVC (High Efficiency Video Coding) staví na důsledném využití prostorové redundance a přesně definovaných matematických modelů. Základním cílem je předpovědět hodnoty pixelů uvnitř bloku na základě známých sousedních hodnot, což umožňuje efektivní kódování bez nutnosti ukládat redundantní informace.

Planární režim vytváří predikční bloky jako průměr výsledků horizontálního a vertikálního filtru. Pro každý pixel v bloku se počítá vážený průměr s ohledem na jeho pozici vůči sousedním hodnotám. Tento režim je zvláště účinný v oblastech s plynulým přechodem jasových hodnot. Výsledná hodnota pixelu je definována rovnicí, která kombinuje horizontální a vertikální extrapolace, následně upravenou pomocí bitového posunu, čímž dochází k aproximaci bez ztráty výpočetní efektivity.

Režim DC (Direct Current) se hodí pro homogenní oblasti bez výrazných hran. Hodnota všech pixelů v bloku je nastavena na jednu konstantu (dcval), která se získává jako průměr okolních referenčních vzorků. Pokud takové vzorky nejsou k dispozici, použije se střední hodnota daná bitovou hloubkou — například 128 pro osmibitové video.

Nejvíce komplexní a výpočetně náročné jsou úhlové režimy, které simulují přirozené směrování textur a hran v obraze. Každý z těchto 33 úhlových režimů využívá sousední vzorky a projektuje jejich hodnoty v konkrétním směru, který je dán úhlovým parametrem A. Tento parametr není rovnoměrně rozložen, ale byl experimentálně optimalizován tak, aby co nejlépe odpovídal typickým strukturám v obraze.

Rozlišujeme úhlové režimy horizontální (režimy 2 až 17) a vertikální (režimy 18 až 34). Horizontální režimy využívají levé sousedy, zatímco vertikální používají horní. Referenční vektor se vytváří jednoduchým kopírováním sousedních hodnot, přičemž pro záporné hodnoty A se využívá i pomocný parametr B, který umožňuje projekci dalších nutných vzorků. Výsledný predikční vzorek je určen váženým průměrem dvou sousedních vzorků z referenčního vektoru — jejich výběr a váha závisí na vzdálenosti a směru projekce.

Specifické jsou režimy 10 a 26, které neprovádějí žádnou interpolaci, ale pouze kopírují hodnoty z referenčních vzorků ve směru horizontálním (režim 10) nebo vertikálním (režim 26). Přestože se jedná o nejjednodušší případy, mají své opodstatnění v oblastech s výrazně směrovanou strukturou.

Z hlediska mezi-snímkové predikce využívá HEVC hybridní blokový systém, kde každý blok prochází množstvím predikčních nástrojů. Nejvýznamnějším z nich je Motion Estimation (ME), jehož cílem je identifikovat pohybující se oblasti ve videu pomocí hledání podobných bloků v předchozích snímcích. ME je výpočetně nejnáročnější částí celého enkodéru, protože vyžaduje srovnávání milionů blokových kandidátů pomocí algoritmů jako je TZS (Test Zone Search), přičemž jako metrika podobnosti se často používá suma absolutních rozdílů (SAD).

Sofistikovanost ME je dále posílena volbou různých velikostí predikčních jednotek (PU) — od 64×64 až po 4×8 pixelů. Rozhodnutí o velikosti PU probíhá v rámci procesu optimalizace poměru bitového toku a zkreslení (RDO), což znamená, že každý blok je testován ve všech možných konfiguracích, aby se nalezla optimální kombinace. I při omezení na jednu velikost (například 32×32) je třeba během jediné sekundy vyhodnotit až 90 milionů bloků, což ukazuje na mimořádné výpočetní nároky této části kódování.

Je důležité pochopit, že efektivita HEVC nespočívá jen v množství predikčních režimů, ale především v jejich kombinaci a adaptivním výběru na základě obsahu videa. Kombinace přesných úhlových projekcí, jednoduchých režimů jako DC a Planar a pokročilé predikce mezi snímky umožňuje dosahovat vysokého kompresního poměru při zachování vizuální kvality. Kromě toho přispívá k flexibilitě formátu schopnost pracovat s různými velikostmi bloků a inteligentní výběr nejvhodnějšího režimu pro každý segment obrazu.

Jak 6WR algoritmus ovlivňuje efektivitu kódování a návrh hardware pro 3D-HEVC

V posledních letech se výrazně zlepšila efektivita video kódování díky různým algoritmům zaměřeným na optimalizaci komprese a snížení energetické náročnosti. Jedním z těchto pokroků je 6WR algoritmus, který je navržen tak, aby zlepšil jak kódovací efektivitu, tak i výkon při zpracování videí, zejména ve formátu 3D-HEVC (High Efficiency Video Coding). Tento algoritmus byl testován na několika videosekvencích s různými parametry kvantizace (QP), což umožnilo podrobně posoudit jeho vliv na výkonnost kódování.

Výzkum ukázal, že použití 6WR algoritmu má výrazný vliv na efektivitu kódování, zejména při použití All-Intra (AI) profilů, kde jsou dostupné pouze nástroje pro intra-předpovědi. Výsledky ukázaly, že algoritmus přináší lepší výsledky u nižších rozlišení, což pravděpodobně souvisí s vyššími detaily obrazu v nižších rozlišeních, což zvyšuje vliv navrhovaného algoritmu. V praxi to znamená, že algoritmus je schopný komprimovat videa s nižšími rozlišeními efektivněji, což se promítá do nižší požadované šířky pásma, při zachování vysoké kvality obrazu.

Jedním z nejdůležitějších ukazatelů kódování je hodnota BD-Rate, která měří změnu v bitové rychlosti při zachování stejné objektivní kvality obrazu (například PNSR). Testy ukázaly, že algoritmus 6WR dosahuje průměrného nárůstu BD-Rate o 2.819 % při použití AI profilu a 1.162 % při použití RA (Random-Access) profilu. To naznačuje, že přínos algoritmu je výraznější u AI profilů, protože zde není možné maskovat jeho vliv pokročilými inter-predikčními nástroji, které jsou dostupné v RA profilu.

Dalším klíčovým přínosem 6WR algoritmu je významné snížení doby zpracování při kódování. Zatímco původní DMM1 algoritmus vyžaduje průměrně 20.28 % času na kódování, nový 6WR algoritmus snižuje tuto dobu na pouhých 0.48 %, což znamená redukci času kódování o 97.62 % při použití AI profilu. Tento výsledek je zásadní, pokud jde o implementaci algoritmu do specializovaného hardware, kde je energetická účinnost a rychlost zpracování klíčová.

Hardware pro 6WR byl navržen tak, aby podporoval vysoký výstupní výkon při minimalizované spotřebě energie. Tento návrh je založen na architektuře, která se skládá z několika jednotek, každá zaměřená na specifický úkol, jako je výpočet gradientů, generování wedgeletů a výpočty SAD (Sum of Absolute Differences). Výsledky ukazují, že hardware je schopen zpracovávat až devět zobrazení 3D HD videa při 30 snímcích za sekundu, přičemž spotřebuje pouze 263.7 mW. Tento design je také schopen pracovat s nižšími frekvencemi (1.2 GHz), což umožňuje real-time zpracování šesti 3D HD videí při 30 fps s nižší spotřebou energie (172.5 mW).

Pro zajištění efektivity a vysoké propustnosti je architektura rozdělena na dvě samostatné jednotky: jednu pro zpracování bloků 4×4 a druhou pro větší bloky. Největší úzké hrdlo výkonnosti představuje zpracování bloků 4×4, protože těch je ve videu mnohem více než bloků s jinými rozměry. Tento design však umožňuje vysokou flexibilitu a adaptabilitu systému pro různé typy videí a rozlišení.

Pro implementaci 6WR algoritmu v energeticky efektivních systémech je tedy klíčové zohlednit nejen jeho schopnost zlepšit efektivitu kódování, ale také jeho schopnost výrazně snížit energetické nároky při zajištění vysoké výkonnosti. Tento přístup může být zásadní při vývoji budoucího hardware pro 3D-HEVC, kde je jak rychlost zpracování, tak i energetická účinnost nezbytná pro dosažení reálného použití ve vysokorychlostních a nízkoenergetických aplikacích.

Jak vysoce efektivní video kódování (HEVC) ovlivňuje hardware a real-time aplikace

V oblasti komprese videa jsou dnes kladeny nároky na maximální efektivitu nejen z hlediska kvality obrazu, ale i z hlediska energetických nároků a výpočetní složitosti. Standard HEVC (High Efficiency Video Coding) se etabloval jako jedna z nejvyspělejších metod komprese videa, která umožňuje dosažení vysoké kvality obrazu při nižších bitratech, než to bylo možné s předchozím standardem H.264. Tento standard je klíčový pro široké spektrum aplikací – od streamování ve vysokém rozlišení až po 3D video a virtuální realitu, a jeho implementace v hardwaru si žádá specifické přístupy.

Realizace HEVC kódování, zejména v reálném čase, představuje pro hardware obrovskou výzvu. Je nutné se zaměřit na optimalizaci výkonu a spotřeby energie, což vyžaduje pečlivé návrhy hardwarových architektur. Důležitým aspektem v této oblasti je i efektivní pohybová predikce, která je základním stavebním kamenem pro kompresi videa v HEVC. Složitost pohybové predikce v HEVC se výrazně zvyšuje ve 3D aplikacích, kdy je třeba zpracovávat více dimenzí – což zahrnuje i hloubku obrazu a jeho trojrozměrnou strukturu.

Pohybová predikce (motion estimation) je v HEVC jedním z nejvíce výpočetně náročných procesů. Použití technik jako jsou subpixelové pohyby (fractional motion estimation, FME) umožňuje dosažení vyšší kvality obrazu, ale za cenu zvýšené složitosti výpočtů. Proto jsou navrhovány speciální hardwarové implementace, které se zaměřují na urychlení těchto procesů, aniž by došlo k nepřiměřenému nárůstu spotřeby energie. V této souvislosti byly vyvinuty různé techniky, jak například hardwarové zrychlení FME, které umožňuje zpracovávat více dat na jednotku času, což je klíčové pro aplikace, které vyžadují nízkou latenci a vysoký průtok dat.

Další důležitou oblastí je optimalizace pro reálný čas. Například pro 3D videa a rozšířené videokonference jsou navrhovány speciální hardwarové moduly pro efektivní kompresi a dekompresi videí ve formátu 3D-HEVC, což zahrnuje i techniky pro zpracování hloubky obrazu a zlepšení kvality video výstupu. K tomu jsou nezbytné sofistikované metody, které dokážou v reálném čase upravovat rozlišení a kompenzovat pohyby v prostoru, což je u 3D videa výzvou.

Kromě pohybové predikce je pro efektivní kódování zásadní také kompresní technologie, která se zaměřuje na využití optimálních kódovacích bloků pro predikci a komprese. V tomto směru se používají různé metody pro snížení složitosti výpočtů a zlepšení kvality obrazu. Všechny tyto inovace musí být implementovány s ohledem na energetickou náročnost zařízení, což je klíčové zejména pro mobilní aplikace a zařízení s omezeným výkonem.

Zlepšení těchto technologií pro hardware v posledních letech vedlo k výraznému zrychlení procesů komprese a dekomprese videa, což umožnilo pokrok ve streamování videí v 4K a 8K kvalitě. Tato vylepšení jsou nezbytná pro aplikace v oblasti virtuální reality (VR) a rozšířené reality (AR), které vyžadují nejen vysokou kvalitu obrazu, ale i rychlou a efektivní manipulaci s daty.

Pokud jde o design hardware, je třeba se zaměřit na optimalizaci procesů pro konkrétní aplikace. To zahrnuje jak hardwarové akcelerátory, které zrychlují specifické operace v rámci video kódování, tak i implementace, které jsou schopné vysoce efektivně manipulovat s vícekanálovými videi. Tyto návrhy jsou nejen zaměřeny na zlepšení výkonu, ale také na zajištění kompatibility s různými formáty, což je důležité pro širokou škálu spotřebních zařízení.

Důležité je rovněž pochopení významu „komplexity managementu“ v implementaci HEVC. Efektivní implementace totiž neznamená pouze dosažení co nejvyšší kvality obrazu, ale i zajištění minimálních nároků na výpočetní výkon. Zjednodušení některých výpočtů, optimalizace kódování a využívání specializovaných hardwarových bloků vede k výraznému zlepšení efektivity celého systému.