Technologie 3D-HEVC (3D High Efficiency Video Coding) umožňuje efektivní kompresi a dekódování 3D video obsahu pro různé zobrazovací technologie, včetně stereoskopických displejů, autostereoskopických systémů a tradičních 2D displejů. Tento standard rozšiřuje HEVC (High Efficiency Video Coding) o podporu pro vícevrstvá zobrazení a hloubkové mapy, čímž poskytuje flexibilitu pro přenos videa v různých formátech, od 2D až po plně 3D.
3D-HEVC pracuje s texturovými obrázky (obrázky ve formátu RGB) a hloubkovými mapami, které obsahují informace o vzdálenosti objektů od kamery. Tyto mapy mohou být získány z různých senzorů, včetně časového letu (ToF) kamer, které jsou schopné přímo generovat hloubkové mapy. Pokud však nejsou k dispozici, musí být použity metody pro odhad hloubky, což vyžaduje dodatečné výpočty a zpracování. Jakmile je tato data k dispozici, může 3D-HEVC kódovat nejen 3D video obsah, ale také generovat stereoskopické video pro 3D displeje nebo dokonce 2D video pro standardní zobrazení.
Jádrem 3D-HEVC je proces syntézy pohledu, který využívá technologii DIBR (Depth-Image-Based Rendering) pro generování meziúrovňových syntetických zobrazení. To znamená, že mezi původními pohledy mohou být vytvořeny nové, což umožňuje reprodukci videa na autostereoskopických displejích bez potřeby nošení brýlí. Tento proces umožňuje, aby stejný bitstream, tedy data přenášená mezi encoderem a dekodérem, byly použity pro různé formáty zobrazení: pro více pohledů na autostereoskopických displejích, pro stereoskopické zobrazení s dvěma pohledy nebo pro tradiční 2D zobrazení.
V rámci procesu kódování je kladeno velké důraz na organizaci dat do tzv. "Access Units" (AUs), které obsahují všechny texturové obrázky a jejich příslušné hloubkové mapy, jež jsou spojeny s daným časovým okamžikem. Každý AU je označen indexem, který se používá pro identifikaci různých pohledů během kódování. Klíčovým prvkem je "Base View" (BV), tedy první pohled, který je kódován bez využití informací z jiných pohledů. Všechny ostatní pohledy v daném AU jsou označeny jako "Dependent Views" (DVs) a jsou kódovány podle specifického pořadí.
Systém kódování 3D-HEVC používá podobné principy jako HEVC, tedy dělení obrázků na bloky, které jsou následně kódovány pomocí nástrojů pro predikci, transformaci a kvantizaci. Kromě toho 3D-HEVC přináší nové nástroje pro kódování hloubkových map, včetně nových režimů predikce a nástrojů pro efektivní kódování rozdílů mezi původními a predikovanými obrázky. Tato predikce je kladně ovlivněna schopností komprimovat prostorové a časové redundance v obrazech, čímž se dosahuje vysoké efektivity kódování.
Když encoder vykoná predikci pro daný blok obrazu, provede rozdíl mezi původním blokem a predikovaným blokem, což vede k vytvoření reziduí. Tato rezidua jsou následně podrobena transformaci a kvantizaci, což snižuje jejich velikost a umožňuje kompresi. V závislosti na kvalitě obrazu a požadované kompresi se může volit úroveň kvantizace, přičemž vyšší hodnota kvantizačního parametru (QP) znamená vyšší kompresi, ale i nižší kvalitu obrazu.
V 3D-HEVC je také podporováno několik alternativních metod pro kódování reziduí. Jednou z nich je Segment-wise DC Coding (SDC), která se aplikuje na hloubkové mapy. SDC umožňuje obejít transformaci a kvantizaci reziduí a místo toho používá průměrnou hodnotu rozdílů mezi původními a predikovanými hodnotami. Tato metoda je efektivní, zejména u bloků s velkými plochami stejné barvy nebo textury.
Je důležité si uvědomit, že 3D-HEVC nejen podporuje kódování pro stereoskopické a autostereoskopické zobrazovací technologie, ale také poskytuje flexibilitu pro různé formáty zobrazení. Díky tomu je možné přenášet a reprodukovat 3D obsah nejen na specializovaných zařízeních, ale i na běžných 2D displejích, což rozšiřuje možnosti využití této technologie v širokém spektru aplikací, od zábavy po vědecké simulace.
Při práci s 3D videem je třeba vzít v úvahu specifické požadavky na zobrazení a kódování, které závisí na typu technologie displeje. Například autostereoskopické displeje vyžadují, aby proces syntézy pohledů byl co nejpřesnější, protože vytváří dojem hloubky bez použití brýlí. U stereoskopických displejů, na druhé straně, je kladeno důraz na přesnost zobrazení dvou pohledů pro každé oko, aby se dosáhlo optimálního 3D efektu.
Jak optimalizovat proces предсказания intra-frame в 3D-HEVC для эффективного аппаратного дизайна?
В последние годы разработка и улучшение технологий видеокодирования столкнулись с важной задачей — оптимизацией вычислительных процессов с учётом требований аппаратных средств. Важной частью этого процесса является использование алгоритмов предсказания внутри кадра (intra-frame prediction), которые играют ключевую роль в эффективности компрессии. Особенно важным стало создание гибких и ресурсосберегающих решений для реализации в 3D-HEVC (High Efficiency Video Coding), когда необходимо учитывать не только текстурные данные, но и данные о глубине, что требует большего вычислительного ресурса.
В данном контексте эффективное использование предсказания на основе различий внутри кадра может значительно улучшить качество кодирования, особенно если учитывать выбор размера Prediction Unit (PU) и способов кодирования для глубины и текстуры. Исходя из статистического анализа, можно увидеть, что некоторые методы предсказания занимают большую часть обработанных данных, что помогает эффективно сжать видео, минимизируя при этом затраты вычислительных ресурсов.
Одним из таких методов является использование различных угловых режимов и DMM-1 (Directional Multiple Modes), которые продемонстрировали высокую эффективность в предсказаниях как для текстур, так и для карт глубины. В частности, было установлено, что угловые режимы с 33 различными углами занимают основную долю в обработке как карт глубины, так и текстурных кадров. Однако, несмотря на их эффективность, высокие вычислительные затраты, особенно при работе с мелкими PU, такие как 4×4, требуют дополнительных оптимизаций.
Также стоит отметить, что для уменьшения вычислительной нагрузки при использовании этих методов целесообразно отказаться от поддержки мелких блоков размера 4×4, поскольку они малоэффективны и требуют большого объёма вычислительных ресурсов для обработки. Основные преимущества, которые были выявлены в процессе анализа, позволяют сконцентрироваться на более крупных PU, таких как 8×8, 16×16 и 32×32, что позволяет значительно снизить нагрузку на аппаратные ресурсы.
Предложенные аппаратно-ориентированные эвристики помогают уменьшить вычислительные затраты, эффективно перераспределяя нагрузку на ресурсы при кодировании текстуры и карт глубины. Одной из таких эвристик является подход, который ограничивает размеры поддерживаемых PU до четырёх наиболее представительных размеров, что оптимизирует использование ресурсов и повышает общую эффективность кодирования. Например, использование угловых режимов для предсказания текстуры и DMM-1 для карт глубины помогает лучше справляться с особенностями структуры данных в обоих каналах.
Особое внимание стоит уделить тому, как взаимосвязаны текстурные и глубинные каналы. Это можно заметить на примере того, как один и тот же блок предсказания (PB) может использовать информацию из обоих каналов. Эвристика Inter-Channel Directional Structure Detector (ICDSD) предлагает учитывать эту корреляцию, направляя предсказания через оптимизированные пути с учётом структурных направлений в каждом канале. В случае, если в одном из каналов предсказание не включает угловые или DMM-1 режимы, то применяется оптимизированное правило для корректировки этих данных.
Кроме того, использование совместных угловых режимов и специальных шаблонов (wedgelets), применяемых в DMM-1, позволяет уменьшить количество необходимых вычислений, сокращая необходимость в больших объёмах памяти и повышая общую энергоэффективность кодирования. С помощью этих эвристик удаётся значительно повысить гибкость и адаптивность системы для работы с разнообразными типами данных, одновременно снижая нагрузку на аппаратные средства.
В итоге, важно понимать, что для достижения наилучших результатов в области видеокодирования необходимо не только применять эффективные алгоритмы предсказания внутри кадра, но и оптимизировать их под конкретные аппаратные ограничения. Это включает в себя как уменьшение вычислительных затрат, так и использование специализированных методов, которые позволяют снизить энергозатраты, а также улучшить качество кодирования при сохранении аппаратной совместимости.
Jaké jsou klíčové aspekty vývoje energeticky úsporného systému pro 3D-HEVC kódování?
Vývoj energeticky úsporného systému pro pohybovou a disparitní estimaci (ME/DE) v rámci 3D-HEVC kódování se soustředí na optimalizaci kódovací efektivity při zachování kompatibility s 2D HEVC systémy. V tomto kontextu byly zavedeny různé techniky a algoritmy, jejichž cílem je výrazně snížit energetickou náročnost a výpočetní složitost bez zásadních ztrát v kvalitě komprese.
Hlavní změnou je přijetí ME/DE omezení pro implementaci 3D-HEVC, které vedlo k významnému snížení výpočetního úsilí o 59 %. Tento nový přístup byl přijat jako základní enkodér pro vyvinutý systém 3D-HEVC ME/DE s energetickým zaměřením. I když se při použití těchto omezení vyskytují určité ztráty v efektivitě kódování, tyto ztráty jsou přijatelným kompromisem pro dosažení reálného zpracování v reálném čase na mobilních zařízeních.
Pro zjednodušení procesů byly zavedeny různé techniky, které jsou běžně používány i u méně složitých HEVC kódovacích systémů, například omezený počet blokových velikostí, zjednodušené algoritmy pro hledání pohybu (BMA) nebo použití pouze jednoho kritéria podobnosti (SAD) pro výběr nejlepšího pohybového vektoru. Mnoho podobných studií však neposkytuje podrobné výsledky o ztrátách v efektivitě komprese způsobených těmito zjednodušeními, což je důležitý aspekt při porovnávání různých přístupů v této oblasti.
Vytvořený hardware pro ME/DE systém je navržen tak, aby efektivně využíval tyto zjednodušení. Důkladné testování a definování základní konfigurace systému je klíčové pro následné vývojové kroky. Výsledky v oblasti zvýšení BD-rate, které ukazují, jak se zjednodušení vlivem různých omezení projevují na výkonu kódování, poskytují důležité informace pro vývoj dalších optimalizovaných systémů.
Základní výhodou tohoto přístupu je schopnost pracovat s různými typy záběrů a různými velikostmi bloků, což zajišťuje flexibilitu při kódování 3D obsahu. Využití specifických optimalizací pro různé typy jednotek a jejich charakteristiky, jako je využívání SRAM paměti, umožňuje dosažení efektivního zpracování a výrazného snížení energetické náročnosti.
Dalším klíčovým prvkem je návrh systému s ohledem na návratnost HEVC, která je nezbytná pro kompatibilitu s existujícími 2D systémy. Tento přístup také zohledňuje korelace mezi kanály textury a hloubky, což umožňuje efektivní sdílení informací mezi těmito kanály, čímž se snižuje potřeba redundantního výpočtu. Zavedeno bylo i dynamické přizpůsobení velikosti vyhledávacího okna pro disparitu na základě hloubky, což přispívá k dalšímu zlepšení efektivity.
Pokud jde o samotný návrh zpracovatelských jednotek, každá jednotka byla navržena pro paralelní zpracování bloků s velikostmi 16×16 nebo 32×32 vzorků. Výsledkem je schopnost systému zpracovávat každý CTU (coding tree unit) sekvenčně, což umožňuje lepší využití dostupného hardwaru a zvýšení efektivity. Využití technik jako interpolace pohybového vektoru (FME) přispívá k dalšímu zvýšení kódovací efektivity, přičemž se přitom zachovává nízká energetická náročnost.
Systém je implementován v rámci 4-stupňového makro-pipeline na úrovni snímku, což umožňuje paralelní zpracování textur a hloubek pro všechny zobrazené pohledy. Každý stupeň systému je optimalizován tak, aby minimalizoval čas zpracování a zároveň udržoval nízkou spotřebu energie, jakmile jednotka dokončí svou úlohu.
Tento energeticky úsporný přístup umožňuje efektivní a flexibilní zpracování 3D obsahu pro širokou škálu aplikací, od mobilních zařízení po profesionální 3D systémy. Významným krokem vpřed je použití technologií, které zajišťují vysokou kvalitu komprese při zachování nízké spotřeby energie, což je klíčové pro zařízení s omezenými zdroji, jako jsou mobilní telefony nebo tablety.
Pochopení těchto optimalizačních technik je klíčové nejen pro vývojáře kódovacích systémů, ale i pro odborníky, kteří se zaměřují na výkon a efektivitu nových médií. Kromě samotné kódovací efektivity by čtenáři měli věnovat pozornost i tomu, jakým způsobem různé zjednodušení ovlivňují finální výstupy a jak se tyto přístupy mohou přizpůsobit konkrétním potřebám konkrétního zařízení. Zároveň by měli brát v úvahu výhody a nevýhody jednotlivých technik při aplikování na reálné aplikace, což je důležitý faktor pro dosažení optimálního poměru mezi výkonem a spotřebou energie v praxi.

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский