U n approfondimento dedicato al nuovo sistema di compressione HEVC (High Efficiency Video Coding). L’articolo è tratto dall’intervento all’HD Forum Conference, tenuto da Paola Sunna, della Direzione del Centro Ricerche e Innovazione Tecnologica Rai di Torino.


Il nuovo algoritmo di compressione video HEVC, così come l’AVC (Advanced Video Coding), è basato sulla codifica a blocchi dell’immagine e sullo sfruttamento della ridondanza spaziale e temporale che caratterizza il segnale video.

Rispetto al suo predecessore, nell’HEVC sono stati ottimizzati i singoli tool di codifica, allo scopo di riuscire ad ottenere la stessa qualità soggettiva, ossia la qualità percepita, con una riduzione del bit-rate dell’ordine di circa il 50%.

Consideriamo, ad esempio, un broadcaster che decida di adottare il DVB-T2, lo standard di seconda generazione per il digitale terrestre. Come riportato nell’immagine di apertura, la banda a disposizione è compresa tra i 32 e i 36 Mbps. Utilizzando gli attuali bit-rate con l’AVC, sarebbe possibile trasmettere 4 canali HD e un canale Ultra HD.
Passando, invece, ad HEVC sarà possibile raddoppiare il numero di canali e mantenere costante la banda di trasmissione.

Inoltre, l’algoritmo HEVC è stato concepito per essere particolarmente efficiente anche nel caso di codifiche di contenuti con risoluzione superiore all’alta definizione, oltre che per agevolare lo sfruttamento di processing parallelo.


Un po’ di storia

Lo standard HEVC nasce dallo sforzo congiunto di MPEG e ITU-T VCEG (Video Coding Expert Group). A metà del 2004 è stato rilasciato lo standard di AVC High Profile e subito dopo è partita un’attività esplorativa al fine di riuscire a migliorare il più possibile l’esigenza di compressione rispetto allo standard AVC. Gli studi hanno dato risposta affermativa e, a gennaio 2012, è stato creato un gruppo di lavoro congiunto, denominato Collaborative Team on Video Coding (JCT-VC), che ha lanciato la Call for Proposals (CfP). Un’iniziativa che ha sortito subito il suo effetto e che ha dato vita a ben 27 proposte. Da qui, sono stati selezionati i tool migliori di ogni proposta che hanno generato, a ottobre 2012, la prima versione del Test Model di HEVC. Da allora è stata migliorata ulteriormente l’efficienza di compressione, ridotta la complessità, ottimizzato il disegno per il processing parallelo e, a gennaio 2013, HEVC è stato rilasciato come FDIS (Final Draft International Standard).


La tabella riportata nella videata mostra che utilizzando l’AVC è possibile trasmettere solo un programma 4K in un Mux/Transponder DVB-T2; è addirittura impossibile utilizzando lo standard DVB-T

La tabella mette a confronto le prestazioni del nuovo algoritmo HEVC con l’AVC, in uso oggi negli standard di trasmissione

HEVC versus AVC: quali differenze?

Il processo di miglioramento dello standard di compressione, frutto di un intenso lavoro di ricerca e collaborazione, ha avuto i suoi riscontri, come evidenziato dall’immagine riportata qui sotto.
È quanto emerso dalla stessa presentazione di Paola Sunna, del Centro Ricerche e Innovazione Tecnologica Rai di Torino, in un intervento all’ultimo convegno di HD Forum Italia: «Innanzitutto è cambiata la dimensione del blocco di codifica, passata da 16×16 pixel ad una dimensione massima di 64×64 pixel – ha affermato Sunna. Lo scopo era quello di riuscire a sfruttare meglio la correlazione che c’è tra pixel vicini tra loro, soprattutto nel caso di risoluzioni di segnali superiori all’alta definizione. È stata migliorata l’accuratezza delle tecniche di predizione tra i quadri, nell’ambito dello stesso quadro, ed è stato ottimizzato ulteriormente il modo di trasmettere i vettori in movimento all’interno dello stream. Inoltre, sono stati apportati ulteriori miglioramenti alla parte di codifica entropica; oltre al filtro di deblocking, già presente in AVC, è stato aggiunto un altro filtro (SAO) che consente di migliorare la qualità del segnale decodificato; in più, sono stati aggiunti dei tool per il processing parallelo: le Tiles e i WPP (Wavefront Parallel Processing ). Questi tool non sono obbligatori nello standard, il loro impiego o meno è lasciato a discrezione del costruttore a seconda delle architetture utilizzate».


Impatto dei cambiamenti sulla complessità

Sulla base dei dati disponibili possiamo affermare che la complessità di un codificatore HEVC è circa dieci volte superiore alla complessità di un encoder AVC. Se poniamo l’accento sul decoder, invece, l’ordine di complessità si aggira intorno a 2/3 volte. Questi dati sono simili a quelli menzionati nel confronto tra MPEG-2 e AVC; la complessità di un codificatore/decodificatore AVC rispetto al suo predecessore, infatti, era circa 8/4 volte superiore. Passando al processo di codifica, e prendendo come riferimento i target attualmente disponibili, il dato che ne emerge è la possibilità di decodificare in tempo reale un flusso in standard definition a 2 Mbps; utilizzando un laptop, single core a 2,6 GHz, ad esempio, si riesce a decodificare in tempo reale un flusso in alta definizione a 7 Mbps.

Per dare un’idea della complessità in codifica utilizzando il software rilasciato in HEVC e utilizzando macchine ad alte prestazioni, 10 secondi di contenuti in alta definizione vengono decodificati in un tempo che varia da un’ora e mezza alle tre ore. Cosa significa? Che le prime implementazioni hardware in real time di codificatori HEVC probabilmente non avranno le stesse prestazioni in termini di efficienza di compressione rispetto al software di riferimento. Una storia già conosciuta, perché avvenuta in passata proprio tra MPEG-2 e AVC.


Da una serie di test effettuati, considerando immagini di diversa natura si è giunti alla conclusione che l’utilizzo dell’HEVC per contenuti Ultra HD porta ad un risparmio di circa il 47% del bitrate

Distribuzione video domestica a 10 bit

Il nuovo standard di compressione video HEVC, così come l’AVC, definisce i profili e i livelli: i profili rappresentano tutti i tool di codifica che devono essere utilizzati per generare un bitstream conforme alle specifiche; i livelli, invece, si riferiscono principalmente alle capacità dei ricevitori, in grado di decodificare fino ad una determinata risoluzione e frame rate. Inoltre, il nuovo standard, definisce 2 tiers: il Main che verrà utilizzato per la maggior parte delle applicazioni e l’High che invece verrà utilizzato per applicazioni che richiedono un elevato bit-rate. La specifica rilasciata a gennaio 2013, include i seguenti profili:

– Main Profile (8 bit – 4:2:0)
– Main 10 Profile (8 &10 bit – 4:2:0)
– Main Still Picture (8 bit – 4:2:0)

Potrebbe risultare strano vedere la presenza di un profilo 10 bit associato al 4:2:0, per profili che si riferiscono alla distribuzione di video a casa dell’utente finale. Solitamente, infatti, le rappresentazioni del segnale a 10 bit, e superiori, si associano a formati di crominanza 4:2:2 o 4:4:4, e vengono utilizzati per applicazioni professionali.

Perché è stata fatta questa scelta?
Nell’AVC sono stati eseguiti diversi aggiornamenti e tutta la parte di rappresentazione del segnale a 10, 12 e 14 bit, con estensione di crominanza 4:2:2, o 4:4:4, è stata inclusa in un secondo momento nelle estensioni per applicazioni professionali.

I display supportano risoluzioni sempre più elevate; si parla oramai di Ultra HD, con display che hanno spazi di colori più ampi, il che rende necessario andare oltre gli 8 bit. La stessa UHD parla di rappresentazione del segnale a 10 e 12 bit. Si è deciso, dunque, di dare la possibilità a chi fosse interessato, fin da subito, a fornire una qualità migliore all’utente finale, di utilizzare il profilo a 10 bit, senza aspettare il rilascio delle estensioni.


Estensioni per applicazioni professionali

Attualmente è in fase di sviluppo tutta la parte relativa ai formati per applicazioni professionali, con rappresentazione del segnale a 10, 12 e 14 bit, associati a formati di crominanza 4:2:2 e 4:4:4, e lo standard dovrebbe essere rilasciato fra circa un anno; lo stesso dicasi per la codifica scalabile. MV-HEVC e 3D-HEVC , che dovrebbero essere finalizzate come standard rispettivamente nel 2014 e nel 2015 e che mantengono la retro-compatibilità rispetto alla visione del segnale 2D.

Sulla base dei risultati disponibili in letteratura (5), le prestazioni in termini di efficienza di compressione di 3D-HEVC sono superiori a quelle di MV-HEVC soprattutto se si codificano anche le mappe di profondità necessarie a sintetizzare le viste mancanti su display autostereoscopici.


La videata è relativa a test effettuati con contenuti HD, compressi in HEVC: in questo caso il risparmio di bitrate è superiore al 37%

Estensioni 3D

Per la parte di codifica 3D, il gruppo di lavoro congiunto MPEG e ITU-T, JCT-3V, sta definendo due estensioni MV-HEVC e 3D-HEVC, che dovrebbero essere finalizzate come standard rispettivamente nel 2014 e nel 2015 e che mantengono la retro-compatibilità rispetto alla visione del segnale 2D. I lavori si sono focalizzati sulla compressione di un segnale 3D composto da più viste per alimentare un display auto stereoscopico e dal quale è anche possibile ricavare la coppia di viste per alimentare i display stereoscopici. Le estensioni 3D includono anche la possibilità di codificare le mappe di profondità associate alle viste, mappe che vengono poi utilizzate in ricezione per ricostruire le viste mancanti.


HD e UHD a confronto

Generalmente, per misurare le prestazioni di un sistema di compressione, si selezionano sequenze con risoluzioni e criticità differenti e si procede a codificarle. Successivamente si decodifica il materiale e a questo punto si possono eseguire due tipologie di misurazioni: la prima (soggettiva) consiste nel mettersi di fronte ad un display e guardare le immagini codificate, con diversi sistemi di compressione, e formulare delle considerazioni sulla qualità percepita; la seconda è una misurazione oggettiva (ad es., il rapporto segnale/rumore), che mette a confronto il segnale originale rispetto a quello che ha subito il processo della codifica.

Le tabelle riportate qui sotto e nella pagina a fianco evidenziano i risultati di uno studio fatto per sequenze in UHD e HD. Il segno meno inserito nelle tabelle significa che l’HEVC è più performante dell’AVC; in particolare, nel caso di sequenze Ultra HD, per ottenere la stessa qualità oggettiva, ossia a parità di rapporto segnale misurato, si può utilizzare, in media, un 47% in meno di bit-rate di HEVC rispetto ad AVC.


Bitstream scalabile

La scalabilità del bitstream consente di decodificare parzialmente il flusso dati, così da produrre immagini con diversi livelli di qualità, risoluzione spaziale e temporale.

Un aspetto toccato dalla stessa Paola Sunna durante il convegno di HD Forum Italia a Saint Vincent: “Per comprendere meglio il concetto di scalabilità, basta considerare un flusso dati multi-livello: quello ‘base’ e quello di ‘miglioramento’, necessario per aumentare la risoluzione spaziale, quella temporale o la qualità rispetto al livello di base. Spostando l’attenzione sui due sistemi di compressione, HEVC e AVC, prendiamo in considerazione due scenari: nel primo, l’HEVC include la scalabilità di tipo spaziale e la scalabilità SNR di rapporto segnale/rumore, che consente di avere livelli successivi con qualità via via crescente rispetto ad un livello ‘base’ codificato con HEVC; il secondo scenario, invece, prevede l’utilizzo dell’AVC come livello base perché è compatibile con il parco macchine esistente e un livello addizionale composto dall’HEVC.

Rispetto all’AVC, che nelle estensioni scalabili prende in considerazione anche la scalabilità temporale, nell’HEVC la scalabilità temporale è già intrinsecamente supportata utilizzando determinate configurazioni in fase di codifica”.


Per dare un’idea concreta

Supponiamo di voler trasmettere contenuti UHD (4K) utilizzando il nuovo standard di compressione video HEVC invece di AVC che richiederebbe bit-rate compresi tra i 35 e i 40 Mbps. Supponendo che i primi codificatori saranno disponibili fra 12/18 mesi, è probabile che non si riesca ad ottenere la stessa qualità soggettiva di un AVC a 35/40 Mbps con metà del bit-rate per HEVC; sulla base dei dati disponibili, infatti, potrebbero essere necessario per HEVC un flusso di circa 25 Mbps, che potrebbe scendere, nel corso dei 5 anni successivi, intorno ai 17/15 Mbps. Un processo identico, già vissuto nei cicli di vita di MPEG-2 e AVC.