[ Home | Redazione | FAQ | HiFi Shows | Ampli | Diffusori | Sorgenti | Tweakings | Inter.Viste]

Quel processo di "dithering"

Rinfreschiamoci la memoria uditiva...

[English version]

Autore: Werner Ogiers - TNT Belgio
Pubblicato: Febbraio 2010
Traduttore: Roberto D'Agosta

Questo è probabilmente l'articolo più corto nella mia carriera di recensore: infatti non avrei mai pensato che, alle soglie del 2010, ci fosse ancora bisogno di questo tipo di articoli.

Ma sembra che io mi sbagli e di grosso: leggendo qua e là nei vari forum audio sembra esserci ancora molta gente, troppa infatti, che non apprezza il dithering (l'aggiunta di rumore per rendere più regolari i transienti in un segnale digitale, N.d.T.) pensando che in fondo vada bene solo per segnali periodici e non per la musica reale.

Questo è un po' sorprendente poiché gli effetti benefici del dithering sono abbastanza semplici e immediati da verificare. Negli anni 90 l'accademico britannico Christopher Hicks aveva preparato una pagina web personale proprio a questo scopo. Quel sito purtroppo è andato perso ormai definitivamente, ma un articolo di Hicks può ancora essere scaricato dal sito Benchmark (in inglese). Al giorno d'oggi abbiamo Wikipedia ma la voce enciclopedica sul dithering, da una parte contiene tutta l'informazione importante nel nostro caso, dall'altra mischia continuamente il dithering audio e grafico (cosa educativa anche questa) e, soprattutto, manca qualsiasi esempio musicale. Ecco quindi spiegato questo mio sforzo.

Il Cosa e il Perché

In un sistema campionato (a intervalli di tempo discreto) e quantizzato (a livelli discreti) come nel caso di un brano audio digitale, il segnale può occupare solo un insieme finito di livelli, mentre nella sua forma analogica non quantizzata può assumere in linea di principio qualsiasi valore tra zero e il livello di picco, a meno di un certo grado di incertezza dovuto al rumore: anche l'analogico non ha una risoluzione infinita, ma questo argomento ci porterebbe su ben altri lidi.

La forma quantizzata del segnale può essere immaginata come una copia perfetta dell'originale più un errore. Quell'errore è formalmente chiamato "errore di quantizzazione" anche se un nome molto più esplicativo sarebbe "distorsione da quantizzazione": a differenza del rumore normale, questo errore è altamente correlato al segnale reale, poiché in qualche senso è perfettamente a tempo con esso, e questo lo rende estremamente fastidioso e insidioso.

Il dithering risolve questo problema: aggiungere un pochino di rumore a largo spettro prima della digitalizzazione rimuove infatti la correlazione. Anche se sembra troppo bello per essere vero, il fenomeno fisico può essere facilmente spiegato: il processo di digitalizzazione deve discretizzare il segnale più il rumore, a ogni istante di tempo. Ovviamente avremo la stessa distorsione di prima, ma ora quell'errore sarà correlato al rumore e non al segnale, e qualcosa che è correlato (="sembra uguale a") al rumore è, semplicemente, altro rumore. Applicare il dithering quindi linearizza la funzione di trasferimento del convertitore trasformando quella che prima era una gigantesca distorsione non lineare in rumore a largo spettro relativamente innocuo. Il prezzo da pagare è che il "silenzio" non equivale all'assenza completa di segnale, ma rimarrà sempre un pochino di rumore di fondo. In maniera simile a un nastro analogico molto, molto buono.

Ma si può fare anche di meglio: il "noise-shaping" è un processo connesso con il dithering in cui non si aggiunge semplicemente del rumore, ma per ogni campionamento si prende il rumore di quantizzazione e lo si immette, tramite un filtro ad alte frequenze, in un ciclo di feedback. Questo fa sí che ci sia meno rumore nella banda media di frequenze, dove il nostro orecchio è più sensibile, e più rumore, ma meno udibile, nella banda delle alte frequenze.

Se tutto questo vi suona arabo, non preoccupatevi, perché non voglio fare un corso sul dithering; se, invece, siete davvero interessati all'argomento andatevi a leggere l'articolo di Hicks. Quello che voglio fare ora è farvi ascoltare alcuni campioni di suono e lasciare a voi la decisione se il dithering sia veramente efficace o solo un'altra illusione dell'ingegneria elettronica teorica.

Ascoltando, scoprirete

Tutti i campioni seguenti sono presi a una risoluzione effettiva di 4 bit, con una frequenza di campionamento di 44.1 kHz. Avete letto bene, state per ascoltare del suono a 4 bit, con appena 16 step di quantizzazione per campione, corrispondenti quindi a una risoluzione 4000 volte inferiore a quella offerta da un CD.

Il primo campione è un'onda sinusoidale a 300 Hz a medio livello, seguita da una parte evanescente verso il silenzio, il tutto a 4 bit non processato:

www.audiochrome.net/clips/300Hz_4b_nodither.mp3

[300 Hz - senza dithering]

Dovete ammettere che suona esattamente come appare (ignorate quelle piccole oscillazioni nel grafico, un artefatto del programma di grafica e non parte del segnale audio).
I prossimi due campioni sono lo stesso segnale, con risoluzione 4 bit, il primo con un dithering a spettro piatto ottenuto da una distribuzione di probabilità triangolare mentre il secondo con un filtro noise-shaping molto aggressivo:

www.audiochrome.net/clips/300Hz_4b_dither.mp3

www.audiochrome.net/clips/300Hz_4b_noiseshapeE.mp3

[toni a 300 Hz]

Il grafico precedente è l'analisi spettrale dei nostri tre segnali di prova. La curva in verde è il segnale originale, 4-bit senza dithering: si nota l'armonica fondamentale a 300 Hz e poi le armoniche causate dalla quantizzazione e, infine, sopra i 3 kHz le componenti distorsive non armoniche causate dalle armoniche che riproducono la frequenza di Nyquist a 22,05 kHz.

La curva in rosso è lo stesso segnale a cui è stato aggiunto del dithering: si notano l'armonica fondamentale, l'assenza, notevole, dei componenti dovuti alla distorsione e ovviamente il rumore di fondo ad ampio spettro e alte frequenze. Il noise-shaping pone rimedio a quest'ultimo come si vede dalla curva in viola: nella banda media, critica per l'ascolto umano, il livello del rumore è in media 20 dB inferiore rispetto a prima mentre è molto maggiore intorno e oltre i 19 kHz dove il rumore, se udibile, è molto meno rilevabile dal nostro orecchio.

OK tutto bello e chiaro, ma questi sono solo toni di prova e di poco conto pratico: decisamente poco per convincere gli scettici! Ecco, quindi, la musica...

www.audiochrome.net/clips/Venice_4b_nodither.mp3

www.audiochrome.net/clips/Venice_4b_dither.mp3

www.audiochrome.net/clips/Venice_4b_noiseshapeE.mp3

Conclusioni

Beh, visto che voi avete fatto tutto il lavoro, vi lascerò anche trarre le conclusioni! Buon ascolto.

© Copyright 2010 Werner Ogiers - www.tnt-audio.com

[ Home | Redazione | FAQ | HiFi Shows | Ampli | Diffusori | Sorgenti | Tweakings | Inter.Viste]