[Teoria Generale] Archiviazione del vinile - parte 4

Facciamo conoscenza con il trascrittore - Parte 4

Una workstation audio digitale per l'Uomo

In questo articolo daremo uno sguardo agli strumenti necessari per tutto il processo esposto negli articoli precedenti partendo dalla registrazione grezza di un disco come punto iniziale.

Una volta che avete l'informazione sonora registrata sotto forma di documenti su un computer, useremo una Digital Audio Workstation (DAW) (postazione di lavoro per l'audio digitale) per processarli. Una DAW non è niente altro che un potente computer connesso a dei buoni convertitori analogico/digitale e digitale/analogico e a un buon sistema di monitoraggio del suono. Questo computer deve essere in grado di far girare un programma di modifica dei file musicali, proprio come nei moderni studi di registrazione ma lavorando, nel nostro caso, solo con due tracce (non 134), senza alcuna accelerazione prodotta da componenti speciali e senza nessun controllo MIDI degli strumenti.

Sistema di monitoraggio

Una rimozione critica dei rumori propri del vinile richiede un suono più immediato e dettagliato, come può essere prodotto da cuffie di qualità, mentre per fare delle alterazioni tonali, una procedura molto critica, è necessario che la stazione d'ascolto mimi abbastanza fedelmente i sistemi in cui le registrazioni saranno suonate. Idealmente questo significa eseguire le modifiche di equalizzazione nella vostra sala d'ascolto, anche se questo potrà sembrare a molti un po' troppo ambizioso o distruttivo. Per quanto mi riguarda eseguo tutte le operazioni su un PC Pentium 4 del 2004 con Windows XP, 1 GB di Ram e due dischi primari da 200 GB (uno per il sistema operativo e i programmi, l'altro per i dati). Una manutenzione regolare e una giudiziosa regolazione delle opzioni del sistema operativo hanno mantenuto questa macchina in forma perfetta e dopo sei anni dal suo acquisto non mostra nessuna riduzione delle prestazioni rimanendo sufficiente per tutte le mie necessità.

In un armadietto, vicino al pavimento c'è un altro hard disk da 500 GB chiamato, giustamente, "The Vault", la cassaforte, che è usato per i miei backup. Il computer stesso è posizionato sopra la scrivania e questo è infatti uno delle più grandi debolezze di tutta la catena essendo decisamente rumorosa, troppo, infatti, per un lavoro audio di precisione. Per il futuro dovrò accontentarmi di questa configurazione, ma siccome stiamo rinnovando un'altra casa, ho la speranza di poter avere un ufficio personale e ridurre il rumore prodotto dai computer è già una delle cose con la priorità più alta nella mia agenda personale.

L'interfaccia audio con il mio computer è costituita da una scheda Terratec Phase 26 '96kHz / 24 bit' USB: ho già scritto riguardo a questo oggetto riscontrando una prestazione misurata decisamente mediocre (e molto lontana dai 24 bit dichiarati) e con un suono appena accettabile. Ho anche il M-Audio FireWire Audiophile che è in qualche senso superiore, ma continuo a preferire la Terratec perché da una parte è alimentata direttamente dal cavo USB, il mio computer parte sempre bene con questo componente mentre il FireWire dà sempre un sacco di problemi, e infine ha esattamente tutti gli ingressi e le uscite al posto giusto. In passato ho anche usato, stanco delle pecche del Phase 26, attraverso una connessione Toslink, un Apogee MiniDAC in una configurazione tra convertitore digitale/analogico e amplificatore per le cuffie.
Tuttavia ho amato così tanto il suo suono che l'ho spostato nel mio sistema principale per cui sono tornato ad ascoltare il Terratec da solo con la sua uscita in linea che viene inviata ad un amplificatore per cuffie autocostruito con un circuito che sembra quello di un Michell Orca semplificato. Da questa unità si va alle mie cuffie AKG K-400 e a un paio di diffusori attivi Fostex PM0.4.

Le AKG sono un'altra sorgente di frustrazione in questo sistema: mentre sono dettagliate non suonano mai in maniera veramente musicale e anche dopo più di 10 anni di servizio non mi sento così avezzo a loro da poterne giudicare accuratamente la tonalità e di certo non aiuta il fatto che sono molto camaleontiche rispetto all'elettronica che le pilota...

I diffusori Fostex sono carini e piccoli abbastanza da non invadere la scrivania (e sono anche disponibili neri, rossi o bianchi!): li ho alimentati attraverso un attenuatore passivo da 10 k che li faceva suonare soffici se non noiosi. Il mio amplificatore di linea si comporta molto molto meglio, rendendoli molto musicali, dinamici, a larga banda anche se non abbastanza trasparenti o neutrali per un serio lavoro di equalizzazione. Eppure, come diffusori per il computer sono molto buoni, economici e superano a mani basse qualsiasi cosa che venga venduta nei negozi di computer.

La nostra nuova casa avrà una stanza dedicata alla musica che misurerà circa 4 x 7 metri. Questa stanza conterrà solo componenti audio, dischi, libri e divani. Magari aggiungerò anche un sistema quasi ideale per la trascrizione del vinile, con un portatile con uscita Toslink ad alimentare il DAC Apogee (10 metri non sono un problema per i cavi ottici) e quindi potrò lavorare proprio come i grandi studi...

(* Due anni fa ho pensato di poter migliorare il sistema aggiungendo un amplificatore per le cuffie: mi sono quindi buttato sul Behringer AMP800, non aspettandomi molto ma sperando di poterlo modificare aumentando la corrente totale e aggiungendo altre uscite di linea... Alla fine però suonava troppo male ed è stato troppo difficile modificarlo per cui mi sono arreso e ho passato un po' di tempo a progettarne uno più decente...)

Scelta del software

Potete creare il vostro flusso di lavoro con un miliardo di differenti programmi, ma cercate invece di lavorare con un singolo programma che contenga la maggior parte se non tutte le funzioni per processare il suono. Nel mio caso, lo strumento che ho scelto è l'Audition 1.5 nato negli anni 90 come programma gratuito con il nome di CoolEdit. Sono personalmente cresciuto usando CoolEdit su un portatile decrepito e sono poi passato al prodotto a pagamento quando ho scoperto che fa veramente tutto quello che mi aspettavo da esso (ed è oggettivamente tanto) e con una qualità tra la buona e l'eccellente. Avversari degni di menzione sono Sony Soundforge, Steinberg Cubase e Wavelab, giusto per fare qualche nome. La versione aggiornata di Audition, l'Audition 3 mi sembra solo che aggiunga opzioni inutili e non sono neanche sicuro che possa girare tranquillamente sulla mia macchina del 2004 con Windows XP SP3.

E poi c'è l'onnipresente programma gratuito Audacity.

Ora il punto è che Audacity non mi piace: certamente è un esempio di un eccellente programma sviluppato gratuitamente oramai da diversi anni, indicando in questo modo l'esistenza di un gruppo di persone che si dedicano attivamente alla sua espansione, e anche dal punto di vista numerico è molto sicuro. Ho provato e non sono riuscito a far fallire il suo algoritmo per la conversione del rate di campionamento o per il guadagno, due test che solitamente dicono molto sulla qualità del programma. Ma trovo la sua interfaccia con l'utente orrenda, l'analizzatore di spettro troppo grezzo per misure di precisione e tutto il concetto di "progetto" difficile da capire quando tutto dovrebbe ruotare semplicemente intorno al file musicale che è stato appena caricato. Ma di nuovo, è completamente gratuito e se non siete avezzi a null'altro, come Audition, probabilmente farà quello che vi serve e anche ragionevolmente bene, per cui, per favore, guardate a questa come a un'opinione estremamente personale.

Detto questo, prima di iniziare a usare un singolo programma dovreste cercare di caratterizzarlo in qualche modo, come per esempio verificare che i suoi algoritmi non aggiungano errori e distorsioni e dovreste fare anche un null test, provando che usandolo su un file senza eseguire alcuna operazione non modifica il file stesso. Meglio ancora potreste eseguire due operazioni opposte come per esempio un guadagno positivo e lo stesso guadagno ma in negativo, e confrontare il file d'ingresso con quello d'uscita, dovendo coincidere almeno con una precisione di 24 bit.

Tutte le operazioni sul segnale audio digitale sono composte da operazioni matematiche che se eseguite dalle macchine hanno un'accuratezza finita. Questo implica che oltre al risultato desiderato c'è l'inevitabile presenza di un errore numerico. L'errore totale accumulato alla fine della catena di operazioni rappresenta una componente della distorsione del segnale d'uscita, una perdita in risoluzione, e deve essere quindi minimizzato. Questo punto sembra essere completamente trascurato da molti progettisti dei programmi audio moderni, ma anche quando questi ultimi siano estremamente precisi rimane comunque un dovere dell'utente fare in modo di usarli correttamente e in maniera ottimale.

Fatemi fare un paio di esempi. L'Adobe Audition 1.5 ha due modalità di operazione, indipendenti dal formato dei file in ingresso, una a 16 e una 32 bit.

Se aprite un file registrato in un formato superiore ai 16 bit, allora il programma entra direttamente nella modalità a 32 bit. Bene. Se aprite un file a 16 bit, diciamo ottenuto da un CD o dalla rete, Audition entra in modalità 16 bit. Qualsiasi operazione viene quindi eseguita in questo spazio (limitato) del segnale a 16 bit e gli errori cresceranno molto rapidamente.

Questo grafico mostra quello che succede a un tono puro a 7 kHz a 16 bit (con già dither applicato) che venga sottoposto a un guadagno di 4 dB con l'operazione eseguita in modalità 32 bit, seguito da un successivo dither a 16 bit. Il risultato è quello atteso, chiaro come un fischio senza nessuna distorsione o segnale spurio.

Il grafico successivo mostra invece quello che succede allo stesso segnale con le stesse operazioni in modalità a 16 bit, cioè senza una accuratezza numerica sufficiente: il troncamento dei valori digitali, di suo una forma di distorsione della quantizzazione, genera armoniche spurie e alias non armonici su tutto la banda di frequenza:

Devo ammettere che l'esempio precedente è patologico e rappresenta il peggiore scenario possibile: con la musica reale, o anche solo con un segnale diverso, le componenti in frequenza generate dall'aliasing non lineare si disperderanno più uniformemente sulla banda di frequenza in una maniera indipendente dal tempo. In questo modo ci sarà una correlazione a tempi lunghi inferiore tra il segnale reale e questa insidiosa forma di distorsione. Ma questo non può essere una giustificazione per questo tipo di errore, soprattutto perché la soluzione a questo tipo di problemi esiste ed è economica.

Per evitarli, infatti, qualsiasi operazione dovrebbe essere eseguita nel più ampio spazio di segnale possibile: nel caso dell'Audition questo è dato dalla modalità a 32 bit. Ci sono due modi per essere sicuri su questo punto: il primo implica regolare le preferenze del programma in modo che apra, di default, qualsiasi file in modalità 32 bit (Options > Settings > Data > Auto-convert all data to 32 bit upon opening), mentre il secondo comporta la conversione manuale del file caricato a 32 bit (Edit > Convert sample type).

Ogni file intermedio dovrebbe essere sempre prodotto a 32 bit e solo quando si sia deciso il formato finale (CD, DVD, FLAC e così via) si deve permettere il dither a 16 o a 24 bit. Nell'ultimo caso la musica stessa eseguirà un auto dithering per cui non c'è veramente bisogno di questa operazione e un semplice troncamento del dato numerico è sufficiente.

Per un controllo accurato di tutto il processo si dovrebbe fare uso di un buono analizzatore di spettro e ancora una volta penso che Audition dia il meglio in questo tipo di lavoro poiché è accurato, copre uno spettro dinamico e in frequenza ampio, offre molte funzioni per la scelta dell'intervallo di analisi e larghe bande dove eseguire un'analisi di Fourier, permette di fare delle medie su segmenti musicali di lunghezza arbitraria e infine permette una facile focalizzazione su ogni dettaglio possibile. A confronto, Audacity non è così ricco: in realtà ho provato analizzatori di spettro che costano molte volte il prezzo di Audition, ma per questo tipo di applicazioni Audition vince a mani basse.

Per questi test occorre produrre dei segnali di prova adatti: generalmente questi sono il silenzio digitale, toni singoli, toni multipli che vengono poi inviati allo stadio di elaborazione che si vuole testare. Quindi si procede all'analisi dei file risultanti alla ricerca di effetti spuri indesiderati come armoniche, componenti non armoniche e un aumentato rumore di fondo. Ogni passo di elaborazione ben implementato dovrebbe essere trasparente come un fischio. Solo allora saprete che l'elaborazione non sta mutilando il segnale musicale.

Un livello di attenzione particolarmente alto deve essere sempre mantenuto con processi di conversione del rate di campionamento (SRC): mentre da una parte le operazioni matematiche necessarie per questa procedura sono ben chiare e in linea di principio si può attuarle in maniera perfetta, dall'altra molti strumenti commerciali e gratuiti, anche oggi, hanno delle prestazioni ridicole. Questo è particolarmente preoccupante con la riduzione della frequenza di campionamento perché questa procedura può potenzialmente distruggere una parte dell'informazione, mentre l'incremento della frequenza di campionamento può solo al massimo riprodurre la stessa informazione nelle bande sbagliate di frequenza. Fortunatamente c'è questa iniziativa, http://src.infinitewave.ca, di una casa di masterizzazione canadese per tentare di caratterizzare i programmi per l'SRC in maniera uniforme e obiettiva.

Andate a visitare quel sito web: mostra come un certo insieme di strumenti si comporta nella conversione, spesso utile, tra i 96kHz e i 44.1kHz. I parametri di qualsiasi strumento che tenti quella conversione sono:

passabanda piatto (se non necessario o specificato altrimenti)
banda di transizione stretta (se non necessario o specificato altrimenti)
alta attenuazione di fine banda
no aliasing
nessun incremento del rumore di fondo
nessuna componente aggiunta di distorsione

Tutte queste prestazioni possono essere facilmente giudicate facendo uso di quella pagina web. Guardiamo alcuni casi interessanti:

Cominciamo con Adobe Audition 1.5 configurato con quelli che sembrano essere i parametri per la migliore prestazione: quality="999" e il pre-filtro abilitato. Le spazzolate in frequenza mostrano la mancanza di qualsiasi alias, cosa di per sè eccellente ma uno sguardo attento a quel grafico mostra che lo sfondo non è perfettamente nero (=silenzio) ma un blu scuro (potreste volere abbassare le luci per vedere meglio questo effetto). In questa modalità l'SRC dell'Audition inserisce nel segnale d'uscita un segnale spurio, vale a dire rumore, su tutto lo spettro di frequenze. Se infatti andate a vedere nella funzione di risposta impulsiva del filtro (facendo uso dello stesso Audition) noterete che la risposta tipica di un filtro FIR Sinc(x) non rimane strettamente monotona alle piccole ampiezze, scostandosi sensibilmente dall'idealità. Allo stesso modo grafico del tono a 1 kHz mostra un rumore di fondo abbastanza alto.

Ora se si disabilita il pre-filtro allora lo stesso grafico mette in mostra una quantità limitata di aliasing, ma cosa più importante, un fondo più scuro e pulito. L'aliasing avrà un effetto significativo solo sulle più alte frequenze (dove peraltro l'orecchio umano è completamente insensibile alla variazione del tono) per cui non è così impattante mentre tutto il segnale musicale trarrà vantaggio dal fondo più pulito. Perciò, secondo me, questa è la configurazione in cui l'SRC di Audition dovrebbe essere usato.

Ora diamo un'occhiata a come si comportano i programmi gratuiti o economici: da sinistra a destra Audacity (migliore qualità), Audacity (media qualità) e Goldwave 5.18.

Audacity nella modalità di qualità maggiore è abbastanza accettabile, simile a Audition con il pre-filtro attivo, mentre non dovrebbe essere usato in qualità media e Goldwave non è neanche descrivibile...

Il gioco diventa anche più interessante se esaminate diversi strumenti commerciali che sono o furono usati nell'industria musicale. Da sinistra a destra, Sony Soundforge 9, Pyramix 6.2.3 e Pro Tools HD7.2. L'ultimo è abbastanza ragionevole, ma lontano dall'eccellenza, mentre gli altri due sono semplicemente orribili. Questo di certo non induce ad avere fiducia negli altri algoritmi presenti in questi costosi pacchetti, vero?

E quando un CD suona male, andrete ancora a incolpare il digitale o forse i colpevoli potrebbero essere i programmi di masterizzazione?

Ora qualcosa di completamente diverso: da sinistra a destra right r8brain (gratuito), SoX (gratuito), iZotope (solitamente usato all'interno di qualche altro programma commerciale come per esempio il Sony Soundforge 10).

Tutti e tre raggiungono quasi la perfezione: iZotope è quasi spaventoso specialmente guardando il residuo della distorsione. Inoltre sia SoX che iZotope vi permettono di scambiare la caduta della banda di transizione con la lunghezza della risposta impulsiva e hanno filtri a fase lineare, minima o intermedia, proprio come gli ultimi lettori "avanzati" targati Meridian o Ayre... e questo dovrebbe dire abbastanza.

Un altro tipo di conoscenza che ho trovato indispensabile è stata l'istruzione: potreste scoprire molto visitando i diversi forum di discussione sulla masterizzazione che esistono in internet, ma la via più breve alla conoscenza, a parte mettere le mani in pasta, è leggere il libro di Bob Katz Mastering Audio - the Art and the Science (in inglese). Questa dovrebbe essere una lettura fondamentale per chiunque sia anche lontanamente interessato alla produzione e alla elaborazione moderna della musica.

[Indietro alla Parte I] | [Indietro alla Parte II] | [Indietro alla Parte III]