Editoriale di Settembre 2018

Il Primo Suono del Futuro?

Autore: David Hoehl - TNT USA
Pubblicato: Novembre, 2018
Traduttore: Roberto Felletti

Quelli tra voi affezionati alle varie serie televisive dell'universo di Star Trek ricorderanno che in Star Trek: Voyager, originariamente trasmessa dal 1995 al 2001 (negli USA; in Italia fu trasmessa originariamente dal 1997 al 2004 - NdT), il medico di bordo è un ologramma (interpretato dall'attore Robert Picardo) - un umano di mezza età, un po' dispeptico, con tendenza alla calvizie, chiamato il “Medico Olografico di Emergenza” (Emergency Medical Hologram, EMH) - con un debole per il canto lirico. In questo modo, come spesso accade, la serie ha dimostrato di essere uno specchio che riflette eventi futuri, ma, come spesso accade, uno specchio distorcente, in cui l'immagine d'insieme è abbastanza precisa ma i particolari sono sbagliati. E così oggi, 17 anni dopo la trasmissione dell'ultimo episodio della serie, possiamo assistere a concerti in cui a cantare è un ologramma; ma non la lirica, bensì musica pop realizzata in crowdsourcing.

Sicuramente il nome “Hatsune Miku” sarà familiare ai lettori più giovani di TNT-Audio, che seguono in tempo reale le tendenze di Internet, ma questo vecchio bacucco ha conosciuto “lei” solo dopo averne letto nella fonte di informazioni più vintage tra tutte: un giornale cartaceo. Per coloro che non sono al passo con i tempi, come me, Hatsune Miku è un personaggio olografico che Wikipedia, la mia fonte di informazioni online preferita, descrive così: «una banca dati vocale di Vocaloid, software di sintesi vocale sviluppato dalla Crypton Future Media, con il suo “moe”[1] avatar antropomorfico ufficiale, una sedicenne con una lunga, doppia coda di cavallo e capelli color turchese che utilizza, per il canto, le tecnologie di sintesi vocale Vocaloid 2, Vocaloid 3 e Vocaloid 4 della Yamaha Corporation. Inoltre, utilizza Piapro Studio, sempre della Crypton Future Media, un plugin VSTi che è un sintetizzatore per il canto. È stata la seconda Vocaloid venduta a utilizzare il motore Vocaloid 2 e la prima Vocaloid giapponese a utilizzare la versione giapponese del motore Vocaloid 2. La sua voce è modellata su quella dell'attrice giapponese Saki Fujita. La personificazione di Hatsune Miku è stata lanciata sul mercato come idolo virtuale ed è stata fatta esibire in concerti, sul palco, come proiezione animata (retroproiezione su schermo in vetro dotato di rivestimento speciale).» Potreste domandarvi, almeno io me lo sono domandato: che cos'è un “Vocaloid”? Seguendo il comodo link nell'articolo, ho scoperto che si tratta di un software che «permette a chi lo usa di sintetizzare il “canto” inserendo il testo e la melodia. Utilizza una tecnologia di sintesi che si avvale di voci, opportunamente campionate, di attori o cantanti. Per creare una canzone bisogna inserire la melodia e il testo. Per inserire la melodia viene utilizzata un'interfaccia simile a quella dei pianoforti meccanici, che impiegavano un rullo di carta perforata, e il testo può essere inserito su ciascuna nota. Il software può modificare l'accento, può aggiungere effetti, come il vibrato, e può cambiare la dinamica e il tono della voce.»

In altre parole, per quanto ne capisco, dietro a Hatsune Miku c'è un generatore video olografico abbinato a un sistema di sintesi vocale, che converte la musica e il testo inseriti dall'utente per dare vita a un'esibizione virtuale di una figura animata, abbondantemente arricchita dal fattore “bellezza” degli anime giapponesi (e i capelli hanno il tipico colore turchese Yamaha). Dico “virtuale” perché l'artista è una figura creata da una macchina, non è un “essere vivente”, e “esibizione”, anziché “registrazione”, perché la musica è suonata dal vivo, in tempo reale, e non riprodotta tramite qualche dispositivo di memorizzazione, nel quale sia conservata in formato completo. L'esibizione può essere identica a qualsiasi altra esibizione che l'ha preceduta, ma a seconda della programmazione dei computer che c'è sotto, a un certo punto può anche variare.

Più importante della magia tecnica è il modo in cui questo personaggio è stato presentato al pubblico: dietro licenza aperta Creative Commons; come Wikipedia, l'enciclopedia che chiunque può modificare, Hatsune Miku è una cantante che canta canzoni che chiunque può scrivere. Come riportato nel Washington Post, Cien Miller, diventata una celebre compositrice sotto lo pseudonimo internettiano Crusher-P, ha descritto così i vantaggi della licenza aperta: «Potete usare la sua voce per la vostra musica, senza paura di infrangere le regole. È la formula perfetta, perché la gente ama Miku, e se ne fate uso le persone si interesseranno a quello che create.» Miller dovrebbe saperlo; a 23 anni fa la compositrice a tempo pieno, grazie soprattutto al suo successo nello scrivere canzoni per Miku.

Il nome del personaggio è il risultato dell'unione di tre parole giapponesi che, grossomodo, significano “Il Primo Suono del Futuro”; chiamarlo così potrebbe non essere un'esagerazione. Non limitato agli schermi dei computer e ai cinema 3-D, il personaggio di Hatsune Miku è stato portato in vari tour di successo in Giappone e in altre nazioni asiatiche, e ora anche negli Stati Uniti. Più avanti, quest'anno, è previsto un tour europeo. In ogni concerto una piccola band di musicisti “umani” accompagna l'ologramma, che si esibisce come cantante/ballerina, proiettato su uno schermo in vetro largo quanto il palco. I brani eseguiti sono tratti da contributi di YouTube da parte del pubblico di ogni parte del mondo, selezionati per essere al passo con le figure popolari del mondo dei computer. Gli organizzatori si accertano che almeno qualche canzone sia nella lingua del paese in cui si svolge il concerto. Gli organizzatori del tour attuale hanno anche bandito un concorso per autori di canzoni, con Hatsune che ogni sera canta la canzone vincente.

Questo modello cosa potrebbe rappresentare per il futuro dell'industria musicale? Hatsune Miku potrebbe essere la prima avvisaglia di un'altra distruttiva tempesta tecnologica in arrivo che potrebbe devastare il business dell'intrattenimento; d'altro canto, potrebbe essere semplicemente un fuoco di paglia da smanettoni tecnologici, come il Dolby FM o la TV 3-D (tenete a mente, comunque, che talvolta le tecnologie precorrono i tempi, fanno la loro comparsa per poi cadere nell'oblio per un po' e successivamente ripresentarsi; come la registrazione multicanale, che negli anni '70, con il nome di “suono quadrifonico”, fece fiasco, ma che anni dopo è riapparsa, abbinata al video, con la denominazione di “suono surround”, e che da allora non ha più guardato al passato.[2] L'elemento video è importante se si considerano le potenzialità di Hatsune Miku). Io non precorro i tempi come Star Trek, ma vi prego di assecondare “quello del vintage”, poiché sono uscito dal mio guscio e rifletto su alcune possibili implicazioni nel caso in cui Hatsune Miku dovesse essere davvero il “primo suono del futuro”.

Tradizionalmente, da quando le registrazioni hanno soppiantato le esecuzioni domestiche amatoriali come fonte principale di musica in casa, il modello convenzionale dell'industria musicale è stato un circolo chiuso in cui dei professionisti creavano il prodotto da far acquistare ai fan. I consumatori erano rinchiusi nel loro ruolo; a parte la decisione se acquistare o meno, essi avevano poca o nessuna voce in capitolo nel processo di sviluppo dei contenuti che acquistavano, e le case discografiche erano come guardiani che stabilivano chi avesse o meno l'autorizzazione per farsi conoscere. Quel modello è durato nel tempo, anche se, in anni recenti, i confini hanno cominciato a vacillare, perché i progressi dei software per la creazione di musica e le piattaforme Internet come YouTube hanno permesso, agli aspiranti produttori al di fuori dell'enclave professionale, di raggiungere un ampio pubblico.

Hatsune Miku accelera quest'ultimo processo. Ora, quei pionieri che allestiscono piccoli canali YouTube sono sfuggiti alle limitazioni di telefoni, tablet o schermi di PC e si sono fiondati sui palchi di sale da concerto, dove grandi folle sono felici di ritrovarsi e di pagare da 55 a 155 dollari a testa per ascoltare creazioni di fan “eseguite” da una “cantante”. Sì, a questo punto l'esercizio richiede ancora una certa sospensione dell'incredulità e la tecnologia ha le sue debolezze: Hatsune Miku sembra un cartone animato, apparentemente ha un repertorio di movimenti limitato e canta con una voce che tradisce chiaramente le sue origini artificiali; dal canto loro, gli spettatori che vogliono agitare le bacchette luminose durante lo spettacolo devono usare esclusivamente quelle vendute ai concerti, perché altri tipi di bacchette sono troppo luminosi e farebbero sbiadire o impedirebbero di vedere la cantante! Non importa. Se la storia dell'era informatica ci ha insegnato qualcosa, è che la tecnologia popolare solitamente all'inizio sembra piuttosto grezza, ma diventa sempre più sofisticata e, nel caso della realtà modellata, più convincente. Ad esempio, confrontate gli originali Donkey Kong o Space Invaders (non tradirò la mia età riferendomi a Pong o a Brickout) con uno qualunque dei mondi virtuali di ultima generazione. Similmente, possiamo aspettarci che gli sviluppatori perfezionino e rifiniscano Hatsune Miku, o personaggi simili, per creare una simulazione ancor più convincente di un artista umano, per non parlare della possibilità di creare non-umani virtuali; per restare in tema Star Trek, con cui ho iniziato, non mi stupirei se qualcuno creasse un'intera opera Klingon. Inoltre ci aspettiamo miglioramenti, da parte degli sviluppatori dell'intelligenza artificiale, che permettano agli artisti virtuali di essere meno legati “al copione” e, anche in questo caso, di essere rappresentazioni più convincenti di esseri viventi.

Tra l'altro, non credo che gli effetti di questa tecnologia siano limitati alla musica pop. I giorni in cui vedremo ologrammi cantare l'opera sono lontani come può esserlo l'astronave Enterprise, ma io penso a diverse situazioni in cui un artista olografico, o anche un ensemble, potrebbe facilmente prendere il posto di musicisti in carne e ossa. Ad esempio, i negozianti di attrezzature da palco potrebbero iniziare a trattare generatori di ologrammi, nel qual caso una coppia che desideri, per il ricevimento di nozze, un quartetto d'archi o un piccolo gruppo jazz, ma non possa permettersene uno composto da veri musicisti oppure viva in un luogo dove non sia possibile trovarne uno, abbia la possibilità di noleggiare un surrogato olografico. (Oppure, ecco una domanda per coloro che vogliano riflettere su questioni filosofiche, etiche e teologiche: la coppia in questione sarebbe legittimamente sposata se a celebrare il matrimonio fosse un sacerdote olografico opportunamente consacrato?)

E che dire delle implicazioni per le registrazioni? Prevedo un paio di influenze contrastanti. Da una parte, se Hatsune Miku, o chi per lei, avesse veramente successo, credo che la vita sarebbe molto più dura per coloro che si guadagnano da vivere sfornando mediocri canzoni pop per intenti puramente commerciali. Attualmente, l'insaziabile appetito di materiale discografico che l'industria ha garantisce un posto agli “scribacchini” di lungo corso, ma in un modello basato sul crowdsourcing tali autori dovrebbero competere con un mondo di amatori, alcuni dei quali molto probabilmente talenti di prima classe, che precedentemente non sarebbero riusciti a oltrepassare i cancelli delle case discografiche. Dall'altra parte, poiché i computer monitorano la popolarità delle creazioni di questi nuovi arrivati e selezionano la più popolare affinché sia eseguita dagli artisti virtuali, richiamare l'attenzione su canzoni al di fuori del gusto prevalente può diventare molto più difficile; il mondo può diventare un gigantesco compositore dilettante.

Un altro possibile disastro sarebbe se l'industria elettronica sviluppasse dei sistemi olografici casalinghi. Oggi i consumatori acquistano televisori con schermi giganti e allestiscono impianti “home theater”, oppure ascoltano musica pre-registrata con le cuffiette o con i diffusori. Immaginate invece se avessero la possibilità di avere una replica olografica, a grandezza naturale, di un essere umano che si “esibisce” a casa loro! Ancora di più, immaginate se l'ologramma disponesse di un'intelligenza artificiale sufficientemente avanzata da permettergli di variare l'esibizione, come farebbe un artista umano; questo significherebbe che non ci sarebbero due esibizioni identiche. Improvvisamente, i dischi che tutti noi conosciamo e amiamo potrebbero sembrare nient'altro che “musica preconfezionata”.

Bene, come ho già detto, io non sono un veggente tecnologico e, probabilmente, tutte le congetture precedenti non sono che una pia illusione. Tuttavia, ciò che non è aperto al dibattito è che, attualmente, le proiezioni olografiche offrono musica, a spettatori paganti, in collaborazione con musicisti dal vivo. Che piaccia oppure no, che diventi un nuovo standard oppure no, il mondo sta cambiando e il modo in cui questa nuova tecnologia evolverà sarà, come dice il Sig. Spock in Star Trek, «affascinante».

Note dell'autore

[1] - “Moe” è un termine giapponese del mondo anime; grossomodo significa “carino, grazioso”.

[2] - Avvertenza obbligatoria di TNT-Audio: Noi sosteniamo la VERA stereofonia! Noi sosteniamo la VERA stereofonia!

[Trovaci su Facebook!]

© Copyright 2018 David Hoehl - drh@tnt-audio.com - www.tnt-audio.com