martedì 13 settembre 2016

Voce reale per computer con Google WaveNet

La voce artificiale è piuttosto comune ma in genere risulta metallica, robotica, artificiale. 


Google vuole invece ottenere una riproduzione vocale che risulti realistica, umana e familiare, raggiungendo un tassello importante nello sviluppo della nuova interazione tra uomo e macchina.

Voce reale per computer con Google WaveNet
Voce reale per computer con Google WaveNet
L'intelligenza artificiale di Google Deepmind ha segnato un nuovo traguardo, riuscendo a simulare la voce umana in modo naturale e realistico.

Nella tecnica del text-to-speech (TTS), quella per cui il computer legge a voce alta, l'AI che ha battuto il campione mondiale di Go sembra ora in grado di riprodurre la voce umana in modo molto realistico.

Chi ha usato anche un semplice navigatore sa che oggi la voce del TTS è ovviamente artificiale. Si capisce semplicemente ascoltando che qualcuno ha registrato un grande database di parole e che il computer le mette una in fila all'altra seguendone l'ordine che appare nel testo scritto.

Un sistema di parametri predefiniti permette al sistema di pronunciare parole non presenti nel database, con risultati a volte che vanno dal "quasi comprensibile" al "ridicolo".

È in questo contesto che si inserisce WaveNet, la nuova tecnologia di Google Voice. Una tecnologia descritta come fully convolutional neural network, e che è capace di "modificare l'onda grezza del segnala audio un sample alla volta", come scrive Lucia Armasu su Tom's Hardware USA.

Fonte: www.tomshw.it

Nessun commento: