Sintesi vocale nel 2003
Una fiera di settore mette in mostra tutte le più recenti tecnologie per il colloquio via voce con i calcolatori
Si è svolto durante il mese di ottobre, nella città di New York, la nona edizione dellannuale incontro SpeechTEK: un evento che riunisce aziende e programmatori specializzati nel campo della sintesi vocale. SpeechTEK ha una forte componente commerciale, una fiera campionaria in cui i produttori di programmi che parlano e ascoltano cercano acquirenti per le loro tecnologie, ma anche un aspetto scientifico, in cui i ricercatori si confrontano e discutono le più recenti tecniche e idee del ramo.
Secondo lorganizzatore dellevento, James Larson, dobbiamo abbandonare la fiducia malriposta nellidea che un calcolatore possa davvero capirci, o che noi possiamo intrattenere una conversazione significativa con una macchina. Fatto ciò, le nuove tecnologie nel campo della sintesi vocale sono assolutamente stupefacenti. Alcuni dei nuovi prodotti mostrati nei padiglioni, in effetti, fanno pensare ai fantascientifici cervelli elettronici che la fantascienza degli anni Cinquanta aveva immaginato, ma a detta dei progettisti si tratta esclusivamente di astuzie tecnologiche. Un calcolatore che ascolta attraverso la linea telefonica le richieste di un consumatore e poi gli offre una risposta pertinente, tipicamente non è altro che un repositorio di suoni organizzati per parole chiave (cioè, una registrazione di tutti i nomi di tutti i prodotti, più parole come guasto, assistenza, intervento, riparazione, installazione, fattura eccetera). Il sistema si limita a confrontare i suoni emessi dal consumatore con quelli che ha in memoria: se riconosce installazione e pincopallo trasmetterà in risposta sulla linea telefonica una registrazione in cui viene spiegato agli acquirenti del prodotto pincopallo come toglierlo dalla scatola e cominciare a utilizzarlo.
Leffetto però è prodigioso: e così a SpeechTEK si sono visti sportelli bancomat senza tastiera e schermo che colloquiano a voce con il risparmiatore, telefoni cellulari senza tastiera (utilissimi per chi ha mani grandi ma vuole un telefonino piccolissimo), IBM ha presentato una versione del suo sistema WebSphere che permette di inserire un colloquio a voce tra il navigatore di Internet e il sito web. La manifestazione si è chiusa con una sfida: gli sviluppatori intervenuti dovevano realizzare entro otto ore un calcolatore che, attraverso domande mirate, guidasse a voce un automobilista e gli permettesse di diagnosticare un qualsiasi guasto alla vettura. Uno dei concorrenti ci è riuscito, inserendo ben trecentosettantotto possibili guasti nel sistema.
Originariamente pubblicato in data 12/10/2003