I software per il riconoscimento vocale circolano da molti anni, e da sempre libri e film di fantascienza ci raccontano mondi in cui l’interazione uomo-computer è mediata sostanzialmente dalla voce. Le nostre aspettative su come debba funzionare un computer futuribile sono così legate alla voce che molti autori, quando devono rappresentare una tecnologia evoluta, si guardano bene dal contemplare display e tastiere. Gli esempi non mancano: dal più ovvio “2001: Odissea nello spazio” a “Star Trek: Rotta verso la Terra” (rimasta celebre tra i fan la scena in cui Scotty, l’ingegnere capo dell’Enterprise, afferra un mouse e cerca di usarlo per impartire comandi vocali a un Mac del 1986).

Le nostre aspettative sull’interazione mediata dalla voce, però, sono state sempre deluse. I primi esperimenti di dettatura al computer erano davvero frustranti, e anche se l’uso della voce è molto più veloce (e istintivo) della scrittura, la quantità di errori di interpretazione era così alta da vanificare ogni vantaggio.

Oggi però lo cose sono diverse.

In modo silenzioso i complicatissimi algoritmi di decifrazione della voce umana sono evoluti. I classici, vecchi software di sintesi vocale ci sono ancora, ma la novità è che ora funzionano. Una piccola rivoluzione, con poco riscontro sulla stampa di settore, eppure oggi possiamo fare ciò che abbiamo sempre immaginato: dettare una lettera al nostro computer, senza perdere troppo tempo a correggere i refusi.

Chi ha uno smartphone, grazie a strumenti come Dragon Dictation per iPhone (http://itunes.apple.com/it/app/dragon-dictation/id341446764) o FlexT9 per Android (http://www.dragonmobileapps.com/android/flex.html), sta già utilizzando gli algoritmi di ultima generazione. Con risultati certo non perfetti, ma comunque sorprendenti, specie se usiamo un auricolare o ci troviamo in un ambiente poco rumoroso.

Perché dunque non provare la dettatura utilizzando il nostro solito computer, che può contare su memoria e processori molto più potenti rispetto a un telefono? Ecco allora la mia prova di MacSpeech Dictate, della MacSpeech Inc. (http://italy.nuance.com/naturallyspeaking/products/macspeech-dictate.asp), un software per Mac basato sugli algoritmi della Nuance, azienda leader nel settore.

A proposito della scelta del software da adottare, gli utenti Mac facciano attenzione a non acquistare Dragon Dictate 2, disponibile ad esempio sull’Apple store. Con scarsa considerazione dei clienti italiani, la Apple non avvisa con sufficiente chiarezza che Dragon Dictate 2 è sì più evoluto rispetto a MacSpeech Dictate, ma non funziona con la ligua italiana! Gli utenti Windows invece possono adottare con buona soddisfazione Dragon NaturallySpeaking 11 (disponibile in varie versioni sul sito della Nuance: http://italy.nuance.com/).

Ed ora, eccoci al dunque: quanto è affidabile il riconoscimento vocale? Come già anticpato, non è infallibile al 100%, ma crea più o meno gli stessi refusi che produrremmo con la tastiera, con il vantaggio di essere molto più veloce, anche rispetto a un dattilografo esperto. Insomma, è uno strumento che mi sento di consigliare.

L’auricolare Plantronics Calisto con adattatore USB Bluetooth BUA-100. L’adattatore USB Bluetooth di serie non funziona con gli iMac recenti (occorre farsi spedire dalla Plantronics un adattatore alternativo)

Certo, per onestà, bisogna aggiungere alcune considerazioni:

  • il riconoscimento vocale è poco pratico se lavoriamo in ambienti molto rumorosi, o abbiamo evidenti difetti di pronuncia;
  • dettare a voce alta significa fare ascoltare a chi ci circonda quello che diciamo, e non sempre è possibile/opportuno;
  • la dettatura cambia il nostro stile di scrittura. Per lo più in meglio, poiché le idee si traducono in testo più velocemente e possiamo seguire più facilmente il filo dei nostri pensieri. Ma se siete abituati a rielaborare le frasi molte volte, avrete bisogno di più tempo per ambientarvi.

Venendo alla versione specifica di MacSpeech Dictate, la 2, devo constatare che il prodotto non è allo stato dell’arte. Il già citato Dragon NaturallySpeaking 11 per Windows ha algoritmi ulteriormente affinati, si integra meglio nel sistema e costa meno. Anche Dragon Dictate 2 per Mac è migliore, benché limitato alla lingue inglese. La versione per noi utenti Mac italiani è comunque valida, nel suo insieme, e ho deciso di acquistarla confidando in un upgrade a prezzo di favore quando l’ultima generazione arriverà anche da noi che viviamo ai “confini dell’impero”. Alcuni blog parlano di settembre/ottobre 2011 (il prodotto è stato effettivamente aggiornato a ottobre 2011: si veda l’articolo su Dragon Dictate 2.5 per Mac).

Installato il prodotto (come al solito l’installazione su Mac risulta semplice e veloce) ci si imbatte in alcune scelte progettuali della MacSpeech Inc. piuttosto discutibili: MacSpeech Dictate non si avvia se non collegate uno dei microfoni imposti. Microfoni che, se non altro, sono sempre inclusi nella confezione del prodotto. Potete scegliere fra:

  • cuffie Plantronics PLT 610 (software + cuffie: 199,00 euro),
  • microfono USB MacMice MicFlex (software + microfono: 209,00 euro),
  • auricolare Plantronics Calisto con adattatore USB Bluetooth (software + auricolare: 329,00 euro).
L’adattatore USB Bluetooth Plantronics BUA-300M, che deve sostituire l’adattatore BUA-100 fornito di serie con MacSpeech Dictate se si usa un iMac recente.

Purtroppo, se avete un iMac recente con microprocessore i3 oppure i5 oppure i7, la terza soluzione non funziona in modo soddisfacente. L’adattatore USB Bluetooth fornito di serie semplicemente non viene riconosciuto, e anche il modello sostitutivo, spedito a richiesta dalla Plantronics (l’adattatore con codice prodotto Plantronics BUA-300M), crea più di un problema. Non solo non è in grado di accoppiare l’auricolare automaticamente (per farlo dovrete ricorrere a un PC con Windows), ma andrà sovente in conflitto con l’antenna Bluetooth interna all’iMac. Un pasticcio dovuto probabilmente a qualche maldestra scelta progettuale della MacSpeech. Di fatto chi ha un iMac recente farà bene a evitare la versione con auricolare Plantronics Calisto.

Venendo al software, ha una interfaccia utente piuttosto semplice, che consiste in una piccola icona che compare nella barra dei menu, che accende e spegne il microfono (lo si può fare anche attraverso comandi vocali), e in una finestra di stato traslucida che indica se il microfono è accesso o no, visualizza il livello di registrazione e consente di accedere alle varie modalità di interazione (dettato, comandi, compitazione, riposo).

Purtroppo la finestra di stato si integra male con le altre applicazioni del Mac perché vi si sovrappone: le medesime funzioni avrebbero potuto essere collocate con maggiore praticità nella barra dei menu. Piuttosto utile, invece, l’editor del vocabolario, che consente di aggiungere parole personalizzate alle quali è possibile anche associare un particolare addestramento vocale, così da ridurre i problemi con sigle, nomi e luoghi.

Utile anche il blocco note; a quanto riferisce la documentazione, le correzioni apportate all’interno di questo editor sono utili a MacSpeech Dictate per apprendere dai propri errori, facendo sì che il programma con il tempo diventi sempre più affidabile.

Per concludere vale la pena citare la possibilità di impartire comandi al proprio computer attraverso la voce (opportunità meno pratica del mouse, ma probabilmente preziosa in certe circostanze), e il CDROM allegato al prodotto con un manuale d’uso in formato audio, utile per utenti con handicap.

MacSpeech Dictate, http://italy.nuance.com/naturallyspeaking/products/macspeech-dictate.asp

  • con cuffie Plantronics PLT 610: 199,00 euro
  • con microfono MacMice MicFlex: 209,00 euro
  • con auricolare Plantronics Calisto e adattatore USB Bluetooth: 329,00 euro