Tutto iniziò con Radio Rex, un cane giocattolo degli anni venti in grado di rispondere al proprio nome, grazie all’uso del riconoscimento vocale; nei decenni le tecnologie si sono affinate e sviluppate ed oggi i dispositivi di voice assistant sono il prodotto su cui stanno maggiormente investendo i colossi della tecnologia, quali Apple e Google. 

Le versioni mobile di assistenza vocale (la famosa Siri per iPhone, introdotta col modello 4S nel 2011,  e la più recente Cortana per i dispositivi Windows) hanno introdotto il pubblico a questa nuova tecnologia, che ha penetrato il mercato in soli 5 anni, dato significativo se paragonato ai tempi di adozione quotidiana da parte della “massa” di web e smarthphone: 20 anni per il primo e 7 per i secondi.
Importante è anche la crescita prevista per il settore: si stima che nel 2020 il 50% delle ricerche sarà effettuata con strumenti vocali ed entro il 2022 questo mercato varrà 40 miliardi di dollari (Voice Commerce Next Major Disruptive Force in Retail, OC & Strategy Consultants Study).

I vantaggi dei voice speaker

Il successo delle tecnologie vocali va innanzitutto ricercato nella loro modalità di funzionamento, che risulta essere meno invadente rispetto agli attuali metodi di comunicazione: il sistema interagisce solo quando interpellato dall’utente ed è in grado di rispondere a richieste ad hoc.
Numerosi studi hanno anche individuato come le richieste vocali richiedano un’attività cerebrale meno intensa rispetto a quella richiesta per digitare un testo di ricerca, l’uso di questi dispositivi richiede quindi meno competenze ed è meno “stressante” rispetto ai metodi di ricerca tradizionali.

Ultimo aspetto, non per importanza, gli strumenti voice danno la possibilità di essere più efficienti e produttivi: in media una persona è in grado di digitare solo 40 parole al minuto, ma di pronunciarne ben 150! Redigere un testo su dettatura vocale, ad esempio, non solo è più veloce, ma permette di ottimizzare i tempi, in quanto la stesura, essendo vocale e quindi eyes and hands free, può essere fatta mentre si guida o mentre si cammina verso un appuntamento.

Le prospettive per il futuro

Il mondo del web marketing appare oberato e l’attenzione, ormai satura, degli utenti va richiamata con nuovi strumenti digitali. Molti brand si stanno già muovendo per individuare nuove strategie marketing che prevedano l’uso di voice speaker, tenendo conto di due aspetti: la modalità di interazione nuova ed i metodi di raccolta delle informazioni. 

Nel caso delle applicazioni voice, l’inizio dell’interazione è possibile solo se è l’utente a volerlo e le richieste effettuate possono essere meramente pragmatiche (come richiedere di inserire un nuovo contatto in rubrica, ad esempio) e non dare nessuna informazione circa i gusti o le abitudini del cliente. I brand devono quindi realizzare assistenti vocali che siano il più possibile realistici e diano l’impressione alle persone di interagire con un vero assistente personale e non con una semplice intelligenza artificiale.
Un esempio di questo tipo l’ha realizzato Mercedes con l’assistente vocale installato sulla nuova Classe A, che esegue comandi vocali di varia natura, è in grado di rispondere in modo naturale e si pone come se fosse un vero e proprio compagno di viaggio.

Gli assistenti vocali hanno potenziali enormi, in quanto adatti a pressoché ogni settore di mercato e, grazie alle continue migliorie dei loro software, sono in grado di apprendere nuove skills e nuovi modi di interazione, proprio come una persona reale.
Il settore della domotica è forse uno dei più interessanti per le tecnologie di voice assistant: questi ultimi potrebbero essere utilizzati per gestire vocalmente tutti i dispositivi smart da ogni punto della propria abitazione, non richiedendo più di trovarsi fisicamente in una stanza per, ad esempio, spegnere il televisore. 

Il campo delle A.I. vocali è in continua espansione e la facilità e praticità di uso le rendono idonee a diventare la prossima “rivoluzione tecnologica”, permettendoci di semplificare processi di ufficio, ma anche di vita quotidiana tramite ordini vocali ed, allo stesso tempo, di limitare il margine d’errore umano, in quanto eseguite da una tecnologia machine learning.