L’adozione delle tecnologie vocali evolve e comporta accorgimenti in ottica privacy e security. Ne abbiamo parlato con Piergiorgio Vittori, Global Development Director & Country Manager Italy, UK and Ireland di Spitch, azienda specializzata nello sviluppo e implementazione di soluzioni vocali
Le tecnologie vocali sono in rapida espansione: il mercato delle soluzioni basate sul riconoscimento del linguaggio parlato, valutato nel 2016 a livello globale intorno ai 5,15 miliardi di dollari, è cresciuto del 19,80% annuo, con la stima di raggiungere i 18,30 miliardi entro il 2023 e fra questi, prima del 2020, il 50% delle query analitiche sarà elaborato in linguaggio naturale.
Gli utenti hanno iniziato a sperimentare servizi erogati in linguaggio naturale (LN) o in cui il linguaggio naturale viene riconosciuto da BOT (operatori robotizzati) che interpretano le richieste e forniscono soluzioni al problema sottomesso. Non sempre le percezioni sono favorevoli da parte degli utenti e spesso non si è a conoscenza delle tecnologie applicate. Risulta infatti dalla una ricerca commissionata da Spitch che molti consumatori ancora non conoscono le possibilità offerte dalle applicazioni basate su AI, machine learning, legate all’assistenza virtuale e al riconoscimento automatico del LN. Più del 55% delle persone coinvolte, trovandosi a interagire con un operatore di call center “robotico” pensa che il sistema non sia in grado di comprendere le sue esigenze, e vorrebbe il supporto di “una persona vera”. Però, il 26% degli intervistati plaude alla modernizzazione e il restante 19% apprezza i vantaggi dell’automazione.
I maggiori trend del 2019 per le tecnologie vocali hanno riguardato: il “Voice first” per cui la customer experience non può più fare a meno della voce, il “We know your voice”, secondo cui la biometria vocale è un fattore di successo, ”l’Omnichannel voice upselling” che richiede di proporre quello che il cliente realmente vuole, il “Voice data & privacy” per usare la speech analytics a supporto della compliance e il “Buy your voice when needed” in relazione all’importanza del servizio in outsourcing.
Considerazioni sulla sicurezza e privacy emergono in relazione all’uso della AI con start up come Lyrebird capaci di sviluppare applicazioni di sintesi vocale, per riprodurre artificialmente la voce umana, e clonarla dopo l’ascolto di minuto di registrazione della voce di una qualsiasi persona. Anche il report Gartner ““Cool Vendors in Speech and Natural Language”, dichiara che le organizzazioni “spesso sottovalutano il livello di localizzazione e personalizzazione richiesto dalle soluzioni di linguaggio naturale”. Il report di Gartner evidenzia come il linguaggio umano contenga molte più informazioni del semplice testo ovvero importanti metadati”. Quindi è molto importante che chi implementa queste tecnologie curi l’aspetto della privacy e della security dei dati biometrici.
Una delle aziende indicata come cool vendor da Gartner nel report sulle tecnologie vocali è l’azienda svizzera Spitch citata fra le tre aziende innovative nel mercato del riconoscimento vocale nel linguaggio naturale. Al suo Global Development Director & Country Manager Italy, UK and Ireland, Piergiorgio Vittori abbiamo volute chiedere alcuni chiarimenti proprio in tema security e privacy.
Ci spiega in dettaglio perché la biometria vocale è sicura, nonostante esistano sintetizzatori vocali che possono riprodurre fedelmente la voce e cosa impedisce ad un hacker di essere sufficientemente accurato nella riproduzione?
L’autenticazione biometrica, in particolare la vocale, ha un livello di sicurezza molto alto, facendo leva su una caratteristica “unica”, e composta da più di 100 variabili morfologiche. Il tema delle riproduzioni vocali sintetiche è cruciale, e dobbiamo affinare i sistemi di riconoscimento per essere sempre più bravi di qualsiasi avanguardia tecnologica malevola.
Che autenticazione a doppio fattore è appropriato implementare in ottemperanza alla PSD2, per evitare frodi da parte di malintenzionati?
Ogni settore di business o azienda saprà scegliere la combinazione più adatta in termini di sicurezza e customer experience. L’autenticazione si basa sui seguenti parametri: “qualcosa che sai” (es. PIN), “qualcosa che hai” (es. token) e “qualcosa che sei” (es. voce). Le modalità sono multiple, e addirittura per le interazioni più delicate possiamo scegliere tre fattori diversi, ovviamente di categorie differenti.
Come proteggere il dato della biometria vocale correttamente in ottica GDPR?
Come per ogni dato sensibile, l’azienda deve strutturare un meccanismo di protezione rigoroso, anche attraverso un sistema di blockchain per cui le violazioni non comportino il furto di tutti i dati collegati allo specifico utente. L’impronta vocale non è di proprietà del fornitore di tecnologie vocali, ma ricade sotto la responsabilità del cliente che la implementa. Ricordiamo che si tratta di un insieme numerico e non di una registrazione, e che non è possibile replicare con successo il processo inverso a quello sottostante la sua creazione né risalire al proprietario della voce senza un’associazione diretta. Infine non tutte le biometrie sono uguali. Nel caso di utilizzo della biometria come metodo di autenticazione, ad esempio, va sottolineato un vantaggio fondamentale delle tecnologie vocali: nessuna informazione viene memorizzata o conservata sui dispositivi mobili, a differenza quel che accade in altre forme di autenticazione biometrica, come appunto quella facciale, che richiedono di scattare una foto o effettuare una registrazione.
Può farci un esempio di come effettuare correttamente il trattamento del dato biometrico vocale per evitare intenzioni etiche discutibili?
Innanzitutto, al momento della creazione dell’impronta vocale deve essere richiesto il consenso dell’utente, a norma di privacy, e non è necessario aggiungere alcuna informazione personale e sensibile. La conservazione va poi effettuata in un “luogo” sicuro, ovvero un server sicuro. Nel caso in cui qualsiasi informazione personale debba essere identificata e cancellata, lo si può fare semplicemente cancellando le informazioni, poiché nulla viene salvato / conservato sui dispositivi personali durante l’intero processo.
In quale ambito le tecnologie vocali sono maggiormente utilizzate?
L’autenticazione biometrica ha il suo campo principale nel settore finanziario, per gestire in piena sicurezza operazioni riservate; altri settori sono Health Care, Insurance, e ovunque sia fondamentale l’operatività decisionale in prima persona in totale sicurezza. Gli altri ambiti delle tecnologie vocali (interazioni in linguaggio naturale, IVR, speech analytics …) possono essere calati in qualsiasi sistema di customer care e call center, e potenzialmente in qualsiasi settore (telefonia, utilities, e-commerce, e molti altri ancora).
Visto che gli utenti sono diffidenti all’uso dei bot perché a loro dire “non capiscono bene”, a che punto sono le tecnologie per ottimizzarli evitando che siano gli umani a doversi adattare al Bot e non viceversa?
I bot, sia testuali che vocali, imparano continuamente dalle interazioni con l’utente, migliorando attraverso il Machine Learning le proprie conoscenze e prestazioni. La tecnologia sta facendo passi da gigante, ampliando la casistica del riconoscimento dell’intento dell’utente, e soprattutto nella personalizzazione per ogni industria e azienda. Spitch proprio per questo sviluppa soluzioni su misura per il singolo clienteperseguendo cinque prassi: valutazione su quanto sia necessario il bot da implementare, ricordare che non sempre il “tutto e subito” è la soluzione giusta, pensare a chi lo userà, mai copiare i processi del sito per la struttura della conversazione e investire da subito nella sicurezza.