Non l’ha ancora rilasciato ma l’ha presentato. Prima di mettere Meena sul mercato, Google sta cercando di risolverne tutti gli eventuali problemi di sicurezza (non dimentichiamo infatti che nel 2016 il bot Tay, rilasciato da Microsoft su Twitter, cominciò a pubblicare tweet sessisti e xenofobi). Meena è l’ultimo chatbot basato su reti neurali di Google e sembra che costituisca un balzo tecnologico verso una conversazione sempre più umana. Meena ha infatti il potenziale per migliorare il servizio clienti di web e call center assumendo compiti sempre più complicati rispetto ai chatbot attuali. Meena si basa su un modello conversazionale neurale end-to-end, in grado di considerare più di 2,6 miliardi di parametri. Per misurarne le capacità, Google ha sviluppato il sistema di misurazione chiamato SSA (Sensibleness and Specificity Average), in grado di valutare le risposte in una conversazione, assicurandosi che esse siano pertinenti e comprensibili. L’SSA ha dato un punteggio dell’86% a una conversazione umana, mentre Meena raggiunge il 79%. Nessun chatbot esistente ha superato il 60%.
Secondo il report 2018 di Grand View Research, il mercato globale del chatbot dovrebbe raggiungere 1,25 miliardi di dollari entro il 2025, con un CAGR del 24,3% (tasso annuo medio di crescita). I risultati della ricerca condotta da Servion, inoltre, stimano che entro il 2025 i chatbot guideranno il 95% delle interazioni tra azienda e clienti. Insomma, quella di Chatbot e Conversational AI non è una moda passeggera destinata al fallimento, come alcuni esperti credevano all’inizio.
Chatbot e Conversational AI: i trend futuri
Il mercato crescerà anche perché trainato da altre tendenze. Tecnologie come l’intelligenza artificiale, l’IoT e le API si stanno evolvendo rapidamente. I chatbot sono integrati con queste tecnologie per offrire operazioni avanzate. Si prevede che i chatbot basati su intelligenza artificiale applicata a voce e audio rappresenteranno la maggiore quota di mercato in futuro. Inoltre, il riconoscimento vocale è migliorato drasticamente e questo dovrebbe comportare prestazioni migliori in varie applicazioni.
La Conversational AI è il prossimo passo dell’interazione tra uomo e computer – un’interazione che potrebbe sostituire mouse e tastiera e divenire uno strumento essenziale per comunicare efficacemente con le macchine di nuova generazione. Ma raggiungere le capacità linguistiche a livello umano nei sistemi di comunicazione vocale, nell’assistenza ai clienti automatizzata, nei macchinari industriali e nei robot, o negli assistenti vocali personali, non è semplice. I recenti sviluppi, tuttavia, fanno ben sperare per l’evoluzione futura e la proliferazione della Conversational IA.
Assistenti personali come Siri di Apple e Alexa di Amazon hanno introdotto nella più ampia popolazione dei consumatori l’idea di un’interazione verbale bidirezionale con una macchina. Mentre la tecnologia che Siri e Alexa utilizzano è in costante miglioramento, esse continuano ad avere compiti e funzionalità limitate. Possono leggere le notizie, mettere una canzone, impostare una sveglia o cercare i termini di base su internet. Si dice che Alexa abbia sviluppato 63.000 competenze, un numero che aumenta di circa 36 al giorno. Ma quando si avventurano al di fuori di questi compiti predefiniti spesso gli assistenti vocali faticano a dare un senso alla conversazione.
Tastiera e mouse “in pensione”
Con l’avanzare dell’IA conversazionale, potrebbe cambiare drasticamente il modo in cui immettiamo i comandi in un computer. L’essere umano pronuncia in media tra le 120 e le 150 parole al minuto, ma digita solo tra le 38 e le 40 parole. Se le macchine fossero in grado di capire e agire basandosi sul parlato, la velocità del flusso di informazioni potrebbe crescere in modo significativo. La comprensione del linguaggio naturale (NLU) è un ramo dell’AI che sfrutta la potenza di calcolo per comprendere gli input linguistici, sia il parlato, sia il testo, sia una combinazione di entrambi.
Le sperimentazioni
Oggi, la maggiore potenza di calcolo dell’unità di elaborazione grafica (GPU) rende possibile l’elaborazione del linguaggio naturale (PNL). Recentemente, il produttore leader di GPU Nvidia ha annunciato che la sua piattaforma AI ha raggiunto un notevole traguardo: ha istruito con successo uno dei modelli linguistici NLP/AI più avanzati al mondo – Bidirectional Encoder Representations from Transformers (BERT) – in un tempo record di 53 minuti. Il sistema è stato in grado di recepire input e comprenderne il significato in soli 2,2 millisecondi. In passato per “istruire” BERT ci volevano alcuni giorni e ogni informazione veniva recepita in seguito a una elaborazione di circa 10 millisecondi. Miglioramenti delle prestazioni come questi stanno incrementando la velocità e la precisione, ponendo le basi per le applicazioni del mondo reale.
Si prevede quindi che la formazione più rapida aumenterà il tasso di diffusione di questi sistemi chatbot nelle applicazioni commerciali. Il numero di interazioni di servizi gestiti dalle tecnologie PNL/AI dovrebbe crescere del 15% entro il 2021, un aumento di quattro volte superiore rispetto al 2017. Nel 2018 erano in uso circa 2,5 miliardi di assistenti vocali digitali, un numero che potrebbe crescere più di tre volte fino a raggiungere 8 miliardi entro il 2023.
La Conversational AI, insomma, è passata dalla fase sperimentale a quella applicativa. Le possibili applicazioni sono trasversali a tutti i settori industriali e vanno ben oltre gli assistenti vocali domestici e i chatbot. La Conversational AI diventerà omnichannel, multi-dispositivo e multi-lingua, potenzialmente in grado di sconvolgere un mercato globale dei servizi in outsourcing da quasi 86 miliardi di dollari, sfruttando i chatbot, le applicazioni di messaggistica, gli assistenti digitali/personali e la ricerca vocale.