Google ha recentemente pubblicato un articolo sul suo nuovo chatbot: Meena. La società ha raggiunto tutti gli accordi desiderati in termini di design e approccio.
Mentre le tecniche sottostanti non sono del tutto nuove, analizzando la costruzione del chatbot ci troviamo di fronte ad un prodotto estremamente versatile e molto simile all’uomo a livello di interazioni.
I chatbot sono sistemi di intelligenza artificiale che interagiscono con gli utenti tramite messaggi di testo o voce. Attualmente risultano largamente impiegati come:
- servizio clienti;
- facilitatori di e-commerce;
- consegna del cibo etc.
La maggior parte delle grandi aziende possiede una propria versione di chatbot; basti per esempio pensare a Siri di Apple, Google Assistant di Google e Alexa di Amazon.
Quali sono le caratteristiche comuni che delineano tutti i chatbot attualmente in commercio?
- Dominio chiuso / Basato su regole: la maggior parte dei chatbot è di dominio chiuso, il che significa che funzionano solo all’interno di un circuito specifico.
- Non conversazionale: le interazioni dovrebbero apparire simili a quelle umane. Con gli attuali sistemi in circolazione non è affatto così.
- Non multigiro: la maggior parte dei chatbot non riesce a prendere in considerazione le interazioni multiple (in cui l’utente e il chatbot interagiscono tra loro, a turno). Questo ci porta nuovamente ad un’esperienza poco umana.
Meena di Google è diverso. E’ un chatbot multigiro, a dominio aperto, basato sull’architettura Transformer seq2seq. E’ addestrato con il metodo end-to-end. Ha dimensioni enormi e comprende parametri di 2,6 B; funziona con dati di testo di oltre 300 GB. Una vera rivoluzione nel settore dei chatbot.
Ecco alcune delle caratteristiche fondamentali del prodotto:
- Dati di formazione: Ogni conversazione di Meena viene trasformata in una coppia (contesto, risposta) in cui “contesto” rappresenta fino a 7 messaggi prima del messaggio “risposta”.
- Architettura del modello: Meena si basa su Evolved Transformer (ET), ovvero un’architettura NAS evolutiva. Il modello possiede 1 blocco encoder ET e 13 blocchi decoder ET.
- Formazione del modello: il chatbot è stato addestrato per ben 30 giorni su un pod TPU v3.
L’approccio e i risultati di Google Meena appaiono entusiasmanti. Resta ancora molto lavoro da fare per costruire chatbot credibili per gli esseri umani; tuttavia Meena pare andare nella giusta direzione.