Case study: GCP alla Carnegie Mellon University

Alla Carnegie Mellon University il machine learning diventa social

Articulab di Carnegie Mellon voleva capire in che modo gli assistenti robotici potessero collaborare con gli esseri umani per completare attività e dare vita a relazioni, invece di sostituire semplicemente il lavoro degli assistenti in carne e ossa. Per studiare le interazioni robotiche con gli esseri umani e addestrare gli agenti a sviluppare una coscienza sociale, ha utilizzato Machine Learning Engine di Google Cloud.

Conferire all'intelligenza artificiale alcune competenze sociali

L'Annual Meeting of the New Champions 2016 di Tianjin, in Cina, ha visto tra le altre cose un debutto degno di nota: SARA, acronimo di Socially Aware Robot Assistant, ovvero l'assistente robot con competenze sociali in grado di interagire con le persone in una modalità completamente nuova. Invece di occupare semplicemente il ruolo di un assistente umano o di elaborare informazioni e fornirle in maniera impersonale, SARA era diversa: intuitiva, cordiale, simpatica e progettata per "collaborare" con utenti in carne e ossa, riconoscerne le espressioni del volto e rispondere, imparare le loro preferenze, nonché migliorare nello svolgimento dei compiti in base agli utenti che incontrava. SARA è stata anche programmata per apprendere determinate regole di interazione sociale, annuendo con il capo mentre un interlocutore parlava e distinguendo le diverse intonazioni.

Sei mesi dopo, a gennaio 2017, il progetto è stato presentato al Forum economico mondiale a Davos, in Svizzera, ed è stata l'unica dimostrazione a essere presentata al Davos Congress Center. SARA ha funzionato come assistente personale virtuale, fornendo ai partecipanti informazioni sulle sessioni, presentando loro colleghi interessanti, consigliando posti in cui mangiare e altro ancora.

All'inizio, SARA era un'assistente personale virtuale con un'applicazione particolare: doveva offrire assistenza durante la conferenza e interagire con gli ospiti. Riusciva a imparare gli interessi e gli obiettivi dei leader mondiali e poi fornire loro un prezioso consiglio sulle sessioni che sarebbero potute essere di loro interesse. Ancora meglio, SARA poteva sfruttare i suoi argomenti di conversazione per costruire relazioni con ogni persona che le parlasse, apprendendo così di più sulle preferenze e sugli obiettivi dell'interlocutore. In questo modo, poteva migliorare le conversazioni future offrendo un aiuto ancora più personalizzato.

SARA è stata la creazione dell'Articulab, un piccolo team della Carnegie Mellon University, la cui missione consiste nello studio delle interazioni umane in contesti sociali e culturali come input per i sistemi computazionali, che a loro volta ci aiutano a farci comprendere meglio le interazioni umane. In che modo le persone comunicano con la tecnologia e in che modo si potrebbe migliorare questa comunicazione con il tempo? Coltivare i legami sociali è essenziale, così come lo sono i legami tra le persone. Come ha osservato il team di Articulab riguardo a SARA: "Invece di ignorare i legami socio-emotivi che compongono il tessuto della società, SARA dipende da quei legami per migliorare le sue capacità di collaborazione".

"Google Cloud sta accelerando la ricerca accademica sull'IA."
Yoichi Matsuyama, ricercatore post-dottorato presso il Language Technologies Institute e capoprogetto di SARA

Utilizzare gli strumenti di Google per costruire SARA

Articulab, condotto da Justine Cassell, vice rettrice per la strategia e l'impatto tecnologico presso la scuola di informatica della Carnegie Mellon University, prima di SARA aveva dimestichezza con Google Cloud grazie agli strumenti e ai finanziamenti impiegati per altri progetti di ricerca. "Poiché avevamo utilizzato TensorFlow per numerose attività di machine learning, è stato naturale iniziare a usare Google Cloud per i nostri progetti recenti di deep learning", afferma Yoichi Matsuyama, ricercatore post-dottorato presso il Language Technologies Institute e capoprogetto di SARA. "Utilizziamo anche diverse API di Google, come Google Speech API (per il riconoscimento vocale) per i nostri agenti in grado di parlare e Firebase per i framework di raccolta dei dati ottenuti in crowdsourcing". L'utilizzo di Google Cloud prosegue mentre SARA si espande a nuovi ambiti e applicazioni. "Siamo ancora nella fase di deployment", aggiunge, osservando che "Google Cloud sta accelerando la ricerca accademica sull'IA".

Matsuyama afferma che il laboratorio sta "utilizzando in maniera massiccia" Compute Engine, comprese le istanze GPU con 4 Nvidia Tesla K80 e TensorFlow. Il team quest'anno sta lavorando su modelli come il Ragionamento sociale basato sull'apprendimento approfondito per rinforzo in contesti di attività e la Generazione naturale del linguaggio condizionata dalla società.

Valutando ciò che si potrebbe descrivere come SARA 1.0, il lancio al Forum economico mondiale, Matsuyama afferma: "Abbiamo avuto più di 250 partecipanti che hanno provato a utilizzare SARA durante i quattro giorni della conferenza. Nel complesso quindi è stato un successo. Tuttavia, stiamo ancora cercando di analizzare le conclusioni, cosa è andato bene e cosa male". Continua: "Una delle principali scoperte di quei dati è che il "rapport", cioè l'insieme delle relazioni interpersonali, è in realtà correlato al risultato delle attività e in questo caso ha avuto un impatto sull'accettazione dei consigli. Quando il rapport era elevato e SARA stabiliva una buona relazione con l'utente, era probabile che quest'ultimo accettasse i suoi consigli. Questa finora è la nostra principale scoperta, ma stiamo continuando a esaminare i dati".

Apertura verso nuovi ambiti, istruzione compresa

Sembra che il lavoro di SARA sia appena iniziato. Altre applicazioni dell'"intelligenza artificiale dotata di competenze sociali" di Articulab finora hanno incluso l'istruzione: ad esempio hanno offerto sostegno ai bambini della scuola pubblica con scarse risorse e promosso la collaborazione tra compagni di classe (che si è dimostrata cruciale per migliorare l'apprendimento). Forniscono inoltre assistenza ai bambini con autismo ad alto funzionamento e con sindrome di Asperger, con cui mettono in pratica competenze di interazione sociali per migliorare le relazioni con bambini con disturbi simili.

Michael Madaio, dottorando presso lo Human-Computer Interaction Institute e capoprogetto di "Rapport-Aware Peer Tutor" (RAPT), osserva che nei dati raccolti sul tutoraggio "umano-umano" "il rapport tra gli studenti che collaboravano è direttamente proporzionale al loro coinvolgimento nell'attività, alla loro capacità di risolvere i problemi e fondamentalmente al loro apprendimento". In altre parole, la collaborazione, a livello sociale, può portare vantaggio a tutti.

Madaio osserva che, man mano che la comprensione del rapport nell'apprendimento nelle applicazioni didattiche progredisce, si vogliono offrire strumenti che non si limitino ad aiutare gli studenti a imparare. "Esistono già piattaforme per l'apprendimento, ma la ricerca sull'istruzione ha evidenziato che gli studenti non sono solo macchine per l'elaborazione delle informazioni che calcolano numeri. Anche la relazione sociale riveste un ruolo essenziale. Per apprendere, è importante sviluppare un legame con gli altri studenti. Le relazioni sono preziose anche quando i tutor virtuali devono fornire un feedback: se si tratta di commenti negativi, come si comporta? Forse all'inizio il tutor è più educato, meno diretto, per un approccio più dolce. Ma con il tempo, può sviluppare la relazione ed essere più diretto fornendo feedback più specifici e più utili per gli studenti".

Se un tutor virtuale è efficace, ciò aumenta "la probabilità che gli studenti vogliano tornare", aggiunge, e questo fattore è importante quanto il grado di coinvolgimento degli studenti. "Non bisogna chiedersi solo se gli studenti tornano perché hanno bisogno di aiuto, ma anche: come si comportano quando devono interagire con il tutor virtuale? Sono più disponibili? Si sentono a loro agio a condividere di più i loro obiettivi e le ansie legate all'apprendimento?" Si tratta di un legame, come qualsiasi altro, che deve essere consolidato nel tempo. Tuttavia, l'aspetto straordinario, come SARA ha dimostrato, è che questo tipo di legame può nascere.

Finora, la risposta nelle applicazioni didattiche è stata positiva. Tuttavia, afferma Madaio, "Non abbiamo ancora avviato un deployment in una scuola. Parte della nostra sfida progettuale per quest'anno consiste nel definire la natura di una distribuzione su larga scala". Stanno provando a immaginare come potrebbe essere quel deployment futuro, ad esempio creando compagni di studio per dare assistenza nello svolgimento dei compiti oppure tutor per l'alfabetizzazione degli studenti con difficoltà di lettura.

Benché non sia previsto un sistema di tutoraggio virtuale nella Carnegie Mellon, il team potrebbe implementare un assistente personale che aiuti gli studenti a scoprire le conferenze imminenti nel campus, fornisca consigli sugli eventi e altro ancora. L'obiettivo più ambizioso di Articulab consiste forse nel creare una versione di SARA in grado di lavorare non solo a una conferenza di quattro giorni, ma sette giorni su sette, 24 ore su 24, in più ambiti. È un'idea audace ma entusiasmante da prendere in esame, che offre infinite possibilità.

"Non bisogna chiedersi solo se gli studenti tornano perché hanno bisogno di aiuto, ma anche: come si comportano quando devono interagire con il tutor virtuale? Sono più disponibili? Si sentono a loro agio a condividere di più i loro obiettivi e le ansie legate all'apprendimento?"
Michael Madaio, dottorando, Human-Computer Interaction Institute