Immaginate di poter registrare la vostra vita -- ogni cosa detta, ogni cosa fatta, disponibile in una perfetta unità di memoria a portata di mano, così da poter tornare indietro e trovare momenti memorabili e riviverli, o setacciare le tracce del tempo e scoprire nella vostra vita dei modelli che in precedenza non erano stati scoperti. Bene, questo è esattamente il viaggio che la mia famiglia ha iniziato cinque anni e mezzo fa. Questa è mia moglie e la mia collaboratrice: Rupal. E in questo giorno, in questo momento, stavamo entrando in casa con il nostro primo bambino, il nostro bellissimo maschietto. Entravamo in una casa con un sistema molto speciale di registrazione video.
Deb Roy: Questo momento e migliaia di altri momenti speciali per noi sono stati catturati nella nostra casa perché in ogni sua stanza, se si guardava in su, si poteva vedere una telecamera e un microfono, e se si guardava in giù, si aveva questa vista a occhio d'uccello della stanza. Questo è il nostro salotto, la camera da letto del bimbo, la cucina, la sala da pranzo e il resto della casa. Tutto ciò finiva in una raccolta su disco che era predisposta per una registrazione continua. Così voleremo attraverso un giorno nella nostra casa mentre ci muoviamo dall'assolato mattino fino alla sera incandescente e, infine, le luci sulla giornata si spengono. Nel corso di tre anni, abbiamo registrato da otto a dieci ore al giorno, accumulando circa un quarto di milione di ore di tracce multiple audio e video.
Così state guardando un pezzo di ciò che finora, è la più grande collezione di video casalinghi mai fatta. (Risate) Ciò che questi dati rappresentano per la nostra famiglia ad un livello personale, ha già avuto un impatto immenso, e stiamo ancora imparandone il valore. Innumerevoli ricordi di momenti naturali non richiesti, momenti non in posa, sono stati raccolti qui, e stiamo imparando come scoprirli e trovarli.
ma c'è anche una ragione scientifica che ha guidato questo progetto, che era di usare questi dati longitudinali e naturali per comprendere il processo di apprendimento di una lingua da parte di un bambino -- mio figlio. Così approntate le molte precauzioni per la privacy per proteggere tutti coloro che sono registrati nei dati, abbiamo reso disponibili elementi dei dati al mio fidato team di ricercatori al MIT così da poter cominciare ad individuare dei modelli in questo massiccio insieme di dati, cercando di capire l'influenza dell'ambiente sociale nell'acquisizione di una lingua. Qui stiamo guardando una delle prime cose che abbiamo iniziato a fare. Questi siamo io e mia moglie che prepariamo la colazione in cucina. E mentre ci muoviamo attraverso il tempo e lo spazio, un vero modello di vita quotidiana in cucina.
Per convertire queste 90.000 opache ore di video in qualcosa che potevamo iniziare a guardare, usiamo l'analisi del movimento per estrarre, mentre ci muoviamo nello spazio e nel tempo, ciò che chiamiamo vermi spazio-temporali. Questa è diventata una parte della nostra cassetta degli attrezzi permettendoci di guardare e vedere a quale punto dei dati ci sono le attività, e con queste, tracciarne il modello, in particolare, quando mio figlio si muove per la casa, così da poter focalizzare i nostri sforzi di trascrizione, su tutti i discorsi dell'ambiente intorno a mio figlio -- tutte le parola che ha sentito da me, da mia moglie, dalla nostra tata, e nel tempo, le parole che ha iniziato a produrre. Così con quella tecnologia e quei dati, e con la capacità di trascrivere i discorsi, con l'aiuto di una macchina, abbiamo fino ad ora trascritto circa sette milioni di parole dalle nostre trascrizioni casalinghe. Detto ciò lasciate che ora vi porti a fare un primo giro nei nostri dati.
Sicuramente voi tutti avete visto dei video accelerati in cui un fiore sboccia mentre si accelera il tempo. Vorrei che ora faceste l'esperienza dello sbocciare di una forma di discorso. Mio figlio, poco dopo il suo primo compleanno, diceva "gaga" al posto di acqua. Nel corso dei successivi sei mesi, lentamente ha imparato ad approssimare la corretta forma adulta: "water". Così navigheremo attraverso questo mezzo anno in circa 40 secondi. Niente video qui, così potrete focalizzarvi sul suono, sull'acustica, di un nuovo tipo di traiettoria: da "gaga" a "water".
(Audio) Bambino: Gagagagagaga Gaga gaga gaga guga guga guga wada gaga gaga guga gaga wader guga guga water water water water water water water water water.
DR: C'è l'ha decisamente fatta, non è vero?
Così non ha solo imparato la parola "water". Nel corso di 24 mesi, i primi due anni, sui quali ci siamo focalizzati, questa è la mappa di tutte le parole che ha imparato in ordine cronologico. Dato che abbiamo le trascrizioni complete, abbiamo identificato ognuna delle 503 parole che ha imparato a produrre entro il suo secondo compleanno. Era un parlatore precoce. E così abbiamo cercato di analizzare il perché. Perché certe parole sono nate prima di altre? Questo è uno dei primi risultati che è emerso dal nostro studio poco meno di un anno fa che ci ha veramente sorpreso. Il modo di interpretare questo grafico apparentemente semplice è che sull'asse verticale c'è un indicazione della complessità delle espressioni degli adulti che gli stavano vicino basata sulla lunghezza delle espressioni. E l'asse orizzontale è quello del tempo.
Tutti i dati sono stati allineati basandosi sull'idea seguente: Ogni volta che mio figlio avesse imparato una parola, saremmo tornati indietro e avremmo cercato tutte le frasi che ha ascoltato che contenevano quella parola. Avremmo riportato la lunghezza relativa di queste frasi. Abbiamo scoperto questo fenomeno curioso, il discorso dell'adulto si riduceva sistematicamente al minimo, rendendo più semplice possibile la lingua, e poi riguadagnava lentamente complessità. La cosa stupefacente era che quel balzo, quella diminuzione, si allineava quasi esattamente con la nascita di ogni parola -- parola dopo parola, sistematicamente. Sembra che i tre adulti principali -- io, mia moglie e la nostra tata -- stessero sistematicamente e, io credo, in modo inconscio destrutturando il proprio linguaggio per incontrarlo alla nascita di una parola e poi portarlo gentilmente ad un linguaggio più complesso. L'implicazione di questo -- ce ne sono tante ma voglio segnalarne una, è che ci devono essere degli stupefacenti cicli di risposta. Ovviamente mio figlio sta imparando dal suo ambiente linguistico, ma l'ambiente sta imparando da lui. Questo ambiente, queste persone, sono prese in queste stretti cicli di risposta e creano una sorta di impalcatura che fino ad ora non è stata notata.
Questo se guardiamo al contesto del discorso. E il contesto visivo? Stiamo guardando a -- pensate a questo come ad uno spaccato da casa di bambola della nostra casa. Abbiamo preso queste lenti circolari a occhio di pesce, e abbiamo fatto qualche correzione ottica, quindi possiamo renderle tridimensionali. Così, benvenuti a casa mia. Questo è un istante, un istante catturato da telecamere multiple. Abbiamo fatto ciò per creare la macchina della memoria finale, con la quale puoi tornare indietro e volare in modo interattivo e infondere video vita in questo sistema. Quello che sto per fare è darvi una vista accelerata di 30 minuti, di semplice vita in un soggiorno. Questi siamo io e mio figlio sul pavimento. Con le analisi del video tracciamo i nostri movimenti. Mio figlio lascia una traccia rossa, io una traccia verde. Ora siamo sul divano, e guardiamo dalla finestra le auto che passano. E infine, mio figlio che gioca da solo con un giocattolo.
Ora congeliamo l'azione, 30 minuti, mettiamo il tempo sull'asse verticale, e creiamo una vista delle tracce d'interazione che abbiamo lasciato. E vediamo queste strutture affascinanti -- questi piccoli nodi di tracce di due colori le chiamiamo 'spazi sociali caldi'. La traccia a spirale la chiamiamo 'spazio solitario caldo'. Pensiamo che questi influiscano sull'apprendimento del linguaggio. Ciò che vorremmo fare è cominciare a comprendere l'interazione tra questi tracciati e il linguaggio a cui mio figlio è esposto per vedere se possiamo indovinare come la struttura del quando le parole vengono ascoltate influisca sul quando vengono imparate -- in altre parole, la relazione tra le parole e ciò che rappresentano nel mondo.
Ecco qual'è il nostro approccio. In questo video, si traccia ancora [il movimento] di mio figlio. Si lascia dietro una traccia rossa. C'è la nostra tata vicino alla porta.
(Video) Tata: Vuoi dell'acqua? (Bambino: Aaaa.) Tata: Va bene. (Bambino: Aaaa.)
DR: Gli offre dell'acqua, ed ecco che le due tracce vanno verso la cucina a prendere l'acqua. Ciò che abbiamo fatto è usare la parola "acqua" per taggare questo momento, questo pezzo di attività. Ora usiamo il potere dei dati e prendiamo ogni momento in cui mio figlio ha sentito la parola "acqua" e il contesto in cui l'ha sentita usare, e li usiamo per penetrare attraverso il video e trovare ogni traccia di attività che si presentava assieme alla richiesta di acqua. Quello che questi dati lasciano nella loro scia è un panorama. Noi lo chiamiamo parolorama. Questo è il parolorama per la parola acqua, e potete vedere che la maggior parte dell'azione è nella cucina. Dove troviamo quei grossi picchi sulla sinistra. E possiamo fare un confronto utilizzando qualsiasi parola. Possiamo prendere la parola 'ciao'. E ci focalizziamo sull'ingresso della casa. Guardiamo e troviamo, come ci si aspetta, un contrasto nel panorama poiché la parola 'ciao' si presenta in contesti molto più strutturati. Così usiamo queste strutture per iniziare a predire l'ordine di acquisizione del linguaggio, è il lavoro che stiamo facendo ora.
Nel mio laboratorio al MIT, nel quale stiamo sbirciando ora -- questo è nel Media Lab. Questo è diventato il mio modo preferito di registrare su video ogni tipo di spazio, Tre delle persone chiave in questo progetto, Philip DeCamp, Rony Kubat e Brandon Roy sono in questa foto. Philip è stato uno stretto collaboratore nel fare tutte le visualizzazioni che state vedendo. Michael Fleischman era un altro dottorando nel mio laboratorio che lavorava con me in questa analisi di video casalinghi, e ha osservato che: "il modo in cui analizziamo come il linguaggio si connette con gli eventi come ci dà una base comune per il linguaggio, quella stessa idea la possiamo fare uscire da casa tua, Deb, e la possiamo applicare al mondo dei media." Così i nostri sforzi hanno preso una piega inaspettata.
Pensate ai mass media come fornitori di una base comune ed avrete la ricetta per portare questa idea in un orizzonte interamente nuovo. Abbiamo iniziato ad analizzare i contenuti televisivi usando gli stessi principi -- analizzando la struttura di un evento di un segnale TV -- episodi di spettacoli, pubblicità, tutte le componenti che costituiscono la struttura dell'evento. Con l'aiuto delle piattaforme satellitari stiamo ora registrando ed analizzando una buona parte di tutte le televisioni guardate negli Stati Uniti. E non dobbiamo andare a microfonare i soggiorni per registrare le conversazioni tra le persone, basta sintonizzarsi ai canali pubblici disponibili.
Così stiamo estraendo circa tre miliardi di commenti al mese. E poi accade la magia. Ecco la struttura dell'evento, la base comune di cui trattano le parole, uscire dalle trasmissioni televisive; abbiamo le conversazioni che riguardano questi argomenti; e attraverso l'analisi semantica -- e questi che state guardando sono i dati reali usciti dalle nostre eleborazioni -- ogni linea gialla mostra un collegamento che viene creato tra un commento allo stato puro e una parte della struttura dell'evento che esce dal segnale televisivo. Ora la stessa idea può essere incrementata. E abbiamo questo parolorama, eccetto il fatto che ora le parole non sono assemblate nel mio soggiorno. Invece il contesto, le attività di base, sono il contenuto televisivo sotteso alle conversazioni. E quello che vediamo qui, questi grattacieli, sono i commenti che sono legati al contenuto televisivo. Il concetto è lo stesso, ma guardando alla dinamica delle comunicazioni in una sfera molto diversa.
Così fondamentalmente, piuttosto che, ad esempio, misurare il contenuto basandosi su quante persone stanno guardando, questo ci dà i dati di base per osservare la capacità del contenuto di suscitare interesse. E proprio come possiamo osservare i cicli di risposta e le dinamiche in una famiglia, possiamo ora aprire gli stessi concetti e osservare a gruppi di persone più ampi. Questo è un sotto insieme di dati dal nostro database -- solo 50.000 su diversi milioni -- e il grafico sociale che collega i dati attraverso le fonti pubbliche disponibili. E se le mettiamo tutti su un piano, un secondo piano in cui c'è il contenuto. Così abbiamo i programmi e gli eventi sportivi e la pubblicità, e tutte le le strutture che li legano costituiscono il grafico del contenuto. E quindi l'importante terza dimensione. Ogni collegamento che vedete rappresentato qui è una reale connessione fatta tra qualcosa che ha detto qualcuno e un contenuto. E ci sono ora decine di milioni di questi collegamenti che ci danno il tessuto connettivo dei grafici sociali e come si relazionano al contenuto. Possiamo ora iniziare a testare la struttura in modo interessante.
Così se noi, ad esempio, tracciamo il percorso di un pezzo di contenuto che porta qualcuno a commentarlo, e seguiamo dove va questo commento, e quindi guardiamo all'intero grafico sociale che viene attivato e torniamo indietro per vedere la relazione tra il grafico sociale e il contenuto, diventa visibile una struttura veramente interessante. Chiamiamo ciò un gruppo di visione condivisa, o se volete un salotto virtuale. Sono in gioco dinamiche affascinanti. Non è un senso unico. Una parte di contenuto, un evento, fa parlare qualcuno. Che parla con altre persone. Questo porta un comportamento di sintonizzazione dei mass media, e si hanno questi cicli che guidano il comportamento collettivo.
Un altro esempio -- molto diverso -- un'altra persona reale nel nostro database -- e ne troviamo a centinaia se non a migliaia. Abbiamo dato un nome a questa persona. E' un critico dei media, un pro-amateur o pro-am che ha questo alto tasso di apertura. Così molte persone lo seguono -- è molto influente -- e hanno la propensione di parlare di ciò che c'è in TV. Così questa persona è un collegamento chiave nel connettere i mass media e i media sociali.
Un ultimo esempio da questi dati: a volte ad essere speciale è un contenuto. Così se andiamo a guardare questo contenuto, il discorso sullo Stato dell'Unione del Presidente Obama di qualche settimana fa, e guardiamo quello che troviamo in questo stesso insieme di dati, alla stessa scala, la capacità di creare delle connessioni di questo contenuto è veramente notevole. Una nazione intera che discute in tempo reale in risposta a ciò che viene trasmesso. Ovviamente, attraverso tutte queste tracce c'è un fluente linguaggio non strutturato. Possiamo passare a i raggi X ed avere in tempo reale il polso di una nazione, il senso in tempo reale delle reazioni sociali presenti nei diversi circuiti del grafico sociale che sono attivati da questo contenuto.
Così, per riassumere, l'idea è questa: Man mano che il nostro mondo diventa sempre più tecnologico ed abbiamo la capacità di raccogliere e collegare i dati tra quello che la gente sta dicendo e il contesto in cui lo dicono, ciò che emerge è la capacità di vedere nuove strutture sociali e dinamiche che non si erano mai viste prima. E' come costruire un microscopio o un telescopio e svelare nuove strutture riguardo il nostro comportamento nell'ambito della comunicazione. Penso che le implicazioni qui siano profonde, sia per la scienza, che per il commercio, per la politica o forse principalmente, per noi come individui.
E così per tornare a mio figlio, mentre stavo preparando questo discorso, mi stava guardando da dietro le spalle e gli ho mostrato le clip che vi avrei mostrato oggi, e ho chiesto il suo permesso -- accordato. Poi ho continuato a riflettere, "Non è stupefacente, tutto questo database, tutte queste registrazioni, che passerò a te e a tua sorella," che è arrivata due anni dopo. "e voi ragazzi avrete la possibilità di tornare indietro e rifare l'esperienza di momenti che non avreste mai, con la vostra memoria biologica, potuto ricordare in questo modo." E lui è stato in silenzio per un momento. E io ho pensato: "Cosa sto pensando? Ha cinque anni. Non capirà queste cose." E proprio mentre stavo pensando questo, mi ha guardato e ha detto, "Così quando sarò grande, potrò mostrarlo ai miei bambini?" E ho pensato: "Wow, questa è roba potente."
Così voglio lasciarvi con un ultimo momento memorabile che riguarda la nostra famiglia. Questa è la prima volta che nostro figlio ha fatto più di due passi alla volta -- catturata in un film. E voglio davvero che vi focalizziate su una cosa mentre vi guido. E' un ambiente disordinato; è vita reale. Mia madre è in cucina, e sta cucinando, e di tutti i posti, nell'entrata, capisco che sta per farcela a fare più di due passi. Così mi sentite incoraggiarlo, comprendendo cosa sta accadendo, e infine la magia accade. Ascoltate molto attentamente. Al terzo passo, lui capisce che sta accadendo qualcosa di magico. Ed ecco il più strabiliante dei cicli di risposta, fa un gran respiro, e sussurra "wow" e istintivamente io gli faccio eco. Così possiamo volare indietro nel tempo a questo momento memorabile.
(Video) DR: Hey. Vieni qui. Ci riesci? Oh, ragazzo. Ci riesci? Bambino: Sì. DR: Mamma sta camminando.
You can share this video by copying this HTML to your clipboard and pasting into your blog or web page. This video will play with subtitles.
You either have JavaScript turned off or have an old version of the Adobe Flash Player. To view this rating widget you
need to get the latest Flash player.
If your browser allows only "trusted sites" to execute Javascript, you should add the "googleapis.com" domain to your whitelist to allow our Flash detection to work properly.
Got an idea, question, or debate inspired by this talk? Start a TED Conversation.
Il ricercatore del MIT Deb Roy voleva capire come il suo bambino imparasse la lingua -- così ha riempito la sua casa di videocamere per catturare ogni momento (con alcune eccezioni) della vita di suo figlio, ha quindi analizzato 90.000 ore di video casalinghi per guardare "gaaa" trasformarsi lentamente in "water". Una ricerca strabiliante e ricca di dati, con profonde implicazioni su come impariamo.
Deb Roy studies how children learn language, and designs machines that learn to communicate in human-like ways. On sabbatical from MIT Media Lab, he's working with the AI company Bluefin Labs. Full bio »
Translated into Italian by Barbara Casarini
Reviewed by Els De Keyser
Comments? Please email the translators above.
10:17 Posted: Feb 2011
Views 1,303,577 | Comments 264
22:42 Posted: Sep 2008
Views 485,808 | Comments 94
Just follow the guidelines outlined under our Creative Commons license.
This comment will be attributed to . Not ? Sign Out.