Imaxinade que puidésedes rexistrar as vosas vidas... todo o que dixestes, todo o que fixestes, ó alcance da man nunha mediateca perfecta para poder volver á procura de momentos memorables e revivilos ou examinar marcas do tempo e descubrir patróns nas vosas propias vidas previamente inadvertidos. Pois esa é exactamente a viaxe que emprendeu a miña familia fai cinco anos e medio. Esta é Rupal, a miña muller e colaboradora. E neste día, neste momento, entramos na casa co noso primeiro fillo, o noso fermoso bebé. E entramos nunha casa cun sistema de gravación de vídeo moi especial.
Deb Roy: Este momento, e milleiros doutros momentos especiais para nós, foron capturados na casa porque en tódalas habitacións da casa se mirases arriba, verías unha cámara e un micrófono e se mirases abaixo terías unha vista de paxaro da habitación. Aquí está a nosa sala de estar, o dormitorio do meniño, a cociña, o comedor e o resto da casa. E todo isto alimentaba un conxunto de discos deseñados para estar continuamente a capturar. Así que aquí estamos, a voar a través dun día na nosa casa, desde o sol da mañá, pasando pola tarde incandescente, e, finalmente, as luces do día se apagan. Durante tres anos, rexistramos de oito a dez horas ó día, acumulando un cuarto de millón de horas de audio e vídeo multi-pista.
Así que estades a ver un anaco de que é, de lonxe, a maior colección de vídeo caseiro até o momento. (Risas) E o que estes datos representan para a nosa familia a nivel persoal, o impacto xa foi enorme, e aínda estamos a apreciar o seu valor. Innumerables momentos de natureza espontánea, non preparados, foron capturados, e aínda estamos comezando a aprender como descubrirlos e atopalos.
Pero hai tamén un motivo científico que impulsou este proxecto, que foi o uso destes datos naturais lonxitudinais para entende-lo proceso de como un neno aprende a lingua, sendo ese neno o meu fillo. E con moitas provisións de privacidade para protexer a todas as persoas rexistradas nos datos, facilitamos elementos dos datos ó meu equipo de investigación de confianza do MIT para poder comezar a identificar patróns neste conxunto masivo de datos, intentando entender a influencia dos medios sociais na adquisición da linguaxe. Así que estamos vendo unha das primeiras cousas que comezamos a facer. Estes somos a miña muller e máis eu preparando o almorzo na cociña. E mentres nos movemos no espazo en no tempo, un patrón cotián da vida na cociña.
Para converter estas 90.000 horas de vídeo opaco en algo que puidésemos comezar a ver, usamos análise de movemento para extraer, mentres nos movemos no espazo e no tempo, o que chamamos vermes espazo-tempo. E isto converteuse en parte das nosas ferramentas para conseguir ver e mirar onde é que están as actividades nos datos, e con isto, trazar o patrón, en particular, de onde é que o meu fillo se move pola casa, para poder enfocar os nosos esforzos de transcrición, no entorno da linguaxe arredor do meu fillo -- todas as palabras que ouviu de min, da miña muller, da nosa neneira, e co tempo, as palabras que comezou a producir. Así que con toda esa tecnoloxía e datos e a posibilidade de, con asistencia técnica, transcribir as palabras, levamos transcritas máis de sete millóns de palabras das nosas transcricións caseiras. E con iso, deixádeme levarvos agora a dar unha primeira volta polos datos.
Seguramente, todos vós vistes vídeos acelerados onde unha flor se abre de forma acelerada. Gustaríame que agora experimentarades o florecemento dunha forma de fala. O meu fillo, xusto despois do seu primeiro aniversario, dicía "gaga" no canto de auga (water). E durante o seu seguinte medio ano, lentamente aprendeu a aproximarse á forma adulta correcta, "auga" ("water"). Así que imos navegar por medio ano nuns 40 segundos. Aquí sen vídeo, de forma que poidades enfocarvos no son, na acústica, dun novo tipo de traxectoria: de gaga a auga (water).
(Audio) Bebé: Gagagagagaga Gaga gaga gaga guga guga guga wada gaga gaga guga gaga wader guga guga auga auga auga (water) auga auga auga (water) auga auga (water) auga.
Pero non só aprendeu auga. Durante os 24 meses, os primeiros dous anos, nos que realmente nos centramos, este é un mapa de cada palabra que aprendeu en orde cronolóxica. E como temos todas as transcricións, identificamos cada unha das 503 palabras que aprendeu a producir até o seu segundo aniversario. Comezou a falar cedo. E comezamos a analizar por que. Por que certas palabras naceron antes ca outras? Este é un dous primeiros resultados que saíron do estudo fai pouco máis dun ano que realmente nos sorprendeu. A forma de interpretar este gráfico aparentemente simple é ver na vertical unha indicación do complexos que son os enunciados do coidador baseada na lonxitude dos enunciados. E o eixo vertical é o tempo.
E tódolos datos foron aliñados baseándonos na seguinte idea: Cada vez que o meu fillo aprendese unha palabra, iriamos cara a atrás e veriamos toda a linguaxe que ouviu que contiña esa palabra. E determinariamos a lonxitude relativa dos enunciados. E o que encontramos foi este curioso fenómeno, que o discurso do coidador iría sistematicamente reducíndose ó mínimo, facendo a linguaxe tan simple como fose posible, e lentamente ascende cara atrás en complexidade. E o sorprendente foi que ese salto, esa redución, aliñábase de forma moi precisa co tempo en que naceu cada palabra -- palabra tras palabra, sistematicamente. Así que parece que os tres coidadores primarios -- a miña muller, a nosa neneira e máis eu, fomos sistematicamente e, penso eu, inconscientemente restruturando a nosa linguaxe até coincidir con el no nacemento dunha palabra e introducilo pouco a pouco nunha linguaxe máis complexa. E as implicacións disto -- hai moitas, pero hai unha que quero resaltar, é que parece que hai sorprendentes bucles de resposta. Por suposto, o meu fillo está a aprender do seu entorno lingüístico, pero o entorno está a aprender del. Esa xente do entorno, están nestes apertados bucles de resposta e crean unha especie de estada que non fora descuberta até agora.
Pero iso é mirando o contexto da linguaxe. Que pasa co contexto visual? O que estamos a ver agora -- pensade nisto como se a nosa casa fose unha casa de bonecas. Collemos esas cámaras de lentes 'ollo de peixe' circulares e fixemos algunhas correccións ópticas para poder darlle unha vida tridimensional. Así que, benvidos á miña casa. Este é un momento, un momento capturado por múltiples cámaras. A razón pola que fixemos isto é crear a máquina de memoria definitiva, onde podes volver atrás interactivamente e dar voltas e entón darlle vida ó vídeo neste sistema. O que vou facer é darvos unha vista acelerada de 30 minutos, outra vez, só da vida na sala de estar. Eses somos eu e o meu fillo no chan. E a análise visual que está a capturar os nosos movementos. O meu fillo está a deixar tinta vermella, eu estou a deixar tinta verde. Agora estamos no sofá, mirando pola fiestra como pasan os coches. E finalmente, o meu fillo xogando el só.
Agora conxelamos a acción, 30 minutos, poñemos o tempo no eixo vertical, e abrimos a vista destas marcas de interacción que fomos deixando atrás. E vemos estas sorprendentes estruturas -- estes pequenos nós de fío de dúas cores chamámoslles puntos quentes sociais. Ó fío en espiral chamámoslle punto quente individual. E cremos que afectan a como se aprende a linguaxe. O que nos gustaría facer é comezar a comprender a interacción entre estes patróns e a linguaxe á que está exposto o meu fillo para ver se podemos predicir como a estrutura de cando se ouven as palabras inflúe cando son aprendidas -- Ou o que é o mesmo, a relación entre palabras e sobre o que tratan no mundo.
Así é como estamos a enfocar isto. Neste vídeo, novamente, o meu fillo está a ser seguido. Está a deixar un rastro de tinta vermella. E aquí está a nosa neneira na porta.
(Vídeo) Neneira: Queres auga? (Bebé: Aaaa) Neneira: De acordo. (Bebé: Aaaa.)
DR: Ofrécelle auga, e aí están os dous vermes pola cociña á procura de auga. E o que temos feito é usar a palabra "auga" (water) para etiquetar ese momento, ese anaco de actividade. E agora collemos o poder dos datos e collemos cada momento no que o meu fillo algunha vez ouviu a palabra auga (water) e o contexto no que a viu, e o usamos para penetrar no vídeo e atopar cada traza de actividade que aconteceu no mesmo tempo da instancia de "auga" E o que estes datos deixan é unha paisaxe Nos chamámoslles palabraxes (wordscapes) Esta é a palabraxe da palabra auga, e poden ver que a maioría da acción está na cociña Que é onde están eses picos grandes da esquerda E só para contrastar, podemos facer isto con calquera palabra. Podemos coller a palabra "adeus" (bye) como na frase de despedida (good bye) E estamos agora facendo zoom na entrada da casa. E miramos, e atopamos, como poderiades esperar, un contraste na paisaxe onde a palabra "adeus" aparece dunha forma moito máis estruturada. Así que usamos estas estruturas para comezar a predicir a orde de adquisición da linguaxe, e iso é no que estamos a traballar agora.
No meu laboratorio, que estamos a ver agora, no MIT -- este é o laboratorio de medios. Esta é a miña forma favorita de videografar sobre calquera espazo. Tres das persoas clave neste proxecto, Philip DeCamp, Rony Kubat y Brandon Roy están nesta foto. Philip foi un colaborador próximo en tódalas visualizacións que estades a ver. E Michael Fleischman foi outro estudante de doutorado no meu laboratorio que traballou comigo nesta análise do vídeo doméstico e fixo a seguinte observación: que "a forma na que estamos analizando como a linguaxe conecta cos eventos que proporcionan un marco común para a linguaxe, a mesma idea pode ser sacada da túa casa, Deb, e podemos aplicala ó mundo dos medios de comunicación." E entón, o noso esforzo deu un xiro inesperado.
Pensade nos medios de comunicación de masas como provedores dun marco común e teredes a receita para levar esta idea a un lugar completamente novo. Comezamos a analizar contido televisivo usando os mesmos principios -- analizando a estrutura dos eventos do sinal da tele -- capítulos de series, publicidade, tódolos compoñentes que conforman a estrutura dos eventos. E estamos agora, con antenas parabólicas, extraendo e analizando unha boa parte de toda a tele que se ve nos Estados Unidos. E non tes que instrumentar salas de estar con micrófonos para conseguir as conversacións das persoas, só tes que sintonizar os sinais dispoñibles dos medios sociais.
Así que estamos a extraer cerca de 3.000 millóns de comentarios ó mes. E entón comeza a maxia. Tes a estrutura do evento, o marco común do que tratan as palabras, saíndo dos sinais da televisión; tes as conversas que tratan sobre eses temas; e a través de análise semántica -- e isto que estades a ver son de verdade datos reais do noso procesamento de datos -- cada liña amarela mostra un enlace feito entre un comentario e unha peza da estrutura de evento saíndo do sinal da televisión. E a mesma idea pódese construír. E obtemos esta palabraxe, só que agora as palabras non son ensambladas na miña sala de estar. No canto, o contexto, as actividades do marco común, son o contido da televisión que está a conducir as conversacións. E o que estamos a ver aquí, estes rañaceos, son comentarios enlazados ó contido da televisión. O mesmo concepto, pero aplicado á dinámica da comunicación nunha esfera moi diferente.
E de forma tan fundamental, en lugar de, por exemplo, medir o contido baseándonos en canta xente o está a ver, isto proporciónanos datos básicos para ver a capacidade de atracción do contido. E da mesma forma que podemos ver os ciclos de resposta e dinámicas nunha familia, podemos expandir os mesmos conceptos e observar grupos de xente moito máis grandes. Este é un subconxunto de datos da nosa base de datos -- só 50.000 dos varios millóns -- e o grafo social que os conecta a través de fontes dispoñibles publicamente. E se os poñemos nun único plano, o segundo plano é onde vive o contido. Así que temos os programas e os eventos deportivos e os anuncios, e tódalas estruturas de enlaces que os manteñen xuntos que fan unha gráfica de contido. E entón temos a importante terceira dimensión. Cada un dos enlaces que vedes xerados aquí son unha conexión feita entre algo que alguén dixo e unha peza de contido. E aquí están de novo, decenas de millóns destes enlaces que nos dan o material conectivo das gráficas sociais e como se relacionan co contido. E podemos comezar a probar a estrutura de forma interesante.
Así que, se, por exemplo, rastrexamos o camiño dunha peza de contido que leva a alguén a comentalo, e entón seguimos onde é que vai ese comentario, e despois observamos a gráfica social completa que se activa e logo volvemos a rastrexar para ver a relación entre a gráfica social e o contido, aparece unha estrutura moi interesante. Chamámoslle un "círculo de co-expectación" se queredes, unha sala de estar virtual. E hai dinámicas fascinantes en xogo. Non é só nun sentido. Unha peza de contido, un evento, causa que alguén fale. Falan con outra xente. Que conduce o comportamento nos medios de comunicación, e se obteñen estes ciclos que conducen o comportamento en conxunto.
Outro exemplo -- moi diferente -- outra persoa real na nosa base de datos -- e estamos a atopar, como mínimo, centos, se non miles como estes. Démoslle un nome a esta persoa. Este é un crítico de medios pro-amater, ou pro-am, que ten unha gran cantidade de seguidores. Así que un montón de xente segue a esta persoa -- moi influente -- e teñen propensión a falar sobre o que botan na tele. Así que esta persoa é un enlace clave na conexión dos medios de masas e dos medios sociais.
Un último exemplo destes datos: algunhas veces, é un anaco do contido o que é especial. Así que se observamos este anaco de contido, o discurso sobre Estado da Unión do presidente Obama de hai só unhas semanas, e vemos que atopamos no mesmo conxunto de datos, na mesma escala, as propiedades de xeración de participación de este anaco de contido son moi notables. Unha nación explotando en conversación en tempo real en resposta ó que está a ser retransmitido. E, por suposto, a través de todas estas liñas flúe linguaxe non estruturada. Podemos radiografar e conseguir o pulso dun país en tempo real, o senso en tempo real das reaccións sociais nos diferentes circuítos da gráfica social que son activados polo contido.
Así que, para resumir, a idea é esta: como o noso mundo se fai máis e máis instrumentado e temos as capacidades para recoller e conectar os puntos entre o que a xente di e o contexto no que o din, o que emerxe é unha habilidade para ver novas estruturas sociais e dinámicas que non foran vistas previamente. É como construír un microscopio ou telescopio e revelar novas estruturas sobre o noso comportamento ó redor da comunicación. E eu penso que as implicacións son profundas, para a ciencia, para o comercio, o goberno, ou quizais, no que máis para nós como individuos.
E volvendo ó meu fillo, cando estaba a preparar esta charla, el estaba a mirar por encima do meu ombro, e mostreille os vídeos que ía mostrar hoxe aquí, e pedinlle permiso -- concedido. E entón seguín a reflexionar, "Non é marabilloso? Toda esta base de datos, todas estas gravacións, vouchas dar a ti e máis a túa irmá," que chegou dous anos despois. "E vós seredes capaces de volver e revivir momentos que nunca poderiades recordar coa vosa memoria biolóxica, como o podedes facer agora." E el ficou quedo un momento. E pensei. "Que estou a pensar? Ten cinco anos. Non vai entender isto." E xusto cando estaba a pensar nisto, el miroume e dixo, "Así que cando medre, podo amosarlle isto ós meus fillos?" E pensei, "Vaia, isto é material potente".
Así que, quero deixarvos cun último momento memorable da nosa familia. Esta é a primeira vez que noso fillo deu máis de dous pasos seguidos -- capturado en vídeo. E quero que vos centredes en algo mentres vos levo. E un entorno desordenado; é a vida natural. Miña nai está na cociña, cociñando, e, de todos os sitios, no corredor, decátome de que vai facelo, vai a dar máis de dous pasos. E aquí estou animándoo, asimilando o que está a pasar e entón ocorre a maxia. Escoitade con atención. Uns tres pasos, e el se decata de que algo máxico está a ocorrer. E aparece o lazo de resposta máis incrible, e el toma aire, e murmura "vaia" e instintivamente eu contesto o mesmo. Así pois, volvamos atrás no tempo até ese momento memorable.
(Vídeo) DR: Ei. Ven acó. Podes facelo? Vaites! Podes facelo? Bebé: Si. DR: Mamá, está andando.
You can share this video by copying this HTML to your clipboard and pasting into your blog or web page. This video will play with subtitles.
You either have JavaScript turned off or have an old version of the Adobe Flash Player. To view this rating widget you
need to get the latest Flash player.
If your browser allows only "trusted sites" to execute Javascript, you should add the "googleapis.com" domain to your whitelist to allow our Flash detection to work properly.
Got an idea, question, or debate inspired by this talk? Start a TED Conversation.
O investigador do MIT, Deb Roy, quería entender como aprendía a falar o seu fillo. Entón, cableou a súa casa con cámaras para capturar cada momento (con excepcións) da vida do seu fillo. Despois, analizou 90.000 horas de vídeo doméstico para ver como "gaaa" se transformaba lentamente en "auga" (water). Unha investigación sorprendente, cunha gran cantidade de datos e profundas consecuencias para o camiño da aprendizaxe.
Deb Roy studies how children learn language, and designs machines that learn to communicate in human-like ways. On sabbatical from MIT Media Lab, he's working with the AI company Bluefin Labs. Full bio »
Translated into Galician by Marcos Lomba
Reviewed by Raquel Uzal
Comments? Please email the translators above.
10:17 Posted: Feb 2011
Views 1,331,699 | Comments 265
22:42 Posted: Sep 2008
Views 499,279 | Comments 95
Just follow the guidelines outlined under our Creative Commons license.
This comment will be attributed to . Not ? Sign Out.