Imaginem que podiam gravar a vossa vida -- tudo o que diziam, tudo o que faziam, disponível num perfeito armazém de memória perfeito ao alcance dos vossos dedos, para que pudessem voltar atrás e encontrar momentos memoráveis e revivê-los, ou examinar ao detalhe marcas do tempo e descobrir padrões na vossa própria vida que tinham ficado por descobrir. Essa é exactamente a jornada que a nossa família começou há cinco anos e meio. Esta é a minha mulher e colaboradora, Rupal. E neste dia, neste momento, entrávamos em casa com o nosso primeiro filho, o nosso menino lindo. E entrámos numa casa com um sistema de gravação de vídeo muito especial.
Deb Roy: Este momento e milhares de outros momentos especiais para nós, foram capturados em nossa casa porque em todas as divisões da casa, se olhassem para cima, iriam ver uma câmara e um microfone, e se olhassem para baixo, teriam a perspectiva de pássaro da divisão. Aqui está a nossa sala de estar, o quarto do bebé, cozinha, sala de jantar e o resto da casa. E tudo gravado num conjunto de discos desenhados para uma gravação contínua. Então, aqui estamos nós a voar através de um dia em nossa casa enquanto nos movemos desde o amanhecer pelo anoitecer incandescente e, finalmente, luzes apagadas ao final do dia Durante três anos, gravámos 8 a 10 horas por dia, acumulámos grosso modo um quarto de milhão de horas de audio e vídeo.
Então vocês estão a olhar para uma amostra do que foi de longe a maior colecção de vídeo doméstico alguma vez feita. (risos) E o que estes dados representam para a nossa família a nível pessoal, o impacto já foi enorme, e ainda estamos a aprender o seu valor. Inúmeros momentos de momentos naturais não-encomendados, momentos não encenados, estão aí gravados, e estamos a começar a aprender como descobri-los e encontrá-los.
Mas também há uma razão científica que guiou este projecto, que era usar esta informação longitudinal natural para compreender este processo de como uma criança aprende a falar -- sendo essa criança o meu filho. E então com muitas medidas para garantir a privacidade de todos os que eram gravados, tornámos estes dados disponíveis para a minha equipa de confiança do MIT para que pudéssemos separar padrões neste conjunto massivo de informações, tentando perceber a influência dos ambientes sociais na aquisição de linguagem. Estamos a olhar aqui para uma das primeiras coisas que começámos a fazer. Esta é a minha mulher e eu a fazer o pequeno-almoço na cozinha. E enquanto avançamos no espaço e tempo, um padrão diário da vida na cozinha.
Para converter estas 90.000 horas de vídeo em algo que pudéssemos começar a ver, usamos análise de movimento enquanto nos movemos pelo espaço e tempo, aquilo que chamamos vermes tempo-espaço. E isto passou a ser parte das ferramentas a que recorremos para podermos ser capazes de olhar e ver onde é que as actividades estão nos dados, e com eles, traçar um padrão de, nomeadamente, por onde é que o meu filho se movia pela casa, para que pudéssemos focar os nossos esforços de transcrição, todo o ambiente linguístico à volta do meu filho -- todas as palavras que ele ouviu de mim, da minha mulher, da ama e com o tempo, as palavras que ele começou a produzir. Então com essa tecnologia e esses dados e a possibilidade de, com recurso a máquinas, transcrever o discurso, que agora transcrevemos mais de 7 milhões de palavras das nossas transcrições diárias. E com isso, deixem-me levar-vos agora a uma primeira viagem aos dados.
Vocês já viram, de certeza, vídeos de "time-lapse" em que uma flor desabrocha quando aceleramos o tempo. Gostava que experimentassem o desabrochar de uma fala. O meu filho, pouco depois do seu primeiro aniversário, dizia "gaga" para tentar dizer água. E durante o curso do meio ano seguinte, lentamente aprendeu a aproximar-se à forma correcta, "water". Vamos navegar através de meio ano em mais ou menos 40 segundos. Não há vídeo aqui, para nos podermos focar no som, na acústica, de uma nova trajectória: gaga para água.
(Audio) Bebé: gagagagagaga Gaga gaga gaga guga guga guga wada gaga gaga guga gaga wader guga guga water water water water water water water water water
Ele não aprendeu só água. Durante 24 meses, os primeiros dois anos, em que realmente nos focámos, este é um mapa de todas as palavras que ele aprendeu por ordem cronológica. E porque temos transcrições completas, identificámos cada uma das 503 palavras que ele aprendeu a produzir até ao seu segundo aniversário. Ele começou a falar cedo. E começámos a analisar porquê. Porque é que certas palavras nasceram antes de outras? Este é um dos primeiros resultados que surgiram do nosso estudo há pouco mais de um ano que realmente nos surpreendeu. A maneira de interpretar este gráfico aparentemente simples é que na vertical é uma indicação de quão complexas as expressões do educador são baseadas no comprimento das expressões. E o eixo vertical é o tempo.
Toda a informação, alinhámos com base na ideia seguinte: Sempre que o meu filho aprendia uma palavra, íamos aos registos procurar toda a linguagem que ele tinha ouvido que contivesse aquela palavra. e interligávamos o comprimento relativo das expressões. E o que encontrámos foi este fenómeno curioso o discurso do educador caía sistematicamente para um mínimo, tornando a linguagem tão simples quanto possível, e daí lentamente ascenderia de novo em complexidade. E a coisa mais espantosa era que esse ressalto, esse declínio, alinhavam-se quase exactamente com quando cada palavra nascia -- uma palavra atrás da outra, sistematicamente. Então parece que os três principais educadores -- - eu, a minha mulher e a nossa ama -- sistematicamente e, penso eu, subconscientemente reestruturávamos a nossa linguagem para ir ao encontro dele no nascimento de uma palavra e trazê-lo gentilmente para linguagem mais complexa. As implicações disto - há muitas, mas uma que gostava de realçar, é que tem de haver círculos de retorno fantásticos. Claro, o meu filho está a aprender com o seu ambiente linguístico, mas o ambiente está a aprender dele. Este ambiente, as pessoas, estão nestes apertados círculos de retorno a criar uma espécie de estrutura de andaimes que não tinha sido observada até agora.
Mas isso é olhar para o contexto do discurso. E quanto ao contexto visual? Não estamos a olhar para -- pensem nisto como uma vista diagragmática de uma casa de bonecas da vossa casa. Pegámos nas tais câmaras com lentes olho-de-peixe, e fizemos algumas correcções ópticas e daí podemos trazê-lo para a vida tridimensional. Então, bem-vindos a minha casa. Isto é um momento, um momento gravado por múltiplas câmaras. A razão porque fizémos isto foi para criar a derradeira máquina de memória, onde podem voltar ao passado e voar interactivamete e respirar a vida do vídeo neste sistema. O que vou fazer é dar-vos uma visão acelerada de 30 minutos, mais uma vez, é só a vivencia de uma sala de estar. Sou eu e o meu filho no chão. E aquilo são vídeos analíticos que estão a seguir os nossos movimentos. O meu filho está a deixar tinta vermelha, e eu tinta verde. Agora estamos no sofá, a ver através da janela vendo os carros a passar. E finalmente, o meu filho a brincar sozinho com um boneco.
Agora paramos a acção, 30 minutos, pomos o tempo no eixo vertical, e abrimos para uma vista destes rastos de interacção que acabámos de deixar. E vemos estas estruturas fantásticas -- estes pequenos nós de duas cores de linha que chamamos "hot spots" sociais. À linha em espiral chamamos "hot spot" individual. E pensamos que afectam a maneira como a linguagem é aprendida. O que gostaríamos de fazer era começar a compreender a interacção entre estes padrões e a linguagem que a que o meu filho é exposto para ver se podemos prever como é que a estrutura de quando as palavras são escutdas afecta quando elas são aprendidas. Então, noutras palavras, a relação entre palavras e sobre o que é que elas são no mundo.
Esta é a maneira como nos estamos a debruçar nisto. Neste vídeo, mais uma vez, o meu filho é seguido. Ele deixa a tinta vermelha. E ali está a nossa ama junto à porta.
(Vídeo): Ama: Queres água? (Bebé: Aaaa.) Ama: Muito bem. (Bebé: Aaaa.)
DR: Ela oferece água, e lá vão os dois vermes até à cozinha para buscar água. E o que fizémos foi usar a palavra "água" para etiquetar aquele momento, aquele pedaço de actividade. E agora pegamos no poder da informação e pegamos em todas as vezes que o meu filho ouviu a palavra água e o contexto em que ele a viu, e usamo-lo para penetrar pelo vídeo e encontrar todo o rasto de actividade que co-ocorreu com a circunstância de água. E o que esta informação deixa no seu rasto é uma paisagem. Chamamos-lhes "paisagens-de-palavras". Esta é a "paisagem-de-palavras" da palavra água. e podemos ver que a maior parte da acção é na cozinha. É lá que estão aqueles grandes picos à esquerda. E só para contrastar, podemos fazer isto com qualquer palavra. Podemos pegar na palavra "adeus" como "adeus, até logo." E agora estamos a fazer zoom na entrada da casa. Olhamos, e encontramos, como seria de esperar, um contraste na paisagem onde a palavra "adeus" ocorre de maneira muito mais estruturada. Estamos a usar estas estruturas para começar a prever a ordem de aquisição de linguagem, e isso está agora a ser trabalhado.
No meu laboratório, que estamos a sondar agora, no MIT -- isto é no laboratório de media. Esta passou a ser a minha maneira preferida de videografar praticamente qualquer espaço. Três das pessoas chave deste projecto, Philip DeCamp, Rony Kubat e Brandon Roy aqui na fotografia. O Philip tem sido um colaborador próximo em todas as visualizações que vocês estão a ver. E o Michael Fleischman era outro aluno de douturamente no meu laboratório que trabalhou comigo nesta análise do vídeo, e fez esta observação: "só a maneira como estamos a analisar como a língua contacta com ocorrências que fornecem um fundo comum para a linguagem, a mesma ideia podemos tirá-la de tua casa, Deb, e aplicá-la ao mundo da comunicação social." E então o nosso esforço teve uma reviravolta inesperada.
Pensem na comunicação social como providenciadores de um fundo comum e têm a receita para levar esta ideia para um campo completamente novo. Começámos a analisar conteúdo televisivo usnado os mesmos princípios -- analisando a estrutura das ocorrências de um sinal de televisão - episódios de séries, anúncios, todos os componentes que fazem a estrutura da ocorrência. Estamos agora, com discos de satélite, a recolher e analisar uma boa parte de toda a televisão que é vista nos Estados Unidos. E não têm de ir agora equipar salas com microfones para ter as conversas das pessoas, basta pegar em conteúdo público dos media sociais.
Portanto estamos a pegar em mais ou menos três mil milhões de comentários por mês. É então que a magia acontece. Têm a estrutura das ocorrências, o fundo comum do que as palavras falam, a sair das televisões; têm as conversas sobre esses tópicos; e através da análise semântica -- e esta informação que vêem é real -- do nosso processamento de dados -- cada linha amarela mostra uma ligação a ser feita entre um comentário em bruto e uma peça de estrutura de ocorrência vinda de um sinal de televião. E a mesma ideia pode agora ser construida. Obtemos esta paisagem-de-palavras, só que agora as palavras não estão na minha sala de estar. Em vez disso, o contexto, as actividades comuns são o conteúdo na televisão que guia as conversas. E o que estamos a ver aqui, estes arranha-céus, são comentários ligados ao conteúdo da televisão. Mesmo conceito, mas a olhar para a dinâmica da comunicação numa esfera muito diferente.
Fundamentalmente, em vez de, por exemplo, medir o conteúdo baseado em quantas pessoas estão a ver, dá-nos informação básica para procurar propriedades de conexão de conteúdo. E tal como podemos olhar para os ciclos de retorno e dinâmicas numa família, podemos agora abrir os mesmo conceitos e ver grupos de pessoas muito maiores. Isto é um subconjunto de dados da nossa base de dados -- só de 50.000 de entre alguns milhões - e o diagrama social que os liga através de fontes disponíveis publicamente. E se os puserem num plano, um segundo plano é onde o conteúdo vive. Então temos os programas e as ocorrências desportivas e os anúncios, e todas as estruturas de ligação que os unem fzaendo um diagrama de conteúdo. E então a importante terceira dimensão. Cada uma das ligações que estão a ver aqui é na verdade uma conexão específica feita entre alguma coisa que alguém disse e um pedaço de conteúdo. Aí estão, mais uma vez, agora dezenas de milhões destas ligações que nos dão o tecido de conexão dos diagramas sociais e como estão relacionados com conteúdo. Podemos agora começar a explorar a estrutura de maneiras interessantes.
Então se nós, por exemplo, traçarmos o caminho de um pedaço de conteúdo que leva alguém a comentá-lo, e daí seguirmos onde esse comentário vai, e daí ver todo o diagrama social que é activado e apanhar-lhe o rasto para ver a relação entre o diagrama social e o conteúdo, torna-se visível uma estrutura muito interessante. Chamamos-lhe um clique de co-visão, uma sala virtual, se quiserem. E estão dinâmicas fascinantes em jogo. Não é uma maneira. Um pedaço de conteúdo, um evento, faz com que alguém fale. Eles falam com outras pessoas. Isso leva o comportamento sintonizado de volta à comunicação social, e ficamos com estes ciclos que guiam o comportamento geral.
Outro exemplo -- muito diferente -- outra pessoa específica da nossa base de dados -- e estamos a encontrar pelos menos centenas, senão milhares, destes. Demos a esta pessoa um nome. Isto é um pró-amador, ou pró-am, crítico de media que tem uma grande taxa de popularidade. Então muita gente segue esta pessoa -- muito influente -- e eles têm uma propensão para falar sobre o que está a dar na televisão. Então esta pessoa é uma ligação chave em juntar os mass media e os media sociais.
Um último exemplo destes dados: Às vezes é mesmo um pedaço de conteúdo que é especial. Se formos procurar esse pedaço de conteúdo, o discurso do Estado da Nação do Presidente Obama de há poucas semanas atrás, e olharmos para o que encontramos neste mesmo conjunto de dados, na mesma escala, as propriedades de ligação deste pedaço de conteúdo são verdadeiramente notáveis. A nação a explodir em conversação em tempo real em resposta ao que está a ser transmitido. E claro, através de todas estas linhas está linguagem fluente não estruturada. Podemos fazer um raio-x e obter o pulso da nação em tempo real, uma percepção em tempo real das reacções sociais nos diferentes circuitos no diagrama social a serem activados pelo conteúdo.
Então, resumindo, a ideia é esta: Enquanto o nosso mundo se torna cada vez mais instrumentalizado e temos as capacidades de recolher e ligar os pontos entre o que as pessoas estão a dizer e o contexto em que as estão a dizer, o que emerge é a a capacidade de ver novas estruturas sociais e dinâmicas que não foram vistas antes. É como construir um microscópio ou um telescópio e revelar novas estruturas sobre o nosso próprio comportamento à volta da comunicação. E eu acho que as implicações são profundas, seja para a ciência, para o comércio, para o governo, ou talvez mais do que tudo, para nós como indivíduos.
E então só para voltar ao meu filho, quando estava a preparar-me para esta conversa, ele estava a olhar por cima do meu ombro, e mostrei-lhe os clipes que ia mostrar-vos hoje, e pedi-lhe autorização -- concedida. E então fui reflectir, "Não é incrível, toda esta base de dados, todas estas gravações, vou dá-las a ti e à tua irmã," -- que chegou dois anos depois - "E vocês vão poder ir atrás e re-experimentar momentos que nunca poderiam, com a vossa memória biológica, alguma vez lembrar da maneira que podem hoje". Fiquei quieto por um momento. E pensei, "O que é que eu estou a pensar? Ele têm cinco anos. Não vai perceber isto." E mesmo enquanto pensava nisto, ele olhou para cima e disse "Então quando eu crescer, vou poder mostrar isto aos meus filhos?" E eu pensei, "Uau, isto é poderoso."
Quero deixar-vos este último momento memorável da nossa família. Esta é a primeira vez que o nosso filho deu mais do que dois passos de uma vez -- gravada em filme. E quero mesmo que vocês se foquem em algo enquanto vos levo a vê-lo. É um ambiente desordenado, é vida real. A minha mãe está na cozinha, a cozinhar, e, com tanto lugar, foi no corredor, apercebo-me que ele está mesmo para fazê-lo, que vai dar mais de dois passos. Vêem-me a encorajá-lo, ao aperceber-me do que está a acontecer, e então a magia acontece. Ouçam com atenção. Aos três passos, ele compreende que algo mágico está a acontecer. E acontece o mais fascinante ciclo de retorno, e ele inspira, e sussurra "uau" e instintivamente eu ecoo o mesmo. Vamos voar para trás no tempo até esse momento memorável.
(Vídeo) DR: Hey. Anda cá. Consegues? Oh, meu deus. Consegues? Bebé: sim. DR: Mãe, ele está a andar.
You can share this video by copying this HTML to your clipboard and pasting into your blog or web page. This video will play with subtitles.
You either have JavaScript turned off or have an old version of the Adobe Flash Player. To view this rating widget you
need to get the latest Flash player.
If your browser allows only "trusted sites" to execute Javascript, you should add the "googleapis.com" domain to your whitelist to allow our Flash detection to work properly.
Got an idea, question, or debate inspired by this talk? Start a TED Conversation.
Investigador do MIT, Deb Roy queria perceber como é que o seu filho aprendia a linguagem - por isso ligou a sua casa com câmaras de vídeo para capturar cada momento (com excepções) da vida do seu filho, depois analisou 90.000 horas de vídeo caseiro para ver "gaaaa" lentamente transformar-se em "water" (água). Investigação surpreendente, rica em dados com profundas implicações para o modo como aprendemos.
Deb Roy studies how children learn language, and designs machines that learn to communicate in human-like ways. On sabbatical from MIT Media Lab, he's working with the AI company Bluefin Labs. Full bio »
Translated into Portuguese by David Rocha
Reviewed by Nuno Miranda Ribeiro
Comments? Please email the translators above.
10:17 Posted: Feb 2011
Views 1,305,342 | Comments 264
22:42 Posted: Sep 2008
Views 487,340 | Comments 94
Just follow the guidelines outlined under our Creative Commons license.
This comment will be attributed to . Not ? Sign Out.