Follow TED
Be the first to know about new TEDTalks, TED news and other announcements.
Click on any phrase to play the video from that point.
Stel je voor dat je je leven kunt opnemen -- alles wat je zei, alles wat je deed, allemaal beschikbaar in een perfecte geheugenbank onder handbereik, zodat je terug zou kunnen om belangrijke momenten terug te vinden en te herleven, of om door de tijd te graven en patronen in je eigen leven te ontdekken die daarvoor verborgen zouden zijn gebleven. Dat is nou precies de reis waar mijn familie aan begon 5,5 jaar geleden. Dit is mijn vrouw en partner, Rupal. Op deze dag, op dit moment liepen we ons huis binnen met ons eerste kind, onze prachtige jongen. We liepen een huis binnen met een heel bijzonder videosysteem.
Deb Roy: Dit moment en duizenden andere van onze speciale momenten werden opgenomen in ons huis omdat je in elke kamer van het huis, als je naar boven zou kijken, een camera en een microfoon zou zien, en als je naar beneden zou kijken, krijg je een beeld van de kamer in vogelvlucht. Dit is onze woonkamer, de babykamer, keuken, eetkamer en de rest van het huis. Dit alles kwam terecht op een opslagsysteem dat was ingericht voor continue opname. Hier gieren we door een dag in ons huis, van de zonovergoten morgen via de gloeiende avond tot uiteindelijk de lichten doven voor de dag. In een periode van 3 jaar namen we 8 tot 10 uur per dag op, wat in totaal een kwart miljoen uur multi-track audio en video oplevert.
Hier hebben we dus verreweg de grootste collectie home-video's die ooit werd gemaakt. (Gelach) En wat deze data hebben betekend voor onze familie op een persoonlijk niveau -- het effect is nu al immens en we leren steeds meer over de waarde. Ontelbare momenten van spontane natuurlijke momenten, ongeposeerd, zijn hier vastgelegd en de beginnen te leren hoe we ze moeten vinden.
Maar er is ook een wetenschappelijke reden achter dit project, namelijk om met deze natuurlijke langlopende datastroom het proces te begrijpen waarmee een kind taal leert -- dat kind is dus mijn zoon. Zo gingen we met alle zorg voor de privacy van iedereen die werd opgenomen in de data aan de slag om delen van de data beschikbaar te stellen voor mijn vertrouwde onderzoeksteam aan MIT zodat we langzaam patronen konden gaan ontwarren in deze enorme dataset om te proberen te begrijpen hoe de sociale omgeving taalverwerving beïnvloedt. Hier kijken we naar een van de eerste dingen die we hebben gedaan. Hier maken mijn vrouw en ik ontbijt in de keuken. En terwijl we door ruimte en tijd gaan zien we een dagelijks levenspatroon in de keuken.
Om dit om te zetten, die ondoorzichtige 90.000 uur video, in iets waar je iets in kunt onderscheiden gebruiken we beweginganalyse om terwijl we door ruimte en tijd bewegen zogenoemde ruimte-tijdwormen eruit te halen. Dit is een onderdeel geworden van onze toolkit om te kunnen zien waar de activiteiten zich in de data bevinden, en daarmee het patroon te herkennen, vooral wanneer mijn zoon door het huis beweegt, zodat we ons transcriptiewerk vooral konden richten op de spraakomgeving van mijn zoon -- alle woorden die hij van mij, mijn vrouw of de nanny hoorde, en de woorden die hij na verloop van tijd ging vormen. Met die technologie en die data en de mogelijkheid om met hulp van een machine spraak te transcriberen, hebben we nu een transcriptie van ruim zeven miljoen woorden uit het transcript van thuis. Dat gezegd zijnde, laat me jullie meenemen op een eerste rondgang door de data.
Jullie hebben vast allemaal weleens een time-lapse video gezien waarin een bloem gaat bloeien terwijl de tijd versnelt. Ik wil jullie nu graag laten ervaren hoe een spraakvorm gaat bloeien. Kort na zijn eerste verjaardag ging mijn zoon "gaga" zeggen als hij water bedoelde. In de loop van de volgende zes maanden leerde hij langzaam de volwassen vorm van het woord te benaderen, "water". We gaan vliegen dus door een half jaar in ongeveer 40 seconden. Er is geen video hier, zodat je kunt concentreren op het geluid, de klankwereld, een nieuw soort overgang: gaga naar water.
(Audio) Baby: Gagagagagaga Gaga gaga gaga guga guga guga wada gaga gaga guga gaga wader guga guga water water water water water water water water water.
DR: Uiteindelijk lukt het, toch?
Maar hij leerde niet alleen water. In die 24 maanden, de eerste twee jaar waar we ons vooral op richtten, is dit een kaart van alle woorden die hij leerde, in chronologische volgorde. Omdat we volledige transcripten hebben, hebben we elk van de 503 woorden herkend die hij rond zijn tweede verjaardag had leren zeggen. Hij begon snel met praten en daarom gingen we analyseren waarom. Waarom worden sommige woorden eerder geboren dan andere? Dit is een van de eerste resultaten die uit onze studie van ruim een jaar geleden naar voren kwamen die ons erg verbaasden. Je moet dit op het oog simpele beeld zo interpreteren: op de verticale as staat een indicatie van hoe complex de uitingen van de verzorger zijn gebaseerd op de lengte van die uitingen. En de verticale as is de tijd.
Al deze data werden geordend volgens dit idee: elke keer dat mijn zoon een woord leerde, gingen we terug om te kijken naar alle taal die hij had gehoord waar dat woord in voorkwam. Daarna zetten we de relatieve lengte van de uitingen uit. Toen vonden we dit opmerkelijke fenomeen: het spreken van de verzorger daalde systematisch tot een minimum, de taal werd zo simpel mogelijk gemaakt om vervolgens langzaam weer complexer te worden. Het verrassende was dat die hobbel, die dip, telkens vrijwel precies samenviel met het moment dat een nieuw woord werd geboren -- woord na woord, elke keer opnieuw. Het lijkt er dus op dat alle drie de verzorgers -- ikzelf, mijn vrouw en onze nanny -- systematisch, en ik denk onderbewust, onze taal zo indeelden om bij hem te zijn bij de geboorte van een woord en hem zachtjes mee te nemen naar meer complexe taal. De implicaties hiervan -- er zijn er vele, maar ik wil er graag een benoemen -- is dat er steeds geweldig veel feedback plaatsvindt. Natuurlijk, mijn zoon leert van zijn linguïstische omgeving, maar die omgeving leert van hem. Die omgeving, mensen, zijn gevangen in een proces van feedback en scheppen zo een soort steigerwerk dat tot nu toe nog niet was opgemerkt.
Tot zover onze blik op de spraakcontext. Hoe zit het met de beeldcontext? We kijken niet naar -- zie dit als een poppenhuisblik in ons huis. We namen camera's met van die fish-eye lenzen en na wat optische correctie kunnen we het driedimensionaal tot leven brengen. Welkom bij mij thuis. Dit is een moment, een moment dat verschillende camera's hebben opgenomen. We deden dit om de ultieme geheugenmachine te maken, waarin je terug kan en interactief kan rondvliegen en dan videoleven kunt toevoegen aan dit systeem. Ik ga jullie een versneld beeld laten zien van 30 minuten, opnieuw, gewoon het leven in de woonkamer. Dat ben ik met mijn zoon op de grond. En hier zijn analysegegevens in de video die onze bewegingen volgen. Mijn zoon laat een rood spoor achter, ik een groen spoor. Hier zitten we op de bank en we kijken uit het raam naar passerende auto's. Aan het einde speelt mijn zoon zelf in een loopspeelgoed.
Nu zetten we de actie stil, 30 minuten, we zetten de tijd op de verticale as, en we krijgen een blik op de interactiesporen die we net hebben achtergelaten. We zien dit soort geweldige structuren -- deze kleine knooppunten van gekleurde draden die we sociale hotspots noemen. Dit spiraalvormige draadje noemen we een solo hotspot. We denken dat deze een invloed hebben op het aanleren van taal. We willen graag inzicht verwerven in de interactie tussen deze patronen en de taal waar mijn zoon mee in aanraking komt om te zien of we kunnen voorspellen hoe de structuur waarin een woord wordt gehoord een invloed heeft op het leermoment -- in andere woorden, de relatie tussen woorden en wat ze betekenen in de wereld.
Dat doen we op deze manier. In deze video zie je opnieuw de sporen van mijn zoon. Hij laat een rood inktspoor achter. Daar bij de deur is onze nanny.
(Video) Nanny: Wil je water? (Baby: Aaaa.) Nanny: Goed. (Baby: Aaaa.)
DR: Ze biedt hem water en daar gaan de twee wormpjes, op naar de keuken om water te halen. Hier hebben we het woord "water" gebruikt om dat moment, die activiteit te markeren. Nu nemen we de kracht van data en bekijken we elke keer dat mijn zoon het woord water heeft gehoord en de context waarin hij het tegenkwam, dat gebruiken we om in de video door te dringen en elk spoor van activiteiten te vinden dat samenviel met een moment dat "water" viel. De data laten in hun kielzog een landschap achter. Dat noemen we een woordenlandschap. Dit is een woordenlandschap voor het woord "water", en je ziet dat de meeste actie in de keuken plaatsvindt. Daar zie je die hoge pieken aan de linkerkant. En als contrast kunnen we dat met elk woord doen. We kunnen kijken naar het woord "bye" als in "good bye". Hier zoomen we in op de voordeur van het huis. En inderdaad, zoals te verwachten vinden we een contrast in het landschap waar het woord "bye" veel gestructureerder verschijnt. We gebruiken deze structuren om voorspellingen te doen over de volgorde van taalverwerving, en dat werk is nu in volle gang.
In mijn lab, waar we nu in kijken, aan MIT -- dit is het medialab. Dit is mijn favoriete manier geworden om zowat elke ruimte op video vast te leggen. Drie van de belangrijkste mensen in dit project, Philip DeCap, Rony Kubat en Brandon Roy, staan hier op de foto. Philip heeft intensief met mij gewerkt aan alle visualisaties die jullie zien. En Michael Fleischman was een andere doctorsstudent in mijn lab die met me heeft gewerkt aan de analyse van de video's. Hij merkte het volgende op: "Net zoals we analyseren hoe taal verbonden is met gebeurtenissen die een bodem vormen onder taal, zo kunnen we dat idee uit jouw huis, Deb, ook gebruiken in de wereld van openbare media." Toen nam ons onderzoek een onverwachte draai.
Denk aan massamedia als een soort bodem en je hebt het recept om dit idee op een heel andere manier in te zetten. We begonnen televisiecontent te analyseren op basis van dezelfde principes -- een analyse van de gebeurtenissenstructuur van wat op tv is -- afleveringen van series, commercials, alle componenten die een gebeurtenissenstructuur bepalen. Dankzij satellietschotels bekijken en analyseren we nu een groot deel van wat in de Verenigde Staten op tv is. Het is tegenwoordig niet meer nodig om huiskamers uit te rusten met microfoons om de gespreken van mensen op te nemen, het volstaat om te kijken naar openbare sociale media.
We verzamelen zo'n 3 miljard reacties per maand. En dan gebeurt het. Je hebt de gebeurtenissenstructuur, de bodem onder de betekenis van woorden, vanuit de stroom op televisie; je hebt de conversaties over deze onderwerpen en door semantische analyse -- nu kijken jullie trouwens naar echte data uit onze gegevensanalyse -- elke gele lijn duidt op een gemaakte link tussen een reactie in het wild en een stukje uit de gebeurtenissenstructuur van de televisiestroom. Hetzelfde idee kan nu worden opgebouwd. We krijgen dit woordenlandschap, maar nu worden woorden niet in mijn woonkamer in elkaar gezet. In plaats daarvan wordt de context, de basisactiviteit bepaald door de content op televisie die de conversaties aanjaagt. Hier zien we deze wolkenkrabbers, dat zijn reacties die zijn gekoppeld aan content op televisie. Hetzelfde concept, maar dan gericht op de dynamiek van communicatie in een totaal andere omgeving.
In plaats van bijvoorbeeld content te meten op basis van hoeveel mensen kijken, krijgen we hier de basisgegevens over hoe content tot interactie leidt. Net zoals we kunnen kijken naar de uitwisseling van feedback en de dynamiek in een gezin kunnen we nu dezelfde concepten wijder maken en kijken naar een veel grotere groep mensen. Dit is een subset van gegevens uit onze database -- slechts 50.000 van enkele miljoenen -- en het sociale beeld dat ze bindt via openbaar beschikbare bronnen. Als je die in één vlak plaatst, staat de content in een tweede vlak. De programma's en de sportevenementen en de commercials en alle verbindende structuren ertussen maken samen een contentplaatje. En dan de belangrijke derde dimensie. Elke koppeling die jullie hier weergegeven zien is een werkelijke verbinding tussen iets wat iemand heeft gezegd en een brokje content. Er zijn, opnieuw, tientallen miljoenen van dit soort links die een web van sociale beelden opleveren en hoe ze zich verhouden tot de content. Nu kunnen we de structuur gaan onderzoeken op interessante manieren.
Als we bijvoorbeeld een pad tekenen van een brokje content dat iemand inspireerde om erop te reageren, en dan volgen waar die reactie heen gaat om vervolgens te kijken naar de complete sociale grafiek die wordt geactiveerd en terug te gaan naar de relatie tussen de sociale grafiek en de content, dan wordt een interessante structuur zichtbaar. Die noemen we een "samen kijkend groepje", een virtuele woonkamer als het ware. Hier is een fascinerende dynamiek gaande. Het is geen eenrichtingsverkeer. Een brokje content, een gebeurtenis maakt dat iemand erover gaat praten. Die praat weer met anderen. Dit stimuleert weer dat men teruggaat naar de massamedia en je krijgt deze cycli die een algemeen gedrag sturen.
Een ander voorbeeld -- heel anders -- van een andere persoon in onze database -- we vinden minstens honderden, zoniet duizenden hiervan. We hebben deze persoon een naam gegeven. Dit is een pro-amateur, of pro-am, mediacriticus die een hoog bereik heeft. Veel mensen volgen deze persoon dus -- hij is heel invloedrijk -- en ze hebben de neiging om te bespreken wat er op tv is. Deze persoon is dus een sleutelverbinding tussen de massamedia en de sociale media.
Een laatste voorbeeld uit deze data: soms is een brokje content zelf bijzonder. Laten we teruggaan en kijken naar dit contentelement, de State of the Union van president Obama van slechts een paar weken geleden en kijken wat we vinden in dezelfde dataset, op dezelfde schaal: de bindingskenmerken van deze brok content zijn echt opmerkelijk. Een heel land explodeert in conversatie in real-time in reactie op wat er is uitgezonden. Natuurlijk, tussen al deze lijnen vloeit ongestructureerde taal. We kunnen een röntgenfoto nemen en in real-time de vinger aan de pols van een land houden, een real-time gevoel van de sociale reacties in verschillende circuits van het sociale plaatje die door de content worden geactiveerd.
Als ik samenvat, is dit het idee: terwijl onze wereld steeds meer wordt bepaald door machines en we de mogelijkheid hebben om te verzamelen en de punten te verbinden tussen wat mensen zeggen en de context waarin ze het zeggen, zien we een mogelijkheid bovenkomen om nieuwe sociale structuren en dynamiek te zien die tot dan toe verborgen bleven. Het is alsof je een microscoop of telescoop bouwt en nieuwe structuren onthult over ons gedrag rond communicatie. Ik denk dat de gevolgen diepgaand zullen zijn, zowel voor de wetenschap, als voor de economie, voor de overheid of misschien nog wel het meest voor ons als individu.
Om terug te keren bij mijn zoon: toen ik dit praatje voorbereidde, keek hij mee over mijn schouder en ik liet hem de clips zien die ik jullie vandaag zou tonen, en ik vroeg hem om toestemming -- die kreeg ik. Toen bedacht ik me: "Is het niet geweldig, deze hele database, al deze opnames, die ga ik nalaten aan jou en aan je zus, die twee jaar later kwam. En jullie zullen terug kunnen gaan en momenten opnieuw kunnen beleven die je je nooit met je biologische geheugen zou kunnen herinneren zoals je dat nu kunt." Toen was hij een moment stil. En ik dacht: "Wat denk ik wel niet? Hij is vijf jaar. Hij begrijpt dit nog niet." En juist toen ik dat dacht, keek hij naar me op en zei hij: "Als ik later groot ben kan ik dit dus aan mijn kinderen laten zien?" Ik dacht: "Tjonge, dat is sterk."
Ik wil jullie graag nog een gedenkwaardig moment meegeven uit onze familie. Dit is de eerste keer dat onze zoon meer dan twee stappen tegelijk nam -- vastgelegd op film. Ik wil graag dat jullie vooral op één ding letten als ik het jullie laat zien. De omgeving is rommelig, het is het echte leven. Mijn moeder is in de keuken aan het koken en in de gang, stel je ook voor, realiseer ik me dat hij het gaat doen, meer dan twee stappen tegelijk nemen. Je hoort mij hem dus aanmoedigen terwijl ik me realiseer wat er gebeurt, en dat komt het magische moment. Luister heel goed. Na ongeveer drie stappen realiseert hij zich dat het gebeurt. Dan komt de meest geweldige feedbackreactie van allemaal, hij neemt een diepe adem en fluistert "wauw" en op instinct doe ik hetzelfde. Laten we teruggaan in de tijd tot dat gedenkwaardige moment.
(Video): DR: Hey. Kom hier. Kun je het doen? Jongen toch. Kun je het? Baby: Ja. DR: Ma, hij loopt.
Got an idea, question, or debate inspired by this talk? Start a TED Conversation, or join one of these:
MIT-onderzoeker Deb Roy wilde begrijpen hoe zijn baby taal leerde -- dus hing hij zijn huis vol videocamera's om elk moment in het leven van zijn zoon vast te leggen (met enkele uitzonderingen), om vervolgens 90.000 uur video door te ploegen en te zien hoe "gaaaa" langzaam "water" werd. Verbazend en datarijk onderzoek met belangrijke implicaties voor hoe we leren.
Deb Roy studies how children learn language, and designs machines that learn to communicate in human-like ways. On sabbatical from MIT Media Lab, he's working with the AI company Bluefin Labs. Full bio »
Translated into Dutch by Albert Edelman
Reviewed by Els De Keyser
Comments? Please email the translators above.
10:17 Posted: Feb 2011
Views 867,811 | Comments 227
22:42 Posted: Sep 2008
Views 360,137 | Comments 85
Just follow the guidelines outlined under our Creative Commons license.
This comment will be attributed to . Not ? Sign out.