Представете си ако можеше да запишете живота си -- всичко което казвате и вършите, достъпно в перфектен склад на спомени на ръка разстояние, така че да можете да превъртите назад и да намерите и преживеете отново паметни моменти, или да пресеете времето и да откриете модели, които следвате във вашият живот, за които не сте подозирали че съществуват. Е, точно такова пътуване предприе моето семейство преди 5 години и половина. Това е моята съпругата и сътрудник, Рупал. И на този ден, в този момент, ние стъпихме вкъщи с нашето първо дете, нашия красив син. И влезнахме в къща със много специална домашна видео записваща система.
Деб Рой: Този момент, както и хиляди други специални за нас мигове, бяха уловени в нашия дом, защото във всяка стая на къщата, ако погледнехте нагоре, щяхте да видите видеокамера и микрофон, а ако погледнехте надолу, щяхте да видите стаята от птичи поглед. Това е дневната, детската, кухнята, трапезарията и останалата част от къщата. И всички те се записваха на дисков масив, пригоден за нон-стоп запис. И така, тук ние прелитаме през един ден в нашия дом, и преминаваме от слънчева сутрин през нажежена вечер и накрая на деня лампите загасват. В продължение на три години, ние записвахме 8-10 часа дневно, натрупвайки около четвърт милион часа аудио и видео запис.
И така, вие наблюдавате част от най-голямата досега позната колекция от домашно видео. (Смях) Това, което тези данни означават за нашето семейство на персонално равнище, въздействието им е вече огромно, и ние все още изучаваме значимостта им. Безброй мигове, естествени, непредизвикани и нережисирани мигове, са съхранени в тези данни, и ние започваме да научаваме как да ги откриваме и намираме
Но има и научна причина, която мотивира този проект, а именно да се използват естествените дългосрочни данни за да разберем процесът, чрез който едно дете научава език, в случая това дете е моят син. И така с много уговорки за поверителност, защитаващи всички, чиито живот камерите са записали, ние предоставихме достъп до част от записите на моят доверен изследователски екип в Масачузетския Технологичен Институт, за да започнем да разгадаваме модели в голямото количество данни, опитвайки се да разберем влиянията на социалната среда върху заучаването на езика. Тук наблюдаваме едно от първите неща, които започнахме да правим. Това сме аз и съпругата ми приготвяйки закуска в кухнята. И докато се движим през времето и пространството, това е доста ежедневен модел на поведение в кухнята.
За да превърнем тези трудноразбираеми 90 000 часа видео, в нещо, което да започнем да виждаме, ние използвахме анализ на движението, докато преминавахме през времето и пространството, който нарекохме времево-пространствени червеи. Те станаха част от нашия арсенал, за да можем да определяме къде в данните се случват дейностите, и чрез тях проследяваме моделът, в частност, на движенията на сина ми из къщата, за да можем да съсредоточим транскрибиращите си усилия върху речевата среда около сина ми -- всички думи, които чува от мен, съпругата ми, детегледачката, и последователно думите, които той започна да произнася. Така с тази технология и тези данни, и способността, с помощта на машините, да записваме реч, засега сме записали повече от 7 милиона думи от домашните ни разговори. И така, нека сега ви отведа на първата разходка из нашите данни
Сигурен съм, че всички вие сте виждали ускорени във времето видеозаписи, където например, може да наблюдавате разцъфващо цвете докато ускорявате времето, Бих желал сега да преживеете разцъфването на една форма на речта. Синът ми скоро след първия си рожден ден започна да нарича водата "гага." И през следващите шест месеца, той бавно се научи да произнася приблизително правилната форма на думата, "вода." Сега ще пропътуваме половин година за 40 секунди. Без видео запис, за да може да се концентрирате върху звука, акустиката на един нов вид траектория: от "гага" до "вода."
(Звук) Бебе: Гагагагагага Гага гага гага гуга гуга гуга уада гага гага гуга гага уода гуга гуга вода вода вода вода вода вода вода вода вода.
Той не само научи "вода." По време на 24-те месеца, първите две години, върху които наистина се съсредоточихме, това е карта на всяка дума научена от него в хронологичен ред. И тъй като имаме пълни записи, идентифицирахме всяка от 503-те думи, които той научи да изговаря до втория си рожден ден. Той проговори рано. И така ние започнахме да анализираме защо. Защо определени думи се раждаха преди другите? Това е един от първите резултати от експеримента ни, който получихме преди година, и той наистина ни изненада. Начинът, по който може да се тълкува тази привидно проста диаграма е, че по вертикалата е индикация за това, колко сложен е изказът на детегледачът, базиран на дължината на речта. А по вертикалната ос е времето.
Подредихме всички данни въз основа на следната идея: Всеки път, когато синът ми научаваше дума, ние проследявахме речта чута от него, съдържаща тази дума. И съставяхме крива със съответната продължителност на словото. И открихме любопитен феномен -- речта на детегледачът системно спадаше до минимум, правейки езикът колкото се може по опростен, и след това бавно сложността на речта се повишаваше. Невероятното в случая е, че този спад съвпадна почти точно с момента, в който всяка дума се раждаше -- методично, дума по дума. И така излглежда, че тримата главни детегледачи -- аз, жена ми и бавачката -- систематично и, мисля, подсъзнателно, реструктурирахме езика си, за да го нагодим там, където се ражда една дума, и да го поведем внимателно към по-сложен език. И последствията от това -- имаше много, но едно от тези, които искам да спомена е, че би трябвало да има невероятнa верига от обратна информация. Разбира се, синът ми се учи от своето лингвистично обкръжение, обкръжението му се учи от него. Хората от обкръжението му са част от веригата за обратна информация, като формират нещо като скеле, което е останало незабелязано досега.
Но това е когато разглеждаме речевия контекст. Ами визуалният контекст? Ние не разглеждаме -- това е страничен разрез на къщтата ни. Използвайки кръговите видеокамери тип 'рибно око,' ние ги коригирахме оптически, за да получим този триизмерен образ И така, добре дошли в моят дом. Това е момент, записан от различни камери. Ние създадохме това с цел да създадем перфектната машина на спомените, с която да можем да се върнем назад и интерактивно да летим наоколо и да вдъхнем живот на видео записите. Сега ще ви покажа ускорен изглед от 30 минути, отново, само от живота в дневната. Това сме аз и сина ми на пода. И има видео анализ, който проследява нашите движения. Синът ми оставя червено мастило, аз оставям зелено мастило. Сега сме на дивана, гледаме през прозореца преминаващи коли. И накрая, синът ми си играе с ходеща играчка самичък.
Сега замразяваме движението, за 30 минути, обръщаме времето на вертикалната ос, и отваряме изглед на тези интерактивни следи, които оставихме току-що. И ние виждаме тези невероятни структури -- тези малки възли от двуцветни нишки, които наричаме социални горещи точки. Спираловидната нишка наричаме единична гореща точка. И ние смятаме, че те оказват влияние върху начина, по който езикът се научава. Това, което искаме да направим, е да започнем да разбираме взаимодействието между тези модели и езика, на който е изложен синът ми, за да разберем дали може да се предскаже, как структурата на това кога думите са чути, оказва влияние на това кога са заучени -- с други думи, връзката между думите и това, което те представляват в света.
Така че, ето как подхождаме към това. В това видео, отново, синът ми е проследяван. Той оставя червено мастило след себе си. И нашата бавачка е до вратата.
(Видео) Бавачка: Искаш ли вода? (Бебе: Аааа.) Бавачка: Добре. (Бебе: Аааа.)
ДР: Тя предлага вода, и двете червейчета потеглят към кухнята да вземат вода. И това, което сме направили, е да използваме думата "вода," за да маркираме този момент, тази дейност. И сега използваме силата на данните, и вземаме всеки път, когато синът ми е чувал думата вода, и контекста, в който я е видял, и използваме това, за да претърсим видеото и да проследим всяка следа от дейност, която се е случила по същото време, когато е използвана думата вода. И това, което тези данни оставят след себе си е пейзаж. Ние ги наричаме словесни пейзажи. Това е словесния пейзаж за думата вода и може да видите, че по-голямата част от действията са в кухнята. Това е мястото, където са се образували тези големи върхове вляво. И само за контраст, ние можем да направим това с всяка дума. Можем да вземем думата "довиждане," като в "до скоро виждане." И сега увеличаваме над входа на къщата. И гледаме, и откриваме, както може да се очаква, контраст в пейзажа, където думата "довиждане" се среща много повече по структуриран начин. Така че ние използваме тези структури, за да започнем да предсказваме редът за придобиване на езикови умения, и това е работа, която вършим сега.
В моята лаборатория, която виждаме в момента, в Масачузетския технологичен институт -- това е в медийната лаборатория. Това се превърна в любимия ми начин за видео представяне на почти всяко пространство. Три от ключовите фигури в този проект, Филип ДеКамп, Рони Кубат и Брендън Рой са на снимката. Филип беше близък сътрудник за всички визуализации, което виждате. И Майкъл Флайшман, който е друг докторант в моята лаборатория, който работеше с мен над анализа на това домашно видео, и той направи следното наблюдение: че "просто начинът, по който анализираме как езика се свързва със събития, които предоставят контекста за езика, същата идея можем да извадим от дома ти, Деб, и можем да я приложим в света на обществените медии." И така, усилията ни претърпяха неочакван обрат.
Мислете си за средствата за масова информация, като предоставящи контекста, и ще раполагате с рецепта за отвеждане на тази идея на съвсем ново място. Ние започнахме да анализираме телевизионно съдържание, използвайки същите принципи -- анализирахме структурата на събитията от телевизионен сигнал -- епизоди на предавания, реклами, всички елементи, които изграждат структурата на събитието. И сега, със сателитни чинии, извличаме и анализираме голяма част от телевизията, която се гледа в Съединените щати. И не е нужно да отидете сега и да инсталирате микрофони във всекидневните, за да научите разговорите на хората, необходимо е просто да се настроите към обществено достъпните социални медийни емисии.
И така, ние извличаме около три милиарда коментари на месец. И тогава се случва магията. Разполагаме със структурата на събитията, контекста, в който се използват думите, произлизащи от телевизионните емисии; разполагаме с разговорите свързани с тези теми; и чрез семантичен анализ -- и това всъщност са реални данни, които виждаме в момента, от нашата обработка на данните -- всяка жълта линия показва връзка между коментар, направен в интернет, и някакво събитие, произлизащо от телевизионния сигнал. И същата идея сега може да бъде изградена. И ние получаваме това словесно пространство, с изключение на това, че сега думите не са събрани от моя хол. Вместо това, контекста, общите дейности, са от телевизионното съдържание, което подтиква разговорите. И това, което виждаме тук, тези небостъргачи сега, са коментари, които са свързани със телевизионното съдържание. Същата концепция, но сега гледаме в комуникационната динамика в съвсем различна сфера.
И така в основни линии, вместо да, например, измерваме съдържанието, на базата на това колко много хора гледат, това ни дава основните данни, за наблюдаване на свойствата на ангажираност към съдържанието. И по същия начин както можем да разглеждаме вериги за обратна връзка и динамиката в семейство, сега можем да вземем същите понятия и да погледнем в много по-големи групи от хора. Това е набор от данни от нашата база данни -- само 50 000 от няколко милиона -- и социалния граф, който ги свързва с публично достъпни източници. И ако ги сложите на една равнина,♫ втората равнина е мястото, което е населено със съдържанието. Така че, програмите и спортните събития и рекламите, и всички свързани структури, които ги обединяват, образуват граф на съдържанието. И после идва важното третото измерение. Всяка една от връзките, които виждате предоставени тук, е конкретна връзка направена между нещо, което някой казал и някакво съдържание. И има, отново, десетки милиони от тези връзки, които ни дават съединителната тъкан на социалния графики, и как те се отнасят към съдържанието. И сега можем да започнем да проучваме структурата по интересни начини.
Така ако, например, проследим пътя на някакво съдържание, което подтиква някой да направи коментар върху него, и ако след това проследим къде отива коментара, и след това погледнем целия социален граф, който става активиран, и след това проследим обратно, за да видим връзката между социалната графика и съдържанието, много интересна структура става видима. Ние наричаме това клика за съвместно гледане, виртуална дневна, ако щете. И се случват някои интересни динамики. Това не е еднопосочно. Някакво съдържание, събитие, подтиква някого да заговори. Те говорят с други хора. Това предизвиква някакво поведение обратно в средствата за масово осведомяване, и се получават тези цикли, които стимулират цялостното поведение.
Друг пример -- много различен -- друг истински човек в нашата база данни -- и ние намираме поне стотици, ако не и хиляди, от тях. Ние сме наименовали този човек. Той е про-аматьор, или про-ам, медиен критик, който има този висок процент на фенове. Така че много хора следват този човек -- много е влиятелен -- и те имат склонност да говорят за това, което дават по телевизията. Така че този човек е едно от ключовите звена за свързването на средствата за масово осведомяване и социалните медии.
Един последен пример от тези данни. Понякога само част от съдържанието е специална. Така че, ако погледнем тази част от съдържанието, годишната реч на президента Обама пред Конгреса, само от преди няколко седмици, и ако погледнем какво намираме в същия набор от данни, в същия мащаб, свойствата на ангажираност на тази част от съдържанието са наистина забележителни. Нация избухнала в разговор, в реално време, в отговор на това, което се излъчва. И разбира се, по всичките тези линии се лее неструктуриран език. Можем да направим рентгенова снимка и да измерим в реално време пулса на една нация, усещане в реално време за социалните реакции в различните вериги на социалния граф, които се активират по съдържание.
И така, да обобщя, идеята е следната: Докато нашия свят става все по-наситен с инструменти, и ние имаме възможността да събираме и свързваме точките между това, което казват хората и контекста, в който го казват, това, което се заражда е способността да се видят нови социални структури и динамики, които преди това не са били виждани. Това е като изграждането на микроскоп или телескоп, и разкриването на нови структури за нашето собствено поведение свързано с комуникацията. И мисля, че последиците тук са значими, независимо дали става дума за наука, за търговия, за управление, или може би най-вече, за нас като индивиди.
И така, да се върнем към моя син, когато подготвях този разговор, той гледаше над рамото ми, и аз му показах клиповете, които щях да ви покажа днес, и го помолих за разрешение -- беше дадено. И после започнах да си мисля: "Не е ли удивително, цялата тази база данни, всички тези записи, ще ги предам на теб и сестра ти," която пристигна две години по-късно. "И вие, деца, ще може да се върнете обратно и да изживеете отново моменти, които никога не бихте могли, с биологичната си памет, да си спомняте по начина, по който можете сега." И той се успокои за момент. И си помислих: "Какво си мисля? Той е на пет години. Няма да разбере това." И докато си мислех това, той повдигна очи към мен и каза: "Значи като порастна, ще мога да покажа това на децата си?" И аз си помислих: "Уау, това е нещо силно."
Така че искам да ви оставя с един последен незабравим момент от нашето семейство. Това е първият път, когато нашият син направи повече от две стъпки наведнъж -- заснето на филм. И наистина искам да се фокусирате върху нещо, докато ви го показвам. Това е разхвърляна среда, това е естествения живот. Майка ми е в кухнята, готви, и, от всички места, в коридора, разбирам, че той е на път да го направи, да направи повече от две стъпки. Можете да ме чуете как го насърчавам, осъзнавайки това, което се случва, и след това се случва магията. Слушайте много внимателно. След около три стъпки той осъзнава, че нещо магическо се случва. И най-невероятния механизъм за обратна връзка преритва, и той поема дъх и прошепва: "Уау," и инстинктивно аз повтарям същото. Така че, нека да полетим назад във времето до този паметен момент.
Видео) ДР: Хей. Ела тук. Можеш ли да го направиш? О, боже. Можеш ли да го направиш? Бебе: Да. ДР: Майко, той ходи.
You can share this video by copying this HTML to your clipboard and pasting into your blog or web page. This video will play with subtitles.
You either have JavaScript turned off or have an old version of the Adobe Flash Player. To view this rating widget you
need to get the latest Flash player.
If your browser allows only "trusted sites" to execute Javascript, you should add the "googleapis.com" domain to your whitelist to allow our Flash detection to work properly.
Got an idea, question, or debate inspired by this talk? Start a TED Conversation.
Деб Рой, изследовател от Масачузетския Технологичен Институт, искал да разбере как новороденият му син се научава да говори -- затова той инсталирал видеокамери из къщата си, които да запечатат всеки момент (с изключения) от живота на сина му, а после анализирал 90000 часа домашно видео, за да види как "гааа" бавно се превръща във "вода". Удивителено, богато на данни изследване, с дълбоки последици върху това как учим.
Deb Roy studies how children learn language, and designs machines that learn to communicate in human-like ways. On sabbatical from MIT Media Lab, he's working with the AI company Bluefin Labs. Full bio »
Translated into Bulgarian by Anton Hikov
Reviewed by Stoyan Georgiev
Comments? Please email the translators above.
10:17 Posted: Feb 2011
Views 1,302,588 | Comments 264
22:42 Posted: Sep 2008
Views 485,535 | Comments 94
Just follow the guidelines outlined under our Creative Commons license.
This comment will be attributed to . Not ? Sign Out.