Koliko vas je nekada moralo da na internetu popuni neku vrstu obrasca gde ste morali da prekucate iskrivljeni niz znakova poput ovog? Koliko vas je pomislilo "Ovo je zaista iritirajuće"? Dobro. Odlično. Ja sam to izmislio. (Smeh) Ili bio sam jedan od ljudi koji su to izmislili.
To se zove CAPTCHA. I tu je kako bismo bili sigurni da je stvorenje koje je popunilo formular zapravo čovek, a ne kompjuterski program koji je napisan kako bi popunio milione ovakvih obrazaca. To funkcioniše jer ljudi, ili barem ljudi koji vide, nemaju problema da pročitaju ove izobličene znake, dok kompjuterski programi jednostavno još uvek to ne mogu da urade. Na primer, u slučaju Tiketmastera, razlog što morate da ukucate ove simbole je da biste sprečili tapkaroše da naprave program koji će im omogućiti da kupe milione ulaznica.
CAPTCHA se koristi širom interneta I budući da je to veoma često, mnogo puta konkretni niz slučajno odabranih simbola koji su pokazani korisniku nije naročito "srećan". Ovo je primer sa stranice za registraciju na Jahu (Yahoo). Slučajno odabrani karakteri prikazani korisniku su bili Č,E,K,A,J,T.E, što naravno daje reč. Ali najbolje od svega je što je dvadesetak minuta kasnije Jahu dobio poruku sledećeg sadržaja. "Pomozite! Čekam već 20 minuta i ništa se ne dešava." (Smeh) Ova osoba je mislila da je trebalo da čeka. Ovo naravno i nije tako loše u poređenju sa ovom jadnom osobom.
CAPTCHA projekat smo uradili ovde na Karnegi Melon univerzitetu pre više od deset godina, i koristi se svuda. Sada ću vam ispričati nešto o projektu koji smo uradili nekoliko godina kasnije i što je u neku ruku evolucija CAPTCHA-e. Ovaj projekat smo nazvali reCAPTCHA, započet je ovde u Karnegi Melonu ali se onda pretvorio u startap kompaniju. Zatim, pre oko godinu i po, Gugl je kupio ovu kompaniju,
Reći ću vam kako je projekat počeo. Počelo je tako što smo shvatili sledeće: ispostavi se da ljudi širom sveta svakog dana ukucaju oko 200 miliona CAPTCHA kodova. Kad sam to čuo prvi put, bio sam prilično ponosan, misleći kako moje istraživanje ima ogroman uticaj. Ali onda sam počeo da se loše osećam. Jer... svaki put kad ukucate CAPTCHA vi izgubite deset sekundi svog života. I ako to pomnožite sa 200 miliona ispada da čovečanstvo troši oko 500.000 sati svakog dana ukucavajući te iritantne CAPTCHA kodove. I tako sam počeo da se osećam loše -
A onda sam počeo da razmišljam, naravno da se ne možemo otarasiti CAPTCHA-e, budući da bezbednost čitavog interneta zavisi od njih. Ali onda sam se zapitao postoji li način na koji možemo iskoristiti ovaj trud za nešto što je dobro za čovečanstvo? Zaključak je sledeći. Tokom tih desetak sekundi dok ukucavate CAPTCHA kod, vaš mozak radi nešto zaista zadivljujuće. On radi nešto što kompjuteri još uvek ne mogu da urade. Dakle, možemo li izvesti da za tih deset sekundi vi uradite nešto korisno? Drugim rečima, postoji li neki ogromni problem koji kompjuteri još uvek ne mogu da reše, a koji možemo izdeliti na malecke deonice od 10 sekundi tako da svaki put kad neko reši CAPTCHA kod reši mali deo tog problema? Odgovor na ovo je "da", i upravo to sada vi radite.
Ono što možda ne znate je da kada ukucate CAPTCHA, ne samo da ste dokazali da ste ljudsko biće već nam zapravo i pomažete da digitalizujemo knjige. Dozvolite mi da objasnim. Postoji mnogo projekata kojima je cilj da digitalizuju knjige. Gugl ima jedan. Internet arhiv ima jedan. Amazon, sada sa Kindlom takođe pokušava da digitalizuje knjige. To funkcioniše tako što počnete sa nekom starom knjigom. Znate te stvari, zar ne? Knjige? (Smeh) Uzmete knjigu i skenirate je.
Skeniranje knjige je kao digitalno fotografisanje svake stranice knjige. Dobijete fotografiju svake stranice. I ovo je fotografija sa tekstom za svaku stranicu knjige. Sledeći korak u procesu je da kompjuter uspe da odgonetne sve reči na ovoj slici. Tu se koristi tehnologija pod imenom OCR (OPK). za optičko prepoznavanje karaktera, koja fotografiše tekst i pokušava da odgonetne šta tu piše. Problem je što ova tehnologija nije savršena. Naročito kada se radi o starijim knjigama gde je tinta izbledela i stranice požutele, pa OPK ne može da prepozna mnoge reči. Na primer, kod stvari koje su napisane pre više od 50 godina, kompjuter ne može da prepozna oko 30 odsto reči. I ono što tada radimo je da uzmemo sve reči koje kompjuter ne može da prepozna i pitamo ljude da ih pročitaju umesto nas dok ukucavaju CAPTCHA na internetu.
Tako da, sledeći put kad budete kucali CAPTCHA, te reči su zapravo reči koje dolaze iz knjiga koje se digitalizuju i koje kompjuter ne može da prepozna. A razlog što danas imamo dve, umesto jedne reči je zato što je jednu od reči sistem dobio iz knjige, nije je prepoznao i pokazaće vam je. Ali budući da ne zna odgovor, ne može ni vas da oceni. Zato vam dajemo još jednu reč, koju sistem prepoznaje. Ne kažemo vam koja je koja, već vas pitamo da upišete obe. I ako upišete tačno reč koju sistem već zna, on zaključuje da ste ljudsko biće i da ćete i drugu reč ukucati tačno. Ako ponovimo ovaj proces sa 10 različitih ljudi i svi oni se slože oko nove reči, dobijemo još jednu tačno digitalizovanu reč.
Tako funkcioniše sistem. Počeo je da radi pre oko tri ili četiri godine, i mnogi sajtovi su već prešli sa stare CAPTCHA kodove gde su ljudi gubili vreme na novi CAPTCHA gde ljudi pomažu da se knjige digitalizuju. Dakle, na primer, Tiketmaster. Svaku put kada kupite karte na Tiketmasteru pomažete digitalizaciju knjiga. Fejsbuk: Svaku put kad dodate prijatelja ili nekog "pokujete", učestvujete u digitalizaciji knjiga. Tviter i oko 350.000 drugih sajtova koriste reCAPTCHA. I zapravo, broj tih sajtova je toliko veliki da je i broj reči digitalizovanih tokom jednog dana veoma veliki. Oko sto miliona dnevno, što je ekvivalent za oko dva i po miliona knjiga godišnje. I to sve reč po reč, samo uz pomoć ljudi koji ukucavaju CAPTCHA kodove na internetu.
Naravno, budući da uradimo toliko reči u toku jednog dana, dešavaju se razne smešne stvari. I ovo je tako jer dajemo ljudima dve slučajno odabrane engleske reči jednu do druge. Pa se dese smešne stvari. Na primer, pojavila se ova reč - To je reč "Hrišćani" i nema tu ništa loše. Ali ako je uparite sa drugom slučajno odabranom reči, mogu se desiti loše kombinacije. Dakle dobili smo ovo. (Tekst: loši hrišćani) Ali, najgore od svega je što se sve ovo desilo na sajtu koji se zove "Ambasada kraljevstva božijeg". (Smeh) Ups. (Smeh) Evo još jednog lošeg primera. DžonEdvards.com (Tekst: Prokleti liberal) (Smeh) Tako da svakodnevno vređamo ljude i desne i leve orijentacije.
Naravno, nije samo da ih vređamo. Budući da su reči slučajno uparene, mogu se desiti i interesantne stvari. Ovo je dovelo do velikog internet fenomena u kom su učestvovale na hiljade ljudi, a koji se zove CAPTCHA umetnost. Siguran sam da su neki od vas čuli za to. Evo kako radi. Zamislite da surfujete internetom i vidite CAPTCHA za koj mislite da je jedinstven, kao na primer ovaj CAPTCHA (Tekst: nevidljivi toster) Ono što bi trebalo da uradite je da sačuvate sliku sa ekrana. A onda naravno popunite CAPTCHA jer nam tako pomažete da digitalizujemo knjige. Ali prvo sačuvate tu sliku, i onda docrtate nešto što je u vezi sa tim. (Smeh) Tako to funkcioniše. Postoje na desetine hiljada ovoga. Neke od njih su veoma simpatične. (Tekst: stegnuo sam ga) (Smeh) Neke su smešnije. (Tekst: drogirani osnivači) (Smeh) A neke od njih, kao "paleontološki švizl", imaju Snup Doga.
Ok, ovo je moj omiljeni broj reCAPTCHA-e. Ovo je nešto što mi se najviše sviđa u vezi sa celim projektom. Ovo je broj različitih ljudi koji su nam pomogli da digitalizujemo makar jednu reč neke knjige kroz reCAPTCHA: 750 miliona što znači da nam je oko 10 odsto celokupne svetske populacije pomoglo da digitalizujemo ljudsko znanje. Ovo je jedan od brojeva koji me motivišu da istražujem dalje. Dakle pitanje koje me motiviše da nastavim je sledeće: ako posmatrate grupna dostignuća čovečanstva, one zaista velike stvari oko kojih se čovečanstvo okupilo i uradilo nešto kao, na primer, gradnju piramida u Egiptu ili Panamskog kanala ili slanje čoveka na Mesec -- zanimljiva činjenica u vezi sa njima je da su svi bili urađeni sa otprilike istim brojem ljudi. Čudno; svi oni su sprovedeni sa oko 100.000 ljudi. A razlog za to je što je pre postojanja interneta koordinisanje više od 100.000 ljudi, a kamoli plaćanje, bilo prosto nemoguće. Ali sada, uz pomoć interneta, upravo sam vam pokazao projekat gde smo okupili 750 miliona ljudi koji su nam pomogli da digitalizujemo ljudsko znanje. Dakle, ono što me motiviše prilikom istraživanja je, što ako sa 100.000 možemo da pošaljemo čoveka na Mesec šta tek možemo da uradimo sa 100 miliona?
I tako bazirano na ovom pitanju počeli smo da radimo na mnogo različitih projekata. Pričaću vam o jednom oko kog sam najviše uzbuđen. To je nešto na čemu radimo polutajno u poslednjih godinu i po dana. Još ga nismo lansirali. Zove se Duolingo. Budući da nije lansiram, psssst! (Smeh) Da, verujem da ćete ćutati. Dakle ovo je projekat. Evo kako je počeo. Počeo je tako što sam postavio pitanje mom studentu, Severinu Hakeru. Ok, ovo je Severin Haker. Dakle, postavio sam mu pitanje. Usput, dobro ste čuli, njegovo prezime je Haker. Pitao sam ga: kako možemo da postignemo da nam 100 miliona ljudi prevede internet na svaki važniji svetski jezik, besplatno?
Ok, prvo moram nešto da kažem o ovom problemu. Prvo, prevod interneta. Trenutno je internet podeljen na mnogo jezika. Veliki deo je na engleskom. Ako ne znate engleski, ne možete pristupiti podacima. Ali postoje i veliki delovi na drugim jezicima, i ako ne znate te druge jezike, ne možete pristupiti. Dakle, voleo bih da prevedem ceo internet, ili makar njegov veliki deo, na svaki važan jezik. To bih voleo da uradim.
Sada neki od vas mogu reći, ali zašto ne kortistite kompjutere za prevod? Zašto ne koristimo mašine za prevod? Kompjutersko prevođenje prevede tu i tamo poneku rečenicu. Zašto ih ne koristimo da prevedu ceo internet? Problem je što i dalje nisu dovoljno dobri, i verovatno neće biti u narednih 15 ili 20 godina. Prave mnogo grešaka. Čak i kada ne naprave grešku, budući da ih često prave, kako da znamo kada je prevod tačan a kada ne.
Daću vam primer nečega što je preveo kompjuter. Zapravo to je bio post na forumu. Neko ko je pokušavao da pita nešto o jeziku Java. Bilo je prevedeno sa japanskog na engleski. Daću vam da pročitate. Osoba počinje izvinjenjem zbog činjenice da se radi o kompjuterskom prevodu. Dakle sledeća rečenica je uvod u pitanje. On nešto objašnjava. Upamtite, pitanje je o Java programskom jeziku. (Tekst: Na često, koza-vreme instaliranja greška je bljuvanje) (Smeh) Onda dolazi prvi deo pitanja. (Tekst: Koliko puta kao vetar, motka i zmaj?) (Smeh) A onda dolazi moj omiljeni deo pitanja. (Tekst: Ova uvreda očevom kamenju?) (Smeh) A onda dolazi kraj, koji mi je omiljeni deo cele stvari. (Tekst: Molimo vas da se izvinite za svoju glupost. Postoje mnoge hvala) (Smeh) Dobro, znači kompjuterski prevod, još uvek nedovoljno dobar. Nazad na pitanje.
Trebaju nam ljudi da prevedemo ceo internet. Sledeće što biste mogli pitati je: zašto jednostavno ne platimo ljudima da to urade? Mogli bismo platiti profesionalnim prevodiocima da to urade. Mogli bismo. Nažalost, to bi bilo preskupo. Na primer, prevod samo malog dela interneta, Vikipedije, u neki drugi jezik, na primer španski, Vikipedija postoji na španskom, ali je veoma mala u poređenju sa onom na engleskom. Predstavlja oko 20 odsto engleske verzije. Ako bismo hteli da prevedemo na španski tih 80 odsto, koštalo bi najmanje 50 miliona dolara -- i to za najiskorišćeniju zemlju koja postoji. Dakle, bilo bi mnogo skupo. I zato želimo da u to uključimo 100 miliona ljudi koji će prevesti internet na svaki veći jezik besplatno.
Ako je ovo ono što hoćete da uradite vrlo brzo shvatate da ćete naići na dve stvari koje će to otežati, dve velike prepreke. Prva je manjak ljudi koji govore dva jezika. Ni ne znam da li postoje 100 miliona ljudi koji koriste internet koji govore dva jezika dovoljno dobro da nam pomognu sa prevodima. To je veliki problem. Drugi problem je nedostatak motivacije. Kako ćemo motivisati ljude da zaista prevedu internet besplatno? Obično platite ljudima za to. Kako ćemo ih onda motivisati da to urade besplatno? Kada smo počeli da razmišljamo o svemu, ove dve stvari su nas kočile. Ali onda smo shvatili da postoji način i da postoji jedno rešenje za oba problema. Jednim udarcem ćemo ubiti dve muve. A to je da prevođenje pretvorimo u nešto što milioni ljudi hoće da rade i to nam takođe pomaže sa problemom manjka bilingvista a to je učenje jezika.
Ispostavilo se da danas imate preko 1,2 milijarde ljudi koji uče strani jezik. Ljudi zaista žele da nauče strane jezike. I to ne samo zato što ih u školama teraju da to rade. Na primer, samo u SAD postoji preko pet miliona ljudi koji su platili više od 500 dolara za softvere za učenje stranih jezika. Dakle ljudi zaista žele da nauče nove jezike. Tako smo u poslednjih godinu i po dana radili na novom sajtu zove se Duolingo -- gde je osnovna ideja da ljudi besplatno uče jezik dok istovremeno prevode internet. I zapravo oni uče dok prevode.
Način na koji ovo radi je da, dok ste tek početnik, dobijate veoma jednostavne rečenice. Naravno, na internetu ih ima mnogo. Damo vam veoma, veoma jednostavne rečenice zajedno sa značenjem svake reči. I dok ih prevodite i dok vidite kako ih drugi prevode, počinjete da učite jezik. Sa vašim napretkom dajemo vam sve kompleksnije rečenice na prevod. Ali sve vreme učite dok radite.
Luda stvar u vezi sa ovim metodom je da on zapravo funkcioniše. Prvo, ljudi zaista uče jezik. Projekat je gotovo završen i sada je u fazi testiranja. Ljudi tako zaista mogu naučiti jezik. I nauče ga jednako dobro kao uz pomoć vodećih programa za učenje jezika. Dakle, ljudi zaista nauče jezik. I ne samo da ga nauče, već je i mnogo interesantnije. Jer, uz Duolingo, ljudi uče koristeći realne sadržaje. Nasuprot učenju kroz izmišljene rečenice, uči se na stvarnim sadržajima, što je samo po sebi zanimljivije. Dakle ljudi zaista uče jezik.
Možda su još više iznenađuje da su prevodi koje smo dobili od ljudi koji koriste sajt, iako su početnici, bili tačni koliko i oni koje su radili profesionalni prevodioci, što je veoma iznenađujuće. Daću vam još jedan primer. Ovo je rečenica prevedena sa nemačkog na engleski. Gore je nemački. U sredini je engleski prevod koji je uradio profesionalni prevodilac, koga plaćamo 20 centi po reči. A dole je prevod urađen od strane korisnika Duolinga, od kojih nijedan nije znao ni malo nemačkog pre nego što su počeli da koriste sajt. Možete i sami videti, savršeno je. Naravno, ovde koristimo trik da bi prevodi bili dobri koliko i profesionalni. Kombinujemo prevode više početnika kako bismo dobili kvalitet jednog profesionalca.
Iako kombinujemo prevode sajt se prevodi prilično brzo. Pokazaću vam, naše procene koliko brzo možemo da prevedemo Vikipediju sa engleskog na španski. Zapamtite, to košta 50 miliona dolara. Dakle, ako bismo hteli da prevedemo Vikipediju na španski, mogli bismo to uraditi za pet nedelja sa 100.000 aktivnih korisnika. I mogli bismo to uraditi za 80 sati sa milion aktivnih korisnika. Budući da su svi projekti na kojima je moja grupa radila uspeli da uključe milione korisnika nadamo se da ćemo kroz ovaj projekat uspeti da prevodimo uspeti da prevodimo prilično brzo.
Sada, stvar oko koje sam najuzbuđeniji oko Duolinga je što mislim da obezbeđuje fer biznis model za učenje jezika. Evo o čemu se radi: trenutni model za učenje stranih jezika je takav da student plaća, i na primer, učenik plaća za Rozeta Stoun 500 dolara. (Smeh) To je postojeći model poslovanja. Problem sa tim je što 95 odsto svetske populacije nema 500 dolara. Tako da je potpuno nefer prema siromašnima. Totalno je usmereno na bogate. A u Duolingu dok učite zapravo stvarate vrednost, prevodite stvari -- za šta bismo mogli da nekog platimo. Ovo je način da to unovčimo. Budući da ljudi stvaraju vrednost dok uče oni ne moraju da plate svojim novcem, već plaćaju svojim vremenom. Ali magična stvar je da oni plaćaju svojim vremenom, a to je vreme koje bi bilo potrošeno svakako na učenje jezika. Dakle, dobra stvar kod Duolinga je da obezbeđuje fer biznis model -- koji ne diskriminiše siromašne.
Evo i sajta. Hvala. (Aplauz) Evo ga i sajt. Nije još pušten u rad, ali ako ga posetite možete sa upisati kako biste bili deo naše "private beta" koja će sigurno početi za tri ili četiri nedelje. Nismo još lansirali ovaj Duolingo.
Usput, ja ovde pričam, ali zapravo Duolingo je proizvod zaista fenomenalnog tima, a neki od njih su ovde. Hvala vam.
You can share this video by copying this HTML to your clipboard and pasting into your blog or web page. This video will play with subtitles.
You either have JavaScript turned off or have an old version of the Adobe Flash Player. To view this rating widget you
need to get the latest Flash player.
If your browser allows only "trusted sites" to execute Javascript, you should add the "googleapis.com" domain to your whitelist to allow our Flash detection to work properly.
Got an idea, question, or debate inspired by this talk? Start a TED Conversation.
Nakon što je CAPTCHA dobila drugu namenu, tako da svaki čovek koji ukuca ovaj kod pomogne digitalizaciju knjiga, Luis fon An se zapitao kako drugačije da iskoristi male doprinose populacije na internetu za neko opšte dobro. Na TEDxCMU je podelio sa nama novosti o svom ambicioznom projektu, Duolingu, koji će milionima ljudi pomoći da nauče novi jezik dok istovremeno, tačno i brzo prevode internet -- i to besplatno.
Luis von Ahn builds systems that combine humans and computers to solve large-scale problems that neither can solve alone. Full bio »
Translated into Serbian by Natasa Golosin
Reviewed by Ivana Korom
Comments? Please email the translators above.
18:18 Posted: May 2011
Views 687,059 | Comments 75
05:29 Posted: Aug 2011
Views 813,866 | Comments 168
13:07 Posted: Jun 2010
Views 579,266 | Comments 227
Just follow the guidelines outlined under our Creative Commons license.
This comment will be attributed to . Not ? Sign Out.