Koliko vas je moralo ispuniti neku vrstu mrežnog obrasca gdje su vas tražili da čitate iskrivljeni niz znakova poput ovog? Koliko vas smatra ovo stvarno, stvarno dosadnim? U redu, izvanredno. Ja sam to izmislio. (Smijeh) Ili sam bio jedan od ljudi koji su to napravili.
Ta se stvar zove Captcha. I razlog zbog kojeg je tu jest da ste vi, entitet koji ispunjava obrazac, doista čovjek, a ne neka vrsta kompjuterskog programa napisana da podnosi obrazac milijune i milijune puta. Ona djeluje zato što ljudi, barem oni koji nemaju oštećen vid, nemaju problema s čitanjem tih iskrivljenih vijugavih znakova, dok to kompjutorski programi jednostavno još ne mogu tako dobro. Npr., u slučaju Ticketmastera, razlog zbog kojeg morate tipkati te iskrivljene znakove jest da se spriječe preprodavači da napišu program koji može kupiti milijune ulaznica, dvije odjednom.
Captche se koriste na cijelom Internetu. I budući da se koriste tako često, puno puta precizan niz nasumičnih znakova koje vidi korisnik nije tako sretan. Ovo je primjer Yahooove stranice za registraciju. Nasumični znakovi koji se pokazuju korisniku bili su W, A, I, T, koji, naravno, sriču riječ (čekaj). No najbolji dio je poruka koju je Yahooov odjel za pomoć dobio oko 20 minuta kasnije. Tekst: "Upomoć! Čekam već 20 minuta, i ništa se ne događa." (Smijeh) Ovaj je čovjek mislio da mora čekati. Ovo, naravno, nije tako loše kao ovaj jadnik.
Projekt Captcha je nešto što smo napravili ovdje na sveučilištu Carnegie Mellon prije 10 godina, i otada se koristi posvuda. Sad ću govoriti o projektu koji smo napravili prije nekoliko godina, nešto nalik sljedećoj evoluciji Captche. Ovo je projekt koji nazivamo reCaptcha, što je nešto što smo započeli ovdje na Carnegie Mellonu, zatim smo to pretvorili u malu tvrtku. I nakon godine i pol, Google je zapravo kupio ovu tvrtku.
Reći ću vam što je pokrenuo ovaj projekt. Dakle, ovaj projekt je krenuo od sljedeće realizacije: Ispada da otprilike 200 milijuna Captcha tipkaju ljudi svaki dan diljem svijeta. Kad sam prvi put čuo za to, bio sam poprilično ponosan na sebe. Mislio sam, pogledaj na utjecaj koje je imalo moje istraživanje. Ali zatim sam se počeo osjećati loše. Evo o čemu se radi, svaki put kad tipkate Captchu, u biti gubite 10 sekundi svog vremena. I ako to umnožite s 200 milijuna, dobivate da čovječanstvo u cijelom gubi oko 500.000 sati svaki dan tipkajući te dosadne Captche. I tad sam se počeo osjećati loše.
I tad sam počeo razmišljati, pa, naravno, ne možemo se samo riješiti Captchi, zato što sigurnost Mreže na neki način ovisi o njima. Ali zatim sam počeo razmišljati, postoji li bilo koji način na koji možemo upotrijebiti ovaj trud za nešto što je dobro za čovječanstvo? Gledajte, evo o čemu se radi. Dok tipkate Captchu, tijekom tih 10 sekundi, vaš mozak radi nešto nevjerojatno. Vaš mozak radi nešto što kompjuteri još ne mogu. Pa, možete li napraviti koristan posao za tih 10 sekundi? Drugim riječima, postoji li neki grdan problem koji kompjuteri još ne mogu riješiti, ali možemo podijeliti na sićušne dijelove od 10 sekundi tako da svaki put kad netko rješava Captchu riješi i mali dio ovog problema? I odgovor na to je "da", i to upravo radimo.
Ono što možda ne znate je da danas, dok tipkate Captchu, ne samo da se identificirate kao čovjek, nego nam također zapravo pomažete digitalizirati knjige. Objasnit ću vam kako to funkcionira. Postoji puno projekata koji pokušavaju digitalizirati knjige. Google ima jedan. Internetski arhiv ima jedan. Amazon, sad s Kindleom, pokušava digitalizirati knjige. U osnovi to funkcionira na način da započinjete sa starom knjigom. Vidjeli ste te stvari, točno? Poput knjige? (Smijeh) Započinjete s knjigom, zatim ju skenirate.
Sad, skeniranje knjige je kao da snimate digitalnu fotografiju svake stranice knjige. Daje vam sliku za svaku stranicu knjige. Ovo je slika s tekstom za svaku stranicu knjige. Slijedeći je korak u postupku taj da kompjuter mora biti kadar dešifrirati sve riječi u toj slici. Koristeći tehnologiju OCR, optičko prepoznavanje znakova, koja snima sliku teksta i pokušava odgonetnuti koji je tekst unutra. Sad, OCR nije savršen. Posebno za starije knjige gdje je tinta izblijedjela i stranice su požutjele, OCR ne može prepoznati puno riječi. Npr., stvari koje su bile napisane prije više od 50 godina, kompjuter ne može prepoznati oko 30 posto riječi. Ono što sad radimo jest uzimanje svih riječi koje kompjuter ne može prepoznati i davanje ljudima da ih čitaju za nas dok tipkaju Captchu na Internetu.
Sljedeći put kad tipkate Captchu, te riječi koje tipkate su zapravo riječi koje dolaze iz knjiga koje se digitaliziraju koje kompjuter nije mogao prepoznati. I sad, razlog zbog kojeg danas imamo dvije riječi umjesto jedne jest taj što je, vidite, jedna od riječi riječ koju je sustav tek dobio iz knjige, nije znao što je, i namjerava je prikazati vama. Ali kako ne zna odgovor na nju, ne može ju ocijeniti za vas. Dakle, dajemo vam drugu riječ, za koju sustav zna odgovor. Ne govorimo vam koja je koja, i kažemo da utipkate obje. I ako utipkate pravilnu riječ za onu koju sustav već zna odgovor, pretpostavlja da ste čovjek, i također dobiva neku sigurnost da ste utipkali drugu riječ pravilno. I ako ponovimo taj proces s 10 različitih ljudi i svi se slože oko toga što je nova riječ, tad mi dobivamo još jednu riječ točno digitaliziranu.
Evo kako sustav funkcionira. I u osnovi, otkad smo ga objavili prije tri ili četiri godine, puno se mrežnih mjesta počelo prebacivati sa stare Captche gdje su ljudi gubili vrijeme na novu Captchu gdje ljudi pomažu digitalizirati knjige. Npr., Ticketmaster. Svaki put kad kupite ulaznicu na Ticketmasteru, pomažete digitalizirati knjigu. Facebook: Svaki put kad dodate prijatelja ili bocnete nekog, pomažete digitalizirati knjigu. Twitter i oko 350.000 drugih mjesta koriste reCaptchu. I u stvari, broj mjesta koji koriste reCaptchu je tako visok da je broj riječi koje digitaliziramo na dan, stvarno, stvarno velik. To je oko 100 milijuna na dan, što je ekvivalent oko dva i pol milijuna knjiga godišnje. I sve rade s jednom po jednom riječju samo ljudi koji tipkaju Captchu na Internetu.
Naravno, budući da obrađujemo toliko riječi na dan, mogu se dogoditi smiješne stvari. I to je posebno istinito zato što sada dajemo ljudima dvije nasumično izabrane engleske riječi jednu pokraj druge. Pa se mogu dogoditi smiješne stvari. Npr., prikazali smo ovu riječ. To je riječ "Christians" (kršćani); sve je u redu s njom. Ali ako ju prikažete zajedno s drugom nasumično odabranom riječi, loše se stvari mogu dogoditi. Pa dobivamo ovo. (Tekst: loši kršćani) Ali još je gore, zato što se određena mrežna mjesta gdje smo ovo pokazali zapravo nazivaju Poslanstvo Kraljevstva Božjeg. (Smijeh) Joj. (Smijeh) Evo još jednog stvarno lošeg. JohnEdwards.com (Tekst: Damn liberal - prokleti liberal) (Smijeh) Nastavljamo vrijeđati ljude na sve strane svaki dan.
Naravno, ne vrijeđamo samo ljude. Evo o čemu se radi, budući da prikazujemo dvije nasumično izabrane riječi, zanimljive se stvari mogu dogoditi. Ovo je zapravo dovelo do stvarno velikog internetskog fenomena u kojem su sudjelovali deseci tisuća ljudi, koji se naziva umjetnost Captcha. Siguran sam da su neki od vas čuli za to. Evo kako funkcionira. Zamislite da ste na Internetu i vidite Captchu za koju mislite da je pomalo neobična, kao ova Captcha. (Tekst: nevidljivi toster) Ono što bi trebali učiniti jest snimiti sadržaj ekrana. Zatim, naravno, ispunite Captchu zato što nam pomažete digitalizirati knjige. Ali zatim, prvo snimite sadržaj ekrana, i zatim nacrtate nešto što ima veze s tim. (Smijeh) Tako to funkcionira. Postoje deseci tisuća takvih. Neke od njih su stvarno ljupke. (Tekst: stisnuti ga) (Smijeh) Neke od njih su smiješnije. (Tekst: napušeni osnivači) (Smijeh) A neki od njih, kao "paleontološki shvisle", imaju Snoop Dogga.
U redu, ovo je moj najdraži broj reCaptche. Ovo je najdraža stvar koju volim u cijelom ovom projektu. Ovo je broj određenih ljudi koji su nam pomogli digitalizirati najmanje jednu riječ iz knjige putem reCaptche. 750 milijuna, što je malo preko 10 posto svjetske populacije, pomoglo nam je digitalizirati ljudsko znanje. Upravo brojevi poput ovih motiviraju moju istraživačku agendu. Dakle, pitanje koje motivira moje istraživanje glasi: ako pogledate velika ljudska dostignuća, te doista velike stvari koje je čovječanstvo steklo zajedno i učinilo povijesno -- kao npr., gradnja egipatskih piramida ili Panamskog kanala ili slanje čovjeka na Mjesec -- zanimljiva je činjenica da su sve napravljene s otprilike istim brojem ljudi. Čudno je; sve su napravljene s oko 100.000 ljudi. I razlog je tomu taj što je, prije Interneta, koordinacija više od 100.000 ljudi, a da i ne spominjem njihovo plaćanje, bilo u osnovi nemoguće. Ali sad s Internetom, upravo sam vam pokazao projekt gdje nam je 750 milijuna ljudi pomoglo digitalizirati ljudsko znanje. Pa pitanje koje motivira moje istraživanje glasi, ako možemo poslati čovjeka na Mjesec sa 100.000, što možemo učiniti sa 100 milijuna?
Na temelju ovog pitanja, imamo puno različitih projekata na kojima radimo. Reći ću vam nešto o jednom zbog kojeg sam najviše uzbuđen. To je nešto na čemu smo napola tiho radili zadnju godinu i pol. Još nije pokrenut. Naziva se Duolingo. Budući da još nije pokrenut, pssst! (Smijeh) Da, vjerujem vam da ćete to učiniti. Ovo je projekt. Evo kako je počeo. Počeo je s pitanjem koje sam postavio svojem diplomiranom studentu, Severinu Hackeru. Ok, ovo je Severin Hacker. Dakle, postavio sam pitanje svojem studentu. Uzgred budi rečeno, dobro ste me čuli; njegovo je prezime Hacker. Postavio sam mu pitanje: Kako pridobiti 100 milijuna ljudi da prevode Mrežu na sve veće jezike besplatno?
Ok, ima puno stvari koje se mogu reći o ovom pitanju. Prvo, prevoditi Mrežu. Trenutno je Mreža podijeljena na brojne jezike. Velik dio je na engleskom. Ako imalo ne znaš engleski, ne možeš joj pristupiti. Ali postoje veliki dijelovi na drugim jezicima, i ako ne znaš te jezike, ne možeš joj pristupiti. Želio bih prevesti svu Mrežu, ili barem većinu Mreže, na svaki veći jezik. Dakle, to bih želio napraviti.
Sad, neki od vas bi mogli reći, zašto ne možemo upotrijebiti kompjutore da prevode? Zašto ne možemo upotrijebiti automatski prijevod? Automatski prijevod danas počinje prevoditi tu i tamo neke rečenice. Zašto ga ne možemo upotrijebiti da prevedemo cijelu Mrežu? Pa, problem je u tome da još uvijek nije dovoljno dobar i najvjerojatnije neće biti 15 do 20 godina. Radi puno grešaka. Čak i kad ne griješi, budući da radi tako puno grešaka, ne znate da li da mu vjerujete ili ne.
Pokazat ću vam jedan primjer nečega što je bilo prevedeno sa strojem. Zapravo je to bio post na forumu. Netko je pokušavao postaviti pitanje o JavaScriptu. Preveden je s japanskog na engleski. Pustit ću vas da pročitate. Ova osoba počinje se ispričavati zbog činjenice da je prevedeno kompjuterom. Pa će sljedeća rečenica biti uvod u pitanje. On samo objašnjava nešto. Zapamtite, ovo je pitanje o JavaScriptu. (Tekst: Na često, jarac-vrijeme instalira greška je izbljuvak.) (Smijeh) Zatim dolazi prvi dio pitanja. (Tekst: Koliko puta kao vjetar, štap, i zmaj?) (Smijeh) Zatim dolazi moj omiljeni dio pitanja. (Tekst: Ovo uvreda očevom kamenju?) (Smijeh) Zatim dolazi kraj, moj najdraži dio cijele stvari. (Tekst: Molim ispričati se za vašu glupost. Ima mnogo hvala vam.) (Smijeh) Ok, kompjuterski prijevod, još nije dovoljno dobar. Nazad k pitanju.
Trebamo ljude da prevode cijelu Mrežu. Dakle, sljedeće pitanje koje bi mogli imati glasi, pa zašto ne možemo samo platiti ljudima da to učine? Možemo platiti profesionalnim prevoditeljima da prevedu cijelu Mrežu. Mogli bi to učiniti. Na žalost, bilo bi ekstremno skupo. Npr., prijevod malenog, malenog dijela cijele Mreže, Wikipedie, na jedan drugi jezik, španjolski. Wikipedia postoji na španjolskom, ali je jako mala u usporedbi s veličinom na engleskom. Iznosi oko 20 posto veličine na engleskom. Da smo željeli prevesti ostalih 80 posto na španjolski, koštalo bi nas najmanje 50 milijuna dolara -- i to kod najiskorištenije, najiznajmljivačke zemlje koja postoji. Bilo bi vrlo skupo. Dakle, ono što želimo jest pridobiti 100 milijuna ljudi da prevode Mrežu na svaki veći jezik besplatno.
Ako je ovo to što želite učiniti, vrlo brzo ćete shvatiti da ćete naletjeti na dvije prilično velike prepreke, dvije velike poteškoće. Prva je nedostatak bilingvista. Pa čak ni ne znam postoji li 100 milijuna ljudi koji koriste Mrežu koji su dovoljno bilingvalni da nam pomognu prevoditi. To je velik problem. Drugi problem na koji ćete naići jest nedostatak motivacije. Kako ćemo motivirati ljude da ustvari prevode Mrežu besplatno? Inače moraš platiti ljudima da to naprave. Kako ćemo ih motivirati da to naprave besplatno? Kad smo započinjali razmišljati o tome, zaustavile su nas ove dvije stvari. Ali tad smo shvatili da ustvari postoji način da riješimo oba problema istom solucijom. Postoji način da se ubiju dvije muhe jednim udarcem. A to je da se transformira prevođenje na nešto što milijuni ljudi žele učiniti, što također pomaže kod problema s nedostatkom bilingvista, a to je učenje jezika.
Ispada da danas, postoji preko 1,2 milijarde ljudi koji uče strani jezik. Ljudi doista, doista žele učiti strani jezik. I to nije samo zato što ih se tjera na to u školi. Npr., samo u Sjedinjenim Državama, ima preko pet milijuna ljudi koji su platili više od 500 dolara za softver za učenje novog jezika. Pa ljudi doista, doista žele naučiti novi jezik. Dakle, ono na čemu smo radili zadnju godinu i pol je novo mrežno mjesto -- Duolingo -- gdje je osnovna ideja da ljudi uče novi jezik besplatno dok istovremeno prevode Mrežu. I u osnovi uče dok prevode.
Način na koji ovo funkcionira jest da kad god ste samo početnik, dajemo vam vrlo, vrlo jednostavne rečenice. Postoji, naravno, puno vrlo jednostavnih rečenica na Mreži. Dajemo vam vrlo, vrlo jednostavne rečenice zajedno s onim što svaka riječ znači. I kako ih prevodite, i dok gledate kako ih drugi ljudi prevode, počinjete učiti jezik. I kako postajete sve više napredni, dajemo vam sve složenije rečenice na prijevod. Ali cijelo vrijeme, učite dok prevodite.
Sad, luda stvar u svezi s ovom metodom jest da ona doista funkcionira. Prvo, ljudi doista, doista uče jezik. Uglavnom smo završili s izradom, sada ga testiramo. Ljudi doista mogu naučiti jezik s njim. I uče ga gotovo jednako dobro kao s vodećim softverom za učenje jezika. Pa ljudi doista nauče jezik. I ne samo da ga nauče jednako dobro, zapravo je puno zanimljivije. Zato što s Duolingom ljudi zapravo uče sa stvarnim sadržajem. U suprotnosti s učenjem s izmišljenim rečenicama, ljudi uče sa stvarnim sadržajem koji je po sebi zanimljiv. Pa ljudi stvarno uče jezik.
Ali možda što je još veće iznenađenje, prijevodi koje dobivamo od ljudi koji koriste mjesto, iako su samo početnici, prijevodi koje dobivamo su jednako točni kao oni profesionalnih prevoditelja, što vrlo iznenađuje. Pokazat će vam jedan primjer. Ovo je rečenica prevedena s njemačkog na engleski. Na vrhu je njemački. U sredini je prijevod na engleski profesionalnog prevoditelja engleskog jezika kojeg smo platili 20 centi za riječ za ovaj prijevod. Na dnu je prijevod korisnika Duolinga, od kojih ni jedan nije znao njemački prije nego što su počeli koristiti mjesto. Možete vidjeti da je prilično savršen. Naravno, izveli smo trik da napravimo prijevode jednako dobrima kao one profesionalnih prevoditelja. Kombinirali smo prijevode više početnika da dobijemo kvalitetu jednog profesionalnog prevoditelja.
Iako kombiniramo prijevode, mjesto zapravo može prevoditi prilično brzo. Pokazat ću vam koje su naše procjene koliko brzo možemo prevesti Wikipediu s engleskog na španjolski. Zapamtite, to je vrijednost od 50 milijuna dolara. Da smo htjeli prevesti Wikipediu na španjolski, napravili bismo to u pet tjedana sa 100.000 aktivnih korisnika. I mogli smo to napraviti za otprilike 80 sati s milijun aktivnih korisnika. Budući da su svi projekti na kojima je radila moja grupa dosad pridobili milijune korisnika, nadamo se da ćemo biti u mogućnosti prevoditi ekstremno brzo s ovim projektom.
Ono što me najviše uzbuđuju kod Duolinga jest to da omogućuje pošteni poslovni model za učenje jezika. Evo o čemu se radi: Sadašnji poslovni model za učenje jezika sastoji se u tome da učenik plaća, i posebno, učenik plaća Rosetti Stone 500 dolara. (Smijeh) To je sadašnji poslovni model. Problem je s tim poslovnim modelom u tome da 95 posto svjetske populacije nema 500 dolara. To je krajnje nepošteno prema siromašnima. Ovo je u potpunosti podređeno bogatima. Sad, u Duolingu, zato što, dok učite vi zapravo stvarate vrijednost, prevodite stvari -- za koje bi npr.mogli platiti nekoga za prijevod. Ovo je način na koji bi to mogli unovčiti. Budući da ljudi stvaraju vrijednost dok uče, ne moraju plaćati novcem, oni plaćaju svojim vremenom. Magična je stvar u tome da plaćaju svojim vremenom, ali to je vrijeme koje bi ionako potrošili učeći jezik. Dakle, lijepa stvar u svezi s Duolingom je u tom što, mislim, omogućuje pošten poslovni model -- onaj koji ne diskriminira siromašne ljude.
Ovo je stranica. Hvala vam. (Pljesak) Ovo je stranica. Još nije pokrenuto, ali ako odete tamo, možete se upisati da budete dio naše probne verzije, koja će najvjerojatnije početi za tri do četiri tjedna. Još uvijek nismo pokrenuli Duolingo.
Uzgred budi rečeno, ja sam taj koji govori, ali zapravo Duolingo je rad stvarno fenomenalnog tima, od kojeg su neki ovdje. Hvala vam.
You can share this video by copying this HTML to your clipboard and pasting into your blog or web page. This video will play with subtitles.
You either have JavaScript turned off or have an old version of the Adobe Flash Player. To view this rating widget you
need to get the latest Flash player.
If your browser allows only "trusted sites" to execute Javascript, you should add the "googleapis.com" domain to your whitelist to allow our Flash detection to work properly.
Got an idea, question, or debate inspired by this talk? Start a TED Conversation.
Nakon što je prenamijenio Captchu na način da svaki odgovor koji utipka čovjek pomogne digitalizirati knjige, Luis von Ahn se pitao kako još upotrijebiti male doprinose mnogih na Internetu za veće dobro. Na TEDxCMU-u govori kako će njegov ambiciozni novi projekt, Duolingo, pomoći milijunima da nauče novi jezik dok prevode Mrežu brzo i točno -- i to besplatno.
Luis von Ahn builds systems that combine humans and computers to solve large-scale problems that neither can solve alone. Full bio »
Translated into Croatian by Silvija P.
Reviewed by Tilen Pigac - EFZG
Comments? Please email the translators above.
18:18 Posted: May 2011
Views 683,816 | Comments 75
05:29 Posted: Aug 2011
Views 789,584 | Comments 168
13:07 Posted: Jun 2010
Views 575,409 | Comments 227
Just follow the guidelines outlined under our Creative Commons license.
This comment will be attributed to . Not ? Sign Out.