Mona Chalabi
1,867,745 views • 11:45

A statisztikáról tartok ma előadást. Ha máris gyanakvók, érthető, ettől még nem lesznek megszállott összeesküvés-keresők, csupán szkeptikusak. Ha számokról van szó, különösen manapság, nem árt, ha szkeptikusak. Jó, ha azt is meg tudják mondani, mely számok megbízhatók, és melyek nem. Ehhez próbálok ma segítséget adni önöknek. De mindenekelőtt szeretném tisztázni, milyen számokról beszélek. Nem olyan állításokról, hogy "10-ből 9 nő ajánlja ezt az öregedésgátló krémet". Azt hiszem, erre sokan csak összeráncoljuk a homlokunkat. Ma már azonban más statisztikákat is megkérdőjelezünk, pl: "Az USA-ban a munkanélküliségi ráta 5%." Ez az állítás abban különbözik, hogy nem magáncégtől származik, hanem a kormánytól.

10 amerikaiból 4 nem bízik a kormány által közölt gazdasági adatokban. Trump elnök támogatói között még rosszabb az arány: 10-ből 7. Mondanom sem kell, milyen sokféle megosztottság van jelen társadalmunkban, és nagy részük kezd érthetővé válni, ha megértjük az emberek viszonyát a kormányzati számokhoz. Egyfelől, vannak, akik szerint a statisztika fontos, szükség van rá, hogy értelmezzük a társadalom egészét a tudománytalan mendemondák helyett, és objektívan mérjük a fejlődést. Másfelől, vannak, akik szerint a statisztika elitista, sőt manipulált; értelmetlen és nem tükrözi az emberek mindennapi életét.

Úgy tűnik, jelenleg a második csoport érvelése áll nyerésre. Az alternatív tények világában élünk, ahol az emberek szerint a statisztika nem jelent közös alapot, kiinduló pontot a vitához. Ez probléma. Vannak olyan törekvések az USA-ban, amelyek megszüntetnének egyes kormányzati statisztikákat. A kongresszus előtti törvényjavaslat a faji egyenlőtlenség méréséről azt mondja: a kormánynak nem szabadna költenie szegregációs adatok gyűjtésére. Ez lesújtó. Ha nincsenek erre vonatkozó adataink, hogyan tudnánk a diszkriminációt tetten érni és főleg elkerülni? Más szavakkal: Hogyan tudna a kormány igazságos politikát kialakítani, ha nem tudja mérni az igazságtalanság szintjét? Nemcsak a diszkriminációról van szó, hanem mindenről! Hogy szabályozhatnánk az egészségügyet, a szegénységet, ha nincsenek jó adataink róluk? Hogyan tudnánk megvitatni a bevándorlást, ha nem tudunk megegyezni, hogy hányan jönnek be, vagy mennek el az országból? A statisztika az államtól ered, innen kapta nevét. Célja volt, hogy jobban mérje a népességet, és így azt jobban szolgálja. Szükségünk van a kormányzati számokra, de nem bölcs ezeket vakon elfogadni, vagy vakon elutasítani. Meg kell tanulnunk kiszúrni a rossz statisztikát.

Én akkor kezdtem szert tenni e képességre, amikor az ENSZ statisztikai részlegében dolgoztam. Az volt a munkánk, hogy feltárjuk, hány irakinak kellett elhagynia otthonát a háború miatt, és mire volt szükségük. Fontos munka volt, de hihetetlenül nehéz. Minden egyes nap a számok pontosságát befolyásoló döntéseket hoztunk: az ország melyik részébe menjünk, kikkel beszéljünk, milyen kérdéseket tegyünk fel. Kezdtem elveszíteni a kedvem, mert bár úgy gondoltuk, jó munkát végzünk, ezt egyedül az irakiak tudták volna igazolni, akiknek ritkán volt lehetőségük olvasni, netán felülvizsgálni az elemzést. Tudtam, hogy az egyetlen módja, hogy pontosítsuk számainkat, ha minél többen vizsgálják felül őket.

Úgyhogy adat-újságíró lettem. Felkutatom az adatokat, és megosztom őket a nyilvánossággal. Bárki megteheti ezt, nem kell hozzá profinak vagy ásznak lenni. Felejtsék el ezeket a szavakat; azok használják, akik okosnak tartják magukat, közben szerénykedni próbálnak. Tehát bárki érthet az adatokhoz.

Három kérdést ismertetek önökkel, amelyek segítenek kiszúrni a rossz statisztikát. Az első kérdés: Lát-e bizonytalanságot? Az emberek viszonyát a számokhoz, sőt bizalmukat a média iránt jelentősen megváltoztatta a közvélemény-kutatás. Sok vele a kivetnivalóm, mert úgy gondolom, az újságíróknak tényekről kell tudósítaniuk, s nem jóslásokba bocsátkozni róluk, különösen, ha ez rombolja a demokráciát, azt üzenve az embereknek, hogy ne is szavazzanak egy jelöltre, mert esélye sincs nyerni. De inkább beszéljünk a kutatás pontosságáról.

Az egyesült királyságbeli, az olasz, az izraeli és természetesen a legutóbbi amerikai elnökválasztás alapján a közvélemény-kutatások előrejelzése kb. olyan pontos, mintha a holdfázisból jósolnánk meg a kórházba kerültek számát. Komolyra fordítva, egy tanulmány adatai alapján jutottam erre a következtetésre. Számos oka van, hogy miért lett ilyen pontatlan a közvélemény-kutatás. Társadalmaink sokszínűvé váltak, emiatt a közvélemény-kutatók nehezen tudnak valóban reprezentatív mintához jutni. Az emberek nem szívesen fogadják a kutatók hívásait, és a megkérdezettek akár hazudhatnak is. De ez nem feltétlen derül ki a médiából. Egyrészt, Hillary Clinton győzelmének valószínűségét tizedesjegy pontossággal jelezték. A hőmérsékletet sem tudjuk megadni ilyen pontossággal. Hogyan tudnánk 230 millió szavazó magatartását ennyire pontosan előrejelezni? Másrészt, vannak ezek a szuper táblázatok. Sok adatmegjelenítés felerősíti a bizonyosságot, és ügyesen elfojtja kritikus gondolkodásunkat. Ha hallunk egy statisztikát, szkeptikusan fogadjuk. Amint táblázatban jelenik meg, valamiféle objektív tudománynak érezzük, pedig nem az.

Próbáltam ezt jobban elmagyarázni az embereknek, megmutatni, hogy a számok bizonytalanságot hordoznak. Fogtam néhány adathalmazt, és megjelenítettem kézzel rajzolt táblázatokba, hogy lássák az emberek, milyen pontatlanok az adatok; és lássák, hogy ezt egy ember készítette, ő találta és jelenítette meg az adatot. Pl. ahelyett, hogy ábrázolnánk minden hónapra az influenza gyakoriságának valószínűségét, az influenzaszezon körülbelüli eloszlását láthatják. Az ábra szerint –

(Nevetés)

februárban tetőzött. Ez megbízhatóbb adatmegjelenítés, mert ha valószínűségeket mutatnánk, lehet, hogy az emberek rosszul döntenének oltásuk időpontjáról.

Ezek a girbegurba vonalak emlékeztetnek a pontatlanságra, de arra is, hogy nem feltétlen egy konkrét számon, hanem a fontos tényeken van a hangsúly: Az igazságtalanság és az egyenlőtlenség nyomot hagy az életünkön. A fekete és őslakos amerikaiak várható élettartama rövidebb, mint más fajoké, és nem is fog változni mostanában. A foglyok olyan magánzárkákban tarthatók az Egyesült Államokban, amelyek kisebbek egy parkolóhelynél.

Az adatmegjelenítésnek az is célja, hogy felhívja a figyelmet néhány fontos statisztikai fogalomra, pl. az átlagra. Tegyük fel, ezt hallják: "Az USA-ban az átlagos uszoda medencéjébe 6,23 esetben kerül ürülék." Ez nem azt jelenti, hogy az ország minden egyes uszodája 6,23 ürüléket tartalmaz. Hogy ezt bemutassam, felkutattam az eredeti adatokat, amelyek a CDC-től származnak, amely 47 uszodát vizsgált. Egy estét rászántam, és helyretettem a "bogyókat". Láthatják, hogy az átlag mennyire félrevezető lehet.

(Nevetés)

Nézzük a második kérdést, amit fel kell tenniük, hogy kiszúrják a rossz számokat: Látom-e magamat az adatokban? Ez is tulajdonképpen az átlaggal kapcsolatos, mert az emberek részben azért csalódtak a nemzeti statisztikákban, mert nem adnak választ arra, hogy ki nyer és ki veszít a nemzet politikájával. Érthető, hogy az embereket bosszantják a világátlagok, ha teljesen más a személyes tapasztalatuk. Meg akartam mutatni, hogy az adat miként része az életünknek. "Dear Mona" néven tanácsadó rovatot indítottam, az emberek megírhatták kérdéseiket, aggodalmaikat, én pedig adatokkal válaszoltam. Mindenfélét kérdeztek, pl. "Normális-e, hogy nem egy ágyban alszom a feleségemmel?" "Megbánják-e, akik tetováltatnak?" "Mit jelent, hogy természetes okokból hal meg?"

Nagyszerű kérdések, mert arra ösztönöznek, hogy fölleljem és közzétegyem az adatokat. Ha azt kérdezi valaki, "Mennyi pisi számít soknak?" mert ezt is kérdezték, fontos úgy megjeleníteni az adatokat, hogy minél többen értsék. Ezek a számok nem elérhetetlenek. Csak néha megbújnak egy tanulmány függelékében. Persze nem ellenőrizhetetlenek; ha szeretnének utánanézni a vizeletmennyiség számainak, fogjanak egy üvegcsét és próbálják meg.

(Nevetés)

Nem feltétlen lényeges, hogy minden adat kapcsolódjon a személyünkhöz. Engem érdekel, hány nőt bírságoltak meg Franciaországban arcfátyol vagy csador viselése miatt, pedig nem ott élek, és nem hordok fátylat. A tágabb kontextus miatt érdemes vizsgálni a kapcsolódásunkat. Sok mindenre ráláthatunk kiindulva egy adatból, pl. hogy a munkanélküliségi ráta 5%, láthatjuk ennek időbeli változását, vagy képzettség szerinti változását – ezért hallottuk folyton a szüleinktől, hogy tovább kell tanulni –, vagy nemek szerinti alakulását. Ma a férfiak körében magasabb a munkanélküliség, mint a nőknél. A 80-as évek elejéig fordítva volt. Ez az egyik legjelentősebb változás az amerikai társadalom életében, és mindez ott van a táblázatban, ha nemcsak az átlagszámokat nézzük. A tengelyek meghatározóak: ha változtatjuk a beosztást, változni fog a kép.

A harmadik és utolsó kérdés, amin el kell gondolniuk, ha szemügyre vesznek egy statisztikát: Hogyan gyűjtötték az adatokat? Eddig csak arról beszéltem, hogyan tesszük közzé, de az is fontos, hogyan gyűjtjük az adatokat. Tudom, bonyolult, mert ennek módszertana átláthatatlan és unalmas is lehet, de van néhány egyszerű lépés, amivel ellenőrizhetjük.

Egy utolsó példát hozok fel. Egy felmérés szerint a muszlimok 41%-a támogatja a dzsihádot ebben az országban, ami kétségkívül elég ijesztő, ezt 2015-ben mindenütt közzétették. Ha ellenőrizni akarok egy ilyen számot, először is megkeresem az eredeti kérdőívet. Kiderült, hogy az újságíró, aki tudósított a felmérésről, nem vett figyelembe egy kérdést a lap alján, miszerint hogyan definiálja a válaszadó a dzsihádot. Legtöbbjük definiálása szerint: "A muszlimok személyes, békés küzdelme hitük megerősítéséért." 16%-uk határozta meg úgy, hogy "erőszakos szent háború a hitetlenek ellen." Ez nagyon fontos szempont: a számok alapján teljességgel lehetséges, hogy azok közül, akik erőszakos szent háborúnak definiálták, senki sem támogatta. Lehet, hogy a két csoport nem fedi egymást.

Azt is érdemes megkérdezni, hogyan végezték a felmérést. Ez szabad részvételen alapult, tehát bárki megtalálhatta és kitölthette az interneten. Nem tudhatjuk, hogy muszlimok voltak-e. Végül pedig, 600 válaszadó vett részt a felmérésben. Nagyjából 3 millió muszlim él ebben az országban, a Pew Research Center szerint. Vagyis a felmérés az ország minden ötezredik muszlim lakosát vonta be.

Sok esetben részben ezért jobbak a kormányzati, mint a magánstatisztikák. Egy felmérés néhány száz vagy ezer embert kérdez meg, vagy egy L'Oreal értékesítő 2005-ben 48 nőt kérdezett meg, és megállapította: a termékek beváltak.

(Nevetés)

A magáncégeknek nincs erős érdekeltségük, hogy a számok jók legyenek, nekik csak a jó számok kellenek. A kormányzati statisztikusok nem ilyenek. Elméletben legalábbis teljesen pártatlanok, többek között, mert a munkájukban nem számít, ki van hatalomban. Köztisztviselők. És jól végzik a munkájukat, nem csak néhány száz emberrel beszélnek. A munkanélküliségi számok, amiket idéztem, a Bureau of Labor Statistics adatai, és becsléseikhez több mint 140 000 vállalattal beszéltek.

Értem, hogy ez lehangoló. Ha ellenőrizni akarnak egy magáncégtől származó statisztikát, vehetnek maguknak és barátaiknak az arckrémből és kipróbálhatják. Ha nem válik be, mondhatják, hogy a számok nem igazak. Hogyan vonható kétségbe a kormányzati statisztika? Mindent ellenőrizzenek! Tudják meg, hogyan gyűjtötték az adatokat. Minden benne van-e a táblázatban, aminek ott kell lennie? De ne mondjanak le a számokról, mert ha így tesznek, a sötétben tapogatózva kell döntéseket hoznunk, s csak magánérdekek fognak vezetni minket.

Köszönöm.

(Taps)