miercuri, 30 mai 2012

Pixel cu pixel se face dreptate

Multă lume nu înțelege cum e cu sondajele astea. E complicate sondajele, dom'le, e aproximative, sondajele manipulează, e proaste, e rele.

Numai lucruri nașpa despre sondaje. Mai ales că toată lumea, în bun tipic balcanic, se pricepe la sondaje, cum de altminteri se pricepe și la folbal, la politică și mai ales și mai ales la găsirea punctului G.

Problema principală e aia cu eșantionarea. Cum naiba vă iese voo din 1000 de cazuri adevărul adevărat? De ce și într-un oraș de 30 mii de oameni, dar și într-o țară de 20 de milioane sau de 1 miliard tot aceeași putere are?

Voi faceți niște șmecherii, nu se poate. Un eșantion de 300 de cazuri nu-i reprezentativ, nu-i așa? Lumea încurcă reprezentativitatea și exactitatea, e tot o eroare în capul lor, marja de eroare e de fapt de oroare, the horror, the horror, cum pe bună dreptate exclama nemernicul de colonel în ultimele minute ale filmului, în încercarea sa disperată de a bate recordul mondial și pangalactic la nemernicie.

Păi ca să înțelegeți cum devine chestiunea cu eșantionarea să recurgem la ce avem noi mai bun în materie de analogii: la analogia vizuală. Primate fiind și bazîndu-ne covîrșitor pe vederea stereoscopică, cînd ni se explică ceva cu ochii înțelegem foarte bine.

Păi să belim ochii atunci la următoarea poză:



Ce vedem noi aici? Noi aici vedem un cîmp de albăstrele, culoarea chiloților lui Dumnezeu, o insuportabilă adîncime a spațiului, o insuportabilă ușurătate a firii.

Noi aici vedem o poză simplă. O poză făcută cerului senin.

Să ne închipuim, cum de altfel e și cazul, că poza e compusă din mulți pixeli. Punctulețe mici mici de informație cromatică elementară care puse unul lîngă altul fac imaginea.

Să zicem că poza e de 1000 x 2000, adică de 2 milioane de pixeli. Aprox. 2 megapixeli, o rezoluție rezonabil de mare, nici prea-prea, nici foarte-foarte.

Acum să zicem că n-avem bani pentru atîția pixeli și că încercăm să aproximăm, să ghicim ce este în poza asta bazîndu-ne pe mai puțină informație. Doar pe cîțiva pixeli, luați la întîmplare. Vrem să fim lugumitori și parcimonioși și eficienți și să spunem ceva suficient de exact despre poză folosind cel mai mic număr de pixeli posibili.

Să zicem că cumpărăm poza la kil, la numărul de pixeli, că fiecare pixel costă și că n-avem bani să cumpărăm toți pixelii ăia 2 milioane, că e prea scump pentru buzunarul nostru. De cîți pixeli e nevoie să cumpărăm pentru a ne face o idee suficient de bună despre toată poza și, cu ocazia asta, să economisim și niște bănuți?

Răspunsul e simplu: de un singur pixel. E suficient să luăm oricare pixel din matricea asta de 1000 x 2000 de pixeli, să ne uităm doar la el, fără să știm cum sînt ceilalți, pentru a spune: poza mare este una cu mult albastru, fără nici un pic de vălurea pe ea, deci e vorba despre cerul senin.

Gata. Am făcut sondajul. Am luat eșantionul – reprezentativ, că am luat orice pixel la întîmplare – un eșantion cocoșător de mic, de doar o unitate, și pe baza lui am fost în stare să spunem suficient de multe despre întreaga poză, economisind o grămadă de bani și de efort.

De ce?

Pentru că poza e simplă. E uniformă. Nu are variație. E toată otova, du colo colo la fel, nediferențiată. În termeni statistici, e o populație de doo milioane de pixeli care nu prezintă variație. În consecință, orice pixel aș lua, pot estima pe baza lui suficient de bine despre ce e vorba în tabloul cel mare.

Din păcate, în general lucrurile în viață nu sînt atît de simple, decît doar în mintea celor care se pricep la toate, la femei, la politică, la folbal, la sondaje, dar mai ales și mai ales la găsirea punctului G cu ochii închiși.

În general, în viață lucrurile e complexe și necesită ecsplicații, cum ecspresiv se escprima Leana lu’ Costel din Vacanța Mare, între timp devenită mare politician și catindat la Sectorul 5 și care habar n-are de prețurile unui sondaj, considerînd că cu 1000 de euro afli tot, ba îți mai rămîne mărunțiș și de o șaorma (da, da: m-am văzut cu el, vroia sondaj; e varză la cap, credea că sondajele se fac pe gratis).

Păi dacă lucrurile e complecse, înseamnă că nu ne mai vine la fel de ușor să aproximăm pe baza doar a cîtorva puncte intermediare. Trebuie să luăm mai multe. Mult mai multe.

Uitați-vă la poza asta. Ce reprezintă?




E o poză făcută prin sondaj. Am luat cîțiva pixeli, unul de prin colțul din stînga sus, altul de prin mijloc, altul de pe mai jos, și am extrapolat. Am fost zgîrcit, n-am avut suficienți bani să fac un sondaj pe 1000 de pixeli, m-am calicit la bani și am făcut doar pe vreo 10-20 de pixeli. Iar acum vreau să trag concluzii. Despre ce e vorba în poza noastră?

Despre cîrcăleală și despre zgîrcenie și despre lipsă de resurse. Despre un eșantion prea mic în condiții de complexitate reală. Poza ne spunem că sîntem zgîrie brînză și că mai trebuie să mai punem un pic umărul la treabă, că n-am cules suficientă informație.

Păi să mai punem. Ia să mai punem o găleată de pixeli, să vedem, e de ajuns?




Nu, nu e de ajuns. Am extrapolat pe baza a vreo 50 de pixeli și tot ceață la mal ne dă. Mai baga cărbuni, dom' sondor! Bagă, bagă, nu te zgîrci!






Hai să vedem și poza pe bune. Despre ce e vorba?




Waw! Ce poză mișto! Cum de nu ne-a trecut prin cap că despre asta este de fapt vorba?

La fel și la sondaje. Cu cît iei din ce în ce mai mulți pixeli (subiecți în eșantion), cu atît încet-încet începi să vezi suficient de bine despre ce este de fapt vorba. Pînă la un anumit număr de pixeli, pînă la un anumit volum de eșantion, nu prea vezi nimic, doar o mare ceață la mal și o mare îmbîcseală.

Pe urmă, din fericire de manieră non-liniară, de pe la cîteva sute de pixeli dintr-o dată începe să se vază. Pînă cînd spre 700 – 800 – 900 – 1000 de pixeli începe să se vază de manieră suficient de bună. E un bun compromis resurse folosite – exactitate obținută. Nici prea-prea, nici foarte-foarte. Nici farmacie, așa cum își doresc clienții cei prea mofturoși, dar nici ghicitorologie.




După aceea, oricît de mulți pixeli ai mai lua, consumi resurse degeaba, dacă pur și simplu vrei doar să te uiți la poza cea mare. Tot mai adaugi pixeli, consumi bani și resurse, fără să mai aduci mare plus de informație în poză.

Dacă vrei să faci zoom pe o anumită parte a pozei, asta este cu totul altceva. Să te concentrezi pe danteluța acestui funduleț sau să analizezi în profunzime rictusul de satisfacție al masculului din fundal. Dar altminteri, dacă vrei doar poza mare, e suficient să iei în jur de 800 – 1000 de pixeli. Începe să se vadă.

Dacă poza ar fi fost și mai complexă, să nu conțină structuri și continuități și forme bine definite, în cadrul cărora să avem o oarecare omogenitate, nici 1000 de pixeli nu ar fi fost îndeajuns.

Gîndiți-vă la o pictură de Pollock. Oricît de mulți pixeli ai folosi, tot nu reușești să cuprinzi groaznica întorlocare a vopselei zvîrlită de-a valma pe podea.




Din fericire, realitatea nu este nici prea complicată, precum pișăciunile lui Pollock. Nu e ea nici prea simplă, precum cerul cel senin, dar nici cocoșător de complicată. Prezintă recurențe, structurări bine definite care o fac suficient de așezată încît să poată să fie aproximată doar cu 1000 de pixeli :)

Drept pentru care vă felicit pentru adaosul de cunoaștere metodologică de care ați avut parte citind aceste rînduri, vă doresc să aveți doar craci frumoși în fața ochilor ori de cîte ori citiți rezultate de sondaj și fie ca forța analogiei să fie cu voi, o dragi căutători de nod în papura sondajelor și de punctul G acolo unde el nu există: în călcîi, în ceafă, în podul palmei, în cot, în cerul gurii unde toți sîntem negri precum viitorul care bate la ușă.

:)






PS: De fapt adevăratul rezultat al sondajului, ăla netrucat, care nu-l aflați voi niciodată, bieți căutători de punct G:





.

11 comentarii:

Unknown spunea...

auzi dom' sondor? da' nu puteai sa pui ultima poza prima? :D

Phaim spunea...

Eu cred ca esti gelos pe inovatia sociologica din sectorul 5.

Garcea si cel de la UNPR si-au luat niste sondori tare hotarati. Iese dintre blocurile Ferentariului productia de procente la hectar de iti vine rau.

E la Buble pe site un race to the bottom de toata frumusetea:)).

Si asta trezeste mare invidie la establishment-ul sociologic, la turambarii din mainstream:)).

Turambar spunea...

@ Jay-Jay: :) Pentru ca asa e sociologii, ei construieste suspans si cliffhangereala, mai ceva ca in filmele cu Stallone

@ Phaim: :) :p Esti individios pe succesurile mainstreamului :)

Ștefan A. spunea...

Domnu sociolog . Trebuie sa recunosc ca meseria e meserie . Cit priveste domnisoara cu picioarele la vedere , ma ofer voluntar sa fac un sondaj dinsei . :)

Turambar spunea...

:) Mersi pt aprecieri. In privintza sondajului la dom'shoara, din pacate va trebui sa va lasati sacosa la o coada considerabila, de lungime semnificativ diferita de zero :)

Blackfox spunea...

Uite unde se ascundea Kundera, mai mai, insuportabila sensibilitate.

Turambar spunea...

Kundera nu se ascunde, el zace deep within, mai vulpe neagra in ceru gurii :)

rodanielb spunea...

Cu toate astea trebuie sa remarc faptul ca dupa ce am vazut cracii din imaginea sursa, am reusit sa inteleg muuuult mai repede continutul extrapolat.

Vasile Dâncu spunea...

Jos palaria, batrane. Cred ca exemplele i-au naucit pe cititori, dar mi-a placut demersul. Aia cu chilotii lui Dumnezeu a fost foarte tare.

Turambar spunea...

:) Mersi de apreciere. Fara un pic de tabloideala si de tzitze si de fata de la pagina 5 nu reusesti sa tii treaza atentia cautatorilor de punctul G pe intuneric. Macar atita lucru am invatat si eu de la toata analiza media pe care o fac de atita timp :)

Vova spunea...

Nu stiu daca ti-a mai zis pana acum vreun barbat asta, dar Te iubesc!:)

Imi printez postul asta si o sa-l tin la mine mereu. Si cum imi mai zice unul daca la el in colegiu nu e de ajuns sa faca 300, 400 de subiecti ii pun in brate textul si-i zic: Focus, Idiot-san!