miercuri, 30 mai 2012

Pixel cu pixel se face dreptate

Multǎ lume nu înțelege cum e cu sondajele astea. E complicate sondajele, dom'le, e aproximative, sondajele manipuleazǎ, e proaste, e rele.

Numai lucruri nașpa despre sondaje. Mai ales cǎ toatǎ lumea, în bun tipic balcanic, se pricepe la sondaje, cum de altminteri se pricepe și la folbal, la politicǎ și mai ales și mai ales la gǎsirea punctului G.

Problema principalǎ e aia cu eșantionarea. Cum naiba vǎ iese voo din 1000 de cazuri adevǎrul adevǎrat? De ce și într-un oraș de 30 mii de oameni, dar și într-o țarǎ de 20 de milioane sau de 1 miliard tot aceeași putere are?

Voi faceți niște șmecherii, nu se poate. Un eșantion de 300 de cazuri nu-i reprezentativ, nu-i așa? Lumea încurcǎ reprezentativitatea și exactitatea, e tot o eroare în capul lor, marja de eroare e de fapt de oroare, the horror, the horror, cum pe bunǎ dreptate exclama nemernicul de colonel în ultimele minute ale filmului, în încercarea sa disperatǎ de a bate recordul mondial și pangalactic la nemernicie.

Pǎi ca sǎ înțelegeți cum devine chestiunea cu eșantionarea sǎ recurgem la ce avem noi mai bun în materie de analogii: la analogia vizualǎ. Primate fiind și bazîndu-ne covîrșitor pe vederea stereoscopicǎ, cînd ni se explicǎ ceva cu ochii înțelegem foarte bine.

Pǎi sǎ belim ochii atunci la urmǎtoarea pozǎ:



Ce vedem noi aici? Noi aici vedem un cîmp de albǎstrele, culoarea chiloților lui Dumnezeu, o insuportabilǎ adîncime a spațiului, o insuportabilǎ ușurǎtate a firii.

Noi aici vedem o pozǎ simplǎ. O pozǎ fǎcutǎ cerului senin.

Sǎ ne închipuim, cum de altfel e și cazul, cǎ poza e compusǎ din mulți pixeli. Punctulețe mici mici de informație cromaticǎ elementarǎ care puse unul lîngǎ altul fac imaginea.

Sǎ zicem cǎ poza e de 1000 x 2000, adicǎ de 2 milioane de pixeli. Aprox. 2 megapixeli, o rezoluție rezonabil de mare, nici prea-prea, nici foarte-foarte.

Acum sǎ zicem cǎ n-avem bani pentru atîția pixeli și cǎ încercǎm sǎ aproximǎm, sǎ ghicim ce este în poza asta bazîndu-ne pe mai puținǎ informație. Doar pe cîțiva pixeli, luați la întîmplare. Vrem sǎ fim lugumitori și parcimonioși și eficienți și sǎ spunem ceva suficient de exact despre pozǎ folosind cel mai mic numǎr de pixeli posibili.

Sǎ zicem cǎ cumpǎrǎm poza la kil, la numǎrul de pixeli, cǎ fiecare pixel costǎ și cǎ n-avem bani sǎ cumpǎrǎm toți pixelii ǎia 2 milioane, cǎ e prea scump pentru buzunarul nostru. De cîți pixeli e nevoie sǎ cumpǎrǎm pentru a ne face o idee suficient de bunǎ despre toatǎ poza și, cu ocazia asta, sǎ economisim și niște bǎnuți?

Rǎspunsul e simplu: de un singur pixel. E suficient sǎ luǎm oricare pixel din matricea asta de 1000 x 2000 de pixeli, sǎ ne uitǎm doar la el, fǎrǎ sǎ știm cum sînt ceilalți, pentru a spune: poza mare este una cu mult albastru, fǎrǎ nici un pic de vǎlurea pe ea, deci e vorba despre cerul senin.

Gata. Am fǎcut sondajul. Am luat eșantionul – reprezentativ, cǎ am luat orice pixel la întîmplare – un eșantion cocoșǎtor de mic, de doar o unitate, și pe baza lui am fost în stare sǎ spunem suficient de multe despre întreaga pozǎ, economisind o grǎmadǎ de bani și de efort.

De ce?

Pentru cǎ poza e simplǎ. E uniformǎ. Nu are variație. E toatǎ otova, du colo colo la fel, nediferențiatǎ. În termeni statistici, e o populație de doo milioane de pixeli care nu prezintǎ variație. În consecințǎ, orice pixel aș lua, pot estima pe baza lui suficient de bine despre ce e vorba în tabloul cel mare.

Din pǎcate, în general lucrurile în viațǎ nu sînt atît de simple, decît doar în mintea celor care se pricep la toate, la femei, la politicǎ, la folbal, la sondaje, dar mai ales și mai ales la gǎsirea punctului G cu ochii închiși.

În general, în viațǎ lucrurile e complexe și necesitǎ ecsplicații, cum ecspresiv se escprima Leana lu’ Costel din Vacanța Mare, între timp devenitǎ mare politician și catindat la Sectorul 5 și care habar n-are de prețurile unui sondaj, considerînd cǎ cu 1000 de euro afli tot, ba îți mai rǎmîne mǎrunțiș și de o șaorma (da, da: m-am vǎzut cu el, vroia sondaj; e varzǎ la cap, credea cǎ sondajele se fac pe gratis).

Pǎi dacǎ lucrurile e complecse, înseamnǎ cǎ nu ne mai vine la fel de ușor sǎ aproximǎm pe baza doar a cîtorva puncte intermediare. Trebuie sǎ luǎm mai multe. Mult mai multe.

Uitați-vǎ la poza asta. Ce reprezintǎ?




E o pozǎ fǎcutǎ prin sondaj. Am luat cîțiva pixeli, unul de prin colțul din stînga sus, altul de prin mijloc, altul de pe mai jos, și am extrapolat. Am fost zgîrcit, n-am avut suficienți bani sǎ fac un sondaj pe 1000 de pixeli, m-am calicit la bani și am fǎcut doar pe vreo 10-20 de pixeli. Iar acum vreau sǎ trag concluzii. Despre ce e vorba în poza noastrǎ?

Despre cîrcǎlealǎ și despre zgîrcenie și despre lipsǎ de resurse. Despre un eșantion prea mic în condiții de complexitate realǎ. Poza ne spunem cǎ sîntem zgîrie brînzǎ și cǎ mai trebuie sǎ mai punem un pic umǎrul la treabǎ, cǎ n-am cules suficientǎ informație.

Pǎi sǎ mai punem. Ia sǎ mai punem o gǎleatǎ de pixeli, sǎ vedem, e de ajuns?




Nu, nu e de ajuns. Am extrapolat pe baza a vreo 50 de pixeli și tot ceațǎ la mal ne dǎ. Mai baga cǎrbuni, dom' sondor! Bagǎ, bagǎ, nu te zgîrci!






Hai sǎ vedem și poza pe bune. Despre ce e vorba?




Waw! Ce pozǎ mișto! Cum de nu ne-a trecut prin cap cǎ despre asta este de fapt vorba?

La fel și la sondaje. Cu cît iei din ce în ce mai mulți pixeli (subiecți în eșantion), cu atît încet-încet începi sǎ vezi suficient de bine despre ce este de fapt vorba. Pînǎ la un anumit numǎr de pixeli, pînǎ la un anumit volum de eșantion, nu prea vezi nimic, doar o mare ceațǎ la mal și o mare îmbîcsealǎ.

Pe urmǎ, din fericire de manierǎ non-liniarǎ, de pe la cîteva sute de pixeli dintr-o datǎ începe sǎ se vazǎ. Pînǎ cînd spre 700 – 800 – 900 – 1000 de pixeli începe sǎ se vazǎ de manierǎ suficient de bunǎ. E un bun compromis resurse folosite – exactitate obținutǎ. Nici prea-prea, nici foarte-foarte. Nici farmacie, așa cum își doresc clienții cei prea mofturoși, dar nici ghicitorologie.




Dupǎ aceea, oricît de mulți pixeli ai mai lua, consumi resurse degeaba, dacǎ pur și simplu vrei doar sǎ te uiți la poza cea mare. Tot mai adaugi pixeli, consumi bani și resurse, fǎrǎ sǎ mai aduci mare plus de informație în pozǎ.

Dacǎ vrei sǎ faci zoom pe o anumitǎ parte a pozei, asta este cu totul altceva. Sǎ te concentrezi pe danteluța acestui funduleț sau sǎ analizezi în profunzime rictusul de satisfacție al masculului din fundal. Dar altminteri, dacǎ vrei doar poza mare, e suficient sǎ iei în jur de 800 – 1000 de pixeli. Începe sǎ se vadǎ.

Dacǎ poza ar fi fost și mai complexǎ, sǎ nu conținǎ structuri și continuitǎți și forme bine definite, în cadrul cǎrora sǎ avem o oarecare omogenitate, nici 1000 de pixeli nu ar fi fost îndeajuns.

Gîndiți-vǎ la o picturǎ de Pollock. Oricît de mulți pixeli ai folosi, tot nu reușești sǎ cuprinzi groaznica întorlocare a vopselei zvîrlitǎ de-a valma pe podea.




Din fericire, realitatea nu este nici prea complicatǎ, precum pișǎciunile lui Pollock. Nu e ea nici prea simplǎ, precum cerul cel senin, dar nici cocoșǎtor de complicatǎ. Prezintǎ recurențe, structurǎri bine definite care o fac suficient de așezatǎ încît sǎ poatǎ sǎ fie aproximatǎ doar cu 1000 de pixeli :)

Drept pentru care vǎ felicit pentru adaosul de cunoaștere metodologicǎ de care ați avut parte citind aceste rînduri, vǎ doresc sǎ aveți doar craci frumoși în fața ochilor ori de cîte ori citiți rezultate de sondaj și fie ca forța analogiei sǎ fie cu voi, o dragi cǎutǎtori de nod în papura sondajelor și de punctul G acolo unde el nu existǎ: în cǎlcîi, în ceafǎ, în podul palmei, în cot, în cerul gurii unde toți sîntem negri precum viitorul care bate la ușǎ.

:)






PS: De fapt adevǎratul rezultat al sondajului, ǎla netrucat, care nu-l aflați voi niciodatǎ, bieți cǎutǎtori de punct G:





.

11 comentarii:

jay-jay spunea...

auzi dom' sondor? da' nu puteai sa pui ultima poza prima? :D

Phaim spunea...

Eu cred ca esti gelos pe inovatia sociologica din sectorul 5.

Garcea si cel de la UNPR si-au luat niste sondori tare hotarati. Iese dintre blocurile Ferentariului productia de procente la hectar de iti vine rau.

E la Buble pe site un race to the bottom de toata frumusetea:)).

Si asta trezeste mare invidie la establishment-ul sociologic, la turambarii din mainstream:)).

Turambar spunea...

@ Jay-Jay: :) Pentru ca asa e sociologii, ei construieste suspans si cliffhangereala, mai ceva ca in filmele cu Stallone

@ Phaim: :) :p Esti individios pe succesurile mainstreamului :)

Ștefan A. spunea...

Domnu sociolog . Trebuie sa recunosc ca meseria e meserie . Cit priveste domnisoara cu picioarele la vedere , ma ofer voluntar sa fac un sondaj dinsei . :)

Turambar spunea...

:) Mersi pt aprecieri. In privintza sondajului la dom'shoara, din pacate va trebui sa va lasati sacosa la o coada considerabila, de lungime semnificativ diferita de zero :)

Blackfox spunea...

Uite unde se ascundea Kundera, mai mai, insuportabila sensibilitate.

Turambar spunea...

Kundera nu se ascunde, el zace deep within, mai vulpe neagra in ceru gurii :)

Daniel Bucur spunea...

Cu toate astea trebuie sa remarc faptul ca dupa ce am vazut cracii din imaginea sursa, am reusit sa inteleg muuuult mai repede continutul extrapolat.

Vasile Dâncu spunea...

Jos palaria, batrane. Cred ca exemplele i-au naucit pe cititori, dar mi-a placut demersul. Aia cu chilotii lui Dumnezeu a fost foarte tare.

Turambar spunea...

:) Mersi de apreciere. Fara un pic de tabloideala si de tzitze si de fata de la pagina 5 nu reusesti sa tii treaza atentia cautatorilor de punctul G pe intuneric. Macar atita lucru am invatat si eu de la toata analiza media pe care o fac de atita timp :)

Vova spunea...

Nu stiu daca ti-a mai zis pana acum vreun barbat asta, dar Te iubesc!:)

Imi printez postul asta si o sa-l tin la mine mereu. Si cum imi mai zice unul daca la el in colegiu nu e de ajuns sa faca 300, 400 de subiecti ii pun in brate textul si-i zic: Focus, Idiot-san!