luni, 2 noiembrie 2009

Ne lucreaza baietii :(

Partea buna a intregii nebunii este ca ne considera suficient de semnificativi / credibili incat sa se foloseasca de sigla noastra si sa incerce sa ne-o traga.

Partea proasta este ca ne-o trag si, in consecinta, primim SMS-uri de la toti stralucitorii posibili (de la mogul, de la Radu, de la Dan, ca sa mentionez doar cativa) care ne intreaba exasperati / intrebatori / mirati / furiosi ce dracu se intampla, ce e cu cifrele astea.

Partea buna este ca cifrele noastre sunt suficient de vizibile incat sa demonteze, macar partial, aceasta incercare de manipulare. Repet: cifrele noastre sunt TB 34 MG 28 CA 19 SO 12.

Partea proasta este ca sunt fosti clienti de-ai nostri care ne-o trag de maniera cat se poate de bruta si brutala. Pe fatza, frate, pe fatza... :(

Partea buna este ca ne-am prins cum au facut lucratura: au luat primul PDF gasit pe Google al nostru

http://www.google.ro/search?as_q=CCSB&hl=ro&num=10&btnG=C%C4%83utare+Google&as_epq=&as_oq=&as_eq=&lr=&cr=&as_ft=i&as_filetype=ppt&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=&as_rights=

si au facut niste chestii destul de usor de demontat: fara diacritice, nu este total Bitmap, ci titlul este text, foloseste o alta structura de prezentare a candidatilor (nu spun mai mult...), iar in Properties este al titlu decat cel al Powerpointurilor noastre recente. Deci suficiente indicii. Cine este cu adevarat interesat, il astept sa-i arat pe laptop.

Partea proasta este ca si ei sunt oarecum vizibili, cel putin suficient de vizibili incat sa induca oareshce dubii in mintile celor care conteaza.

Partea buna este ca mai sunt trei saptamani si se va vedea care sunt adevaratele cifre ale adevaratei mame Omida probabilistice.

Partea proasta este ca sunt oameni suficient de importanti (printre care si un fost sef de servicii secrete) care sunt bagati in chestia asta.

Partea buna este ca cititi acest blog.

Sa moara pisica. Fac infarct. Mai sunt trei saptamani. Si pe urma doua saptamani. Si fostii clienti, suparati ca nu am cantat in cifre, ne fac de maniera ieftina. Si bruta. Si brutala. Iar alti clienti sunt si ei suparati, ca nici lor nu le-am cantat in cifre. Si sunt si ei destul de importanti in economia jocului.

Nu spun mai mult.

:/

PS: pentru cei care nu intzeleg despre ce este vorba in propozitie: Liberalii. Si site-urile apropiate lor. Nu va luati dupa soparle. Nu e adevarat. Crin nu sta asa de bine, nici Geoana asa de prost. Incearca si ei marea cu degetul, doar-doar iese ceva...

Repet: cifrele sunt 34 28 19 12.

:(

10 comentarii:

Sergiu spunea...

Turambar,

Nici nu stiu ce sa mai zic...
Uneori, ma intreb...si daca totusi astia de la realitatea - insomar or avea dreptate si geoana e in frunte...si ma uit in jur si zic...nu e posibil....daca nu sociologic, macar logic...
Te rog spune-ne ca nu ai fost sunat de realitatea pentru a va "potrivi" sondajele ...asa ceva e prea mult si nu pot sa cred....ce ti-ar fi putut spune...sa faceti o medie ?!
Si daca electoratul influentat de cifrele Insomar se va lasa convins si va da cifrele lor la urne ?...
Sa vina mai repede 22 si sa vedem atunci....
E foarte important de vazut daca urmatoarele voastre sondaje vor confirma trendurile pe care le-ai identificat deja...
Cand vei putea vedea acest lucru ? Adica cand veti termina urmatorul sondaj ?

Turambar spunea...

Nu, nu am fost sunati de cei de la Realitatea. Alta e povestea. Din alta parte ni se trage.

:(

Repet cifrele: 34 28 19 12. Restul e incercare ieftina de manipulare. De-aia am si dat comunicatul acela astazi.

Sergiu spunea...

Nu stiu daca te-ai uitat la succesiunea intrebarilor din sondajul Insomar ?
Intrebarea cu presedintele e penultima dupa alte intrebari, inclusiv intrebarea cu votul la parlament...Nu asa se adreseaza o intrebare cheie....

Lucian Ancu spunea...

O problema pe care nu am inteles-o si pe care o intreb de fiecare data cand am ocazia. Pe ce se bazeaza faptul ca un numar de 1200 de persoane este un sample statistic reprezentativ la nivel national? (Am vazut la voi 1216, la ceilalti 1207)

Am auzit ca in joc ar fi multi coeficienti si corectii aplicate. As vrea sa stiu si eu din cei 2.9% cat e eroarea de metoda si cat eroarea statistica. E eroarea de 2.9% constanta pentru toti candidatii ? Imi permit sa pun aceste intrebari lucrand cu experimente statistice, dar in cu totul alt domeniu !!!

Personal vad cele doua sondaje compatibile intre ele (daca stiu sa interpretez bine sondajele). Chiar daca valorile centrale sunt diferite, intervalurile in care valoarea reala a variabilei masurate se afla cu o prob de 95% se suprapun! De aceea in limita erorilor 32=30=34=28 si concluzia e ca primii doi candidati sunt la egalitate in limita erorilor de masura. Chiar asa de ce nu desenati si intervalul de eroare in graficele pe care le publicati ?

PS: Daca credeti ca raspunsul la intrebarile mele sunt prea tehnice pentru un post de blog, va rog totusi sa imi raspundeti printr-un e-mail.

parvan spunea...

turambar: slaba consolare: "ne considera suficient de semnificativi / credibili incat sa se foloseasca de sigla noastra"

e ca si cum pagubitul unui furt s-ar mandri cu faptul ca totusi faptul ca s-a furat de la el si nu de la vecinu e dovda ca el ar fi mai bogat decat vecinul. Protejati-va brandul, fiti vizibili, numiti impostura.

@Sergiu: ai vazut chestionarul? zici ca de acolo e? Acel 52,4 centrat poate fi efectul unor rationalizari anterioare. Dar 63.5 la turul 2 ... ar infirma ipoteza asta. Nu cred ca au intrebat intai de turul 2, apoi baterie generala si abia apoi turul 1.

maria spunea...

Fostul sef de servicii secrete e marea eroare a lui TB ? Sa inteleg ca cei doi soti se ocupa de campania lui Crin ? Acum vor vedea ca de unde nu e nici Dzeu nu da !

Sunt convinsa ca cifrele tale vor fi aproape de realitate la primul tur (pana la alegeri oricum se mai schimba si la voi ) , dar pe cele de turul II nu le cred , cu toate ca se va uni toata "floarea cea vestita" impotriva stralucitorului pe care-l voi vota eu .

parvan spunea...

@Maria Ca tot am gasit reperul care confirma "apropierea de realitate" a unor masuratori sociale. Nu vreau sa scap prilejul si as vrea sa aflu unde e cu exactitate Elodia, si care-i adevarata verisoara a buncii omida.

Dau la schimb o straveche dilema despre moartea licuriciului:
Licuriciul este identificat ca insecta care produce "straluciri". Desi insecta traieste si dupa ce nu mai lumineaza ... "multa lume crede" ca licuriciul moare cand i se stinge lumina nu cand moare insecta. Eu cred ca licuriciul moare cate putin de fiecare data cand rasare soarele :)

Turambar spunea...

@ Parvan: Waw. That's deep. De tzinut minte sa o spun in acele situatzii de socializare informala cand se spun bancurile dupa trei pahare de limonada. Stii tu de care limonada.

:)

@ Maria: Acum, turul II asa se vede. O trecere de la 55 / 45 in favoarea lui TB la un echilibru 50 / 50 la, si mai recent, un 45 / 55 in favoarea adversarilor lui Basescu. Insa intre turul I si turul II se vor intampla chestii, se vor remodela intentii de vot in functie de cine iese in turul II, de ce comunica cei care nu intra, de... de... . Trebuie sa asteptam.

@ Lucian Ancu: Waw. Tu ma pui sa-ti tzin un curs de statistica. No more, no less.

Buuuun.

Ideea e urmatoarea: se face confuzie frecvent (inclusiv tu aici) intre reprezentativitate si exactitate. In extremis, daca aloci probabilitati de selectie egala tuturor indivizilor si faci selectia aleatorie, si un esantion de o persoana este reprezentativ. Cu niste compromisuri insa uriase fata de exactitatea masurarii (operationalizata prin vestita marja de eroare). Invers: in extremis, eu itzi pot alege un eshantion de 1 milion de oameni care sa nu fie reprezentativ pt populatia Romaniei (simplu: itzi iau doar babe batrane cu braul de lana din Moldova Muntenia Dobrogea).

Deci retine: reprezentativitate vs exactitate (marja de eroare). Reprezentativitatea este asigurata de maniera de constructie a esantionului. Exactitatea este data, pe de o parte, de reprezentativitatea esantionului, dar si de volumul sau. Cu cat mai mare (provided is selected randomly), cu atat mai exact.

Ca sa complicam si mai mult lucrurile, teoria matematica te asigura (aici zambesc: acest cuvant: asigura, este horribile dictu intr-o stiinta probabilistica, aproximativa), deci teoria matematica itzi spune ca la un numar suficient de mare de masuratori (sondaje), vei avea unele care, indiferent de cat de bine si de riguros realizate, de curate, vor fi gresite (acele 5% cazuri de risc care sunt mai departe de realitate decat vestitele plus minus doua erori standard, sau acele 1% cazuri de risc care sunt mai departe de realitate decat plus minus TREI erori standard). Adica, cu alte cuvinte, simple si clare: de cele mai multe ori, sondajele masoara suficient de exact. Sunt momente (5% din cazuri) in care sunt mai departe de realitate decat ne-am dori (dincolo de plus-minus marja de eroare). E o poveste lunga, care cel mai bine este explicata nu pe blog, ci la un curs de statistica. Poti sa cauti pe Internet, sunt suficient de multe resurse disponibile. Poti sa incepi de la sfanta Wikipedia, de ex:

http://en.wikipedia.org/wiki/Margin_of_error

Alta tema de complicare a discutiei: marja de eroare la diverse niveluri de probabilitate. Da, ai dreptate cand intrebi: "E eroarea de 2.9% constanta pentru toti candidatii?" Nu, nu este. Cu cat este probabilitatea apriorica a evenimentului mai mica (in cazul de fata, procentele obtinute de candidati), cu atat scade si marja de eroare. Pentru ca altminteri, iti dai seama ca ar fi hilar sa spui ca Kelemen are 2% plus minus 2.9%, pentru ca e posibil sa itzi dea cu minus si sa fie nevoie sa mai aduci niste unguri de-acasa ca sa fie zero :)

Joke aside: Aceasta marja de eroare teoretica este cea maxima, la niveluri de aparitie a evenimentului de 50% (atunci cand incertitudinea este maxima) si ia in considerare doar erorile de esantionare, nu alte tipuri de erori (erorile sistematice) pe care putem sa le evaluam mult mai greu (de ex: spirala tacerii; sau diferenta dintre cei care raspund la chestionare si cei care nu raspund; sau limitarile de comunicare / interactiune a operatorilor de teren)

Deci, pe scurt: e o stiinta complicata si aproximativa si cred ca daca vrei sa afli mai mult ar trebui sa citesti. Insa daca spui ca te ocupi cu experimentele statistice in alt domeniu, probabil ca stii more or less despre ce vorbesc.

Iar peste toate astea, nemuritoare si reci si puternice, partidele si institutiile media, care induc si ele factori suplimentari de stress cardiac.

:(

cti97 spunea...

ok, dupa ce am citit explicatia lu nenea Turambar, ma simt ca in Matrix. Dar nu stiu cine este "the one"

Lucian Ancu spunea...

@Turambur:

Scuze daca am parut imperativ cerandu-ti un curs. Vreau pur si simplu sa inteleg mai bine masinaria din spatele numerelor care ajung sa le vad in final in aceste sondaje.

Multumesc mult pentru explicatiile pe larg si trimiterile facute. Din trimiterea pe care mi-ai dat-o am inteles mult mai bine cum calculati eroarea si asta e foarte important pentru mine (defect profesional :) ).

Mai sunt lucruri asupra carora am intrebari dar prefer sa nu iti acaparez spatiu aici si sa te fortez sa imi dai un curs de statistica.

PS: in domeniul in care lucrez eu lucram numai cu intervaluri de confidenta de peste 95%. Cele care le pretuim sunt 3 si 5 sigma. De aceea probabil traspun prost ceea ce simt din domeniul meu la statisticiile de sondaj.