marți, 3 noiembrie 2009

Cum se fac, de fapt, sondajele

Daca duminica viitoare ar avea loc alegeri generale pentru Presedintele Romaniei si ar candida urmatorii, Dvs. cu cine ati vota?



7 comentarii:

Radu spunea...

Eu as nuanta putin, dat fiindca stim cand vor avea loc alegerile: In 22 noiembrie va avea loc primul tur al alegerilor generale pentru Presedintele Romaniei. Dvs. cu cine ati vota dintre urmatorii candidati?

Despre eficienta vs. eficacitate nu mai discutam... :)

Stii unde s-ar putea sa difere modul de raportare a cifrelor de cel al altor institute? Tu prezinti numai intentia de vot a celor care declara ca sigur merg la vot. Ceea ce pare a fi logic dar nu e chiar kosher (ex. cei cu studii superioare sunt mai putin categorici in a afirma ca sigur vor merge la vot si,totusi, participa intr-o proportie mai mare decat alte categorii).

In raport apare o mentiune eronata: ponderea celor care se afla in tara de 85%, eventual, nu 15%.

Dar, cu toate astea, e mare diferenta dintre CCSB si INSOMAR. Si nu imi explic de ce... Sincer, cred ca si voi si ei lucrati bine si aveti suficienta experienta pentru a nu gresi fundamental.

Deci, ce ar diferi intre CCSB si INSOMAR:

- CATI vs. PAPI (si implicit decupaje de univers diferite)
- raportare a datelor de vot la subesantionul participantilor "siguri" vs. raportare la intreg esantionul
- formularea intrebarii privind intentia de vot

Unde ar fi cheia...? :)

Turambar spunea...

Formularea intrebarii privind intentia de vot e cam standard peste tot. Nu aici e cheia. Nu aici e diferenta. Cristi Parvan spunea intr-un alt post ceva legat de structura chestionarului (cand a fost pusa intrebarea de vot: inainte sau dupa unele care sa creeze convingeri). Ei nu stiu cum au chestionarul. La noi e simplu: e la inceput (ma rog, dupa cele filtru de participare la vot).

Da, cel mai probabil diferentele cred ca vin de la "siguri" vs intreg esantion (nu stiu cum a facut INSOMAR: din total populatie? din cei care vin la vot? de verificat)

Si CATI vs PAPI iti da niste mici diferente.

Vom vedea la vot.

Da, ai dreptate: in graba redactarii, am trecut 15, nu 85. Si de fapt nu e 85, ci e 87, dupa cum poti vedea din placinta (15% plecati din tara, restul de 87% baza de calcul). Aia sa fie gresheala... :)

Radu spunea...

Din rapoartele publicatepe site-ul lor, cei de la INSOMAR au raportat itemul privind intentia de vot la intreg esantionul.

Da, e normal ca structura chestionarului sa influenteze raspunsul dar, asa cum am mai spus, nu cred in erori fundamentale...

In trei saptamani vom afla raspunsul. Pana atunci se mai pot intampla destule... Sa ne intindem bine antenele peste realitate. Asa nu o sa ne scape nimic!

Turambar spunea...

Asta cu "sa ne intindem bine antenele peste realitate" este de macsima ecsceptzie creativo-rautacioasa. Un rautacism expresiv, ca sa il parafrazez pe retoricul Hagi.

O sa o tzin minte, sa le-o spun nepotzilor cand ii voi tzine pe genunchi, pe spatul de spital, printre perfuzii shi alte parafernalii de mentzinere a functziilor vitale in viatza :)

ZaffCat spunea...

Intrebare din ciclul "vreau sa inteleg/invat": cat inseamna 'esantion reprezentativ'? Care este numarul persoanelor care raspund la un sondaj? Exista praguri? Toate institutele de sondare folosesc acelasi numar de persoane in esantion?
Multumesc! ;-)

Turambar spunea...

Uite aici

http://turambarr.blogspot.com/2009/11/ne-lucreaza-baietii.html#comment-2115515808872940997

comentariu despre confuzia dintre reprezentativitate si exactitate.

Raspunsul este simplu: daca este construit cum trebuie, un esantion este reprezentativ, indiferent de volumul sau. Asta nu inseamna insa ca e si exact. Pentru exactitate iti trebuie atat reprezentativitate (data de maniera de selectie a esantionului) cat si volum. Cu cat mai mare volumul, cu atat e din ce in ce mai probabil sa fie din ce in ce mai exact. Formula simplista a marjei maxime de eroare este 1 pe radical din n (unde n = volum esantion).

Scaderea marjei de eroare (deci cresterea exactitatii) este una continua, cf cu functia 1 pe radical din n. Pragurile de care vorbesti sunt mai degraba psihologice. Se alege de regula un esantion in zona lui 1000 de subiecti (1000 ... 1100 ... 1200) pt ca marja de eroare asociata este de in jur de plus minus 3%, adica un interval de eroare de plus minus 6%, care este suficient de aproape de acel 5% pana la care suntem in general noi dispusi sa riscam / sa acceptam eroarea. Sunt domenii de masurare in care 5% e prea lax / riscant (de ex medicina / stiinte militare) si atunci se aplica rigori mai mari de siguranta, corespunzatoare unor marje de eroare mult mai mici (de regula 1% la nivel de probabilitate de 99%), care implica insa volume de esantionare muuult mai mari si, in consecinta, resurse implicate mai mari (bani, timp, oameni, logistica).

E clar: trebuie sa va fac niste posturi de culturalizare intr-ale statisticii. Problema este ca e complicat sa explici in cuvinte simple si clare, adecvate la arhitecti, poetzi si politicieni :)

ZaffCat spunea...

Multumesc frumos de luminare!

Hint: pentru arhitecti poti sa desenezi, pentru poietzi sa pui in versuri, pentru politicieni... nu stiu :-)