Aspects techniques : la fabrique du sondage.

 

 

1. LĠŽchantillonnage

 

Sans entrer dans les dŽtails, la thŽorie statistique indique que pour conna”tre la probabilitŽ dĠŽvnements parmi une population donnŽe il est possible de nĠen Žtudier quĠune petite partie, ˆ condition de la choisir selon des rgles rigoureuses, garantissant sa reprŽsentativitŽ. Il existe deux mŽthodes : la mŽthode alŽatoire et celle des Ç quotas È.

 

Marge dĠerreur acceptable

Il ne sĠagit pas ici dĠune erreur fondŽe sur des considŽrations psychologiques ou comportementales, mais simplement de la fourchette dĠincertitude qui indique lĠŽcart observable entre diffŽrents tirages potentiellement effectuŽs sur cette population. Elle est purement mŽthodologique et dŽcoule du hasard des tirages. Dans le cas de deux rŽponses possibles ˆ une question, rŽparties Žgalement (50% de Ç oui È et de Ç non È par exemple), la valeur de cette fourchette est indiquŽe dans le tableau suivant :

 

Nombre de personnes interrogŽes

Fourchette (le rŽsultat sĠy trouve avec une probabilitŽ de 95%)

100

~ 10 %

400

~ 5 %

1000

~ 3 %

1600

~ 2,5 %

10 000

~ 1 %

 

Cette marge dĠerreur est calculable dans le cadre de tirages alŽatoires. Pour les Ç quotas È, elle nĠest pas calculable avec prŽcision, ce qui participe des critiques adressŽes ˆ cette mŽthode. On considre en gŽnŽral quĠelle est du mme ordre que celle dĠun Žchantillon alŽatoire, pour autant que les conditions du choix de lĠŽchantillon soient proches dĠun tirage alŽatoire (ce qui est rarement le cas, et est aussi une condition trs floue).

Les Žchantillons sont gŽnŽralement de lĠordre de 1000 personnes : cĠest un juste milieu entre lĠexigence de prŽcision et la faisabilitŽ pratique de lĠenqute.

La connaissance de la marge dĠerreur est essentielle ˆ lĠanalyse dĠun sondage, dĠautant plus si les enjeux sont Ç serrŽs È. Ainsi, le second tour de lĠŽlection prŽsidentielle de 1981 sembla Ç faire mentir les sondages È car ceux-ci, qui crŽditaient en moyenne (sur 21 sondages effectuŽs de dŽcembre 1980 ˆ mai 1981) Giscard dĠEstaing de 50,57 % et Mitterrand de 49, 42 % des voix, Žtaient prŽsentŽs sans marges dĠincertitude.

 

 

DifficultŽs de lĠŽchantillonnage.

Toute partie trop petite dĠune population de rŽfŽrence empche dĠy pratiquer tout sondage. Ainsi, aux Etats-Unis, Gallup refusait dĠeffectuer des sondages avant les Žlections primaires, auxquelles la participations est trs faible (moins de 10 % des inscrits). La population ˆ sonder est ici trop Žtroite, hŽtŽrogne et instable.

Des difficultŽs dĠordre technique se prŽsentent Žgalement chaque fois que lĠon sĠŽloigne des conditions dĠune stratification instituŽe de la population ˆ sonder. Ainsi, tenter dĠŽtablir la composition dĠune foule est assez alŽatoire, et lĠon doit se contenter dĠinterrogations ponctuelles en divers endroits sans autre garantie de prŽcision.

 

 

2. Les incertitudes liŽes ˆ lĠŽlaboration du questionnaire

 

Une des principales incertitudes quant ˆ la validitŽ scientifique des sondages provient de la faon dont est ŽlaborŽ le questionnaire : en effet, on voit en prenant quelques exemples de sondages que lĠintention de celui qui pose la question (ou la fait poser par un institut de sondage) influe sur la mŽthode utilisŽe pour interroger des gens ainsi que sur la signification des rŽsultats. Les prŽfŽrences des demandeurs influencent ainsi la formulation des questions, lĠordre dans lesquelles elles sont posŽes, les rŽponses proposŽes, et les analyses quĠon en tire. Il peut alors sĠagir dĠambigu•tŽs involontaires de formulation ou de manipulations intentionnelles visant ˆ favoriser tel ou tel rŽsultat (questions dites inductrices).

 

Il existe tout dĠabord de distorsions qui ne procdent pas dĠune manipulation intentionnelle mais dĠeffets liŽs au dŽcalage entre ceux qui Žlaborent les questions et ceux auxquelles elles sont posŽes. Ainsi, les mmes mots ne sont pas forcŽment compris de la mme faon dans des contextes sociaux diffŽrents : si lĠon demande ˆ quelquĠun Ç sĠil prend souvent des vacances È, la signification du mot Ç souvent È ne sera pas la mme pour toutes les personnes interrogŽes. Dans une Žtude sur les travailleurs de lĠindustrie, on sĠest aussi rendu compte que la moitiŽ des enqutŽs confondaient les termes Ç production È et Ç productivitŽ È.  Faute de rŽflexion sur la portŽe des mots utilisŽs, leur niveau de comprŽhension, les connotations diffŽrentes qui leur sont attachŽs selon les milieux, de graves distortions peuvent donc intervenir. NŽanmoins, les ambiguitŽs de formulations sont assez souvent intentionnelles.

 

La plus simple des manipulations dans les sondages dĠopinion est lĠutilisation de la formulation Ç Etes-vous dĠaccord avec É È qui pousse ˆ des rŽponses positives, nombre de personnes nĠaimant pas afficher leur dŽsaccord.  LĠutilisation dĠŽchelles Ç plus ou moins dĠaccord È qui est censŽe contrecarrer cet effet, a une autre consŽquence : le gonflement des rŽponses modŽrŽes (plut™t dĠaccord ou plut™t pas dĠaccord) au dŽtriment des extrmes.

On obtient aussi des rŽponses diffŽrentes selon que lĠon pose une question sur le mode du souhait ou du pronostic : dans le cas de sondages sur les modes dĠŽnergie utilisŽ dans le futur, les rŽponses majoritaires se portent sur lĠŽnergie solaire quand la question est posŽe sur le mode du souhait, et sur le nuclŽaire lorsquĠelles sont posŽes sur le mode du pronostic. Le premier sodage a ŽtŽ commanditŽ par le comitŽ dĠaction solaire, le deuxime par la chambre syndicale des pŽtroliers. Le choix de la formulation est dans ce cas liŽ au rŽsultat quĠon espre, et le glissement de sens entre Ç Souhaitez-vous È et Ç Pensez-vous È peut trs bien tre estompŽ lors de la lecture qui est faite des rŽsultats.

Dans de nombreux cas, le problme vient aussi du fait que lĠon peut comprendre la question de plusieurs faons : on peut prendre lĠexemple dĠun sondage de 1983, la question posŽe Žtant Ç En cas dĠalternance du pouvoir, croyez-vous quĠil faudra dŽnationaliser ? È. Dans ce cas, on ne sait pas si la question est Ç Y-aura-t-il dŽnationalisation en cas de victoire de la droite È ou Ç Etes-vous dĠaccord avec la nŽcessitŽ de dŽnationaliser ? È. On peut ainsi utiliser un tel sondage pour suggŽrer quĠune majoritŽ des Franais est favorable aux privatisations (exemple tirer de Ç Les sondages dĠopinion È, Repres nĦ38).

Le contexte dans lequel est posŽ une question peut aussi faire varier les rŽponses : on voit ainsi que, au lendemain dĠun crime dĠenfant particulirement horrible, le nombre de partisans de la peine de mort augment nettement, pour retomber par la suite. On peut donc choisir des moments plus ou moins favorables ˆ lĠobtention de la rŽponse souhaitŽe.

Enfin, lĠordre des questions joue sur les rŽponses donnŽes selon un effet dit Ç effet de halo È. Exemple : une premire question demande si Ç lĠarrivŽe au pouvoir de lagauche a eu des effets Žconomiques catastrophiques È et une deuxime Ç voterez-vous pour la gauche au prochaines Žlections È.  Dans ce cas, la 1re question a un effet clairement inducteur sur la rŽponse donnŽe ˆ la deuxime.

Il existe donc de nombreuses faons dĠavantager dĠavance un terme du choix par rapport dans la phase dĠŽlaboration des questions et des rŽponses possibles, dont le choix et lĠordre ne sont nullement neutres. Ces techniques de manipulation sont particulirement importantes dans la mesure o obtenir une rŽponse majoritairement positive ˆ un sondage est devenu un argument fort dans le dŽbat politique.

 

 

3. Les mŽthodes dĠenqute

 

Une fois lĠŽchantillonnage effectuŽ, il reste ˆ rŽaliser lĠenqute concrtement. Or, les enquteurs se heurtent ˆ de nombreuses difficultŽs qui peuvent induire des biais dans la composition de lĠŽchantillon ainsi que dans les rŽponses.

Le premier problme est le problme classique des enqutes quantitatives reposant sur des passations de questionnaire ˆ domicile : selon lĠheure ˆ laquelle sĠeffectue lĠenqute, on a beaucoup plus de chance de trouver telle ou telle catŽgorie socio-professionnelle. Une enqute effectuŽe dans la journŽe donnera un Žchantillon surreprŽsentŽs en retraitŽs, femmes au foyer, ch™meurs, Žtudiants et É concierges. LĠenquteur aura ainsi du mal ˆ trouver le nombre de cadres, ouvrires, employŽs demandŽs pour son Žchantillon. Une pratique courante est alors, faute de trouver des Ç chefs de famille È en nombre suffisant, de prendre lĠopinion dĠune Žpouse au foyer comme un fidle reflet de lĠopinion du mari. Par ailleurs, les personnes vivant dans certains lieux (hameaux isolŽs, Žtages ŽlevŽs sans ascenseurs) seront sous-reprŽsentŽs.

Une autre source de biais importante provient de la relation dĠenqute elle-mme, cĠest-ˆ-dire la faon dont les enqutŽs peroivent les questions quĠon leur pose ainsi que lĠenquteur lui-mme. Dans certains cas, il peut tre assimilŽ ˆ un policier, ˆ un travailleur social, et cette perception peut Žveiller une mŽfiance te modifier les rŽponses : on refusera ainsi de rŽpondre ˆ certaines questions, par exemple de rattachement politique, ou bien on nĠexprimera pas telle ou telle rŽponse dont on pense quĠelle sera mal vue. Un bon exemple est ainsi les enqutes cherchant ˆ Žvaluer lĠimportance du racisme, qui reoivent des rŽponses trs diffŽrentes selon les formulations employŽes, renvoyant plus ou moins directement au racisme, mais aussi selon les caractŽristiques de lĠenquteur lui-mme (une Žtude amŽricaine montre ainsi que sur ce sujet, les rŽponses sont trs diffŽrentes selon que lĠenquteur est blanc ou noir). On peut ainsi supposer que les rŽponses ne seront pas les mmes selon que lĠenquteur est un homme ou une femme, selon son ‰ge, selon quĠil est peru comme quelquĠun dĠun milieu social proche ou ŽloignŽ par lĠenqutŽÉ Alors que dans une enqute de type qualitatif par entretien approfondi, cette relation dĠenqute est analysŽe comme un composante de lĠŽtude, les enqutes par  sondages font par nature lĠimpasse sur tous les biais quĠelle peut engendrer.

Enfin, on constate quĠun enjeu important pour lĠenqutŽ peut tre de ne pas perdre la face : sĠil ne comprend pas ˆ quoi fait allusion la question, il peut trs bien rŽpondre tout de mme ˆ la question pour ne pas dŽvoiler son ignorance. Le CREDOC a mis en Žvidence ce phŽnomne en posant une question portant sur un amendement imaginaire, Ç Avez-vous entendu parler de lĠamendement Bourrier, concernant la SŽcuritŽ Sociale ? È, question ˆ laquelle entre 4 et 6% des personnes interrogŽes rŽpondent oui. Cela montre que dans un sondage, toute proposition, fžt-elle imaginaire ou fantaisiste, est susceptible de rencontrer un minimum dĠadhŽsion, car lĠenqutŽ nĠest pas une machine ˆ rŽpondre mais une personne prise dans un contexte social, rŽagissant non seulement ˆ des questions mais ˆ un enquteur et ˆ lĠimage quĠil en a, et capable de stratŽgies.

 

 

4. Le traitement des donnŽes.

La mŽthode du redressement

Ce terme recouvre deux pratiques de traitement des donnŽes, selon que lĠon souhaite corriger un biais structurel de lĠŽchantillon ou un biais observŽ a posteriori dans les rŽponses (typique des sondages politiques).



[1] JŽr™me JaffrŽ, Vice-prŽsident de la SOFRES, Ç Les sondages mesurent lĠopinion, ils ne la crŽent pas È, entretien accordŽ ˆ MŽdiaspouvoirs, mai 1995.

[2] Colloque de lĠAFSP, 1984

[3] JŽr™me JaffrŽ, op. cit.