Aspects techniques : la fabrique du sondage.
1. LĠchantillonnage
Sans
entrer dans les dtails, la thorie statistique indique que pour connatre la
probabilit dĠvnements parmi une population donne il est possible de nĠen
tudier quĠune petite partie, condition de la choisir selon des rgles
rigoureuses, garantissant sa reprsentativit. Il existe deux mthodes :
la mthode alatoire et celle des Ç quotas È.
Marge
dĠerreur acceptable
Il
ne sĠagit pas ici dĠune erreur fonde sur des considrations psychologiques ou
comportementales, mais simplement de la fourchette dĠincertitude qui indique
lĠcart observable entre diffrents tirages potentiellement effectus sur cette
population. Elle est purement mthodologique et dcoule du hasard des tirages.
Dans le cas de deux rponses possibles une question, rparties galement (50%
de Ç oui È et de Ç non È par exemple), la valeur de cette
fourchette est indique dans le tableau suivant :
|
Nombre de personnes interroges |
Fourchette (le rsultat sĠy trouve avec une
probabilit de 95%) |
|
100 |
~ 10 % |
|
400 |
~ 5 % |
|
1000 |
~ 3 % |
|
1600 |
~ 2,5 % |
|
10 000 |
~ 1 % |
Cette
marge dĠerreur est calculable dans le cadre de tirages alatoires. Pour les
Ç quotas È, elle nĠest pas calculable avec prcision, ce qui
participe des critiques adresses cette mthode. On considre en gnral
quĠelle est du mme ordre que celle dĠun chantillon alatoire, pour autant que
les conditions du choix de lĠchantillon soient proches dĠun tirage alatoire
(ce qui est rarement le cas, et est aussi une condition trs floue).
Les
chantillons sont gnralement de lĠordre de 1000 personnes : cĠest un
juste milieu entre lĠexigence de prcision et la faisabilit pratique de
lĠenqute.
La
connaissance de la marge dĠerreur est essentielle lĠanalyse dĠun sondage,
dĠautant plus si les enjeux sont Ç serrs È. Ainsi, le second tour de
lĠlection prsidentielle de 1981 sembla Ç faire mentir les
sondages È car ceux-ci, qui crditaient en moyenne (sur 21 sondages
effectus de dcembre 1980 mai 1981) Giscard dĠEstaing de 50,57 % et
Mitterrand de 49, 42 % des voix, taient prsents sans marges dĠincertitude.
Difficults
de lĠchantillonnage.
Toute
partie trop petite dĠune population de rfrence empche dĠy pratiquer tout sondage.
Ainsi, aux Etats-Unis, Gallup refusait dĠeffectuer des sondages avant les
lections primaires, auxquelles la participations est trs faible (moins de 10
% des inscrits). La population sonder est ici trop troite, htrogne et
instable.
Des
difficults dĠordre technique se prsentent galement chaque fois que lĠon
sĠloigne des conditions dĠune stratification institue de la population
sonder. Ainsi, tenter dĠtablir la composition dĠune foule est assez alatoire,
et lĠon doit se contenter dĠinterrogations ponctuelles en divers endroits sans
autre garantie de prcision.
Une des principales
incertitudes quant la validit scientifique des sondages provient de la faon
dont est labor le questionnaire : en effet, on voit en prenant quelques
exemples de sondages que lĠintention de celui qui pose la question (ou la fait
poser par un institut de sondage) influe sur la mthode utilise pour
interroger des gens ainsi que sur la signification des rsultats. Les
prfrences des demandeurs influencent ainsi la formulation des questions,
lĠordre dans lesquelles elles sont poses, les rponses proposes, et les
analyses quĠon en tire. Il peut alors sĠagir dĠambiguts involontaires de
formulation ou de manipulations intentionnelles visant favoriser tel ou tel
rsultat (questions dites inductrices).
Il existe tout dĠabord de
distorsions qui ne procdent pas dĠune manipulation intentionnelle mais
dĠeffets lis au dcalage entre ceux qui laborent les questions et ceux
auxquelles elles sont poses. Ainsi, les mmes mots ne sont pas forcment
compris de la mme faon dans des contextes sociaux diffrents : si lĠon
demande quelquĠun Ç sĠil prend souvent des vacances È, la
signification du mot Ç souvent È ne sera pas la mme pour toutes les
personnes interroges. Dans une tude sur les travailleurs de lĠindustrie, on
sĠest aussi rendu compte que la moiti des enquts confondaient les termes
Ç production È et Ç productivit È. Faute de rflexion sur la porte des
mots utiliss, leur niveau de comprhension, les connotations diffrentes qui
leur sont attachs selon les milieux, de graves distortions peuvent donc
intervenir. Nanmoins, les ambiguits de formulations sont assez souvent
intentionnelles.
La plus simple des
manipulations dans les sondages dĠopinion est lĠutilisation de la formulation Ç Etes-vous
dĠaccord avec É È qui pousse des rponses positives, nombre de
personnes nĠaimant pas afficher leur dsaccord. LĠutilisation dĠchelles Ç plus ou moins
dĠaccord È qui est cense contrecarrer cet effet, a une autre
consquence : le gonflement des rponses modres (plutt dĠaccord ou
plutt pas dĠaccord) au dtriment des extrmes.
On obtient aussi des rponses
diffrentes selon que lĠon pose une question sur le mode du souhait ou
du pronostic : dans le cas de sondages sur les modes dĠnergie
utilis dans le futur, les rponses majoritaires se portent sur lĠnergie
solaire quand la question est pose sur le mode du souhait, et sur le nuclaire
lorsquĠelles sont poses sur le mode du pronostic. Le premier sodage a t
commandit par le comit dĠaction solaire, le deuxime par la chambre syndicale
des ptroliers. Le choix de la formulation est dans ce cas li au rsultat
quĠon espre, et le glissement de sens entre Ç Souhaitez-vous È et
Ç Pensez-vous È peut trs bien tre estomp lors de la lecture qui
est faite des rsultats.
Dans de nombreux cas, le
problme vient aussi du fait que lĠon peut comprendre la question de
plusieurs faons : on peut prendre lĠexemple dĠun sondage de 1983, la
question pose tant Ç En cas dĠalternance du pouvoir, croyez-vous quĠil
faudra dnationaliser ? È. Dans ce cas, on ne sait pas si la question
est Ç Y-aura-t-il dnationalisation en cas de victoire de la droite È
ou Ç Etes-vous dĠaccord avec la ncessit de dnationaliser ? È.
On peut ainsi utiliser un tel sondage pour suggrer quĠune majorit des
Franais est favorable aux privatisations (exemple tirer de Ç Les sondages
dĠopinion È, Repres nĦ38).
Le contexte dans lequel
est pos une question peut aussi faire varier les rponses : on voit ainsi
que, au lendemain dĠun crime dĠenfant particulirement horrible, le nombre de
partisans de la peine de mort augment nettement, pour retomber par la suite. On
peut donc choisir des moments plus ou moins favorables lĠobtention de la
rponse souhaite.
Enfin, lĠordre des questions
joue sur les rponses donnes selon un effet dit Ç effet de halo È.
Exemple : une premire question demande si Ç lĠarrive au pouvoir de
lagauche a eu des effets conomiques catastrophiques È et une deuxime
Ç voterez-vous pour la gauche au prochaines lections È. Dans ce cas, la 1re
question a un effet clairement inducteur sur la rponse donne la deuxime.
Il existe donc de nombreuses
faons dĠavantager dĠavance un terme du choix par rapport dans la phase
dĠlaboration des questions et des rponses possibles, dont le choix et lĠordre
ne sont nullement neutres. Ces techniques de manipulation sont particulirement
importantes dans la mesure o obtenir une rponse majoritairement positive un
sondage est devenu un argument fort dans le dbat politique.
Une
fois lĠchantillonnage effectu, il reste raliser lĠenqute concrtement.
Or, les enquteurs se heurtent de nombreuses difficults qui peuvent induire
des biais dans la composition de lĠchantillon ainsi que dans les rponses.
Le
premier problme est le problme classique des enqutes quantitatives reposant
sur des passations de questionnaire domicile : selon lĠheure laquelle
sĠeffectue lĠenqute, on a beaucoup plus de chance de trouver telle ou telle
catgorie socio-professionnelle. Une enqute effectue dans la journe donnera
un chantillon surreprsents en retraits, femmes au foyer, chmeurs,
tudiants et É concierges. LĠenquteur aura ainsi du mal trouver le nombre de
cadres, ouvrires, employs demands pour son chantillon. Une pratique
courante est alors, faute de trouver des Ç chefs de famille È en
nombre suffisant, de prendre lĠopinion dĠune pouse au foyer comme un fidle
reflet de lĠopinion du mari. Par ailleurs, les personnes vivant dans certains
lieux (hameaux isols, tages levs sans ascenseurs) seront sous-reprsents.
Une
autre source de biais importante provient de la relation dĠenqute elle-mme,
cĠest--dire la faon dont les enquts peroivent les questions quĠon leur
pose ainsi que lĠenquteur lui-mme. Dans certains cas, il peut tre assimil
un policier, un travailleur social, et cette perception peut veiller une
mfiance te modifier les rponses : on refusera ainsi de rpondre
certaines questions, par exemple de rattachement politique, ou bien on
nĠexprimera pas telle ou telle rponse dont on pense quĠelle sera mal vue. Un
bon exemple est ainsi les enqutes cherchant valuer lĠimportance du racisme,
qui reoivent des rponses trs diffrentes selon les formulations employes,
renvoyant plus ou moins directement au racisme, mais aussi selon les
caractristiques de lĠenquteur lui-mme (une tude amricaine montre ainsi que
sur ce sujet, les rponses sont trs diffrentes selon que lĠenquteur est
blanc ou noir). On peut ainsi supposer que les rponses ne seront pas les mmes
selon que lĠenquteur est un homme ou une femme, selon son ge, selon quĠil est
peru comme quelquĠun dĠun milieu social proche ou loign par lĠenqutÉ Alors
que dans une enqute de type qualitatif par entretien approfondi, cette
relation dĠenqute est analyse comme un composante de lĠtude, les enqutes
par sondages font par nature
lĠimpasse sur tous les biais quĠelle peut engendrer.
Enfin,
on constate quĠun enjeu important pour lĠenqut peut tre de ne pas perdre la
face : sĠil ne comprend pas quoi fait allusion la question, il peut trs
bien rpondre tout de mme la question pour ne pas dvoiler son ignorance. Le
CREDOC a mis en vidence ce phnomne en posant une question portant sur un
amendement imaginaire, Ç Avez-vous entendu parler de lĠamendement
Bourrier, concernant la Scurit Sociale ? È, question laquelle
entre 4 et 6% des personnes interroges rpondent oui. Cela montre que dans un
sondage, toute proposition, ft-elle imaginaire ou fantaisiste, est susceptible
de rencontrer un minimum dĠadhsion, car lĠenqut nĠest pas une machine
rpondre mais une personne prise dans un contexte social, ragissant non
seulement des questions mais un enquteur et lĠimage quĠil en a, et
capable de stratgies.
4. Le traitement des donnes.
Ce
terme recouvre deux pratiques de traitement des donnes, selon que lĠon souhaite
corriger un biais structurel de lĠchantillon ou un biais observ a posteriori
dans les rponses (typique des sondages politiques).