You are on page 1of 77

Mthodes de sondage - SOL3017

Notes de cours, deuxime partie L'chantillonnage La gestion du terrain

Dpartement de sociologie Universit de Montral

professeur : Claire Durand

Claire Durand 2002

Table des matires

1. Qu'est-ce qu'un chantillon, pourquoi un chantillon? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2. Les divers types d'chantillons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2.1 Lchantillon probabiliste: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 a) Il y a en gros deux faons de tirer un chantillon probabiliste. . . . . . . . . . . . . . . . . 2 b) La probabilit de slection peut tre gale ou ingale; elle peut dpendre de divers facteurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 c) Un chantillon peut tre stratifi, proportionnel ou non-proportionnel . . . . . . . . . . . . 3 d) Lchantillon peut tre tir par groupes dunits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 e) Un chantillon peut tre appari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 f) Les mthodes de tirage, de regroupement, de stratification peuvent tre combines en plusieurs tapes, degrs, etc. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.2 Lchantillon non-probabiliste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3. Marge d'erreur et taille requise de lchantillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 La distribution d'chantillonnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Le calcul de la marge d'erreur en fonction du seuil de confiance recherch . . . . . . . . . . . . . . 3.3 La dtermination de la taille de l'chantillon ncessaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4. chantillon thorique, chantillon de dpart, base de sondage et gestion de la collecte . . . . . . . . . . . 4.1 La validit des units slectionnes ou la qualit de la liste. . . . . . . . . . . . . . . . . . . . . . . . . 4.2 L'ligibilit des units slectionnes ou la qualit des personnes . . . . . . . . . . . . . . . . . . . . 4.3 Le taux de rponse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 L'chantillon thorique, l'chantillon de dpart et le rendement du plan chantillonnal . . . 4.5 La fraction de slection, le pas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 La pondration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7 Synthse des tapes suivre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. chantillonnage et planification des oprations; quelques principes de base . . . . . . . . . . . . . . . . . . . 5.1 La gestion du terrain- questionnaire par la poste: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 La gestion du terrain - questionnaire par tlphone: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 La gestion informatise du terrain - avantages et inconvnients . . . . . . . . . . . . . . . . . . . . . 5.4 Le droulement des oprations type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 8 9 12 12 12 13 14 14 15 17 19 20 21 22 23

6. La qualit des enqutes par sondage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 6.1 Les critres de qualit des sondages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 6.1.1 La base de sondage doit comprendre tous les lments de la population . . . . . . . 25 6.1.2 Les membres de l'chantillon doivent tre rejoints et accepter de rpondre . . . . . 26 6.2 Les facteurs qui influencent la qualit des sondages et le taux de rponse . . . . . . . . . . . . . . 27 6.2.1 Effets de la base de sondage et de la slection . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 6.2.2 Effet de la gestion du personnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 6.2.3 Effet du suivi de terrain . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 6.2.4 Des dterminants de la conduite des pratiques mthodologiques . . . . . . . . . . . . . 29 6.3 Exemples : lestimation de lintention de vote . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 6.3.1 La question des non rejoints et de leur possible intention de vote, lments de rflexion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 6.3.2. Leffet des facteurs mthodologiques sur la qualit de lestimation des intentions de vote : La non-rponse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Rfrences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Appendice 1 Exemples de stratgies dchantillonnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 Exemple 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Exemple 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Appendice II Petits problmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Exercices partir des donnes dun sondage Som publi par La Presse les 8 et 9 mars 1997 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Appendice lII Les divers types de documents et de rapports . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A. Proposition de service: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B. Rapport de pr-test: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C. Rapport mthodologique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D. Plan de code . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E. Rapport d'analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 59 60 62 63 64

Appendice IV C. Durand et S. Vachon (1997), La gestion des appels et lutilisation de logiciels ITAO par les firmes de sondage prives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 3

1. Qu'est-ce qu'un chantillon, pourquoi un chantillon? Un chantillon est constitu ds que l'on slectionne un nombre restreint d'units partir d'une population d'units. Cette population doit tre dfinie de telle manire que l'on peut toujours savoir si une unit fait partie de la population. Pourquoi chantillonner - rduire les cots; - assurer un meilleur contrle des oprations et une surveillance plus rigoureuse; - acclrer la cueillette et le traitement des donnes; - long terme, rduire le fardeau des informateurs. Note: "Les chercheurs universitaires effectuent souvent des sondages auprs des tudiants qui suivent des cours magistraux en grands groupes. La facilit et le cot moindre d'une telle mthode expliquent sa popularit mais elle donne rarement des rsultats d'une quelconque valeur. Ce type de mthode peut servir pour un pr-test mais ne devrait pas tre utilis pour une tude visant dcrire la population tudiante." Babbie, E. (1977) Survey research methods. p. 108 Dfinitions: La population est donc constitue de lensemble des units auxquelles les rsultats de l'enqute s'appliqueront. La base dchantillonnage ou base de sondage est constitue par la liste des units d'chantillonnage (liste matrielle ou conceptuelle), c'est--dire liste des units partir de laquelle se fera la slection. Cette liste doit constituer la meilleure approximation possible de la population : Chaque membre de la population doit y apparatre une fois et une seule fois. Exemple: Si je prends les diplms de bacc, matrise et doctorat des cinq dernires annes, certaines personnes peuvent apparatre deux ou mme trois fois dans la liste, i.e. en tant que diplms de 1 er, 2 me et 3 me cycle; elles auront donc plus d'une chance d'tre choisies; je devrais donc purer la liste de toutes les doubles ou les triples entres avant de tirer l'chantillon. Lunit d'chantillonnage est constitue de chaque "membre" de la base dchantillonnage. Elle renvoie au niveau auquel se fait l'chantillonnage; l'unit d'chantillonnage peut tre un mnage (un appartement ou un numro de tlphone), une cole, un lot, un tudiant. A diffrencier de : - Lunit d'analyse - le niveau sur lequel porte l'analyse; on slectionne des mnages mais lanalyse porte sur des individus - Lunit dclarante - celle relative l'informateur qui donne des informations sur dautres personnes; par exemple, une mre interroge sur ses enfants. - Lunit de rfrence - celle sur laquelle on demande des informations; par exemple, les enfants pour lesquels la mre a donn des informations.

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 1

2. Les divers types d'chantillons Aprs avoir constitu la base de sondage, la deuxime tape consiste dterminer la meilleure faon dchantillonner. Plusieurs stratgies soffrent nous. Il faut dterminer laquelle sera la plus efficiente tout en permettant de gnraliser la population. 2.1 Lchantillon probabiliste:

6 Chaque unit doit avoir une probabilit connue d'tre choisie. Cette probabilit ne peut pas tre nulle mais elle nest pas ncessairement gale pour toutes les units. 6 Cette probabilit ne doit pas dpendre de circonstances entranant un biais (Ex. personnes rpondant habituellement au tlphone)
Pourquoi utiliser un chantillon de type probabiliste? - permet l'utilisation de mthodes d'estimation et de mthodes d'infrence et d'analyse statistique qui toutes sont bases sur la thorie des probabilits. - permet de connatre et donc de contrler les biais. Type d'chantillons probabilistes: a) Il y a en gros deux faons de tirer un chantillon probabiliste. - le tirage alatoire simple C'est le hasard pur, l'quivalent de tirer des noms d'un chapeau ou du tirage au hasard la loterie. Pour le raliser, concrtement, il faut avoir une liste de la population la base dchantillonnage-- et numroter chaque unit de la liste; ensuite, il faut soit utiliser une table de nombres alatoires qui dterminera quelles units sont choisies ou, si on a une liste sur fichier informatique, utiliser une procdure informatique (BASIC, PASCAL, SPSS, etc.). - le tirage alatoire systmatique : Il s'agit ici de tirer seulement la premire unit de la liste au hasard, et de prendre ensuite les units un intervalle prdtermin (une unit toutes les X units). Il faut faire ou avoir une liste - au moins conceptuelle - de la population et donc savoir combien d'units elle comprend. Il faut ensuite dterminer lintervalle en fonction du nombre d'units requises dans l'chantillon et dterminer au hasard la premire unit. Pour procder, on choisit la premire unit et on choisit ensuite les units en en prenant une tous les intervalles. Ainsi, si lintervalle est de 10 et que le nombre choisi au hasard est 7, on prendra les units suivantes : 7, 17, 27, 37,... Note : La liste ne doit pas avoir un ordre qui pourrait entraner un biais : Par exemple, si j'chantillonne un logement sur trois dans un lot o il n'y a que des triplex, je n'aurais dans l'chantillon que des personnes vivant au rez-de chausse -- et relativement plus de proritaires -- ou que des personnes vivant au deuxime tage et plus de locataires... b) La probabilit de slection peut tre gale ou ingale; elle peut dpendre de divers facteurs. Si lchantillon est probabilit gale, chaque unit a exactement la mme probabilit dtre choisie. Par contre, dans lchantillon probabilit ingale, la probabilit de slection pourrait dpendre, par exemple, de la frquence doccupation dun lieu, du chiffre daffaires de lentreprise, du nombre dlves dans ltablissement. Concrtement, je peux faire un chantillon des commissions scolaires au Qubec o chacune delles, quelque soit sa taille, a la mme probabilit dtre choisie. La commission scolaire de Montral (CSDM) aurait donc la mme probabilit dtre dans lchantillon que celle de la Basse Cte nord. Par contre, dans un chantillon probabilit ingale, la probabilit dtre dans lchantillon tant fonction du nombre dtudiants, la CSDM aurait nettement plus de chance dtre dans lchantillon que

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 2

toute autre commission scolaire au Qubec.

chantillon alatoire simple probabilits gales, illustration tire de Dussaix et Grosbras (1994):

m m

c) Un chantillon peut tre stratifi, proportionnel ou non-proportionnel - chantillon stratifi On parle d'chantillon stratifi lorsque la fraction de slection diffre en fonction de certaines caractristiques de la population (sexe, rgion, statut, ge, etc.). On stratifie pour permettre que toutes les catgories de la population qui nous intressent soient reprsentes en nombre suffisant. Le tirage de lchantillon proprement dit peut tre alatoire simple ou systmatique mais se fait indpendamment pour chacune des sous-populations (strates) dfinies. La stratification est un regroupement des units de la base de sondage en sections relativement homognes appeles strates. Lchantillon final est compos dchantillons prlevs indpendamment dans chacune des strates.... On a recours la stratification pour rduire lerreur dchantillonnage,... pour permettre un meilleur contrle des cots, pour avoir des estimateurs par strate,... Dussaix et Grosbras, 1994). Les chantillons stratifis peuvent tre proportionnels, cest--dire que lon tire proportionnellement le mme nombre dunits dans chaque strate; il sagit alors de sassurer dune bonne reprsentation proportionnelle des strates. Ils peuvent tre non-proportionnels, cest--dire que certaines strates sont sur-reprsentes par rapport leur proportion relle dans la population. Il sagit alors de sassurer davoir un chantillon suffisant dans chaque strate. Ainsi, les chantillons utiliss pour les sondages lectoraux au Qubec sont peu prs toujours des chantillons stratifis non-proportionnels. Un exemple typique est la rpartition en deux strates, une pour la rgion mtropolitaine de Montral, et une pour le reste du Qubec. Lchantillon est constitu de telle sorte que les deux strates soient peu prs de mme taille. En procdant ainsi, on gonfle lchantillon de Montral ce qui permet davoir une meilleure reprsentation de la diversit des points de vue et des origines (plus danglophones et dallophones dans lchantillon). En plus, on rduit les cots puisquil y a moins dappels interurbains faire (moins dappels en province).

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 3

chantillon alatoire stratifi non-proportionnel, illustration tire de Dussaix et Grosbras (1994) :

m m

m m

d) Lchantillon peut tre tir par groupes dunits - chantillon par grappes - arolaire Il sagit ici de slectionner des ensembles (units collectives du type units de recensement, pts de maison, coles, classes). Dans l'chantillonnage par grappes, on slectionnera un certain nombre d'units puis les units contigus (grappes). Dans l'chantillonnage arolaire, on slectionne directement les ensembles. La base dchantillonnage arolaire est constitue de la liste des units collectives partir desquelles la slection se fera. Ainsi, par exemple, un chantillon en grappes serait constitu si on slectionnait au hasard un certain nombre dtudiants de luniversit et quensuite, on constitue lchantillon en prenant tous les tudiants qui suivent un cours en mme temps que chacun des tudiants slectionns. Chaque groupe dtudiants suivant les cours choisis est une grappe. Dans un chantillon arolaire, je slectionne les groupes dtudiants partir dune liste de cours. Chaque unit est constitue par lensemble des tudiants suivant les cours choisis.

chantillon par grappes, illustration tire de Dussaix et Grosbras (1994) :

m m

m m

m m m m

m m

m m

m m

m m m m

m m m m m m

m m

m m

m m

e) Un chantillon peut tre appari. - chantillon appari : Il s'agit de slectionner des chantillons de telle sorte qu'il y ait une

relation deux deux entre les membres des deux chantillons au plan des caractristiques ou de certaines relations. Exemple : un chantillon d'tudiants, un chantillon constitu des parents des tudiants slectionns et un autre constitu des professeurs des mmes tudiants. L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 4

f) Les mthodes de tirage, de regroupement, de stratification peuvent tre combines en plusieurs tapes, degrs, etc.
- Toute combinaison de ces mthodes (plusieurs degrs, plusieurs phases) - plusieurs phases: slection d'units, prise d'information, slection sur la base des informations prises, nouvelle prise d'information, ... - plusieurs degrs: slection de commissions scolaires, d'coles l'intrieur des Commissions scolaires, d'lves et ou d'enseignants l'intrieur des coles. Le cas classique de l'chantillonnage plusieurs degrs est celui de l'chantillonnage pour les sondages tlphoniques auprs de la population. On slectionne un mnage (reprsent par un numro de tlphone) et ensuite, une personne l'intrieur du mnage au moyen d'une grille de slection au hasard.

chantillon deux ou plusieurs degrs, illustration tire de Dussaix et Grosbras (1994) :

m m

m m

m m

On devra recourir une hirarchie de bases dchantillonnage: Il peut y avoir des bases plusieurs niveaux lorsque l'on a une stratgie en plusieurs phases ou plusieurs degrs. Par exemple, il y aura au premier niveau une liste de numros de tlphone partir duquel sera tir un chantillon renvoyant aux mnages. Au deuxime niveau, lintrieur des mnages choisis, il y aura une liste des membres du mnage partir de laquelle on choisira au hasard la personne qui rpondra au sondage.

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 5

2.2 Lchantillon non-probabiliste: - Lchantillon raisonn - au jug : Slectionne les "units considres caractristiques" du phnomne l'tude. Souvent utilis en mthodologie qualitative, ce type d'chantillon pourrait tre justifi pour une tude en sociologie au premier niveau de slection. Il sagit ici de choisir des units (quartiers, lots, coles,...) en fonction de certaines caractristiques. L'chantillonnage l'intrieur de chacune des grandes units se fait ensuite au hasard. On ne peut alors gnraliser qu'aux units choisies. L'avantage consiste permettre de recueillir des caractristiques objectives des grandes units. Par exemple, il pourrait tre justifi de choisir des pts de maison (ilots) types en fonction dun certain nombre de caractristiques de composition sociale que lon veut contrler. Par la suite, on effectue une slection au hasard des units dhabitation dans chaque lot. - Lchantillon par quota : Il sagit ici de dterminer le nombre de personnes possdant chaque caractristique de base que l'on veut dans l'chantillon et darrter de recueillir les donnes ds que ce nombre (le quota) est atteint. (Exemples: focus group, chantillon par quota "standard"). L'chantillonnage par quota, encore pratiqu par certaines firmes de sondage, a t longtemps le principal mode d'chantillonnage. Strictement parlant, il ne permet pas l'infrence statistique et il est moins fiable en ce sens que les rsultats sont plus variables dun chantillon lautre (voir Vachon, Durand et Blais, 1999). Ce type dchantillon est pratiquement le seul utilis par les firmes de sondage dans plusieurs pays dEurope, des considrations techniques, pratiques et sociologiques ayant retard lutilisation dchantillons probabilistes. - chantillon de volontaires : "Chercheur conduisant une tude sur ... cherche volontaires pour participer une exprience; Centre de recherche sur le syndrome pr-menstruel cherche femmes pour participer... si vous avez un ou plusieurs des symptmes suivants, prire de communiquer avec nous....". En aucun cas, l'chantillonnage de volontaires ne peut tre considr comme reprsentatif d'une population. On l'utilise uniquement lorsque l'on peut prtendre que les phnomnes tudis sont intra-individuels et universels, lorsque l'on tudie des processus pour eux-mmes.

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 6

3. Marge d'erreur et taille requise de lchantillon La troisime tape du processus consiste dterminer la taille de lchantillon ncessaire pour sassurer dune fiabilit acceptable des donnes. Les notions de distribution dchantillonnage et de marge derreur sont essentielles pour dterminer cette taille. 3.1 La distribution d'chantillonnage Il y a trois types de distributions: Deux sont bien connues: - La distribution dun chantillon laquelle sont associes des statistiques moyenne de l'chantillon : X 6 cart-type de l'chantillon : s variance de l'chantillon : s2 - La distribution de la population laquelle sont associs des paramtres moyenne de la population : : cart-type de la population : F variance de la population : F2 - Si on prenait tous les chantillons que l'on peut tirer d'une mme population, on obtiendrait une distribution des chantillons, distribution laquelle sont associes les statistiques de la distribution d'chantillonnage: La moyenne des chantillons : Elle s'approche de la moyenne de la population avec l'augmentation du nombre d'chantillons. n Lerreur-type (s/%6) est lcart-type de la distribution des moyennes des chantillons. Pour une proportion, l'erreur-type=

Quelque soit le type de distribution de la population, la distribution des moyennes des chantillons tirs de la population tendra vers une distribution normale avec l'augmentation du nombre d'chantillons tirs. Cette distribution aura une moyenne : et une variance de F2/N : C'est le thorme central limite. CECI CONSTITUE LA BASE DE TOUTES LES STATISTIQUES INFRENTIELLES.

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 7

3.2 Le calcul de la marge d'erreur en fonction du seuil de confiance recherch - SEUIL DE CONFIANCE " La probabilit qu'un chantillon reprsente bien une population, tant donn les lois des probabilits se nomme le seuil de confiance: C'est la certitude que l'on a quant la justesse des rsultats. Le critre que l'on retient habituellement est de 95%, c'est--dire que si on prend plusieurs chantillons d'une mme population, 19 fois sur 20 (95% des fois) l'chantillon constituera une reprsentation fidle de cette population. Cette proportion correspond 1,96 cart-type sur la courbe normale. Cette valeur est le Z", cest--dire la surface sous la courbe normale pour 1-" (i.e. ,95). Si lon dsirait un seuil de confiance plus grand, 99% par exemple, cette proportion correspondrait un Z" de 2,58 alors qu linverse, un seuil de confiance de 90% correspond un Z" 1,67. - MARGE D'ERREUR - INTERVALLE DE CONFIANCE : La marge d'erreur, c'est la prcision du rsultat obtenu tant donn le seuil de confiance que l'on est prt accepter. La marge d'erreur est alors gale Z" erreur-type et la formule est la suivante:

o et

Z" est la surface o l'on retrouve 1-" de la courbe normale (Z") et donc 1,96 lorsque le seuil de confiance accept est de 95%, p est la proportion de personnes ayant le comportement dont on estime la prcision, n est la taille de l'chantillon.

Lorsque la population est infinie (plus grande que 20 fois "n") et que la proportion est maximale (.5), cette formule est quivalente 1/%n. 6

6 D'o la note dans la prsentation des rsultats de sondage tirs d'chantillon d'environ 1000 personnes:
La marge d'erreur maximale est de 3,1% i.e 1/%6666 ou 1000

et ce 19 fois sur 20 (i.e dans 95% des cas) Note 1: On calcule habituellement pour les sondages la marge derreur maximale, cest--dire celle qui correspond une proportion de ,5. Cest en effet quand la population se divise moiti moiti que la marge derreur des rsultats est la plus grande. Par contre, pour chacun des rsultats prsents, il est possible de calculer la marge derreur spcifique. Pour ce faire, il suffit dutiliser la formule prsente. Si la proportion dont on veut estimer la marge derreur est de 32%, il suffit de remplacer (,5*(1-,5)) par (,32*(1-,32)), ce qui donne (,32*,68) L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 8

Note 2: Il y a une relation entre la certitude (le seuil de confiance) et la marge derreur. On peut constater que plus on veut une grande certitude, plus la marge derreur est grande et moins l'estimation apparat prcise; par contre, moins la certitude est grande, plus l'estimation apparat prcise. - Lorsque la population est "finie" i.e. moins que 20 fois l'chantillon, on ajoute ce qu'on appelle une correction pour chantillon fini. La formule de la marge d'erreur devient la suivante:

Z" est la surface o l'on retrouve 1-" de la courbe normale (Z") et donc 1,96 lorsque le seuil de confiance accept est de 95%, p est la proportion de personnes ayant le comportement dont on estime la prcision, n est la taille de l'chantillon,

et

N est la taille de la base chantillonnale.

Ainsi, pour un chantillon de 1000 personnes et une base chantillonnale comprenant 6,800 noms, une seuil de confiance de 95% et une proportion maximale (,5), on aurait lquation suivante:

ce qui donne 2,86% (plutt que 3,1% sil sagissait dun chantillon provenant dune population infinie). Lintervalle de confiance dune proportion est gal cette proportion la marge derreur. Ainsi pour lexemple prcdent, la marge derreur est de 50% 2,86, cest--dire que la proportion dans la population se situe vraisemblablement entre 47,14% et 52,86%. Cest ce quon appelle lintervalle de confiance.

3.3 La dtermination de la taille de l'chantillon ncessaire : C'est sur la mme formule, la formule de la marge d'erreur pour population infinie, que l'on se base pour, l'inverse, dterminer la taille de l'chantillon ncessaire pour obtenir la prcision voulue (marge d'erreur), au seuil de confiance dtermin, pour une proportion maximale (ou loccasion pour une proportion spcifique connue).

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 9

Pour connatre la taille "n" ncessaire pour avoir une marge d'erreur dtermine pour une proportion dtermine un seuil de confiance ", il suffit d'inverser l'quation de la marge d'erreur. Pour une population infinie, la formule sera donc la suivante:

o et

Z" est la surface o l'on retrouve 1-" de la courbe normale (Z") et donc 1,96 lorsque le seuil de confiance accept est de 95%, p est la proportion de personnes ayant le comportement dont on estime la prcision, e est la marge derreur que lon est prt accepter en dcimales i.e 2% sinscrit ,02.

Dans le cas d'une proportion maximale de 50% (,5), dun seuil de confiance de 95% et d'une marge d'erreur accepte de 5% (,05), on aura le calcul suivant:

Il faut donc un minimum de 384 rpondants pour avoir une marge derreur maximale de 5% un seuil de confiance de 95%. Si la proportion attendue du comportement tait de 45% et que l'on acceptait une marge d'erreur assez faible telle 2%, les rsultats seraient les suivants :

Il faudrait au moins 2377 rpondants pour obtenir une marge derreur aussi faible. On voit que le nombre d'units ncessaire augmente trs vite lorsque l'on veut rduire substantiellement la marge d'erreur, surtout lorsque la population est rpartie relativement galement en deux groupes. Plus la proportion est faible, moins il faut d'units pour obtenir une marge d'erreur acceptable. Ainsi, si la proportion est de 10% et que l'on accepte une marge d'erreur de 2%, l'chantillon ncessaire est de 864.

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 10

Tout comme pour la marge derreur, il existe galement une formule qui permet de corriger pour les populations finies, cest--dire lorsque lon peut penser que lchantillon sera plus grand que un vingtime (1/20) de la population. Voici la formule. Elle peut paratre complexe mais il suffit de mettre les bons chiffres au bon endroit et de faire les calculs!

Z" est la surface o l'on retrouve 1-" de la courbe normale (Z") et donc 1,96 lorsque le seuil de confiance accept est de 95%, p est la proportion de personnes ayant le comportement dont on estime la prcision, e est la marge derreur que lon est prt accepter en dcimales i.e 2% sinscrit ,02,

et

N est la taille de la base chantillonnale.

Note: Le tableau I en appendice donne les rsultats approximatifs de ces calculs pour diverses proportions et marges d'erreur avec un seuil de confiance de 95%. On peut galement consulter diffrents sites sur Internet qui donne le rsultat de ces calculs. Il suffit alors de savoir quel chiffre mettre quel endroit! Note: A laide de ces formules, on aura dtermin la taille de l'chantillon final que lon appelle aussi lchantillon thorique que l'on veut obtenir. Cet chantillon serait quivalent l'chantillon de dpart dans un monde parfait, c'est--dire un monde o les listes ne comportent aucune erreur, tout le monde peut tre rejoint, est disponible, en bonne sant et intress ma fabuleuse enqute. Mais... la vie n'est pas parfaite, d'o les pages suivantes.

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 11

4. chantillon thorique, chantillon de dpart, base de sondage et gestion de la collecte Aprs avoir dtermin lchantillon thorique ncessaire, il faut dterminer combien dunits de dpart il est ncessaire de tirer pour obtenir le nombre thorique voulu. Ceci constitue la quatrime tape du processus. La qualit de la liste de mme que l'ligibilit des units inscrites sur la liste entranent ncessairement que lon doive tirer plus dunits dans lchantillon de dpart pour obtenir lchantillon thorique. Par contre, on parlerait linverse de biais de la liste lorsque l'on estime que certaines units qui font partie de la population tel que dfinie n'apparaissent pas dans la liste (Exemple : numros de tlphones confidentiels ou nouveaux abonns dans une liste prise dans le bottin tlphonique). 4.1 La validit des units slectionnes ou la qualit de la liste. Il s'agit ici de tenir compte des erreurs et des imperfections de la liste utilise comme base d'chantillonnage. Les units non valides sont celles qui ne devraient pas figurer sur la liste si celle-ci tait jour et sans erreur et pouvait correspondre parfaitement la population. Lorsque l'on utilise le GANT , cest--dire la gnration alatoire de numros de tlphones (RDD pour random digit dialing en anglais) pour gnrer des numros de tlphone au hasard (en utilisant un programme informatique), une certaine proportion des numros ainsi gnrs ne sont pas attribus (Pas de service), sont des lignes FAX, DATA, commerciales (Non rsidentiel). L'ensemble des numros non-attribus et non-rsidentiels constituent des numros non-valides. En fait, quelque soit la base chantillonnale, il y a habituellement une proportion de la base qui est non-valide. On doit estimer cette proportion de faon dterminer le plus prcisment possible l'chantillon de dpart requis. De mme, dans un sondage auprs des tudiants, les tudiants qui ont abandonn leurs tudes mais qui sont encore sur la liste seront considrs non-valides : si la liste tait jour, leurs noms n'y apparatraient pas. 4.2 L'ligibilit des units slectionnes ou la qualit des personnes En fonction de la dfinition de la population et de la base chantillonnale choisie, certaines units peuvent tre considres comme non-ligibles. Ainsi, si la population d'intrt est dfinie comme l'ensemble des personnes de 18 ans et plus pouvant conduire une entrevue de 10 minutes en franais ou en anglais, les personnes ne pouvant converser en franais ou en anglais (problme de langue), les personnes malades ou confuses (Age, maladie) seront considres comme tant des units valides mais non-ligibles. De mme, les personnes n'ayant pas droit de vote sont non-ligibles dans un sondage sur l'intention de vote. De mme, si la population est dfinie comme celle des jeunes de 18 29 ans, les personnes de moins de 18 ans et de plus de 29 ans seront considres comme non-ligibles. Dans ce cas, on devra estimer la proportion des mnages comprenant un jeune de 18 29 ans, cest--dire lincidence dans la population. Lligibilit, cest--dire la proportion des ligibles sur l'ensemble des ligibles et des non-ligibles et donc sur lensemble des units valides, doit tenir compte de lincidence lorsque lon chantillonne un sous-ensemble dune population. L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 12

Le taux d'ligibilit dans un sondage auprs de lensemble de la population est habituellement d'environ 95%. Le taux dincidence varie en fonction de la population ltude. 4.3 Le taux de rponse Parmi les personnes ligibles, certaines ne pourront pas tre rejointes pour diverses raisons: Dans le cas des sondages auprs des mnages, on classe habituellement les non-rponses de la faon suivante: refus du mnage: La personne qui rpond au tlphone ou la porte refuse que l'on fasse la slection ou refuse de nous permettre de parler la personne slectionne. refus de la personne: La personne slectionne refuse de rpondre au questionnaire. pas de rponse: Personne ne rpond aprs plusieurs appels tlphoniques ou visites effectus diffrentes heures. absence prolonge: La personne slectionne est absente pour la dure de la collecte des donnes (partie en voyage, en vacances, etc.). incomplet: La personne slectionne a t rejointe et l'entrevue commence mais l'entrevue n'a pas pu tre complte avant la fin de la priode de cueillette. Dans les sondages tlphoniques, on vise un taux de rponse (nombre de questionnaires complts divis par le nombre d'units ligibles) de plus de 60%. Dans le cas des sondages postaux, l'absence de retour de questionnaire et le retour de questionnaires non remplis sont considrs comme des non-rponses. Les mauvaises adresses sont habituellement considres comme non-valides. Dans les sondages postaux, un taux de rponse d'environ 50% (nombre de questionnaires retourns complts divis par le nombre d'units ligibles) devrait tre vis. Si on peut difficilement contrler le taux de validit et le taux d'ligibilit, le contrle du taux de rponse constitue le centre mme de tous les efforts dans le droulement d'un sondage puisque, si le taux de rponse est trop bas, on pourrait penser que ceux qui ne rpondent pas ont des caractristiques particulires susceptibles de modifier les rsultats. On parle alors de biais de non-rponse. Pour estimer les diffrents taux (de validit, dligibilit, de rponse) en vue de dterminer lchantillon de dpart, on recueille les informations aux sources disponibles. Un fournisseur dchantillon de numros de tlphone pourra habituellement nous indiquer la validit des numros fournis. Dautres sondages raliss par des moyens similaires auprs de populations similaires nous donneront des indications sur la validit, lligibilit, le taux de rponse quil est possible datteindre. Les donnes statistiques (StatCan, ISQ, etc) nous permettront destimer lincidence.

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 13

4.4 L'chantillon thorique, l'chantillon de dpart et le rendement du plan chantillonnal L'chantillon de dpart ncessaire se calcule en prenant l'chantillon thorique (c'est--dire la taille d'chantillon que l'on vise obtenir lorsque l'enqute sera termine) que l'on multiplie par l'inverse des taux de validit, d'ligibilit et de rponse estims. La formule est la suivante:

o et

ndpart est le nombre d'units que je devrai tirer dans la base chantillonnale, nthorique est l'chantillon thorique, le nombre d'units sur lesquelles je veux que l'analyse porte, les diffrents taux sont en dcimales (i.e. 0,6 pour 60%).

Exemple: Si et le taux de rponse prvu est de 60% (,6), le taux d'ligibilit est de 95% (,95), le taux de validit de 80% (,80)

et si je dsire avoir un chantillon thorique de 384 rpondants (marge d'erreur de 5% pour une proportion de ,50 avec un seuil de confiance de 95%), Je ferai le calcul suivant:

Je peux donc valuer que je dois tirer 842 units de la base chantillonnale pour obtenir un chantillon thorique de 384 rpondants dans les conditions cites plus haut. L'ensemble des facteurs mentionns plus haut (validit, ligibilit/incidence et taux de rponse) amne parler du rendement du plan chantillonnal, c'est--dire la proportion attendue de questionnaires complts tant donn l'chantillon de dpart. Ce nombre peut tre trouv en divisant l'chantillon thorique (celui que l'on veut obtenir) par l'chantillon de dpart. On dira que le rendement prvu du plan chantillonnal est de 384/842, c'est--dire 45,6%. On obtiendrait le mme nombre en multipliant le taux de rponse par le taux de validit et par le taux d'ligibilit (0,6*0,95*0,8=0,456). 4.5 La fraction de slection, le pas ou lintervalle Une fois que nous avons toutes les informations en main, soit la base chantillonnale et une estimation de lchantillon de dpart ncessaire, il ne reste plus qu dterminer la fraction de L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 14

slection ou, linverse, le pas ou lintervalle de slection. La fraction de slection est la relation entre l'chantillon de dpart et la base chantillonnale

Une fraction d'chantillonnage de 1/10 indique que l'on doit tirer une unit de la base chantillonnale toutes les 10 units. La fraction de slection indique aussi le rapport entre l'chantillon ligible et valide et la population (voir pondration). On utilise aussi la notion de "pas" ou d'intervalle. Il s'agit de l'inverse de la fraction d'chantillonnage:

Donc, une fraction de 1 sur 10 correspond un pas de 10, ce qui veut dire que je dois chantillonner une unit de la base chantillonnale toutes les 10 units. On utilise habituellement le pas parce quon cherche une fraction "entire". On ne veut pas prendre une personne sur 2,7 personnes, ce qui est trs difficile faire, mais une personne sur 3 (on arrondit habituellement au nombre entier suivant. Toutefois lorsque l'chantillon est fait au moyen d'une procdure informatique, les fractions avec dcimale peuvent tre utilises la plupart du temps. Dans le processus pour prciser lensemble de ces oprations, certains allers-retours sont parfois ncessaires. Ainsi, on estimera dans un premier temps que lintervalle requis est de 9,8. Comme on veut arrondir pour tre en mesure de tirer lchantillon, on dcidera dun intervalle de 10. On recalculera alors lchantillon de dpart (N de la base divis par 10) et donc, par la suite, lchantillon thorique et la marge derreur. Il ne faut pas oublier galement que dans le cas dun chantillon stratifi, on fera plusieurs sous-chantillons avec des fractions de slection diffrentes et que lon devra donc faire les calculs pour chacune des strates. 4.6 La pondration Ltape de la pondration arrive aprs la cueillette de donnes. Elle est ncessaire... ... lorsque les fractions de slection varient selon certaines caractristiques de dpart (chantillon stratifi), ... lorsque les taux de rponse varient en fonction de certaines caractristiques importantes que l'on peut et veut contrler, ... lorsque l'on veut faire une estimation s'appliquant la population de rfrence, Les rsultats sont pondrs en fonction des informations que l'on a de faon ce que les rsultats refltent le poids rel de chaque unit dans la population. L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 15

Le rapport entre le nombre d'units ligibles et la population dfinie est le mme que le rapport entre l'chantillon de dpart et la base chantillonnale. En pondrant, je cherche estimer la population des units auxquelles je veux gnraliser mes rsultats. Les poids que l'on doit appliquer sont les suivants: - Poids d'chantillonnage: inverse de la fraction de slection ou "pas". - Poids de non-rponse: inverse du taux de rponse Mnages et individus Remarque 1: Notons que lorsque l'on slectionne via un chantillon correspondant des mnages (units de slection) et que l'enqute vise des individus (units d'analyse), il faut procder une slection l'intrieur des mnages. Des grilles de slection bases soit sur l'ge seul (grille de Kish), soit sur l'ge et le sexe (Troldahl-Carter), soit sur la date de naissance (non recommande), sont utilises. Par la suite, on appliquera automatiquement un poids gal au nombre de personnes dans le mnage o l'individu a t slectionn; il s'agit du poids de slection dans les mnages. Remarque 2. Lorsque l'on effectue une slection dans les mnages, on utilise habituellement un facteur de correction de 1.1 pour tenir compte de ce mode de slection. Ce facteur s'applique autant la formule de dtermination de la taille qu' la formule de dtermination de la marge d'erreur. Au cours des dernires annes, des mthodes statistiques trs raffines se sont dveloppes pour tenir compte des biais entrans par les divers modes de slection. Redressement On effectue aussi parfois un redressement lorsque, aprs pondration, on s'aperoit que la rpartition selon certaines caractristiques importantes dans l'chantillon final pondr s'carte encore significativement de la rpartition dans la population. poids de redressement: poids qu'il faut appliquer pour que chaque catgorie d'intrt soit reprsente en fonction de son poids rel dans la population

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 16

4.7 Synthse des tapes suivre: 1. Trouver les informations sur la base chantillonnale. 2. Dterminer le mode dchantillonnage qui sera utilis (mode de tirage, de collecte, stratification, etc.) 3. Dterminer la taille de l'chantillon thorique ncessaire ( partir des informations disponibles sur l'incidence du comportement ainsi que de la prcision et du seuil de confiance voulus). Il peut sagir de plusieurs sous-chantillons dans le cas dun chantillon stratifi. 4. Estimer le taux de non-rponse attendu, le taux dligibilit (incluant le taux dincidence le cas chant) et le taux de validit de la liste. Dterminer la taille de l'chantillon de dpart requis en fonction de ces informations. 5. Dterminer la fraction de slection (chantillon de dpart requis divis par N de la base chantillonnale) ou le pas (N de la base chantillonnale divis par l'chantillon de dpart requis). Le pas est l'inverse de la fraction de slection. A partir de ces informations et des rsultats finaux, on pourra dterminer les poids appliquer pour la pondration de base. A partir d'informations complmentaires sur la population on dterminera les poids de redressement.

Note: voir en appendice II des problmes permettant de vrifier lacquisition des connaissances.

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 17

Population

Base chantillonale
N de la liste qualit de la liste

chantillon
n dpart taux de validit n valide taux dligibilit et taux dincidence n ligible taux de rponse n rpondants
(n thorique, n attendu)

N valide

N valide Qualit des individus

N ligible


(pondration)

disponibilit et coopration des indiv.

MARGE DERREUR

SEUIL DE CONFIANCE

Informations provient de StatCan, etc.

Information empirique Bottin, liste de membres, etc.

Taux de rponse = n rpondants effectifs n ligibles Taux dligibilit = n units ligibles n units valides Taux de validit = n units valides n de dpart Rendement du plan dchantillonnage = Taux de rponse x Taux dligibilit x Taux de validit ndpart = nthorique x 1/ %rep x 1/ %lig x 1/ %valid f = n dpart N liste pas = N liste = N population n dpart n valide

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 18

5. chantillonnage et planification des oprations; quelques principes de base Les taux de validit, d'ligibilit et de rponse affectent de faon importante les ressources que l'on doit affecter la conduite des oprations de cueillette des donnes. Les taux de validit et d'ligibilit dpendent de la base chantillonnale choisie, de la qualit de cette base et de l'adquation entre la base et la population tudie. Le taux de rponse dpend de plusieurs facteurs qui sont plus fortement sous le contrle du chercheur et qu'il faut contrler pour des raisons tant thoriques que pratiques. Si un faible taux de personnes ligibles rpond l'enqute, il est plausible de penser que les personnes qui n'ont pas rpondu ont des caractristiques diffrentes, pensent diffremment des personnes qui ont rpondu. Un taux de rponse faible entache fortement la crdibilit des rsultats. Par ailleurs, un taux de rponse faible cote cher en temps et en argent. Il faut donc planifier le droulement des oprations et former le personnel de faon amener le taux de rponse au niveau le plus lev possible et faire tous les efforts possibles pour rejoindre toutes les personnes qui font partie de l'chantillon. Quelque soit la mthode d'enqute choisie, il faut s'assurer d'tre en mesure de contrler le taux de rponse et donc de recueillir toute l'information pertinente (nombre de questionnaires distribus, nombre de mauvaises adresses, nombre d'lves absents,...). Ces informations sont essentielles pour faire le rapport mthodologique

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 19

5.1 La gestion du terrain- questionnaire par la poste: - Mthodes pour rduire le taux de non-rponse: 1) prsentation, "facture" gnrale du questionnaire - prsentation de forme cahier - qualit de l'impression - prsentation soigne en premire page - rassurer le rpondant sur la confidentialit; gagner sa coopration en suscitant son intrt pour la recherche. - s'identifier et donner au rpondant un moyen de nous rejoindre (Nom et numro de tlphone) 2) Rappels: - planification de rappels postaux, de prfrence uniquement ceux qui n'ont pas renvoy le questionnaire (lorsqu'il est possible de les identifier sans qu'il y ait bris de confidentialit) : Minimum de deux rappels, un aprs 15 jours et un second 10 jours plus tard. - Note: on peut penser des rappels visibles (Carte postale rose, etc.) - Lorsque les numros de tlphone sont disponibles, planification de rappels tlphoniques (y compris possibilit de remplir le questionnaire au tlphone), plus efficaces que les rappels crits. Taux de validit et d'ligibilit: - Attention la qualit des listes qui servent de base d'chantillonnage et l'adquation liste-population - Problmes les plus frquents: Erreurs de transcription des adresses. On ne doit pas hsiter vrifier les adresses par d'autres moyens que ceux prvus au dpart et rexpdier le questionnaire.

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 20

5.2 La gestion du terrain - questionnaire par tlphone: Mthodes pour rduire le taux de non-rponse : la gestion du terrain - Qualit des interviewers: Formation et slection - Gestion des appels : Formation du- de la responsable de terrain. - On doit tenter de rejoindre la personne slectionne diverses heures (jour, soir, souper, week-end) et ce plusieurs reprises i.e. prendre tous les moyens possible pour rejoindre la personne. La gestion de ces appels se fait (se faisait) au moyen de ce qu'on appelait une "page couverture" (voir exemple). Maintenant, l'quivalent de la page couverture existe sur logiciel et la distribution des numros de tlphone se fait via logiciel galement. La page couverture comprend: - Le numro de tlphone et la grille de slection en fonction du nombre de personnes dans le mnage - La ou les questions permettant de faire la slection ou de dterminer l'ligibilit de la personne qui rpond - L'espace suffisant pour inscrire les rsultats de chaque appel (Pas de rponse, Rendez-vous pris avec xx, xy,) - Les codes de rsultats (01=complt, 02= pas de service,...) - On doit s'efforcer de prendre rendez-vous avec la personne si elle ne peut pas rpondre au questionnaire au moment o on l'appelle (Heure du repas, sries finales de hockey, les enfants qui braillent...). Les gens ne sont pas obligs de rpondre nos questions mais pour nous, il est essentiel que toute personne que l'on peut rejoindre rponde. Il faut donc convaincre les gens, respecter leur disponibilit. - Les interviewers doivent tre convaincus de la ncessit d'obtenir la collaboration de chaque personne et ils doivent avoir les comptences pour obtenir cette collaboration. - Le gestionnaire de terrain doit donc: - grer le personnel 6 former, motiver, encourager, rpartir le travail quitablement, valuer. 6 valuer les besoins en personnel en fonction du temps d'entrevue, du rendement du plan chantillonnal,... - grer les appels

6 jour, soir, week-end; 6 Longue distance aux heures de rduction d'abord 6 Langue des appels, rgion de Montral 6 Gestion des rendez-vous 6 Rcuprer les refus de rpondre

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 21

5.3 La gestion informatise du terrain - avantages et inconvnients Avantages: - L'interviewer est libre pour la conversation - Feed-back rapide au chercheur sur les mauvaises questions: on "pourrait" faire des modifications en dbut de terrain? - Interaction rapide pour la modification du questionnaire. - On peut faire des entrevues avec un "portable" - On peut mettre les entrevues sur disquette. - On peut avoir des questionnaires "auto-grs", la sortie de la caftria,etc. - Cots conomiss : - impression du questionnaire - stockage des questionnaires - codification -vrification ? - Saisie des donnes - Niveau de sophistication permis plus important - Contrle de la gestion plus facile - chronomtrage... - slection du rpondant - par interviewer, par jour,... - monitoring - entrevues...? Inconvnients: - Cots d'installation, d'infrastructure - Fatigue visuelle - interviewer - Dpendance vis--vis l'outil 6 lectricit, gestion de rseau informatique - Temps de conception... Pour certains systmes: - Impossibilit de reprendre un questionnaire non-termin un autre moment - Erreur dans la composition du numro de tlphone toujours possible - Gestion des rendez-vous par l'interviewer un peu difficile. - Ergonomie de la prsentation du questionnaire l'cran. - On veut tout informatiser y compris faire faire de la codification par l'interviewer, ce qui donne habituellement des rsultats faibles et parfois inutilisables et, dans tous les cas nonvrifiables...

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 22

5.4 Le droulement des oprations type a) Questionnaire: Premire version Version pr-test Version finale Traduction? b) cueillette - questionnaire tlphonique ou sur place ? heures interview - dure totale ? copies du questionnaire dans chaque langue ? nombre d'interviewers dans chaque plage horaire - questionnaire postal: ? timbres aller; timbres retour ? cartes, lettres de rappel c) codification - Elaboration du plan de codification - codification ? nombre de codeurs - heures codage. d) entre des donnes ? nombre de caractres e) analyse et interprtation Notez que l'analyse et l'interprtation, la rdaction du rapport d'analyse devrait tre prcds de l'laboration au dpart d'un plan d'analyse. Notons aussi que cette opration prend presque toujours, et d'autant plus lorsque l'on a moins d'exprience, nettement plus de temps que ce qui est planifi au dpart. Une bonne analyse, c'est du temps, du temps, de la rflexion, de la rdaction, des tableaux et des graphiques. Un bon rapport d'analyse doit tre comprhensible pour le public-client qui il s'adresse.

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 23

Page couverture type (opration tlphonique):

Bonjour, je suis xx________________ de la firme XYZ. Nous conduisons prsentement une tude sur....... (Votre numro de tlphone est choisi au hasard par ordinateur) (Cette tude permettra d'tablir..., d'aider ...)

1 2 3 4 5 6 7 1 2 1 3 4 3 7 (514) 343-7447

(06)

De faon choisir au hasard la personne qui rpondra aux questions, pouvez-vous m'indiquer le nombre de personnes, en vous incluant, qui rsident avec vous et qui ont 18 ans et plus? NB____________________ Pouvez-vous me donner l'ge de ces personnes en commenant par la plus ge? 1._________ 2._________ 3. ________ 4._________ 5._______ 6._______ 7._______ 8._______

Puis-je parler la personne qui a _______ ans. Date et heure contact Rsultat Commentaire (refus: (H F) ( - = +) Ident. interviewer Codes rsultats: 01 complt 02 Pas de service 03 non-rsidentiel 04 non -ligible 05 probl. de langue 06 ge, maladie 07 Refus du mnage 08 Refus personne 09 Abs. prolonge 10 Pas de rponse 20 Autre

L'chantillonnage et la gestion du terrain - Claire Durand - 8 mars 2002- 24

6. La qualit des enqutes par sondage 6.1 Les critres de qualit des sondages Claire Durand - mars 2000. Les critres de qualit des sondages sont relativement clairs au plan thorique. La capacit d'infrer les rsultats d'un sondage la population reprsente par un chantillon est base sur les postulats de la thorie des probabilits et du thorme central limite de Laplace prsent en 1783. Pour estimer les paramtres d'une population quelconque, on peut tirer un chantillon de faon alatoire1. Les statistiques provenant de cet chantillon donnent un estim des paramtres de la population avec une marge d'erreur qui dpend de la taille de l'chantillon et de la variance estime du paramtre. Si, thoriquement, la situation semble relativement simple -- il s'agit de tirer un chantillon alatoire -- en pratique, la situation devient un peu plus complexe pour plusieurs raisons. La base de sondage, c'est--dire la liste dont on tire l'chantillon, doit idalement comprendre tous les membres de la population reprsenter. Les membres de l'chantillon doivent pouvoir tre rejoints et accepter de rpondre au sondage et les personnes non rejointes ne doivent pas avoir des caractristiques qui les distingueraient des personnes rejointes. Prenons ces lments un un. 6.1.1 La base de sondage doit comprendre tous les lments de la population Dans le cas des sondages tlphoniques, une fraction de la population ne peut pas tre rejointe par tlphone pour un certain nombre de raisons, soit que les personnes vises n'ont pas le tlphone ou qu'elles ne rsident pas dans un mnage priv (chambreurs, rsidents de centres d'accueil). Ces personnes ne seront donc pas reprsentes. Il faut aussi tablir une liste des numros de tlphone de tous les membres de la population. La base la plus utilise au dbut des sondages tlphoniques tait le bottin fourni par les compagnies de tlphone. Toutefois, on estime que jusqu' 20 p. cent des mnages (Tremblay, 1981), particulirement en milieu urbain, ne sont pas inscrits au bottin, volontairement (numro confidentiel) ou involontairement (dmnagement, erreur). Ces personnes ne sont donc pas reprsentes dans l'chantillon lorsque l'on utilise le bottin comme base de sondage. Deux types de bases de sondage ont t dveloppes pour compenser la sous-reprsentation lie aux bottins. Le premier mode est constitu par la gnration alatoire de numros de tlphone (habituellement appele RDD pour random digit dialing) et le deuxime, appel ici CD-ROM +, est bas sur les numros de tlphone lists mais permet la gnration de numros de tlphone au hasard, sans gard la prsence dans la liste. Ces deux modes permettent de s'assurer que l'ensemble des personnes rsidant dans un mnage priv possdant un tlphone ont une chance connue d'tre choisies. On considrera donc que

Ce n'est tout de mme qu'en 1903 que le principe du recours l'chantillon est accept par l'Institut international de statistique. A partir de 1925, le dbat porte sur le meilleur moyen d'chantillonner -- hasard alatoire ou chantillon judicieux, c'est--dire par quota (Droesbeke, Fichet et Tassi, 1987). Qualit des sondages - Claire Durand 27 mars 2000 - 25

l'utilisation du RDD ou du CD-Rom+ plutt que des seuls numros lists au bottin constitue un facteur de qualit en rduisant le biais associ la base de sondage. Un problme demeure toutefois. A un tlphone correspond un mnage2 pouvant comprendre plusieurs personnes. Comment s'assurer que ces personnes ont une chance gale d'tre choisies? L'utilisation d'une grille de slection alatoire -- la grille de Kish a t la premire propose et demeure sans doute la plus connue -- permet de prserver le principe du choix au hasard. D'autres modes de slection sont apparus plus rcemment : la grille de Troldahl-Carter, qui consiste faire la slection en fonction du nombre d'hommes et de femmes dans le mnage, et la mthode de la date de naissance, qui consiste slectionner la personne dont la date de naissance est, au moment du sondage, soit la plus rapproche, soit la prochaine ou la dernire arrive. Ces mthodes ne sont pas considres comme strictement alatoires mais elles prservent l'impossibilit, pour l'interviewer, de parler soit la personne qui rpond la premire au tlphone, soit celle qui apparat plus sympathique ou qui se porte aisment volontaire. Une autre manire de faire consiste fixer des quotas bass sur la rgion, le sexe3 et parfois le groupe d'ge dans la conduite des activits de cueillette (Marsh, 1990; Stephenson, 1979). Elle consiste ne pas faire de slection alatoire dans les mnages jusqu' ce que les quotas soient remplis; une fois certains quotas remplis, la slection se fait en conservant seulement les personnes qui rpondent aux critres permettant de remplir les quotas non remplis. Cette mthode suscite un dbat depuis les dbuts des discussions sur la validit de l'chantillonnage (Droesbeke, Fichet et Tassi, 1987; Marsh, 1990). La mthode des quotas n'tant pas strictement probabiliste, soulignent les uns, on ne peut utiliser les analyses bases sur la thorie des probabilits avec des chantillons recueillis de cette manire, ce quoi les utilisateurs de la mthode des quotas rpondent que "En pratique, marche" (Marsh, 1990). Avec la mthode des quotas, le taux de rponse apparat nettement moins pertinent puisque tout individu possdant les caractristiques d'une cellule de quotas est considr comme reprsentatif. Il faut souligner que la mthode des quotas telle qu'applique par les firmes de sondage utilise un chantillon de dpart probabiliste. 6.1.2 Les membres de l'chantillon doivent tre rejoints et accepter de rpondre L'objectif vis, l'idal thorique, consiste rejoindre toutes les personnes slectionnes dans l'chantillon et les sonder. En pratique, plusieurs problmes peuvent survenir. D'une part, dans le mnage slectionn, la ou les personnes peuvent ne pas tre au domicile au moment de la tentative de contact. D'autre part, lorsqu'une personne est rejointe, elle peut refuser de collaborer avant mme qu'il soit possible d'effectuer la slection de la personne dans le

Le problme des mnages multiples numros de tlphone (rsidence secondaire, numro spcifique pour les enfants) est volontairement laiss de ct. Le problme de la possible surreprsentation de ces mnages commencent peine tre abord. Les objectifs (quotas) pour chaque cellule sont fixs en fonction des donnes du recensement. Dans les entrevues sur place utilisant cette mthode, les quotas peuvent tre trs dtaills et inclure des objectifs bass sur l'occupation des rpondants. Qualit des sondages - Claire Durand 27 mars 2000 - 26
3

mnage -- on parle de refus du mnage. Enfin, la personne slectionne peut dcliner ellemme de rpondre -- on parle de refus de la personne -- ou ne pas pouvoir tre rejointe pendant la dure du sondage (absence prolonge). En pratique donc, toutes les personnes slectionnes ne peuvent pas tre rejointes. Si l'on veut tre en mesure de postuler que l'chantillon est reprsentatif, deux critres apparaissent. D'une part, la proportion de l'chantillon non-rejoint, pour cause de refus ou de non-contact, doit tre la plus rduite possible; d'autre part, il faut postuler que les non-rejoints ne se distinguent pas des personnes rejointes. Comme ce postulat est difficilement vrifiable, il demeure que plus la proportion de personnes non-rejointes est faible, plus l'impact de la diffrentiation des non-rejoints est minimis. Cette situation explique l'insistance mise sur le taux de rponse, la proportion de personnes rejointes dans l'chantillon des personnes rejoindre, comme indicateur de l'absence ou de la rduction possible du biais dans l'chantillon. En pratique, des mthodes pour rduire la non rponse sont utilises. Il s'agit de faire un nombre suffisant de tentatives des priodes diffrentes (jour, soir, week-end) pour rejoindre les mnages slectionns et de tenter de rduire les refus -- par la slection et la formation du personnel interviewer, entre autres -sinon, de les rcuprer, c'est--dire de rappeler dans les mnages qui ont refus pour tenter de nouveau d'obtenir leur collaboration. La mthode des quotas laisse habituellement l'utilisation de moyens pour rejoindre les membres de l'chantillon et les convaincre de rpondre la discrtion du responsable de la cueillette. L'chantillon peut tre augment la convenance de celui-ci selon les besoins. Le taux de rponse apparat donc moins important, la qualit des donnes tant formellement mesure par le fait que les quotas sont atteints. 6.2 Les facteurs qui influencent la qualit des sondages et le taux de rponse Quels sont les facteurs qui, dans la recherche faite sur cette question, apparaissent pouvoir expliquer les diffrences dans la non rponse? Une bonne partie de la recherche, et particulirement celle faite par Groves, Couper et leurs collgues l'Universit du Michigan4, porte sur les caractristiques des rpondants, particulirement de ceux qui refusent leur collaboration. Ces recherches tentent entre autres d'expliquer thoriquement, selon un modle de dcision postulant la rationalit du comportement, pourquoi certaines personnes refusent de collaborer, une meilleure connaissance des personnes non-rejointes devant permettre de mieux estimer les biais dus la non rponse (Groves, 1989, ch.5). Rien dans ces recherches ne permet toutefois d'expliquer les diffrences de taux de rponse pour une mme population durant la mme priode. Tout au plus permettent-elles de trouver une explication aux diffrences de taux de rponse dans le temps (Steeh, 1981) ou auprs de populations diffrentes (Maas et De Heer, 1995). Un autre groupe de chercheurs s'est donc pench sur les causes de la non-rponse attribuables la gestion de la base de sondage et la gestion du personnel : le devis de sondage

Deux livres runissent une partie de ces travaux : Telephone survey methodology (1988) et Survey errors and survey costs(1989). Qualit des sondages - Claire Durand 27 mars 2000 - 27

(type de base de sondage et de slection dans les mnages (Dillman, 1979; Lavrakas, 1993; Drew, Chowdhry et Hunter, 1988; Groves et Lyberg, 1988; Sebold, 1988), la slection, la formation et la rmunration des interviewers (Steeh, 1981; De Heer, 1996; Cooper et Groves, 1992; Groves, Cialdini et Couper, 1992; Collins, Sykes et coll., 1988; Groves et Lyberg, 1988; Smith et Dechter, 1993), la conduite des oprations -- squences d'appels, rcupration des refus (Maas et De Heer, 1995; De Heer, 1996; Hidiroglou, Drew et Gray, 1993) de mme que divers moyens d'inciter la participation -- lettre prsentant le sondage, prsentation verbale, commandite, notorit de la firme, etc (Presser, Blair et Triplett, 1992; De Heer, 1996; Groves, 1989 ch. 5; Traugott, Groves et Lepkowski, 1987). Ces tudes, quoique rarement ralises pour des sondages effectus par des firmes prives, montrent une certaine constance dans les effets. 6.2.1 Effets de la base de sondage et de la slection Il appert que la gnration alatoire de numros de tlphone, tout le moins par RDD, est associe un plus bas taux de rponse pour deux raisons : d'une part, l'augmentation des refus due au fait que l'on aborde des mnages sans connatre le nom des personnes et que certains de ces mnages ont des numros confidentiels et, d'autre part, l'augmentation des numros considrs comme des non contacts due la prsence dans la banque de numros non valides ou non rsidentiels qui ne sont pas dtectables (Dillman, 1979; Lavrakas, 1993; Drew et coll., 1988). Par ailleurs, l'utilisation de la grille de Kish pour la slection dans les mnages peut aussi faire augmenter les refus puisqu'elle requiert de demander l'ge des personnes dans le mnage pour faire la slection. Cette demande peut tre perue comme une intrusion et donc augmenter la rsistance la collaboration (Lavrakas, 1993; Groves et Lyberg, 1988). Par contre, au moment o les sondeurs se plaignent du fait que le tlmarketing fait augmenter les refus en entachant la crdibilit des sondages "srieux", il est possible de penser que le recours la slection alatoire peut en contrepartie avoir l'avantage de permettre de distinguer les "vrais" sondages des entreprises de vente. 6.2.2 Effet de la gestion du personnel Les tudes faites sur la question montrent un effet important de l'exprience du personnel d'entrevue sur le taux de rponse (De Heer, 1996; Smith et Dechter, 1993). Certaines tudes mettent l'hypothse d'une interaction interviewer- zone de cueillette o l'effet de l'exprience serait d'autant plus important en zone urbaine, l o la rsistance est la plus leve (Cooper et Groves, 1992). Les tudes tentent aussi de vrifier quelles sont les stratgies utilises par les interviewers qui auraient un impact sur le taux de rponse (Snijkers, Hox et De Leeuw, 1996; Cooper et Groves, 1992). De mme, les attentes des interviewers semblent jouer un rle (Groves et Lyberg, 1988; Groves et coll., 1992; Singer, Frankel et Glassman, 1983). Enfin, la formation des interviewers sur la mthodologie de sondage et sur les tactiques de communication (Groves et coll., 1992) de mme que les modes de rmunration ont un impact sur le taux de rponse. Entre autres, on s'entend pour dire que les meilleurs interviewers doivent tre mieux rmunrs (De Heer, 1996) et que la rmunration horaire, qui ne pnalise pas les interviewers qui prennent du temps pour convaincre et pour bien slectionner et rejoindre la personne slectionne, est la plus approprie. Qualit des sondages - Claire Durand 27 mars 2000 - 28

Qualit des sondages - Claire Durand

27 mars 2000 - 29

6.2.3 Effet du suivi de terrain Les pratiques de suivi de terrain ont certainement l'impact le plus direct sur le taux de rponse (De Heer, 1996, Maas et De Heer, 1995; Hidiroglou et coll. 1993) puisqu'elles visent rduire le non contact par la gestion des squences d'appel et rduire les refus principalement par la rcupration des refus. Le nombre de contacts est un lment essentiel du taux de rponse (Traugott, 1987; De Heer, 1996; Maas et De Heer, 1995; Hidiroglou et coll., 1993; Smith et Dechter, 1993; Traugott et coll., 1987). On considre qu'il faut au moins quatre tentatives de contact rparties divers moments de la journe et de la semaine (Traugott, 1987) et jusqu' sept ou huit tentatives (Chevalier et Durand, 1997) pour s'assurer de minimiser efficacement les diffrences entre personnes non-rejointes et rejointes. Toutefois, aprs quatre ou cinq tentatives, l'augmentation du taux de rponse devient relativement marginale (Traugott, 1987, Chevalier et Durand, 1997). La rcupration des refus est utilise entre autres parce les refus sont plus nombreux en dbut de priode de cueillette et chez les interviewers dbutants et parce que certains refus peuvent tre circonstanciels; ce type de refus peut dont tre relativement facile rcuprer. L'impact de cette pratique tant sur le taux de rponse que sur le biais possible de l'chantillon apparat important. D'une part, cette pratique peut amener une hausse assez substantielle du taux de rponse (11,2 p. cent dans Chevalier et Durand, 1997); d'autre part, le profil des mnages o se produisent les refus de collaborer est relativement typ: couples ou personnes seules vivant en banlieue, souvent propritaires, ... (Chevalier et Durand, 1997; Collins et coll., 1988; O' Neil, 1979; Cooper et Groves, 1996; Groves et Couper, 1992; Groves et coll.,1992) 6.2.4 Des dterminants de la conduite des pratiques mthodologiques La question pose dans cette recherche remonte un niveau plus haut la chane des dterminants du taux de rponse. Si les facteurs qui influencent le taux de rponse sont connus et les moyens de contrler la qualit des donnes le sont aussi, qu'est-ce qui explique les diffrences de pratiques sur ce plan. Les pratiques privilgier sont-elles connues? Sont-elles respectes et dans quelles circonstances le sont-elles? L'existence postule d'un cart important entre les pratiques ayant cours au Qubec et dans le reste du Canada permet d'explorer plus avant ces facteurs. Alors que les tudes (Goyder, 1987) mettent plutt l'hypothse d'une culture lie au sondage influenant directement la population, cette hypothse apparat peu pertinente tant donn les faits noncs prcdemment. L'hypothse a donc t faite d'un impact de la culture sur les organisations qui conduisent les sondages. Marsh (1990) relate que le dbat sur l'importance du taux de rponse et particulirement sur l'acceptabilit de la mthode des quotas divisait en Angleterre les firmes qui faisaient plus de marketing de celles qui faisaient du sondage socio-politique. Aux tats-unis, le recours aux quotas chez ceux qu'on appelle les Pollsters est courante et les taux de rponse pour les sondages lectoraux se situent souvent en bas de 30 p. cent ou mme de 20 p. cent (Pettigrew, 1995). L'intrt de la situation canadienne rside dans le fait que la diffrenciation semble se faire de faon assez hermtique sur une base rgionale et culturelle plutt que sur une base lie au type de clients. Qualit des sondages - Claire Durand 27 mars 2000 - 30

Les facteurs retenus ici sont ceux qui apparaissent les plus pertinents dans les recherches lies la sociologie des organisations. On peut catgoriser ces facteurs selon deux axes. Un premier axe est li aux connaissances. Sur ce plan, on peut postuler que l'adoption de pratiques dfinies dpend de la connaissance que l'on a des pratiques adopter, de la volont de les adopter (lie aux perceptions et attentes) et enfin, de la capacit le faire (lie aux ressources techniques et la comptition entre les firmes). Un deuxime axe serait celui de l'environnement interne et externe des organisations. Les pratiques ce niveau dpendent des comportements et des attitudes des acteurs. Sur ce plan, la direction de la firme est de la plus haute importance de mme que le personnel professionnel (directeurs de recherche, analystes) et le personnel de terrain (superviseurs et interviewers). Leurs connaissances, leurs croyances et leurs attentes (Groves et Lyberg, 1988; Signer et coll., 1983) dterminent en partie leur comportement. Enfin, au plan de l'environnement externe, les clients (caractristiques, attentes, comportements) et la socit elle-mme via entre autres ses mdias (De Heer, 1996; Lachapelle, 1991) influencent l'importance accorde divers aspects de la mthodologie de sondage. L'ensemble de ces lments influencent et dterminent au moins partiellement la culture de la firme en ce qui a trait l'importance accorde a la mthodologie et au taux de rponse. Sur ce dernier point, Lachapelle (1991) soutient que les sondages pr-lectoraux sont plus nombreux au Qubec et qu'il y aurait aussi proportionnellement plus de firmes de sondage au Qubec que dans le reste du Canada.

Qualit des sondages - Claire Durand

27 mars 2000 - 31

6.3 Exemples : lestimation de lintention de vote 6.3.1 La question des non rejoints et de leur possible intention de vote, lments de rflexion par Claire Durand Introduction... Certains mettent lhypothse que la non rponse aux sondages, compose des personnes que lon ne russit pas rejoindre et de celles qui refusent de rpondre au sondage lui-mme, puisse avoir autant dimportance dans le biais destimation des intentions de vote que la rpartition des indcis, dfinis comme les personnes qui rpondent au sondage mais non aux questions sur lintention de vote. Le texte qui suit tente de faire le point sur lensemble des biais possibles des chantillons, cest--dire ceux relatifs au mode de gnration de la base de sondage et la gestion de cette base. La non rponse au sondage Dans un sondage tlphonique, les non rejoints se rpartissent en deux groupes : dune part les personnes que lon ne russit pas rejoindre aprs un certain nombre de tentatives et dautre part celles qui refusent de rpondre au sondage lui-mme, rparties en deux groupes, les cas de refus du mnage o il est impossible de savoir si on a parl la personne qui aurait eu rpondre au sondage, et les cas appels refus de la personne slectionne o cest la personne qui devrait rpondre qui refuse. En gros, on estime que les personnes non rejointes aprs de nombreuses tentatives (au moins cinq, de prfrence plus) ont un profil typ : Les personnes que lon rejoint aprs cinq tentatives sont plus souvent des personnes de 25 34 ans, seules, de scolarit universitaire, en emploi ou en chmage, locataires, vivant plus souvent dans des difices de 5 logements ou plus et dans le centre de la CUM (Chevalier et Durand, 1997). Ce sont aussi des personnes qui ont une plus faible coute tl et qui font plus de sorties (spectacles, cinma, etc). On pourrait donc penser que les personnes non rejointes ont plus souvent un profil, soit de non-voteur, soit de voteur du PQ. Quant aux personnes qui refusent, elles ont aussi un profil typ : Pour ce qui est des refus de mnage, on parle plus de familles de la classe moyenne, vivant en maison unifamiliale, plus souvent dans lOuest de la CUM. Comme ce sont des refus rcuprs, on peut difficilement conclure sur le profil de tous les refus de mnage. Dans ce cas-ci, les personnes qui collaboreront ventuellement au sondage sont plus souvent des jeunes (15 24 ans) aux tudes, ce qui laisse penser quau point de dpart, ce sont les parents qui avaient refus et que leurs enfants sont plus coopratifs. Par contre, pour ce qui est des refus de la personne, on parle plus souvent de personnes de 55 ans et plus, plus souvent retraites, relativement pauvres et peu scolarises, vivant en banlieue de Montral. Lensemble de ces personnes aurait un profil soit de non-voteur, soit de voteur PLQ. Ces informations ont fait dire certaines personnes que si on quilibrait les non rejoints et les refus, les profils typs des deux groupes risquaient de sannuler et la non rponse aurait donc peu dinfluence sur lestimation. A cet effet, il faut noter que plus on fait de tentatives Qualit des sondages - Claire Durand 27 mars 2000 - 32

pour rejoindre les personnes difficiles rejoindre, plus le taux de refus baisse, dune part parce que les personnes difficiles rejoindre ne refusent habituellement pas de collaborer (Chevalier et Durand, 1997) et dautre part, probablement parce que les interviewers que lon garde en dernier sont les plus expriments et que de toutes faons, aprs plusieurs jours de terrain, les interviewers matrisent mieux le questionnaire. Do, pour un sondage court o le nombre de tentatives faites pour rejoindre les personnes est restreint, le taux de refus aura tendance tre plus lev mais le taux de non rejoint galement. Ces lments militent en faveur dun impact minime sinon inexistant, particulirement, aprs redressement, des non rpondants au sondage. Toutefois, on estime que le vrai pourcentage de personnes non rejointes se situerait plutt autour de 6 p. cent et que le reste des numros non rejoints, particulirement quand lchantillon a t gnr par GANT (gnration alatoire de numros de tlphone), sont en fait des numros non valides (entrepts, locaux vides, personnes parties ltranger,...). Cette portion de la non rponse aurait donc moins dimpact sur lestimation que les refus. Comme il y a gnralement plus de refus que de non rejoints dans lchantillon final, il pourrait y avoir lgre sous reprsentation des voteurs PLQ dans lchantillon. Les biais des bases dchantillonnage Un deuxime type de raisons pourrait biaiser les chantillons et par consquent, lestimation de lintention de vote, celle des biais de la base dchantillonnage elle-mme. Plusieurs firmes de sondage utilisent le bottin tlphonique plutt que de la gnration alatoire de numros de tlphone. On peut penser que les numros absents du bottin tlphonique ne le sont pas au hasard : Il sagit soit de personnes qui ont dmnag (jeunes urbains actifs, personnes en instance de sparation, asociaux), soit de personnes qui gardent leur numro confidentiel (soit plus riches, soit asociaux). Les donnes Statmedia 1998 montrent que les personnes rejointes dont le numro ntait pas inscrit au bottin affirmaient quil tait moins probable quelles aillent voter aux lections municipales, taient plus souvent de langue maternelle autre que francophone, taient en moyenne plus jeunes et refusaient plus souvent de rpondre la question sur le revenu. On retrouve ici la mme possible rpartition de sous reprsentation que pour les non rpondants au sondage. :Les personnes qui dmnagent plus seraient plus souvent des non voteurs ou des voteurs PQ alors que les personnes dont le numro est confidentiel sont soit des non voteurs, soit des voteurs PLQ. Les sous reprsentations auraient donc tendance sannuler condition toutefois quelles squilibrent. Deux autres raisons relies la base de sondage et sa gestion doivent tre prises en compte : Dune part, le fait que les rsidences pour personnes ges ne sont pas inclues dans la base de sondage puisquon ne garde que les mnages privs. Ces personnes sont souvent vises par les candidats qui font des tournes de ces rsidences. Il y aurait sous reprsentation des personnes ges en foyer collectif et cette sous reprsentation nest pas corrige par le redressement puisque les statistiques produites par Statistique Canada ne comprennent elles aussi que les mnages privs. Comme il sagit dune portion de llectorat plus librale, cette situation pourrait expliquer en partie la sous reprsentation des intentions de vote PLQ.

Qualit des sondages - Claire Durand

27 mars 2000 - 33

Toujours dans les possibilits de sous reprsentation, les personnes incapables de rpondre en franais ou en anglais sont habituellement considres comme non ligibles, ce qui sajoute au fait que les anglophones auraient tendance moins collaborer aux sondages. Il est donc fort possible que ces groupes, normalement voteurs PLQ soient sous-reprsents. Toutefois, le redressement par la langue dusage corrige en partie cette sous reprsentation. A linverse, il arrive trs frquemment que les chantillons comprennent une proportion de femmes nettement plus leve que dans la population, soit parce les femmes collaborent plus facilement aux sondages ou parce quelles sont plus faciles rejoindre, ce qui aurait tendance entraner une sur-reprsentation du PLQ. Certaines firmes prennent des mesures pour viter que cette situation se produise en utilisant des grilles de slection dans le mnage qui diminuent le problme. Il faut toutefois noter que, comme il y a redressement en fonction du sexe par la suite, cette sur-reprsentation est, au moins partiellement, corrige. Le redressement permet en effet de corriger les biais de reprsentation socio-dmographique de lchantillon. On doit toutefois noter que le redressement a pour effet dattribuer, dune certaine manire, la rpartition de lintention de vote dun groupe dge/sexe/rgion/langue toutes les personnes de ce groupe alors quil est possible que les personnes moins faciles joindre ou moins collaboratrices aient de fait des opinions diffrentes des personnes semblables au plan socio-dmographique mais qui sont faciles rejoindre. En rsum, un seul lment permet de penser de faon relativement certaine que, mme lorsquun sondage est suffisamment bien fait -- taux de rponse acceptable, rcupration de refus, slection approprie dans les mnages -- il y aura impact des non rpondants au sondage sur lestimation des discrets. Cet impact se ferait via une sous reprsentation des personnes ges rsidant en foyer collectif. Il sagit dun impact sans doute minime. Evidemment, ces considrations valent pour un sondage bien fait o tous les moyens sont pris pour minimiser les biais. Ainsi, un sondage Compas, publi par le Financial Post du 1er aot, faisait tat dun revirement spectaculaire de lintention de vote qui serait passe de 12 points davance pour le PLQ en juin 1998 12 points davance pour le PQ, cest--dire un changement de 24 p. cent, et ceci sans quaucun vnement ne justifie un tel revirement. Il y a lieu de penser quun tel revirement ne sest pas produit. Une telle enqute naurait pas d tre ralise pendant les vacances de la construction et en pleine canicule. Qui sont les indcis ? Posons nous maintenant la question des autres raisons, outre celles mentionnes prcdemment, qui feraient que lon doive faire une rpartition non proportionnelle des indcis. Le mode de rpartition propos par Pierre Drouilly est dabord et avant tout empirique. Il y a lieu de se demander pourquoi cette rpartition semble plus approprie quune rpartition proportionnelle. Il faut dabord se pencher sur la possibilit que les discrets soient en fait des personnes qui niront pas voter. Dans une analyse de questions dun sondage ralis en juin 1998 et portant sur la relation entre lintention de vote aux lections municipales et lintention daller voter, il est apparu que la relation entre ces deux mesures est la suivante : plus les personnes affirment quil est probable quelles iront voter, moins elles sont indcises quant leur intention de vote. Si cela savrait aussi au niveau provincial -- il faudrait poser la question Qualit des sondages - Claire Durand 27 mars 2000 - 34

sur lintention daller voter -- une rpartition proportionnelle des indcis, restreinte aux personnes qui disent ne pas savoir pour qui elles voteront et celles qui affirment ne pas voter, serait approprie. Les personnes qui refusent de rvler leur intention de vote seraient rparties selon dautres critres. De fait, comme larticle de La Presse du samedi 7 novembre le montre, les discrets sont plus souvent discrets sur plusieurs questions et il est possible de penser quil sagit en bonne partie de non voteurs. Toutefois, les discrets semblent plus souvent des femmes et, lorsquelles expriment des opinions sur dautres questions que lintention de vote, leur profil est plus prs de celui des libraux ou des adquistes que de celui des pquistes. En conclusion En conclusion, une rpartition proportionnelle des discrets serait adquate si les discrets taient dans lensemble des non voteurs ou si leur profil ne diffrait pas de celui des voteurs. La ncessit dune rpartition non proportionnelle sexplique sans doute en partie par des facteurs relatifs lchantillon, caractristiques des personnes qui refusent et non reprsentation des personnes ges en hbergement, mais cette partie apparat relativement faible. La majeure partie de lexplication relve sans doute du fait que les voteurs discrets sont plus souvent des voteurs PLQ qui cachent leur intention de vote ou des personnes rellement indcises qui, dans lisoloir, auront plus tendance se replier sur un vote plus scurisant.

Qualit des sondages - Claire Durand

27 mars 2000 - 35

6.3.2. Leffet des facteurs mthodologiques sur la qualit de lestimation des intentions de vote : La non-rponse Par Vachon, Sbastien (1998), extrait de mmoire de matrise. 1.3 Reprsentativit de lchantillon Dans ltude ralise par Chevalier et Durand (1997), il apparat que dans 9 p. cent des entrevues compltes, il y a eu prcdemment refus du mnage et dans 10 p. cent, refus de la personne slectionne. Ainsi, dans 19 p. cent des entrevues finalement compltes, il y a eu un refus initial qui, subsquemment, a t rcupr. Sachant que les personnes moins coopratives ont des caractristiques socio-dmographiques, des comportements et des attitudes propres (Chevalier et Durand, 1997; Groves et Lyberg, 1988; ONeil, 1979; Triplett, 1997; Triplett, Blair, Hamilton et Kang, 1996), il apparat vident que la rcupration des refus peut avoir un effet important sur la reprsentativit de lchantillon et chance, sur la qualit des estims. Il faut noter que le profil des rpondants moins coopratifs diffre selon le type de refus qui a t rencontr: refus du mnage ou refus de la personne slectionne (Chevalier et Durand, 1997). Les rpondants plus difficiles joindre ont, eux aussi, un profil spcifique (Chevalier et Durand, 1997; Sebold, 1988; Traugott, 1987; Triplett, 1997). De plus, il apparat que les rpondants ayant initialement refus ont un profil socio-dmographique oppos celui des personnes plus difficiles joindre (Chevalier et Durand, 1997; ONeil, 1979). Bref, lampleur des biais de la non-rponse est fonction de la diffrence de caractristiques entre les rpondants et les non-rpondants, et de la non-rponse elle-mme5 (Groves et Lyberg, 1988 dans Drew, Choudry et Hunter, 1988: 235). 1.3.1 Reprsentativit des personnes moins coopratives Il est ncessaire de faire la distinction entre les refus mnage et les refus de la personne slectionne. Dans un premier temps, il sera question du profil des rpondants ayant initialement refus de participer et dans un deuxime temps, de ceux demeurant dans un mnage o il y a eu initialement refus.

The magnitude of respondents bias is a fonction both of the difference in characteristics of respondents and nonrespondents, and of the nonresponse rate itself. Qualit des sondages - Claire Durand 27 mars 2000 - 36

Le tableau II prsente les caractristiques des rpondants selon leur degr de coopration. Tableau II. Profil du rpondant coopratif et du rpondant moins coopratif
Variable sociodmographique Occupation Scolarit Rpondant coopratif (aucun refus) Professionnel
(ONeil, 1979)

Rpondant moins coopratif (ayant initialement refus) Travailleur qualifi


(ONeil, 1979)

Moins scolaris
(ONeil, 1979; Triplett, 1997; Triplett et al., 1996; Chevalier et Durand, 1997; Groves et Lyberg, 1988)

Race

Noir
(ONeil, 1979)

Blanc
(ONeil, 1979)

Noir
(Triplett et al., 1997)

Ethnicit ge

Afro-amricain
(ONeil, 1979)

Allemand et Polonais
(ONeil, 1979)

25-34 ans
(ONeil, 1979)

65-74 ans (retrait)


(ONeil, 1979; Triplett, 1997; Triplett et al., 1996; Chevalier et Durand, 1997; Groves et Lyberg, 1988)

Mnage

Prsence denfants
(ONeil, 1979)

Absence denfant
(ONeil, 1979; Triplett, 1997)

Absence denfant de moins de 18 ans


(Triplett, 1997)

Une ou deux personnes


(Chevalier et Durand, 1997)

Logement

Autre type de logement


(ONeil, 1979)

Bungalow
(ONeil, 1979)

Propritaire
(ONeil, 1979)

Locataire
(ONeil, 1979)

difice cinq logements et plus


(Chevalier et Durand, 1997)

Revenu Rgion

Faible revenu (moins de 20 000$)


(Chevalier et Durand, 1997)

Banlieue (ouest, est et nord de Montral)


(Chevalier et Durand, 1997)

Plus en milieu urbain (p/r rural)


(Groves et Lyberg, 1988; Triplett, 1997)

Malgr quelques divergences entre les auteurs, le profil des personnes moins coopratives est assez cohrent. Il sagit dune personne ges ayant plus souvent un faible niveau de scolarit et un faible revenu. Travailleur qualifi la retraite, il demeure en milieu urbain. Selon Groves et Lyberg (1988), ces personnes ges refusent davantage de participer cause de problmes auditifs et de leur dsengagement social qui les amne hsiter interagir avec un tranger. galement, la peur dtre victimis et une socialisation diffrente envers le tlphone peuvent tre des facteurs explicatifs. Le profil socio-dmographique de ces personnes est assez typ. Qualit des sondages - Claire Durand 27 mars 2000 - 37

Les personnes demeurant dans un mnage o il y a eu initialement refus, mais qui elles nont jamais refuses de collaborer, ont galement un profil assez prcis (tableau III). Tableau III. Profil du rpondant demeurant dans un mnage o il y a eu initialement refus (Chevalier et Durand, 1997) Variable sociodmographique ge Scolarit Mnage Revenu du mnage Logement Langue Rgion Caractristique du rpondant 15-24 ans Secondaire ou cgep (aux tudes) Deux quatre personnes 40 000 60 000$ Maison unifamiliale Anglophone, allophone Ouest de lle de Montral

Selon les auteurs, le profil type du refus mnage serait [...] celui o les parents, plus souvent un mnage de la banlieue de Montral, bloquent laccs au jeune slectionn. 1.3.2 Reprsentativit des personnes plus difficiles joindre Il est important de ne pas confondre le nombre de tentatives de contacts pour joindre le mnage, pour joindre le rpondant et pour complter lentrevue. Sur le plan conceptuel, ces indicateurs sont diffrents. Cependant, sur le plan des caractristiques des mnages, des personnes plus difficiles joindre, il y a une relative adquation entre ces indicateurs. De fait, que lon utilise lun ou lautre de ces indicateurs, il est ncessaire que, chance, le questionnaire soit complt pour que ces informations soient disponibles. Selon Sebold (1988), en utilisant la GANT (gnration alatoire de numros de tlphone) pour gnrer lchantillon, aprs 4 appels, 50% des numros o il ny a pas encore eu contact sont des mnages et aprs 20 appels, 5%. Ainsi, sans se rendre jusqu 20 appels, il apparat important, si lon veut faire diminuer la non-rponse attribuable aux noncontacts, de faire un certain nombre de rappels pour joindre le mnage. De fait, le nombre de tentatives de contact affecte, selon plusieurs chercheurs (Cantril, 1991; ONeil, 1979; Sebold, 1988; Traugott, Groves et Lepkowski, 1987; Traugott, 1987; Triplett, 1997; Triplett, Blair, Hamilton et Kang, 1996), la taux de rponse et la reprsentativit de lchantillon. Afin de faire les nuances qui simposent, le tableau IV prsente les caractristiques des personnes plus difficiles joindre en fonction du type dindicateurs employs par les chercheurs.

Qualit des sondages - Claire Durand

27 mars 2000 - 38

Tableau IV. Profil du rpondant plus difficile joindre


Variable sociodmographique Indicateur Nombre de tentatives pour joindre le mnage 25-34 ans
(Chevalier et Durand, 1997)

Nombre de tentatives pour complter lentrevue 25-34 ans


(Chevalier et Durand, 1997*; Traugott, 1987)

ge

Moins souvent g de 65 ans et plus


(Sebold, 1988)

18-24 ans
(Triplett, 1997)

Sexe Race Mnage Une personne


(Chevalier et Durand, 1997)

Homme
(Chevalier et Durand, 1997*; Traugott, 1987; Triplett, 1997)

Noir
(Triplett, 1997)

Clibataire
(Triplett, 1997)

Clibataire
(Sebold, 1988)

Scolarit Statut Revenu du mnage Logement

Universitaire
(Chevalier et Durand, 1997)

Universitaire
(Chevalier et Durand, 1997*)

En emploi ou au chmage
(Chevalier et Durand, 1997)

Pas retrait
(Chevalier et Durand, 1997*)

80 000$ et plus
(Chevalier et Durand, 1997*)

Locataire
(Chevalier et Durand, 1997)

difice de 5 logements et plus


(Chevalier et Durand, 1997)

Rgion Langue

Centre de lle de Montral


(Chevalier et Durand, 1997)

Centre et ouest de Montral


(Chevalier et Durand, 1997*)

Anglophone, allophone, 1997


(Chevalier et Durand, 1997*)

*: Ces informations ne figurent pas dans la version finale du texte de Chevalier et Durand (1997). Elles ont t tires dune version de travail communique par les auteurs.

Malgr certaines diffrences, on peut constater quil y a une relative adquation entre ces deux indicateurs. Ainsi, il apparat que les personnes plus difficiles joindre sont plutt jeunes, assez scolarises, clibataires et vivent en appartement en milieu urbain. 1.4 Qualit des estims Il apparat vident que les diffrentes pratiques mthodologiques ne squivalent pas, certaines sont meilleures, permettent dobtenir un chantillon plus reprsentatif de la population ltude et par le fait mme, des rsultats plus fiables. Des tudes ont t menes Qualit des sondages - Claire Durand 27 mars 2000 - 39

afin de mesurer limpact de certaines pratiques, notamment celles entranant la sousreprsentation des personnes plus difficiles joindre et moins coopratives, sur la qualit des estims. Cependant, il faut noter que peu de recherches analysent les effets de la sousreprsentation de ces groupes sur la qualit de la mesure des intentions de vote. Ainsi, pour ce type de sondage, il a t impossible de trouver une recherche analysant les effets de la sous-reprsentation des personnes moins coopratives. Pour ce qui est de la sous-reprsentation des personnes plus difficiles joindre, trois recherches amricaines traitent de la question (Traugott, 1987; firme Harris, 1988 et firme Galup, 1988 dans Cantril, 1991). De plus, sans que leurs recherches portent sur lvaluation de lestimation des intentions de vote, certains chercheurs (Chevalier et Durand, 1997; ONeil, 1979; Triplett, 1997; Triplett, Blair, Hamilton et Kang, 1996) ont explor les effets de la sous-reprsentation de ces groupes sur la qualit des estims. Les personnes ayant initialement refus sont en gnral moins impliques socialement, plus isoles (ONeil, 1979).
Dautres variables qui ont t examines mais qui ne sont pas explicitement prises en compte dans cette article permettent de penser que les personnes moins coopratives sont moins intgres socialement que les autres rpondants. Elles sont significativement moins portes participer des activits ou des organisations communautaires (activits et organisations interprtes au sens large) que les autres rpondants. De plus, elles sont moins portes indiquer soit leur volont ou bien une occasion o elles ont appel la police pour rapporter des crimes quelles ont observ dans leur quartier et celles qui ont appel lont fait moins frquemment.

Chevalier et Durand (1997) arrivent des rsultats, bien que ne portant pas sur le mme sujet, assez cohrents avec ces derniers. En effet, propos des pratiques culturelles des Qubcois, il apparat que les rpondants ayant initialement refuss font moins de sorties (2,34 par semaine) que les rpondants demeurant dans un mnage o il ny a eu aucun refus (3,64 par semaine). Cependant, sur le plan de lcoute tlvisuelle, il ny a pas de diffrence significative. Ainsi, en concordance avec leur profil socio-dmographique, il apparat que ces derniers sortent moins, sont moins impliqus socialement. Ils fournissent moins dinformations: plus fort taux de non-rponse partielle aux questions et entrevue plus courte (Triplett, 1997). O il y a eu refus du mnage, la qualit des donnes fournies par les rpondants est comparable celle des autres (Ibid.). Ils coutent davantage la tlvision (31,1 heures par semaine) que les autres (25,6 heures par semaine) (Chevalier et Durand, 1997). Sur le plan des sorties, il ny a pas de diffrence significative (Ibid.). Pour ce qui est des rpondants plus difficiles joindre, il faut tout dabord distinguer les recherches disponibles en fonction du type dindicateurs utiliss: le nombre dappels pour joindre le mnage ou pour complter lentrevue. La recherche de Chevalier et Durand (1997) a utilis ces deux indicateurs6. Ainsi, que lon utilise lun ou lautre des indicateurs, on peut constater que les personnes plus difficiles joindre coutent moins la tlvision et font davantage de sorties, ce qui est concordant avec leur profil socio-dmographique.

Les informations portant sur les pratiques culturelles des personnes plus difficiles joindre, sur la base du nombre dappels pour complter lentrevue, ne figurent pas dans la version finale du texte de Chevalier et Durand (1997). Ces informations proviennent dune version de travail communique par les auteurs.

Qualit des sondages - Claire Durand

27 mars 2000 - 40

Plus directement reli au sujet de cette tude, Traugott (1987), la firme Harris (1988) et la firme Gallup (1988) (dans Cantril, 1991) ont dmontr quun faible nombre de tentatives de contact (pour complter lentrevue) entrane un biais en faveur des Dmocrates (voir tableau V et VI), les rpondants plus difficiles joindre, cest--dire les jeunes hommes clibataires et demeurant en milieu urbain (Chevalier et Durand, 1997; Sebold, 1988; Traugott, 1987; Triplett, 1997), tant davantage rpublicains. Tableau V. Nombre dappels faits pour complter lentrevue et intentions de vote (lection amricaine de 1988) Nombre dappels 1er appel 2e appel 3e appel 4e appel
Gallup, 1988; *: Harris, 1988

Bush 47,8% (49,5%*) 48,9% 49,1% (50,9% *)

Dukakis 44,8% 43,6% 43,4%

Tableau VI. Nombre dappels faits pour complter lentrevue et intentions de vote (lection amricaine de 1984) Nombre dappels 1er appel 2e appel 3e appel 4e appel Traugott, 1987 Au premier appel, il y a surreprsentation, par rapport lchantillon final, des Dmocrates. Aprs quatre appels, les paramtres dmographiques sont plus fidles de la ralit et la proportion de Dmocrates a diminu, lavantage des Rpublicains (Traugott, 1987). Ainsi, le nombre dappels faits pour complter lentrevue a un effet sur les paramtres dmographiques de lchantillon et chance, sur la qualit de lestimation des intentions de vote. ..... Il est noter que limportance relative de la sous-reprsentation des personnes moins coopratives et plus difficiles rejoindre est fonction de la maximisation de lchantillon. Labsence de prise de rendez-vous, lutilisation des quotas, la substitution de numros de tlphone, etc., sont quelques unes des pratiques qui, pouvant tre qualifies de non orthodoxes, ne maximise pas lchantillon et ainsi, risquent de faire augmenter les biais dus la non-rponse. Ainsi, la maximisation peut tre oprationnalise, entre autre, par le taux Qualit des sondages - Claire Durand 27 mars 2000 - 41 Reagan 48% 51% 51% 52% Mondale 45% 45% 42% 40%

de rponse7, une forte maximisation tant accompagne dun bon taux de rponse. Ainsi, il apparat que, quand un chantillon est fortement maximis, les refus forment la plus grande part de la non-rponse et inversement, sil ne lest que trs peu, si un chantillon ouvert est utilis, les non-contacts (pas de rponse) formeront la plus grande part. Bref, certaines pratiques mthodologiques peuvent affecter la reprsentativit de lchantillon et chance, la qualit des estims. De fait, si les rpondants moins coopratifs (Chevalier et Durand, 1997; Groves et Lyberg, 1988; ONeil, 1979; Triplett, 1997; Triplett et al., 1997) et ceux plus difficiles rejoindre (Chevalier et Durand, 1997; Harris, 1988 dans Cantril, 1991; Gallup, 1988 dans Cantril, 1991; Sebold, 1988; Traugott, 1987; Triplett, 1997) ont un profil socio-dmographique, des attitudes et des comportements typs, les pratiques mthodologiques qui entranent leur sous-reprsentation risquent de causer des biais dans les estims. Ainsi, afin dobtenir un chantillon reprsentatif et des rsultats fiables, il est prfrable dutiliser des pratiques mthodologiques permettant de rduire le plus possible la non-rponse, quelle soit lie des problmes de coopration ou la difficult rejoindre certains groupes de la population.

Bien quil ny ait pas unanimit sur la manire de calculer ce taux, on sentend gnralement pour dire quil sagit du rapport entre le nombre dentrevues compltes et le nombre de numros dans lchantillon, cest-dire valides et ligibles.

Qualit des sondages - Claire Durand

27 mars 2000 - 42

Rfrences Chevalier, S., et C. Durand. 1997. Le taux de rponse dans les sondages tlphoniques, dterminants et consquences. 65 me Congrs de l'ACFAS, Montral, Universit du Qubec Trois-Rivires. Collins, M., W. Sykes, P. Wilson, et N. Blackshaw, "Nonresponse: The UK Experience." dans: Robert M. Groves, Paul P. Biemer, Lars E. Lyberg, James T. Massey, W.L. Nicholls II, et J. Wasberg. Telephone survey methodology. New York, Wiley, 213-231. 1988 Couper, Mick P., et Robert M. Groves. "Le rle de l'intervieweur dans la participation aux enqutes." Techniques d'enqutes 18(2):279-294. 1992 Couper, M.P., et R.M. Groves. "Household-Level Determinants of Survey Nonresponse." New directions for evaluation, 70:63-79. 1996 De Heer, Wim. 1996. International response trends. 4th International social science methodology conference, july 1996, University of Essex, Colchester England. Dillman, Don A. Mail and telephone surveys. New york, Wiley. 1978 Drew, Douglas J., Hussain G. Choudhry, et Lecily A. Hunter, "Nonresponse Issues in Government Telephone Surveys." dans: Robert M. Groves, Paul P. Biemer, Lars E. Lyberg, James T. Massey, William L. Nicholls II, et Joseph Waksberg. Telephone survey methodology. New York, Wiley, 233-246. 1988 Droesbeke, Jean-Jacques, Bernard Fichet, et Philippe Tassi, "La Place Des Sondages En Statistique." dans: Jean-Jacques Droesbeke, Bernard Fichet, et Philippe Tassi, Les sondages. Paris, Economica, 3-28. 1987 Durand, C., "La Violence Envers Les Femmes, Questions Mthodologiques." dans: Maryse Rinfret-Raynor. Violence envers les femmes: la controverse des chiffres. Montral, CRI-VIFF, Actes du colloque tenu Montral le 17 mai 1994 dans le cadre du 62 me Congrs de l'ACFAS. Collections Rflexions no. 2, 71-80. 1994 Dussaix, A.M. et Grosbras, J.M. (1994). Sondage et qualit des donnes in. Grang, D. Et Lebart, L. Ed. Traitement statistique des enqutes. Paris, Dunod, p.21-52. Fowler, Floyd J. Survey research methods. Neybury Park, Sage. 1993 Goyder, John. The silent minority. Boulder, Colorado, Westview press. 1987 Groves, Robert M., "Probing the Causes of Nonresponse and Efforts to Reduce Nonresponse." dans: Robert M. Groves, Survey errors and survey costs. New York, Wiley, 1989 Groves, Robert M., Paul P. Biemer, Lars E. Lyberg, James T. Massey, William L. Nicholls II, et Joseph Waksberg, eds. Telephone survey methodology. New York, Wiley. 1988

Qualit des sondages - Claire Durand

27 mars 2000 - 43

Groves, R.M., R.B. Cialdini, et M.P. Couper. "Understanding the Decision to Participate in Surveys." Public opinion quarterly 56(4):475-495. 1992 Groves, R.M., et L.E. Lyberg, "An Overview of Nonresponse Issues in Telephone Surveys." dans: Robert M. Groves, Paul P. Biemer, Lars E. Lyberg, JamesT. Massey, William L. Nicholls II, et Joseph Waksberg. Telephone survey methodology. New York, Wiley, 191-211. 1988 Hidiroglou, Michael A., Douglas J. Drew, et Gerald B. Gray. "Cadre Pour L'valuation La Rduction De La Non-Rponse Dans Les Enqutes." Techniques d'enqutes 19(1):91-105. 1993 Lachapelle, Guy. Les sondages et les mdias lors des lections au Canada. Le pouls de l'opinion Approvisionnements et Services Canada ed., Vol. 16., Dundurn Press Limited & Wilson & Lafleur Limite. 1991 Lavrakas, Paul J. Telephone survey methods: sampling, selection and supervision Applied social research methods series ed., Vol. 7. Newbury Park, Sage. 1993 Maas, Cees, et Wim De Heer. "Response Developments and the Fieldwork Strategy." Bulletin de mthodologie sociologique(48):36-50. 1995 March, Catherine, et Elinor Scarbrough. "Testing Nine Hypotheses About Quota Sampling." Journal of the market research society 32(4):485-506. oct. 1990 O'Neil, Michael J. "Estimating the Non Response Bias Due to Refusals in Telephone Surveys." Public opinion quarterly 43(2):218-232. 1979 Pettigrew, Thomas F. How to think like a social scientist? Santa Cruz, California, Harper Collins. 1995 Platek, R., et G.B. Gray. "Sur les dfinitions des taux de rponse." Techniques d'enqutes 12(1):19-30. 1986 Presser, Stanley, Johnny Blair, et Timothy Triplett. "Survey Sponsorship, Response Rates, and Response Effects." Social science quarterly 73(3):699-702. 1992 SCSP-ACSALF. Sondages politiques et politiques des sondages au Qubec. Montral, mimo. 1979 Sebold, Janice, "Survey Period Length, Unanswered Numbers, and Nonresponse in Telephone Surveys." dans: Robert M. Groves, Paul P. Biemer, LarsE. Lyberg, James T. Massey, William L. Nicholls II, et Joseph Waksberg. Telephone survey methodology. New York, Wiley, 247-256. 1988 Singer, E., M.R. Frankel, et M.B. Glassman. "The Effect of Interviewer Characteristics and Expectations On Response." Public opinion quarterly 47:68-83. 1983 Smith, Herbert L., et Aime Dechter, "Effect of Non Response On the Measurement of Qualit des sondages - Claire Durand 27 mars 2000 - 44

Social Life Feelings." dans: Dagman Krebs, et Peter Schmidt. New directions in attitudes mesurement. New York, Walter de Gruyter, 1993 Snijkers, Ger, Joop Hox, et Edith D. De Leeuw, Interviewers' tactics for fighting survey nonresponse. 4th international social science methodology conference, july 1996, University of Essex, Colchester, England. 1996 Steeh, Charlotte G. "Trends in Nonresponses Rates, 1952-1979." Public opinion quarterly 45(1):32-49. 1981 Stephenson, Bruce C.. "Probability Sampling With Quotas: An Experiment." Public opinion quarterly 43(4):477-496. 1979 Traugott, Michael W. "The Importance of Persistence in Respondent Selection for Preelection Surveys." Public opinion quarterly 51:48-57. 1987 Traugott, Michael W., Robert M. Groves, et James M. Lepkowski. "Using Dual Frame Designs to Reduce Nonresponse in Telephone Surveys." Public opinion quarterly 51:522539. 1987 Tremblay, Victor. La slection dans le bottins tlphoniques: ampleur et consquences de la non-inscription. Montral, Centre de sondage, Universit de Montral. janvier 1981

Qualit des sondages - Claire Durand

27 mars 2000 - 45

Appendice 1 Exemples de stratgies dchantillonnage

Qualit des sondages - Claire Durand

27 mars 2000 - 46

Exemple 1. Population : Ensemble des tudiants gs de 13 ans 16 ans de Montral - O les trouver de faon ce que toute personne rpondant ce critre ait une chance connue et gale aux autres de faire partie de l'chantillon? exemple: coles secondaires publiques et prives de l'le de Montral Problmes: Est-ce que je considre les tudiants vivant Montral (mme s'ils tudient ailleurs) auquel cas ces personnes ne seront pas dans l'chantillon; il y aura donc un biais 6rviser la dfinition de la population? Est-ce que je considre les tudiants tudiant Montral mme s'ils vivent ailleurs? S'ils ne font pas partie de la population, je devrai filtrer pour les liminer. Donc: Les tudiants de Montral: pas assez prcis. 6 choix: Les personnes ges de 13 16 ans tudiant dans une cole publique ou prive situe sur l'le de Montral et rsidant Montral. Problme: Est-ce que j'inclus les handicaps mentaux qui sont dans des coles spciales ou dans les coles rgulires, les handicaps physiques qui sont dans des coles spciales... Donc: Les personnes de 13 16 ans frquentant le cursus rgulier d'une cole secondaire publique ou prive... Problme: de 13 16 ans: S'ils ont 12 ans et qu'ils sont en secondaire 1, je les exclus ou pas? et s'ils ont 16 ans et un mois et sont en Secondaire 5. En fait pourquoi est-ce que j'ai fix ce critre d'ge... Problme: par ailleurs, si je maintiens le critre d'ge, est-ce inclusif ou exclusif? i.e 13, 14, 15 et 16 ans ou 13, 14, 15... Donc: Supposons que la population est dfinie comme l'ensemble des personnes tudiant au secteur rgulier dans une cole secondaire prive ou publique situe sur l'le de Montral et vivant Montral.

Qualit des sondages - Claire Durand

27 mars 2000 - 47

Maintenant, regardons la base chantillonnale, cest--dire la liste des units partir de laquelle on peut tirer lchantillon: - Liste de tous les tudiants inscrits dans les coles.... Problme 1: Les dcrocheurs encore inscrits, est-ce que je les garde dans l'chantillon? - Normalement, si ma population est celle des personnes tudiant..., je vais les considrer comme non-ligibles. Problme 2: O je trouve la liste de tous les tudiants inscrits... Et la loi de protection des renseignements personnels?

6Stratgie d'chantillonnage:
Stratgie 1: chantillonnage de type alatoire simple ou systmatique Pour utiliser cette stratgie, je dois obtenir la liste de tous les tudiants inscrits dans les coles secondaires prives et publiques de l'le de Montral. - Je dois d'abord trouver la liste des commissions scolaires de l'le et la liste des collges privs dispensant un enseignement secondaire. C'est une information publique que je peux obtenir de diverses sources. Exemple: S'adresser au Conseil scolaire de l'le; Trouver le rpertoire des commissions scolaires : Bibliothque EPC, Publications du Qubec (Place Desjardins), ami au Ministre de l'ducation, Association des collges privs,... - Il faudra ensuite obtenir la collaboration de chaque commission scolaire, de chaque collge priv. Je pourrais dcider de convaincre le conseil scolaire de l'le et l'association des collges privs pour qu'ils appuient ma recherche et invitent leurs membres collaborer avec moi. (ATTENTION: tous ces organismes sont trs sollicits. A la CECM, il faut passer par le service de recherche qui filtre les demandes). - Mon problme demeure toutefois. Ils ne peuvent pas lgalement me fournir la liste de leurs tudiants (Loi de protection des renseignements personnels). Je ne pourrais donc utiliser un chantillon compltement alatoire moins que toutes les units dcident de collaborer avec moi et reprennent l'tude leur compte. Si seulement certaines units acceptent, je dois me demander si elles sont reprsentatives de l'ensemble des tudiants. La rponse scientifique cette question est non. Les tudiants de ces units ont comme caractristiques spcifiques de faire partie d'units dont la direction est intresse mon projet. Si l'tude porte sur la perception que les tudiants ont de la direction de l'cole, l'chantillon peut apparatre trs biais puisque les directions intresses par mon projet ont de fortes chances d'tre ce type de direction qui est mieux peru par les tudiants.

Stratgie 2 : chantillon plusieurs degrs. Au premier degr, j'chantillonne les coles partir de la liste des coles. 6Chaque cole a une probabilit connue d'tre choisie. L'unit d'chantillonnage, c'est l'cole. Je contacte ces coles et j'essaie d'avoir la collaboration de toutes les directions d'coles. Je leur demande de me fournir la liste des foyers et du nombre d'tudiants par foyer. Au deuxime degr, j'chantillonne des foyers; chaque foyer -- unit d'chantillonnage de deuxime

Qualit des sondages - Claire Durand

27 mars 2000 - 48

niveau -- a une probabilit connue d'tre choisi. Au troisime degr, je peux dcider d'utiliser un chantillon de type arolaire et prendre tous les tudiants des foyers slectionns. Je pourrais aussi dcider de slectionner des tudiants l'intrieur de chaque foyer (chantillon alatoire ou systmatique). Note : Ce type d'chantillon a des dsavantages dont celui d'entraner possiblement une plus grande homognit de l'chantillon. Il peut toutefois avoir des avantages normes, particulirement en sociologie, celui de permettre de recueillir des donnes sur les caractristiques collectives des units de premier degr (niveau socio-conomique du quartier o est situ l'cole; proportion d'lves d'origine ethnique "autre",etc). Stratgie 3: chantillon plusieurs phases. J'chantillonne un nombre important d'coles. J'adresse un questionnaire la direction d'cole demandant des informations quant certaines caractristiques. J'chantillonne par la suite de nouveau les coles mais sur la base des caractristiques. Exemple: Je veux chantillonner les coles selon le niveau d'activit du comit d'cole. J'chantillonne d'abord 1,000 coles; je leur expdie un questionnaire demandant un certain nombre de questions me permettant de dterminer le niveau d'activits du comit d'cole (frquence des runions, prsence aux runions, nombre d'activits organises, etc). A partir de ces indicateurs, je dtermine un indice d'activit. Les rsultats montrent qu'il y a 300 coles dont le comit est considr comme trs actif, 150 dont le comit est moyennement actif et 150 dont le comit est peu actif. Je dcide d'chantillonner 50 coles trs actives (f= 1/6), 50 coles moyennement actives (f=1/3) et 50 coles peu actives (f=1/3). Je fais alors un chantillon stratifi, i.e. la probabilit d'tre choisi est dtermine par strate et peut diffrer selon les strates. A l'intrieur des coles slectionnes, je dciderai par la suite d'une slection qui peut comprendre diverses populations: enseignants, membres du comit d'cole, parents d'lves, lves...). Je pourrais faire un chantillon appari... La mthodologie, c'est l'art de poser toutes les questions. Le choix de la stratgie d'chantillonnage dpend de divers critres: - Efficacit de la stratgie : recueillir le maximum d'informations au moindre cot en temps et en argent. - Disponibilit des informations : A-t-on accs une liste d'adresses ou de numros de tlphones, le cas chant. - Mode de cueillette : - Par la poste 6 liste d'adresses, hasard alatoire ou systmatique - Par tlphone 6 numros de tlphone ou RDD, hasard alatoire ou systmatique. - Entrevues sur place 6 slection d'ilts, chantillons arolaires ou en grappes. L'IMAGINATION doit tre au rendez-vous : Une stratgie originale permettant de combiner divers modes d'enqutes ou d'chantillonnage lorsque ncessaire permettra d'arriver des rsultats plus intressants, permettant une meilleure analyse de la situation.

Qualit des sondages - Claire Durand

27 mars 2000 - 49

Exemple 2. Supposons que je veux faire un chantillon dcoles du Qubec en vue de faire une enqute auprs des directeurs dcole. La premire tape consiste identifier linformation dont jai besoin. Combien y a t-il dcoles au Qubec. Comment lenseignement est-il organis : priv vs public, commissions scolaires, primaire vs secondaire vs ducation des adultes, nombre dlves par cole, etc. Normalement, je dois pouvoir trouver lensemble de ces informations sur le site du ministre de lducation. ... Une fois linformation recueillie, je dois tenter de voir quel type dchantillon convient le mieux ma problmatique et quels sont les avantages et inconvnients de chaque type dchantillon. A titre dexemple. Echantillon alatoire probabilits gales: Dans ce cas, je tire un chantillon dcoles, sans me soucier de la taille des coles, de leur type (priv, public, primaire, secondaire, etc). Je mintresse aux directeurs dcole et tous les directeurs, quel que soit le type dcole dont ils sont responsables sont quivalents. Pour procder, je dois me rappeler que je peux tirer un chantillon alatoire simple... je peux prendre une table de nombres alatoires (que lon trouve dans tout bon livre de statistique), je peux imprimer la liste de noms, dcouper la liste en un papier par cole, mettre le tout dans un chapeau et piger jusqu atteindre le nombre pr-dfini (voir estimation de la taille requise) je peux, plus simplement, rcuprer la liste de noms dans une base de donnes (SPSS, Excel,...) et utiliser une procdure dchantillonnage (SAMPLE dans SPSS). ou alatoire systmatique: Jimprime la liste et je massure quil ny a pas un ordre dans la liste susceptible de biaiser le hasard. Je tire au hasard un premier chiffre compris entre 1 et lintervalle de slection, ce qui me permet de choisir la premire cole slectionne dans la liste. Je continue ensuite en suivant la liste et en choisissant les coles en fonction de lintervalle de slection. Concrtement, si je dois choisir une cole sur dix, je prends au hasard alatoire un nombre compris entre un et dix inclusivement. Sil sagit de 6 par exemple, je garderai dans lchantillon la sixime cole, puis la seizime, la vingt-sixime, etc. Cette procdure est trs pratique et approprie quand il faut procder manuellement. Je peux encore l utiliser une base de donnes. Dans ce cas, il est habituellement possible de faire mler la liste de noms pour sassurer quelle nait pas dordre susceptible de biaiser lchantillon. Ensuite, on peut slectionner via des fonctions de slection du type (MOD (ID,10) gale 6) o ID est le numro squentiel du cas. Concrtement, le MOD (pour modulo) est le reste de la division de ID par 10 et donc cette procdure permettrait de slectionner le cas 6 (6/10=0, reste 6), le cas 16 (16/10=1, reste 6), le cas 26 (26/10=2, reste 6) etc. Jobtiendrai alors un chantillon de directeurs dcole. Je peux vrifier, partir des donnes que jai dj recueillies sur la population des coles, que lchantillon reflte assez bien cette population, sans trop de distorsions : Les rpartitions public-priv, primaire-secondaire, selon les rgions administratives, sont-elles similaires dans la population dorigine et dans lchantillon? Ceci me permet de massurer que le hasard na pas fait mal les choses, ce qui arrive parfois (au moins une chance sur 20).

Qualit des sondages - Claire Durand

27 mars 2000 - 50

Ceci ne massure pas dune bonne reprsentation des caractristiques des directeurs -- qui pourraient tre influences par dautres paramtres que je ne peux pas contrler puisque je nai pas linformation de base -- mais, je peux affirmer que jai tent dans la mesure du possible de massurer de contrler tout ce quil est possible de contrler. Les caractristiques des directeurs dans lchantillon risquent donc de sapprocher fortement de celles de la population. Dans cet exercice, je ne connais pas les paramtres de la population des directeurs et je tente de les estimer au mieux, i.e. avec une marge derreur acceptable, partir de lchantillon. Linconvnient de cet chantillon est que les directeurs de petites coles seront sur-reprsents dans lchantillon. Echantillon alatoire probabilits ingales Dans le cas de ce type dchantillon, je voudrais que lchantillon des directeurs reflte limportance de leurs responsabilits. En dautres termes, plutt que de donner la mme importance un directeur dcole primaire de village et un directeur de polyvalente, je veux que lchantillon de directeurs que je vais constituer reflte limportance de la population scolaire dont ils ont la responsabilit. Les donnes sur la population des coles tant disponibles, lide est de constituer lchantillon en accordant aux directeurs une probabilit dtre choisi proportionnelle limportance de leurs responsabilits. Il sagit donc de constituer le chapeau de telle manire que, par exemple, le directeur responsable dune cole de 100 lves voit son nom apparatre une seule fois alors que le directeur dune cole de 600 lves voit son nom apparatre six fois et ait donc six fois plus de chances dapparatre dans lchantillon. Avec un tel chantillon, les directeurs dcoles plus importantes seront reprsents dans lchantillon en fonction de limportance de leurs clientles. Comment procder? Il faut dabord que je constitue une liste pondre en fonction du nombre dlves Pour cela, si je veux procder par tirage dans un chapeau (de type loto), je dois doubler, tripler, etc. les noms en fonction du nombre dlves par cole Si jai rcupr la liste dans une base de donnes, je peux utiliser une procdure de pondration. Dans SPSS, par exemple, la commande Weight (pondrer les observations dans le menu Donnes) permet de dfinir que la variable donnant le nombre dlves est utilise pour pondrer. Ensuite, il suffit dutiliser la mme procdure (tirage au sort, SAMPLE, systmatique) que pour lchantillon alatoire probabilits gales.

Lavantage et linconvnient de cet chantillon rside dans ce qui est recherch, en fait: une surreprsentation des directeurs de grosses coles. Echantillon arolaire, chantillon en grappes Rappelons que les deux termes sont parfois utiliss lun pour lautre mais recouvre des procdures lgrement diffrentes. Dans le cas de lchantillon arolaire, exemple que nous allons donner, il sagit de slectionner des aires et de procder ensuite si ncessaire une slection lintrieur de ces aires. Dans le cas de lchantillon en grappes, il sagit de slectionner des cas et de constituer les grappes en prenant un certain nombre de cas voisins des cas slectionns. Supposons que lenqute auprs des directeurs dcole me demande daller les rencontrer en face face, soit pour conduire lentrevue proprement dite, soit pour effectuer des observations sur le milieu de lcole, ou pour dautres raisons. Ce type de situation amne frquemment utiliser des chantillons arolaires de faon viter les cots associs des dplacements indus. On pourrait ainsi, dans notre cas, prslectionner des commissions scolaires, des rgions ou sous-rgions administratives, etc.

Qualit des sondages - Claire Durand

27 mars 2000 - 51

Supposons que je dcide dy aller par commissions scolaires, en incluant les coles prives qui sont sur le territoire des dites commissions scolaires. En recueillant les informations, je maperois quil y a 72 commissions scolaires, de taille toutefois trs variable. La CSDM par exemple, regroupe environ 6,8 pourcent de la clientle scolaire du Qubec. De plus, ses coles sont proportionnellement plus grosses que celles des autres C.S. Il sagit dun problme important lorsque lon veut constituer un chantillon arolaire et que les units de la population ne sont pas quivalentes. Imaginons ce que se passerait si, en slectionnant au hasard, la CSDM ne se trouve pas incluse dans mon chantillon : 6,8% de la population scolaire, des situations dcoles, spcifiques au cnetre de lle de Montral se trouvent exclues de mon chantillon. Celui-ci se retrouve irrmdiablement biais. Par ailleurs, si la CSDM est slectionne et que jai dcid de prendre toutes les coles des C.S. slectionnes, je biaise galement lchantillon en surreprsentant la rgion de Montral et en constituant un chantillon comprenant trop dunits vivant des situations similaires non indpendantes (puisquelles sont dans la mme C.S. et sur un territoire ayant nombre de caractristiques communes). Ceci illustre les dangers de lutilisation irrflchie dun chantillon arolaire. Ayant donc rflchi lensemble des problmes auxquels je risque de me heurter, et comme la premire raison pour laquelle jai opt pour un chantillon arolaire dans ce cas est la ncessit de rduire les cots de transport, jopte pour un chantillon mixte: Sur lle de Montral, je constituerai un chantillon au hasard probabilits gales parmi la liste de toutes les coles. Hors de lle de Montral, je constituerai un chantillon de commissions scolaires au hasard probabilits ingales, fonction de la taille des commissions scolaires. Ensuite, dans chacune des commissions scolaires slectionnes, je prends une fraction des coles au hasard alatoire. Ce type dchantillon me permettra normalement de massurer de reprsenter lensemble du Qubec, lensemble des situations de la faon la plus efficiente possible, en rduisant les cots associs la ncessit de visiter chaque cole. Un des avantages de cet chantillon demeure la possibilit de recueillir des informations de deuxime niveau sur les units -- caractristique de la commission scolaire dappartenance par exemple -- ce qui pourrait permettre destimer si certaines relations ou certains comportements ou directives des directeurs dcole seraient dues des politiques existant au niveau des commissions scolaires, plutt quau niveau des coles elles-mmes Ce faisant, jai toutefois, dune certaine manire stratifi mon chantillon en deux strates (Ile de Montral, reste du Qubec) en utilisant un mode de slection diffrent dans chaque strate. Je pourrais stratifier davantage et diffremment (voir suite). Echantillon stratifi Revenons au problme mentionn dans le premier type dchantillon, savoir la reprsentation en fonction de la taille des coles. Il pourrait arriver que, tant donn le sujet de mon enqute, jaccorde une forte importance ce quil y ait une bonne reprsentation des coles selon leur taille ou selon, par exemple, quelles sont situes en milieu rural ou urbain. Je pourrais ainsi distinguer les coles se trouvant dans des grands centres urbains -- Montral, Qubec, Hull-Gatineau,-- ou hors de ces centres. Jai donc deux grandes strates pour lesquelles je pourrai dcider dappliquer des fractions de slection et mme des modes de slection diffrents de faon par exemple, obtenir la mme marge derreur pour les deux strates. Exemple:

Qualit des sondages - Claire Durand

27 mars 2000 - 52

Donnes 2001 du ministre de lducation du Qubec: Strate Nb coles totales Nb coles publiques primaires secondaires prim. et second. Nb coles prives primaires secondaires prim. et second.

Strate 1 Total Montral Qubec Hull-Gatineau Strate 2 Total Total Province

719 597 86 36 1175 2894

382 316 40 26 1480 1862

117 103 12 2 345 462

27 23 2 2 206 233

95 75 17 3 47 142

56 43 11 2 85 141

42 37 4 1 12 54

Ainsi dans le cas prcdent, pour tirer un chantillon dcoles publiques gal dans les trois centres urbains et dans le reste du Qubec, on pourrait dcider de prendre une cole sur 10 dans la strate 2 (reste du Qubec), ce qui donnerait 117 coles, et de prendre une cole sur 5 dans Hull-Gatineau (7 coles), une sur 8 Qubec (10 coles) et une sur 6 Montral (100 coles). On aurait donc un chantillon final comprenant 113 coles dans les trois centres urbains et 117 coles dans le reste du Qubec. Une fois les donnes en main, on devrait les pondrer par linverse de la fraction dchantillonnage lorsque lon prsenterait les donnes pour lensemble du Qubec. Si on avait pris un chantillon proportionnel, on aurait, pour 117 coles dans le reste du Qubec (strate 2), 72 coles seulement en rgion urbaine (719 divis par 10).

Qualit des sondages - Claire Durand

27 mars 2000 - 53

Appendice II Petits problmes

Qualit des sondages - Claire Durand

27 mars 2000 - 54

Petits problmes Problme 1.: L'Universit de Montral veut construire une piste de ski sur la montagne. Vous faites partie d'un groupe de pression qui veut empcher cette construction. Un de vos arguments majeurs est l'opposition tant de la population tudiante que de la population du quartier environnant ce projet. La population tudiante est estime 30,000 personnes alors que la population du quartier est estime 50,000 personnes (15,000 mnages). Vous dcidez de mener deux sondages, un auprs des tudiants et un autre auprs de la population du quartier. (Notez que les bases se recoupent!). Si la proportion relle d'tudiants opposs au projet est de 57%, 1) Quelle taille chantillonnale devez-vous avoir pour pouvoir affirmer avec 95% de chances de ne pas vous tromper qu'une majorit d'tudiants (50% +1) est oppose au projet? (Estimez d'abord la marge d'erreur que vous pouvez vous permettre). 2) Quelle serait la marge d'erreur si le nombre de rpondants de l'chantillon final tait de a) 3,000 b) 1,000 c) 300 3) a) Combien de numros de tlphone dois-je slectionner au dpart pour obtenir un chantillon final de 600 personnes si le taux de rponse estim est de 70%, le taux d'ligibilit de 92% et le taux de validit des numros de tlphone de 80%. b) quelle sera la fraction de slection? quel sera le pas? si N valide=2,330,000 (N valide tant le nombre de mnages avec numros de tlphone). c) Quel est le poids que vous devrez appliquer chaque rpondant (excluant le poids d la slection dans le mnage)?

Qualit des sondages - Claire Durand

27 mars 2000 - 55

Autres petits problmes 1. a) Une tude a t effectue et 553 questionnaires ont t compltes. Lors de l'analyse, nous constatons que 53,7% des rpondants affirment avoir lu au moins un livre durant les trois derniers mois. Dterminez la marge d'erreur de cette proportion avec un seuil de confiance de 99% (Z"=.99=2.58). b) De ces 553 questionnaires, 110 ont t complts par des personnes dont la langue d'usage est l'anglais et 443 par des personnes dont la langue d'usage est le franais. - Quelle est la proportion de personnes dans l'chantillon dont la langue d'usage est l'anglais? - Quelle est la marge d'erreur de cette proportion si j'accepte un seuil de confiance de 95%. c) Parmi les 110 personnes de langue anglaise, 66 ont lu au moins un livre au cours des trois derniers mois. - Quelle est la proportion de personnes de langue anglaise dans l'chantillon qui ont lu au moins un livre au cours des trois derniers mois? - Quelle est la marge d'erreur de cette proportion si j'accepte un seuil de confiance de 95%. - Dans la population de langue anglaise, avec un seuil de confiance de 95%, la proportion de personnes qui ont lu au moins un livre se situerait dans quel intervalle de valeur (entre combien p. cent au minimum et combien p. cent au maximum)? d) Parmi les 443 personnes de langue franaise, 221 ont lu au moins un livre au cours des trois derniers mois. - Quelle est la proportion de personnes de langue franaise dans l'chantillon qui ont lu au moins un livre au cours des trois derniers mois? - Quelle est la marge d'erreur de cette proportion si j'accepte un seuil de confiance de 95%. - Dans la population de langue franaise, avec un seuil de confiance de 95%, la proportion de personnes qui ont lu au moins un livre se situerait dans quel intervalle de valeur (entre combien p. cent au minimum et combien p. cent au maximum)?

Qualit des sondages - Claire Durand

27 mars 2000 - 56

2. Lors d'une tude portant sur la qualit de vie urbaine, nous voulions complter 300 questionnaires pour chacune des 4 rgions dsignes comme typiques. En estimant le rendement du plan chantillonnal x%, nous avons dcid de slectionner 500 personnes par rgion. Nous avons utilis comme base chantillonnale les listes lectorales. Chaque rgion avait un nombre diffrent d'lecteurs.

Rgion

nb. lecteurs sur la liste 16000 9000 13000 22000

f pas

nb dpart (slectionns) 500 500 500 500

% validit

% ligibilit 95% 95% 95% 80%

% rponse

nb rpondants 300 325 400 225

marge erreur 95%

rendement chantillonnal

1 2 3 4

90% 90% 95% 85%

Dans le tableau prcdent, vous avez toutes les informations ncessaires pour remplir les cases blanches et toutes les notions que vous devez maitriser sont l ou presque... bonne chance. Pour le plaisir (SIC), ajouter une colonne pour la pondration.

Qualit des sondages - Claire Durand

27 mars 2000 - 57

Exercices partir des donnes dun sondage Som publi par La Presse les 8 et 9 mars 1997:
1. Avec un seuil de confiance de 95 % a) Quelle est la proportion de personnes qui ont lintention de voter PQ aux prochaines lections et quelle est la marge derreur de cette proportion ?

b) Quelle est la proportion de personnes qui ont lintention de voter PQ aux prochaines lections et quelle est la marge derreur de cette proportion ?

c) Quelle est la proportion de personnes qui ont lintention de ne pas aller voter aux prochaines lections et quelle est la marge derreur de cette proportion ?

2. Dans quelle(s) sous-population(s) pouvez-vous tre certain 95% que plus de 50% des personnes appuie le oui (ou le non votre choix) ?

3. Y a-t-il une diffrence significative entre les hommes et les femmes quant lintention de voter oui au rfrendum ?

Qualit des sondages - Claire Durand

27 mars 2000 - 58

Appendice lII Les divers types de documents et de rapports

Qualit des sondages - Claire Durand

27 mars 2000 - 59

A. Proposition de service: La proposition de service, comme le projet de recherche mais dans un autre contexte, sert tablir les services qui seront rendus, l'chancier, le cot et le mode de paiement. Une proposition de service type comprend habituellement les informations suivantes: - Objectif de la recherche: On rsume ici les objectifs premiers de la recherche (Ex. Connatre les facteurs qui influencent le dcrochage scolaire chez les immigrants et chez les non-immigrants,..., connatre le taux de satisfaction ...), le mandat excuter. - Stratgie d'chantillonnage propose On note le mode de slection, la prsence de strates s'il y a lieu, les taux de validit, d'ligibilit et de rponse attendus, la marge d'erreur qui devrait en rsulter. - Outil de cueillette On prsente les dimensions, sous-dimensions et indicateurs prvus de mme que des informations plus techniques (nombre approximatif de questions, dure approximative du questionnaire, nombre de pr-test) - Analyses statistiques prvues (en fonction du mandat et de la question de recherche). 6 Esquisse du plan d'analyse. - chancier prvu: Dans cette section, on notera les dates prvues pour chacune des grandes oprations: laboration du questionnaire et pr-test, cueillette des donnes, entre et premier traitement des donnes, analyses et rapport d'analyse. - Soumission quant au cot des oprations et au mode de paiement. Cette partie comprend les estimations de cot, habituellement dtailles pour chacune des oprations (laboration du questionnaire, frais d'impression, de traduction, de cueillette des donnes, de gestion des oprations, d'entre des donnes, de traitement, d'analyse,...) - Prsentation du soumissionnaire Cette partie prsente en annexe prsente les principales ralisations du soumissionnaire et un bref curriculum vitae

Qualit des sondages - Claire Durand

27 mars 2000 - 60

B. Rapport de pr-test: But du pr-test: 1) Vrifier si les questions... - sont comprises (Est-ce que les gens font rpter la question?) - sont comprises de la mme manire par tout le monde (donnent lieu au mme type de rponses dans le cas des questions ouvertes) - sont "productives" - donnent lieu des rponses "riches de sens" - donnent lieu des rponses (peu de "ne sais pas" pour les questions d'opinion) - les choix de rponses se rpartissent de faon approprie 2) Vrifier l'ordre des questions - Les filtres (Passez question...) sont appropris - Le questionnaire "coule bien". 3) Vrifier la dure du questionnaire Pr-test effectu: - de prfrence auprs de gens faisant partie de la population cible mais non de l'chantillon - faciles rejoindre - Le pr-test est effectu de la manire dont l'enqute se droulera i.e. au tlphone pour un sondage tlphonique, anonymement pour un sondage postal,... Le rapport de pr-test comprend: 1) Dure du questionnaire Moyenne: Minimum: Maximum: Mdiane: Bref commentaire sur la dure. Note: La dure du questionnaire inclut l'introduction, la prise de contact et la slection de l'individu s'il y a lieu (dans un mnage par exemple)

Qualit des sondages - Claire Durand

27 mars 2000 - 61

2) Les questions Selon les rsultats du pr-test et l'obligation de faire des modifications plus ou moins grandes, cette partie comprendra - soit des rfrences chaque question avec un bref commentaire et parfois la rpartition des choix de rponse - soit des rfrences uniquement aux questions qui ont pos des problmes (lorsqu'il y en a peu). On notera ici le type de problme entran par les questions et le type de solution propos. La suggestion de modification de la question est soit insre avec ces commentaires, soit rfre la version finale du questionnaire. 3) Ordre des questions, droulement de l'entrevue On notera ici les problmes amens par les filtres, par l'ordre des questions. On notera les ajouts d'introduction certaines sries de question, les modifications dans l'ordre d'une question ou d'un groupe de questions. Note: Il est particulirement important ce niveau de porter attention aux premires questions. Si celles-ci constituent une entre trop "vive" dans le coeur du sujet, il y a risque de provoquer des refus ou des rsistances rpondre certaines questions.

Qualit des sondages - Claire Durand

27 mars 2000 - 62

C. Rapport mthodologique Le rapport mthodologique est habituellement annex au rapport d'analyse. Il comporte les informations suivantes: - Dfinition de la population: - Information sur la base chantillonnale - Information sur le mode de slection et la fraction de slection (par strate s'il y a lieu) - Rapport de "terrain" i.e Informations sur la cueillette des donnes: - Information sur le droulement des oprations: - Date de dbut et date de fin - Prsence d'vnements perturbants - Postal, auto-administr : Nombre et date des rappels - Tlphonique : Nombre et moment des appels faits pour rejoindre les personnes - Tableau des rsultats du terrain (voir norme AIRMS): chantillon de dpart: N de dpart Non-valides (non-rsidentiels et non attribus dans le cas d'un sondage tlphonique; gnralement, non-membres de la base chantillonnale) chantillon valide: N valide, taux de validit Non-ligibles (malades, confus, incapables de converser en franais ou en anglais, etc.) chantillon ligible: N ligible, taux ligibilit Refus de rpondre (mnage, individu) Absence prolonge Non-rponse chantillon final: N rpondants, taux de rponse - Pondration et redressement appliqu selon les strates, le cas chant

Qualit des sondages - Claire Durand

27 mars 2000 - 63

D. Plan de code Le plan de code comprend les indications aux codeurs sur la manire dont les donnes doivent tre codes. Il contient donc des informations du type: Pour chaque question laquelle la situation s'applique: - Que faut-il faire lorsqu'une personne n'a pas rpondu une question (Attribuer un code prdtermin? laisser en blanc? - Que faut-il faire lorsqu'une question n'a pas tre rpondue par une personne (Attribuer un code pour "Ne s'applique pas"? Laisser en blanc? - comment doit-on coder les questions ouvertes (Lister les rponses, regrouper par catgories,...) - comment coder les occupations, les types d'organisations - que faire lorsque les rponses plusieurs questions ne "balancent" pas (Exemple: On demande aux gens la proportion de leur temps d'coute tl qu'ils ont consacr l'coute des diverses chanes de tlvision et le total ne donne pas 100%. Livre de code: Le livre de codes comprend les codes pour chacune des questions. Il est essentiel pour les questions ouvertes, moins que les codes soient inscrits dans le programme informatique (Value labels). Il est annex au rapport d'analyse.

Qualit des sondages - Claire Durand

27 mars 2000 - 64

E. Rapport d'analyse Le rapport d'analyse est le texte final remis au "client". Le "corps" du rapport comprend: - Une introduction o on rappelle le mandat et o l'on prsente les grandes parties du texte qui suivra. - Les divers chapitres comprenant chacun l'analyse d'une partie des donnes (Un rapport pourrait, dans les cas soumis dans le cadre de ce cours, comprendre un chapitre sur les connaissances, un autre sur les comportements et un troisime sur les attitudes). Dans chaque chapitre, on prsentera habituellement les tableaux des frquences pour les questions pertinentes puis les croisements appropris. - Une conclusion qui fera le point sur la question de recherche et les rponses qui y ont t apportes. - Les rapports comprennent souvent, avant l'introduction, ce qu'on appelle les "faits saillants", c'est--dire les rsultats les plus importants, les plus frappants, de l'tude. Les annexes suivantes sont habituellement incluses: - Rapport mthodologique - Questionnaire (versions franaise et anglaise s'il y a lieu) - Livre de codes - Tableaux des frquences pour chaque question (pondres ou non-pondres selon le cas)

Qualit des sondages - Claire Durand

27 mars 2000 - 65

Appendice IV C. Durand et S. Vachon (1997), La gestion des appels et lutilisation de logiciels ITAO par les firmes de sondage prives.

Qualit des sondages - Claire Durand

27 mars 2000 - 66

Recueil du Symposium 97 de Statistique Canada Nouvelles orientations pour les enqutes et les recensements Novembre 1997

LA GESTION DES APPELS ET LUTILISATION DE LOGICIELS

ITAO PAR LES FIRMES DE SONDAGE PRIVES


C. Durand8 et S. Vachon
RSUM

La recherche prsente trace un bilan des logiciels dinterview tlphonique assiste par ordinateur (ITAO) et de leur utilisation actuelle dans les firmes de sondage prives. Trois sources de donnes sont utilises: un sondage auprs des firmes de sondage, des observations sur place des oprations et la documentation fournie par les fabricants. Les rsultats montrent quil y aurait lieu damliorer la capacit des logiciels grer la rpartition des tentatives de contact en fonction de lhistorique des appels, de dterminer la priorit dans la file dattente aux numros non-touchs ainsi que de faciliter le suivi des oprations en implantant des rapports-type appropris. Enfin, la gestion des oprations pourrait tre amliore en facilitant le pairage des caractristiques des interviewers et de celles des sous-chantillons de mme quen amliorant la formation formelle en mthodologie de sondage des superviseurs. MOTS CLS: ITAO; mthodologie de sondage; gestion des appels.

1. INTRODUCTION Cette recherche sintresse un aspect spcifique de la gestion des oprations de sondage, celui de lutilisation des logiciels dinterview tlphonique assiste par ordinateur (ITAO) pour faire la gestion de la cueillette de donnes. La recherche a t volontairement restreinte aux logiciels utiliss par les firmes prives. Elle vise rpondre principalement deux questions. Dune part, les logiciels utiliss par les firmes permettent-ils faire une gestion de terrain approprie et dautre part, les firmes utilisent-elles les logiciels de faon oprer une gestion de terrain optimale. Les recherches sur les systmes ITAO ont surtout port sur les avantages aux plans de la conception du questionnaire et de la qualit des donnes. Les textes portant sur ces questions datent de prs de 10 ans pour la plupart (Berry et ORourke 1988; Carpenter 1988; Connett 1990; Saris 1991; Weeks 1988). Ds 1988, il apparaissait que les fonctionnalits minimales de base taient disponibles pour presque tous les logiciels (Carpenter 1988) et la situation ne peut que stre amliore depuis. Il napparat donc pas ncessaire de refaire les mmes valuations relatives la prsence de fonctionnalits. Cette recherche a vis entreprendre un bilan des logiciels 10 ans plus tard un niveau plus qualitatif, au plan des valuations et des utilisations effectives ainsi que des amliorations apporter. 1.1 Contexte de la recherche

Tant Berry et ORourke (1988) que Weeks (1988) soulignent que la gestion des appels dans les sondages tlphoniques est peu systmatise et relve encore souvent du folklore et de lintuition. Des questions demeurent encore non rsolues (Weeks 1988): le meilleur moment pour placer le premier appel, la meilleure mthode pour classer les rendez-vous, les systmes de priorit dappels, la capacit de prvoir les heures de travail ncessaires pour complter un sondage de mme que des rapports permettant une estimation fiable du taux de rponse actuel et prvoir. Plusieurs lments demandant des dcisions dordre mthodologique et de gestion apparaissent dans le droulement des oprations de cueillette tlphonique assistes par ordinateur. On peut les rpartir en deux grandes catgories, les fonctions lies au traitement automatique des appels priorit dappels, protocoles dappel, capacit de pairage des caractristiques de lchantillon et du personnel et les fonctions lies la supervision ! contrle des oprations et suivi. 1.2 Mthodologie utilise Cette recherche a demand le recours plusieurs sources dinformation. En premier lieu, des donnes ont t recueillies auprs des firmes de sondage oeuvrant dans lensemble du Canada (voir Durand et coll. 1997) au moyen dentrevues sur place (Qubec) et de questionnaires postaux (Reste du Canada). En tout, 29 des 38 firmes sondes avaient des oprations informatises de sondage par tlphone et 28 directeurs de terrain ont rpondu lensemble des questions dvaluation du logiciel en mentionnant le logiciel utilis. En deuxime lieu, pour

Claire Durand, dept. de sociologie, Universit de Montral, C.P. 6128, succ. Centre-ville, Montral, (Qubec), H3C 3J7, courrier lectronique: durandc@ere.umontreal.ca. Les tableaux dtaills des rsultats sont disponibles auprs de C. Durand.

Qualit des sondages - Claire Durand

27 mars 2000 - 67

chacun des logiciels utiliss, les manuels et la documentation fournis par les fabricants ont t tudis. En troisime lieu, pour chaque logiciel, au minimum une observation sur place a t ralise, portant sur lutilisation faite par le(s) superviseur(s) au moment de la mise en place. Les logiciels valus sont Interviewer, Dash, Quantime, Sawtooth Ci3 et Pulse Train. 1.3 Rsultats2 Les valuations quant la flexibilit des logiciels sont gnralement positives sauf pour un logiciel o les valuations sont partages. Lorsque lon aborde la facilit matriser les logiciels, lvaluation est moins positive et les opinions sont partages pour trois logiciels. Les points forts mentionns portent surtout sur la fiabilit des logiciels et sur la facilit de programmation alors que les points faibles les plus frquemment mentionns sont la lenteur du systme, la difficult de programmation et la difficult de raffectation (surtout pour les logiciels sur ordinateur central). Il faut toutefois souligner que les directeurs ne sont pas habituellement les utilisateurs des logiciels de gestion de terrain. Certaines fonctions sont effectues par des programmeurs (programmation des rgles de raffectation, des questionnaires), dautres presque uniquement par les superviseurs de terrain. 2. LES FONCTIONS LIES AU TRAITEMENT AUTOMATIQUE DES APPELS Pour ce qui est des quatre fonctions spcifiques sur lesquelles les directeurs ont t questionns, les valuations varient. Elles sont ici mises en relation avec le potentiel rel des logiciels. Laffectation des rendez-vous aux interviewers qui les ont pris peut se faire relativement facilement pour les logiciels sur PC, nettement plus difficilement pour les logiciels sur ordinateur central; la perception des directeurs est relativement conforme la ralit. Pour ce qui est daffecter automatiquement les horaires de contact, les valuations sont gnralement positives et les capacits des logiciels existent si lon comprend par l uniquement la fonction gnrale de raffectation automatique selon des rgles minimales (dlais entre tentatives). Enfin, la raffectation des interviewers spcifiques napparat pas poser de problmes au contraire de laffectation de certains changes tlphoniques ayant des caractristiques spcifiques, qui apparat difficile raliser pour une bonne partie des directeurs. Cette dernire fonction peut effectivement tre difficile raliser avec la plupart des logiciels moins davoir des informations prcises sur les caractristiques de certains changes. 2.1 Priorits et files dattente: Les numros non contacts doivent-ils avoir

priorit sur les numros dj contacts ? Si la priorit est accorde lchantillon dj contact (PR), une partie de lchantillon ne pourra tre rejointe une premire fois que vers la fin du terrain et aura donc eu une moins grande chance dtre interroge. Cette manire de procder postule que le fait que les chantillons sont mlangs au dpart limine les possibilits de biais systmatiques. Lorsque la priorit est accorde lchantillon neuf, lchantillon est gnralement ferm (nombre pr-dfini de numros de tlphone) et lon vise ce que chaque numro ait la mme chance dtre rejoint. Trois logiciels permettent daccorder la priorit aux numros non-touchs. Dans deux cas sur trois, lutilisation dune telle possibilit demande lintervention du superviseur, soit dans la file dattente (en changeant la priorit donne aux banques de rsultats), soit par des consignes diffrencies aux interviewers. Deux logiciels prsument dune priorit aux numros dj touchs, difficilement modifiable. Cette pratique apparat lie une certaine utilisation de la mthode des quotas o lchantillon de dpart est pratiquement illimit, lchantillon non touch en fin de terrain tant considr comme ne faisant pas partie de lchantillon de dpart. 2.2 Les protocoles dappel Lchantillon doit tre touch des priodes varies du jour et de la semaine de faon pouvoir dtecter les numros commerciaux et les rsidences secondaires et sassurer le plus possible de rejoindre les personnes qui sont moins souvent prsentes la maison ou qui travaillent le soir. Weeks (1988) note quatre modes de gestion des appels: le every shift approach (un appel chaque quart de travail), le scatter approach, approche o on fait varier les moments dappel selon le jour et lheure du jour, le contact probabilities approach, o on dtermine le moment du prochain appel en tenant compte de la meilleure probabilit de contact un moment dtermin et enfin, le priority score approach, o le score qui dtermine la priorit dans la file dattente est bas sur des facteurs multiples tels le nombre de tentatives de contact antrieures, le moment de ces tentatives, la probabilit de contact, etc. Jusqu quel point est-il possible de rpartir les appels de faon non seulement informatise mais automatise? Les logiciels ne permettent pas aisment de programmer et de vrifier une distribution des tentatives dappel qui tienne compte de lhistorique des appels. Ils permettent aisment, sinon par dfaut, de programmer une approche de type every shift (tentatives de contact en rotation chaque quart de travail) et de dterminer ce quest un quart de travail. La plupart des logiciels permettent galement, de par la possibilit de programmer des rgles cumulatives, de faire varier lintervalle de temps entre les tentatives de contact en fonction du nombre de tentatives. Il apparat trs difficile sinon impossible, avec les logiciels tudis, de vrifier si tous les numros ont reu des tentatives certaines heures (jour, soir) et certains moments de la semaine (sur semaine, week-end). Lapproche de rpartition des appels (jour, soir, week-end)

Qualit des sondages - Claire Durand

27 mars 2000 - 68

ou scatter approach est donc en ce moment trs difficile implanter sur la plupart des logiciels tudis sinon en ayant recours une programmation complexe.9 Cette situation amne parfois les firmes contourner la difficult, en programmant des demiquarts de travail ou en traitant les numros nonrejoints comme des rendez-vous. Des approches plus complexes, bases sur la probabilit de contact ou sur des scores de priorit, ne sont pas disponibles. 2.3 Les capacits de pairage des caractristiques de lchantillon et du personnel Une gestion fine de lchantillon demande de tenir compte dun certain nombre dinformations. Les numros de tlphone sont habituellement distribus au hasard alors quune gestion optimale des ressources humaines commanderait plutt que certains changes ou bottins soient distribus dabord, au dbut de la cueillette ou certains groupes dinterviewers. Les logiciels permettent-ils de bien grer, facilement, lensemble des paramtres de gestion fine lis la conduite des oprations? Les logiciels permettent deffectuer une gestion par sous-chantillon, mais relativement difficilement. Les fonctionnalits qui y sont lies apparaissent souvent complexes de telle sorte que les utilisateurs prfrent oublier cette partie en engageant, par exemple, uniquement des interviewers bilingues ou utiliser des moyens dtourns faute de connaissance des moyens prvus. Trois des logiciels ne permettent pas que les consignes soient traduites ce qui oblige linterviewer faire face un libell de question dans une langue avec des instructions dans une autre langue. Il serait possible dimplanter pour les sondages auprs de la population un module permettant dinformer linterviewer de lendroit o il appelle et de la rpartition linguistique cet endroit par limportation de variables systme qui devraient alors tre associes au fichier dchantillon. Cette possibilit faciliterait par la suite le pairage des caractristiques des interviewers et de celles des sous-chantillons. La plupart des logiciels permettent de crer des groupes dinterviewers en fonction de caractristiques dintrt et de faire des affectations qui tiennent compte de ces caractristiques. Toutefois, probablement d en partie la mobilit du personnel dentrevue ou la difficult de reprogrammer la composition des groupes, ces fonctions sont peu sinon pas du tout utilises.

3. LA SUPERVISION, LE CONTRLE ET LE SUIVI DES OPRATIONS 3.1 Le contrle des oprations La conception mme des logiciels de gestion dentrevues tlphoniques vise nommment liminer la ncessit pour le superviseur dintervenir dans la rpartition des numros de tlphone. Le systme idal est entirement automatis et les superviseurs peuvent se concentrer sur lcoute et la validation des entrevues. Il faut se demander jusqu quel point, dans la pratique, lintervention du superviseur est ncessaire ou frquente, et jusqu quel point il est en mesure deffectuer aisment les oprations requises et ce, avec lensemble de linformation ncessaire pour prendre les dcisions. Lintervention du superviseur dans la file dattente, cest-dire laffectation manuelle de parties dchantillon dont les rgles ne prvoient pas laffectation un moment dtermin, semble tre la norme plutt que lexception. Les superviseurs semblent matriser assez bien sinon trs bien cet aspect de leur travail et cela, quelque soit la facilit ou la difficult effectuer les oprations avec un logiciel donn; cette observation accrdite lide que lintervention du superviseur dans laffectation des numros de tlphone est habituelle. Les superviseurs observs pouvaient prsenter la trs grande majorit sinon toutes les fonctions de supervision du logiciel utilis en sachant quoi elles servaient. Ils semblaient trs laise avec le logiciel, quel quil soit. Pour certains logiciels trs flexibles, il tait tonnant de constater la crativit des superviseurs et du personnel de terrain pour forcer le logiciel faire ce quils voulaient par des moyens dtourns si ncessaire (utilisation de codes spciaux pour identifier les anglophones, de fuseaux horaires pour fermer des strates de numros commerciaux, de codes de rendez-vous spciaux pour contrler la rpartition des appels). Les superviseurs ont en gnral une certaine connaissance, gnralement assez superficielle, des rgles qui prsident laffectation des appels dans la file dattente; ils ninterviennent toutefois pas habituellement dans cette programmation mme lorsquelle leur est accessible (non protge contre les modifications). Dans les observations ralises, un seul superviseur avait la capacit dintervenir dans la programmation et le faisait. Etant donn la volont avoue des fabricants de logiciels autant que des directeurs de terrain den arriver une automatisation complte de la gestion de la cueillette, il est frappant de constater quel point la plupart des superviseurs interviennent rgulirement dans la gestion automatise des oprations, soit pour ractiver des numros classs, classifier et rattribuer les rendez-vous, vrifier le suivi des quotas et en modifier les pondrations, etc. La plupart de ces oprations sont rendues ncessaires par le fait que les rgles relatives aux protocoles dappel ne sont pas assez prcises ou assez souples ou ne sont carrment pas appropries au type de

Un logiciel avait t programm pour quil y ait un compteur du nombre de tentatives par type de priode (jour, soir, week-end) et des rgles quant au nombre maximum de tentatives, ce qui permettait tout le moins de sassurer dune variation dans les moments des tentatives. Un autre avait t programm de telle sorte que linterviewer indique le moment de la prochaine tentative partir dun menu suggrant des priodes appropries.

Qualit des sondages - Claire Durand

27 mars 2000 - 69

gestion que les firmes dsirent faire. Il faut aussi se demander si les superviseurs ne prfrent pas intervenir dans la file dattente de faon garder limpression dun certain contrle sur les oprations. Si lautomatisation presque complte de lattribution des numros de tlphone demeure un objectif, elle devra permettre aux superviseurs de garder un certain contrle, mme subjectif, sur le droulement du terrain par une capacit amliore dtre inform du droulement des oprations. 3.2 La capacit de faire le suivi Une des oprations les plus importantes dans la gestion du terrain est celle du suivi puisquelle permet dagir et de ragir au droulement des oprations. Cest une fonction dautant plus importante que lenqute se fait auprs dun chantillon dont les caractristiques taux de validit et dligibilit de la base de sondage ne sont pas connues. Le suivi de terrain devrait permettre, dune part destimer le rendement du plan chantillonnal et dautre part, de suivre le rendement du personnel de mme que de prvoir le personnel ncessaire. Les rapports donnant linformation sur le droulement du terrain tat de lchantillon, des rendez-vous respecter et du taux de rponse, productivit des interviewers demandent dans la plupart des cas, soit une programmation prliminaire, soit la connaissance dun certain nombre de commandes plus ou moins complexes. Limplantation des logiciels, telle quobserve, ne permet pas toujours un accs facile ce type dinformation. De fait, plusieurs firmes utilisent une base de donnes de type Excel ou Lotus, dans lesquelles elles entrent manuellement linformation provenant du logiciel ou provenant des statistiques tenues par les interviewers (notes sur papier). Le seul fait que les firmes aient recours un autre logiciel laisse penser que les logiciels de gestion ne sont pas appropris sur ce point ou que les superviseurs ou les programmeurs manquent de formation ou dinformation. 4. CONCLUSION Les logiciels ITAO ont certainement facilit le travail dentrevue et amlior la conception des questionnaires ou du moins tendu les possibilits sur ce plan. Toutefois, pour ce qui est de la gestion des oprations de cueillette, des faiblesses importantes apparaissent dans lautomatisation de la rpartition des appels et dans la capacit suivre le droulement des oprations. Ceci nest pas surprenant. Dune part, avant linformatisation, la gestion de terrain ntait pas arrive une systmatisation des oprations (Weeks 1988; Berry et ORourke 1988). Les protocoles dappel taient variables et relevaient de lintuition (Weeks 1988). Dautre part, le recours aux quotas est frquent dans

les firmes prives (Durand et coll. 1997). La plupart des logiciels sinon tous semblent permettre une gestion par quota plus facile et raffine que la gestion des tentatives de contact, ncessaire pour les chantillons avec rappels. La question des rapports et du suivi est plus complexe puisque les logiciels semblent permettre un assez bon suivi et une flexibilit dans la dtermination des informations contenues dans les rapports. Le fait quune partie des firmes ont recours dautres outils laisse penser que les outils fournis ne sont pas adquats, quils sont jugs trop complexes utiliser ou encore, que la formation est dficiente. Aucun logiciel ne semble pouvoir aider la planification des ressources ncessaires aux oprations de cueillette. Enfin la gestion fine, permettant de coupler caractristiques des interviewers et de lchantillon, est difficile effectuer. Les logiciels permettraient de faire une meilleure gestion sur ce plan mais les fonctions permettant de le faire sont peu utilises. Ceci peut tre d en partie linstabilit du personnel dinterview et de leurs horaires mais aussi une complexit certaine de ce type de couplage. Quelles amliorations apporter? Les amliorations qui apparaissent prioritaires se situent sur deux plans. Dune part, implanter des modules qui permettraient de raliser aisment une rpartition des appels de type variation systmatique (Scatter approach). De mme, les fonctions qui permettraient le pairage des caractristiques des interviewers et de celles de lchantillon devraient tre amliores. Dautre part, il y a lieu dimplanter des rapports type qui, par dfaut, donneraient un estim du taux de rponse prvu ou du taux de collaboration, un estim des rappels effectuer certains moments choisis ainsi que des rapports de productivit dont les informations pourraient tre transfrables aisment sur les logiciels de base de donnes courants. Les oprations de cueillette des donnes de sondage tlphoniques sont entre les mains des superviseurs. Ces derniers semblaient bien connatre les objectifs quils devaient atteindre et savoir comment les atteindre. Il faut toutefois se demander si les superviseurs ont la formation thorique qui leur permettrait de savoir pourquoi les oprations se font dune manire plutt quune autre. La sparation entre professionnels-mthodologues dune part et techniciens dautre part, maintenue sinon renforce depuis lavnement des logiciels ITAO, constitue sans doute un frein lamlioration de la gestion des appels. La formation du personnel se fait gnralement sur le tas, chaque firme produisant son cahier de rfrence pour les superviseurs et les interviewers. La formation apparat parcellaire et fragmente, chacun ne connaissant que les parties quil a utiliser rgulirement. Le temps serait sans doute venu de se doter doutils de formation professionnelle du personnel de terrain. Ceci ne pourrait que profiter tant aux firmes qu lindustrie du sondage en gnral. Enfin, on ne peut que ritrer que les recherches doivent se poursuivre pour amliorer et systmatiser les manires de faire dans la gestion des appels de faon maximiser le taux de rponse.

Qualit des sondages - Claire Durand

27 mars 2000 - 70

REMERCIEMENTS Cette recherche a t ralise grace une subvention du Conseil de recherche en sciences humaines du Canada (CRSHC) que nous tenons remercier. Nous tenons galement remercier les firmes qui ont apport leur collaboration particulirement pour la phase d'observation.
BIBLIOGRAPHIE

Connett, W.E., Blackgurn, Z., Gebler, N., Greenwell, M., Hansen, S.E., et Price, P. (1990). A report on the evaluation of three CATI systems. Survey Research Center, Institute for Social Research, University of Michigan, 99. Durand, C., Tanguay, I., et Vachon, S. (1997). La gestion de la mthodologie dans les firmes de sondage au Qubec et au Canada. 65 me Congrs de l'ACFAS, Universit du Qubec Trois-Rivires, 16 mai 1997. Nicholls II, W.L. (1988). Computer-assisted telephone interviewing. (ds.) R. M. Groves, P. P. Biemer, L. E. Lyberg, J. T. Massey, W. L. Nicholls II, et J. Waksberg Telephone Survey Methodology, New York: John Wiley, 377-385. Saris, W.E. (1991). Computer-assisted interviewing. Newbury Park: Sage. Weeks, M.F. (1988). Call scheduling with CATI: current capabilities and methods. (ds.) R.M. Groves, P.P. Biemer, L. E. Lyberg, J. T. Massey, W.L. Nicholls II, et J. Waksberg, Telephone Survey Methodology, New York: John Wiley, 403-420.

Berry, S.H., et ORourke, D. (1988). Administrative designs for centralized telephone survey centers: implications of the transition to CATI. (ds.) R. M. Groves, P. P. Biemer, L. E. Lyberg, J. T. Massey, W. L. Nicholls II, et J. Waksberg, Telephone Survey Methodology, New York: John Wiley, 457474. Carpenter, E.H. (1988). Software tools for data collection: microcomputer-assisted interviewing. Social Science Computer Review, 6, (3), 353-368.

Qualit des sondages - Claire Durand

27 mars 2000 - 71

Index chantillon alatoire probabilits ingales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 arolaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 en grappes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 stratifi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 Base chantillonnale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1, 14, 15, 47 Codification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 distribution chantillonnage (d') . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 population (de la) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 cart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7, 8 chantillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 alatoire probabilits gales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 alatoire simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2, 49 alatoire systmatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2, 48, 49 appari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4, 48 arolaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 dpart (de) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11, 14-16, 62 ligible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 final . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11, 62 grappes (par) - arolaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 non-probabiliste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 plusieurs degrs () . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5, 47 plusieurs phases () . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5, 48 probabiliste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 quota (par) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 raisonn - au jug . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 stratifi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3, 15, 48 thorique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12, 14 valide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 volontaires (de) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Echantillon stratifi non-proportionnels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 proportionnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 chantillonner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 ligibilit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12, 14 erreur-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 facteur de correction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 fraction de slection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14, 17 gestion du terrain . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 informatise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 poste (par la) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 tlphone (par) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Qualit des sondages - Claire Durand 27 mars 2000 - 72

incidence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12, 13 infrence statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6, 7 intervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 intervalle de confiance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 intervalle de slection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 marge d'erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8, 10, 11 marge derreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Mode de cueillette . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 non-ligibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 non-rponse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 absence prolonge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 incomplet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 pas de rponse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 pas (le) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14, 17 Poids d'chantillonnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 de non-rponse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 de redressement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 pondration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Population . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1, 46 finie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 infinie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 random digit dialing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Rapport d'analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 de pr-test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 mthodologique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 refus de la personne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 du mnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 rendement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 seuil de confiance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8, 9, 11 une chance sur 20 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 stratgie d'chantillonnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47, 48 taux d'ligibilit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13, 19, 20 de non-rponse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17, 20 de rponse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13, 14, 19 de validit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13, 19, 20 units . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 d'analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 d'chantillonnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1, 47 de rfrence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 dclarante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 non-ligibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12, 47 Qualit des sondages - Claire Durand 27 mars 2000 - 73

non-valides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 valides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 validit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12, 14 variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Qualit des sondages - Claire Durand

27 mars 2000 - 74

You might also like