You are on page 1of 130

FORMATION

FORMATION
Etudes quantitatives sur SPSS
Rdaction darticles
scientifiques en anglais

PRSENTE PAR
M. Marco CARAMELLI
PRSENTE PAR
Mme Margaret HAUGH

34, bd Haussmann 75009 Paris


Tl. : 01 42 46 98 74
Fax : 01 42 46 00 33

Contenu:
1 : Introduction aux mthodes de recherche en managementp.1
2 : Les diffrents types de recherche en management..p.13
3 : La problmatique de recherche.p.26
4 : La revue de littrature et les hypothses de recherche (tudes quanti)p.34
5 : Ltude qualitative : les entretiens semi-directifs et lanalyse de contenu thmatiquep.42
6: Introduction aux tudes quantitatives : les principes de construction dun
questionnairep.61
7 : Validit et fiabilit des mesuresp.82
8 : Lanalyse des donnes quantitatives et le test des hypothses de recherchep.101
Bibliographie

1 : Introduction aux mthodes de recherche en management


Comme toutes les sciences, en allant des plus duresPhysique, Chimie, aux plus molles
Biologie, Mdecine, Psychologie etc la science de lentreprise ou sciences de gestion ,
a comme objectif de rendre compte de la ralit de lactivit des entreprises, de la manire la
plus objective possible.

Chaque individu a des croyances propres dans diffrents domaines, qui sont le fruit de son
histoire et de ses expriences personnelles. Afin daller au-del de ces subjectivits
individuelles, et dapporter de la connaissance la plus objective possible, des mthodes
spcifiques ont t dveloppes.

Selon les auteurs, les objectifs, les moyens financiers disponibles, le temps et les comptences
disponibles, les mthodes utilises peuvent tre plus ou moins sophistiques.

Par exemple, les tudes ralises au sein des entreprises commerciales, utilisent le plus souvent
des mthodes moins rigoureuses et sophistiques que les tudes ralises dans le cadre de
recherches scientifiques.

Dfinition des Sciences de Gestion


On peut considrer que les sciences de gestion concernent ltude scientifique de toute
problmatique concernant lactivit et lorganisation des entreprises : de leur naissance leur
dveloppement, leur disparition, et dans leur fonctionnement interne ou linteraction avec leur
environnement.

Ltude de la naissance des entreprises est une discipline que lon appelle lentrepreneuriat.
Elle vise expliquer, par exemple, quels sont les facteurs de succs de la cration dune
entreprise, et par la suite, ses facteurs de survie et de dveloppement.

Ltude du dveloppement et de la croissance des entreprises fait gnralement partie dune


discipline que lon appelle la stratgie.
On essaye ici de comprendre les raisons pour lesquelles une entreprise est comptitive ou pas
sur son march, ainsi que la manire de dvelopper cet avantage concurrentiel.

Ce dveloppement et cette croissance ncessitent des investissements et donc de largent.


Ltude de la manire dont les entreprises grent les flux entrants et sortants de trsorerie et la
maximisation de sa valeur sappelle la finance dentreprise.
La valeur boursire des socits cotes est dtermine quotidiennement sur les marchs
financiers : la finance de march est la discipline qui essaye de comprendre le comportement
des acteurs de ce march ainsi que les mcanismes sous-jacents.

Lhomme de marketing a besoin de comprendre le fonctionnement du consommateur : son


comportement, ses attentes, ses besoins, ses ractions face la communication. Le marketing
est ainsi la discipline qui tudie le comportement du consommateur et les moyens de
linfluencer.

Enfin, lentreprise doit attirer des talents puis les retenir, et lorsquils sont dans lentreprise,
faire en sorte quils soient satisfaits et motivs et quils souhaitent cooprer, travailler dur, quils
soient fiers dappartenir lentreprise
Le DRH doit comprendre le comportement des salaris : que faire pour que ceux-ci soient
motivs ? Quils soient fiers dtre dans lentreprise ? Quils soient panouis ? Quils ne partent

pas chez le concurrent ? Ainsi la Gestion des Ressources Humaines est la discipline qui tudie
le comportement du salari, et les moyens de linfluencer.

Lentrepreneur ou le manager doivent en fait sans cesse comprendre les mcanismes rgissant
une multitude de processus qui se droulent dans lentreprise et dans son environnement.

Ils ont en effet toujours besoin danticiper des situations lies lactivit de lentreprise et
dagir sur celle-ci afin de modifier le cours des choses.

Sur quoi le manager se base-t-il pour prvoir les vnements, et savoir quelles actions mettre
en uvre pour les modifier dans un sens qui sera favorable ses intrts ?

Lorsquil prend une dcision, le manager se base sur des lois ou rgles dans lesquelles il croit,
et qui drivent de son exprience et ventuellement de sa formation.

Par exemple, chaque manager sexprimant rgulirement en public a ses propres croyances
concernant la manire dattirer lattention, se faire comprendre, susciter ladhsion

Ces principes sont le fruit de lexprience de chacun, de lectures ou de la formation de chacun


le cas chant.

Il en est de mme pour tous les autres mtiers :

Le mcanicien arrive dtecter une panne en coutant le bruit du moteur grce


son exprience et aux cours de mcanique quil a suivis ;

Le mdecin qui dtecte une maladie et propose un traitement, se base sur son exprience
des cas semblables auxquels il a t confront et sur ses cours de mdecine.

Face une situation donne, toute personne met un diagnostic, et met en uvre des mesures
qui lui sont dictes par son exprience et sa formation (N.B. la formation est un type
dexprience, bien videmment).

Quest-ce que lexprience ?

Lexprience est lensemble de tout ce quune personne a vcu, observ, lu, ou qui lui a t
rapport par des tiers lors de discussions.
Chaque individu fait inconsciemment une synthse de cet ensemble dlments, et cette
synthse cre des croyances sur le fonctionnement des choses et sur les actions ncessaires
pour modifier les choses dans le sens souhait.

Par exemple, certains managers pensent quun management autoritaire est plus efficace, alors
que dautres ont une prfrence pour un management plus participatif.

Comme suggr prcdemment, ces croyances sont subjectives, et risquent parfois dtre
errones.
En mdecine, par exemple, les mdecins out pendant longtemps pltr les entorses de chevilles
et prn du repos en cas de lombalgies, avant que des tudes ne montrent quil tait prfrable
de ne pas pltrer les entorses, et que lactivit tait prfrable au repos en cas de lombalgie.

La ralisation dtudes, enqutes ou recherches (on pourra utiliser les trois termes comme
synonymes) revient finalement dvelopper de lexprience mais dune manire acclre, et
en essayant de limiter au maximum la subjectivit.

Les mthodes permettant de limiter la subjectivit vont jouer sur deux paramtres principaux :

Le nombre des observations

La qualit des observations

Par exemple, si nous voulons savoir quelles sont les attentes des jeunes diplms en termes de
conditions de travail, il faudra en interroger un nombre suffisant, reprsentant une certaine
diversit de profils et dune manire qui nous assure quils diront rellement ce quils pensent.

Si ces rgles mthodologiques ne sont pas respectes, le rsultat obtenu sera faux, cest--dire
quil napportera pas linformation quil tait cens apporter.

Lobjectif du prsent cours est de vous transmettre les principes mthodologiques et


conceptuels fondamentaux des tudes ralises dans le cadre de problmatiques
dentreprise.
Cest ce que nous appellerons les Mthodes de Recherche en Management

Pourquoi tudier les mthodes de recherche en management ?

Le cours de mthodes de recherche est en mme temps un cours de culture gnrale et un


cours fondamental pour un tudiant dcole de commerce.

Un cours de culture gnrale car, en tant que citoyen, nous sommes tous confronts
quotidiennement des rsultats dtudes et denqutes qui peuvent agit sur nos
croyances et donc notre comportement.
Ces tudes et enqutes ntant pas rglementes par la loi, elles peuvent tre
ralises par des personnes incomptentes et dans lirrespect des rgles de lart. Il
est ainsi important de connatre ces rgles afin dtre en mesure de distinguer une
tude valide dune tude biaise.

Un cours fondamental car vous serez tous amens plus ou moins directement
utiliser les principes du cours, soit pour raliser vous-mme des tudes ou diffrentes
analyses, soit en tant amen commander des tudes auprs dinstituts spcialiss
ou en interne.

La Recherche Acadmique en Management

Comme suggr prcdemment, les moyens intellectuels, financiers et temporels ne sont pas
les mmes lorsquune tude est ralise dans le but dtre publie dans une revue scientifique
ou si elle est luvre dun cabinet dtudes.

La recherche scientifique dans les sciences de lentreprise est trs mconnue du grand public
en comparaison des autres domaines scientifiques.
Cest pourquoi, il est important pour vous den avoir quelques notions.

Qui fait de la recherche en management ?

Ce qui distingue lenseignement suprieur de lenseignement primaire et secondaire, est que les
tablissements denseignement suprieur doivent simultanment transmettre et crer des
connaissances.
Ainsi, tous les professeurs de lenseignement suprieur (hors intervenants vacataires et
teaching professors ) sont galement chercheurs, cest--dire quils doivent raliser des
recherches dans diffrents domaines et russir les publier dans des revues scientifiques.
En France, la seule exception concerne le CNRS o les chercheurs nenseignent pas.

Le prestige des universits est directement li leurs publications scientifiques qui ncessitent
des moyens financiers et intellectuels considrables. Ainsi, il nest pas tonnant quen France,
les institutions les plus productives en termes de recherche acadmique en gestion sont les
principales grandes coles : INSEAD, HEC, lESSEC, lEDHEC, lESCP-Europe et lEM
Lyon.
Par exemple, les trois premires business schools mondiales pour la production scientifiques
sont :

INSEAD, la premire franaise arrive en 14me place.


Source

:http://jindal.utdallas.edu/the-utd-top-100-business-school-research-

rankings/worldRankings#20092013

Comment se diffusent les rsultats des recherches ?

De mme quun mdecin ou un chimiste dentreprise na pas le temps de lire toutes les
publications scientifiques paraissant chaque mois dans son domaine (il y en a des centaines) les
managers dentreprises ne lisent pas les articles de recherche des revues scientifiques.
La diffusion de ces connaissances se fait de manire indirecte travers notamment des cours
dispenss aux tudiants et les magazines de vulgarisation scientifique.

Les diffusions non-acadmiques

La presse conomique et managriale

On trouve souvent dans certains magazines papier ou web, des articles faisant tat de rsultats
de recherches scientifiques.

Les manuels universitaires et les cours

Les professeurs lisent les articles de recherche et en intgrent les rsultats leurs cours ou dans
les manuels de cours dont ils sont les auteurs. Les tudiants devenus de futurs managers,
appliquent ensuite ces connaissances dans les entreprises. De nombreux professeurs de
Business School diffusent galement les rsultats des recherches travers leur activit de
conseil lorsquils en ont une.

Les confrences mixtes acadmiques et professionnelles

Certaines confrences et autres workshops ont vocation crer des rencontres entre chercheurs
et professionnels dentreprises. Les premiers viennent prsenter les rsultats de leurs travaux
aux seconds et des changes voire des collaborations de recherche font suite ce type de
rencontres.

Les diffusions acadmiques

Certains canaux de diffusion sont par contre spcialement destins au monde acadmique.

Les revues acadmiques/scientifiques

Seules les publications dans ces revues sont considres comme de la recherche scientifique.
En effet, chaque article propos une revue est valu par deux ou trois valuateurs. Environ
90% des articles sont rejets, et les 10% restants font lobjet dun long processus de
modifications avant acceptation et publication.
Ces revues font lobjet de classements qui dtermine leur prestige et leur niveau de slectivit.

Il existe des revues spcialises par discipline (Journal of Marketing Research, Human
Resource Management Journal) ou des Revues Gnralistes (Revue Franaise de Gestion,
Academy of Management Journal etc).
La carrire et le salaire des professeurs dpend gnralement de leur capacit publier des
articles de recherche.

- Les confrences acadmiques

Il existe galement des confrences acadmiques nationales et internationales avec ou sans


comit de slection, au cours desquelles les chercheurs peuvent prsenter leurs travaux de
recherche et faire ainsi du networking. Parfois, les textes des articles prsents lors de ces
confrences sont disponibles sur le Web et il est possible de les trouver au moyen de moteurs
de recherche comme google scholar.

- Les ouvrages acadmiques.

Ils se constituent gnralement dun ensemble darticles de recherche portant sur un mme
thme. Le processus de slection est moins contraignant que pour les revues.

Que produit la recherche ?

quoi ressemblent les rsultats dune recherche ?

Rappelons que lobjectif est de dcrire la ralit de la manire la plus objective possible.
Pour information, sachez quil existe galement de la recherche dite normative qui ne
sintresse pas comment sont les choses, mais comment elles devraient tre. Il sagit donc
dune recherche plus conceptuelle, alors que la recherche positive se base le plus souvent sur
des observations de la ralit.

La recherche produit des Thories

Une thorie (du grec theorein qui signifie contempler, observer, examiner ) peut proposer
une explication un phnomne donn, ou prsenter des relations de cause effet entre une
action et un rsultat.

Par exemple, en conomie le fait de considrer quaugmenter les taux directeurs baisse
linflation est une thorie montaire.

Il en est de mme de la thorie de loffre est de la demande.

Mais les thories peuvent galement montrer le quand, comment ou pourquoi de diffrents
phnomnes.

Par exemple, les thories du plafond de verre apportent des explications la raison pour
laquelle on trouve plus dhommes que de femmes dans les postes hirarchiques levs.
Points importants

Dans les sciences dites dures , les thories ou lois proposes ont un caractre
dterministe cest--dire que ce quelles prvoient est cens se produire chaque
fois.

En revanche, dans les sciences humaines et sociales, les thories ne se vrifient pas toujours,
mais avec des probabilits plus ou moins importantes.

Par exemple, la thorie selon laquelle les enfants tendent avoir le mme mtier que les parents
ne signifie pas que cela se vrifie tous les coups, mais seulement quun fils de mdecin a dix
fois plus de chance de devenir lui-mme mdecin, quun fils davocat.

Dans le langage courant les termes de thorie et thorique sont utiliss pour
dsigner des ides ou des penses ayant un caractre idal, mais loignes de la
ralit, et mme parfois pour dsigner quelque chose de faux.

Il est galement courant de considrer la thorie comme tant loppos de la pratique .

Cette conception du langage courant est fausse, car une thorie peut parfaitement reprsenter la
ralit et avoir une forte implication pratique.

On peut ainsi distinguer la thorie de la pratique :


La pratique est le fait de faire quelque chose, alors que la thorie est lexplication de quelque
chose.

On comprend bien, partir de cette distinction, que thorie et pratique sont des concepts trs
diffrents et incomparables.
On peut ainsi faire quelque chose en ignorant la thorie sous-jacente, et connatre la thorie
sans tre capable de lappliquer.

Par exemple, on peut expliquer partir de la physique et la chimie, pourquoi tel ou tel ingrdient
est ncessaire llaboration dun plat, ou pourquoi tel assemblage daliments aboutit un
rsultat si particulier.
Ainsi, on peut parfaitement tre un excellent cuisinier grce la pratique, mais sans comprendre
le pourquoi des choses.
Lavantage de la thorie, est quelle facilite les innovations et le progrs, alors que le manque
de thorie conduit souvent raliser les choses de manire dogmatique et donc perptuer les
traditions.
Par exemple, un ouvrier du secteur des travaux publics est amen faire du ciment sans
forcment comprends les mcanismes chimiques sous-jacents. Un chimiste, au contraire, qui
connat la thorie la base du ciment, sera en mesure de proposer une nouvelle formule pour
des besoins spcifiques justement grce ses connaissances thoriques.

Lintrt de thoriser est donc de comprendre la pratique, et de pouvoir ainsi la contrler,


lamliorer, voire la dupliquer.

Par exemple, nous savons tous que certains individus sont de meilleurs commerciaux que
dautres, cest--dire quen pratique, ils ralisent- toutes choses gales par ailleurs - des ventes
moyennes suprieures aux autres.

Eh bien, si lon parvient comprendre le pourquoi, cest--dire ce qui distingue ce commercial


des autres, on pourra utiliser cette connaissance pour la rpliquer au travers de formations.
Au contraire, une connaissance non thorise ne peut pas tre transmise dautres personnes.

Les Modles

La recherche produit galement des modles qui peuvent se dfinir comme des
reprsentations simplifies de la ralit.

Le plus souvent, les modles sont des reprsentations schmatiques de relations entre variables.
Les variables sont des caractristiques qui varient dun individu un autre ou dune entreprise
une autre.
On reprsente gnralement les variables par des ovales, et leurs relations rciproques par des
flches.

Exemple :
+
Prestige
du

Salaire

Ce schma montre la relation entre 2 variables ; il sagit bien de caractristiques dun individu
(le prestige de son diplme et son salaire) et il sagit bien de caractristiques qui peuvent varier
(diplme plus ou moins prestigieux, salaire plus ou moins important).

La flche est le + , signifient que lon sattend ce que le prestige du diplme ait un effet
positif sur le salaire peru. On pourrait dire galement que le salaire peru est positivement
dtermin par le prestige du diplme.

Il est ensuite possible de complexifier le modle en ajoutant des variables qui dterminent, ou
des variables qui sont dtermines par dautres. Les premires sont gnralement appeles
variables explicatives et les autres variables expliques.

+
+
Prestige
du

Exprienc
e

Salaire

Satisfactio
n

Plus gnralement, les variables que lon souhaite expliquer sont des variables de rsultat ou
de performance, et les variables explicatives sont des variables daction.

Variables dAction

Variables de Rsultat
Marketing

Innovation, prix, communication

Ventes, Image de Marque, Notorit

Management
Primes, Style de leadership, Travail en Motivation,
quipe, communication interne

Implication

Satisfaction,

Absentisme, Productivit
Finance

Diversification,

analyse

technique, Cours de bourse, rentabilit, profits etc

titrisation

Ainsi, lorsque vous dveloppez un modle, ayez en tte quil doit comporter ces deux types de
variables.

2 : Principes Gnraux des tudes Empiriques


Dans ce deuxime poly, nous allons balayer rapidement les principes de ralisation dune tude
empirique, afin que vous en ayez une vision globale.
Nous les reverrons par la suite de manire approfondie.

Une tude empirique ou tude de terrain, consiste tudier un phnomne en lobservant


directement.
Au contraire, une tude qui ne se base que sur de la rflexion, des ides et des raisonnements
est une tude conceptuelle (ou thorique).

tant donn que la recherche consiste rendre compte de et expliquer la ralit, il va sagir
un moment donn dobserver cette ralit, et de rendre compte de ces observations.

Cependant, on ne peut pas observer et comprendre la ralit sans disposer de connaissances


conceptuelles prliminaires.
Toute tude empirique doit donc normalement dbuter par une tude documentaire.

Ainsi, quelle que soit la discipline, la recherche comporte gnralement deux volets :
- La premire consiste faire ltat des connaissances existantes/ncessaires llaboration
dune problmatique intressante et la comprhension des observations de terrain.
- La deuxime consiste observer soi-mme la ralit, afin dapporter une contribution
nouvelle aux connaissances existantes.

Ltude de terrain suit elle-mme plusieurs tapes :

Collecte

Analyse

Rsultats

Interprtation
Recos

Un rapport dtude doit obligatoirement contenir de


manire trs claire ces quatre parties !

Si jinsiste sur ce point, cest parce que certains tudiants oublient rgulirement de
prsenter une section Rsultats dans leur mmoire, alors que lobjectif final dune
tude est dobtenir des rsultats !

Sil est aussi important de bien sparer chaque partie, cest parce que chacune apporte
une information spcifique que le lecteur peut souhaiter consulter spcifiquement.

Partie Collecte des donnes

Dans cette partie, on doit faire figurer quelles donnes ont t utilises dans ltude et
comment elles ont t collectes.
Si une tude se base sur des donnes de mauvaise qualit ou insuffisantes, il est inutile
de lire la suite
Cette partie nous informe en quelque sorte sur la crdibilit des rsultats.

Partie Analyse des donnes

Ce que lon souhaite savoir en lisant cette partie, cest comment les donnes ont t
analyses. Quelle(s) mthode(s) ont t utilises pour obtenir les rsultats.
Ici aussi, une mauvaise analyse peut rendre les rsultats faut et donc inutiles.
Cette partie complte donc la prcdente pour informer le lecteur sur la qualit des
rsultats obtenus.

Partie Rsultats

Dans la partie rsultats, il faut prsenter le fruit des observations.


Quai-je dcouvert en collectant et en analysant les donnes ?
Les rsultats sont quelque chose de neutre et de normalement objectif.
Exemples de rsultats :
-

Les hommes ont un salaire moyen de 2350 euros, les femmes de 1750.

Les fils davocats ont 3 fois plus de chances que les autres de devenir leur tour
avocats

La corrlation entre salaire et satisfaction au travail est de 0.35.

Les principales raisons qui poussent un individu crer son entreprise sont ()

Les rsultats sont la consquence de lanalyse des donnes collectes sur le terrain.
Ils sont neutres et objectifs si la collecte et lanalyse ont t ralises dans les rgles de lart.

Partie interprtation

La plupart du temps, un rsultat na pas de sens en lui-mme : il faut linterprter pour lui
en donner un. On entre donc dans une phase subjective ; par exemple, nous avons observ que
les tudiants dcole de commerce mettaient en moyenne x mois pour trouver un CDI, alors que
les tudiants dUniversits mettaient en moyenne y mois ; que pouvons-nous en conclure ? Estce un rsultat attendu ? tonnant ?

Linterprtation des rsultats consiste leur donner du sens.

La diffrence observe est-elle forte ? Faible ? En diminution par rapport au pass ? Diffrente
des pays voisins ?
Il sagit de mettre en perspective un rsultat qui na pas forcment de sens en soi.

Un trs bon exemple de ce principe est illustr par un type dtude que vous connaissez tous :
ltude de votre sang lorsque vous faites des analyses .

Le laboratoire commence par vous faire une prise de sang, qui reprsente la collecte de
donnes .
Ces donnes peuvent faire lobjet de diffrents types danalyse.

Dans lexemple ci-dessus, 6 analyses sont ralises, dont lobjectif de chacune est de mesurer
la quantit de certains lments prsents dans le sang.

Les rsultats sont prsents dans la premire colonne.

Comme suggr prcdemment, les rsultats sont la consquence dobservations neutres et


objectives qui nont pas souvent une signification en elles-mmes.

Cest pourquoi, nous avons une deuxime colonne qui reprsente linterprtation du rsultat :
sommes-nous dans la norme ou pas ?

Partie recommandations

Si lon ralise des tudes, cest dans lobjectif de pouvoir prendre les dcisions les plus
pertinentes possibles dans un contexte donn.
Il est donc normal de proposer des recommandations en fin de rapport dtudes.
Ces recommandations doivent tre prcises, directement lies aux rsultats obtenus, et ralistes
considrant les moyens de lorganisation laquelle on les propose.

Si je reprends lexemple de analyses le sang, les recommandations sont ce que le mdecin


conclut en lisant les rsultats des analyses.
Par exemple, si vous avez un taux de cholestrol plus important que la norme, il recommandera
un rgime ou des mdicaments spcifiques.

Maintenant que nous avons prcis la logique globale dune tude terrain, nous allons
approfondir davantage chaque tape.

tape 1 : La collecte de donnes

Les donnes sont des informations provenant directement du sujet que lon souhaite tudier
et qui permettent de rpondre une problmatique de la manire la plus objective et concrte
possible.

Sont par exemple des donnes :

les rponses des questionnaires ;

le fichier des absences des salaris dans une entreprise ;

les cours de bourse des socits ;

le fichier des ventes de chaque produit dans un magasin ;

les rponses des individus des questions ;

le chiffre daffaires dune entreprise ()

Comme le suggrent les exemples ci-dessus, il existe plusieurs types de donnes qui se
collectent et peuvent sanalyser de manires diffrentes.

Donnes Primaires vs. Donnes Secondaires

Une premire typologie distingue les donnes qui sont cres pour les besoins de ltude (qui
nexistaient donc pas avant), des donnes qui existaient dj avant quon dcide de raliser
une tude.

On parle gnralement de donnes primaires pour les donnes cres ad hoc, et de donnes
secondaires pour les donnes prexistantes.

Par exemple, les donnes collectes en interrogeant des individus sont des donnes
primaires, car ces donnes nexistaient pas avant que ces individus ne soient interrogs.

Au contraire, il peut arriver, dans le cadre dune tude, dutiliser des bases de donnes dj
existantes que lon appelle donnes secondaires. Un fichier de ventes, par exemple, est un
fichier de donnes secondaires sil est utilis par quelquun dautre que celui qui a constitu le
fichier.

Donnes Qualitatives vs. Donnes Quantitatives

Certaines donnes correspondent des mots ou des phrases ou des images, voire des sons ou
des odeurs, alors que dautres correspondent des chiffres et renseignent sur des quantits.

On parle dans le premier cas de donnes qualitatives et dans le deuxime cas de donnes
quantitatives.

De par leurs caractristiques diffrentes, les donnes qualitatives et quantitatives sont soumises
des principes mthodologiques diffrents.

Autrement dit, il existe des mthodes de collecte et danalyse qui sont propres chaque grande
famille de donnes.

En croisant les deux modalits, on aboutit 4 types de donnes :

Types de Donnes

Primaires

Secondaires

Qualitatives

Entretiens

Logos,

Observations

discussions sur des forums,

Publicits,

FB, commentaires clients


online
Quantitatives

Questionnaires,

Notes des tudiants, relevs

Exprimentations,

de ventes, cours de bourse

Observations

Les donnes qualitatives primaires sont collectes surtout par entretien individuel ou de
groupe, en face face ou online.

Les donnes qualitatives secondaires concernent le plus souvent des documents dentreprises,
des affiches, des publicits, des descriptifs doffres demploi, les discours des dirigeants
Avec lavnement du web 2.0, ce que les internautes crivent sur des pages Facebook, blogs,
forums etc., est de plus en plus utilis comme donnes dans des tudes.

Les donnes quantitatives primaires sont essentiellement collectes par questionnaires, mais
galement par exprimentation. Nous en reparlerons par la suite.

Les donnes quantitatives secondaires sont des bases de donnes quantitatives existantes
comme des relevs de vente, des informations comptables et financires, un fichier de notes
dexamens etc.

Une tude, peut combiner des donnes primaires et secondaires et des donnes qualitatives ou
quantitatives.

Exemple : je souhaite raliser une tude sur les dterminants de la rmunration des diplms
de lINSEEC.
Pour cela, je dois collecter des donnes les concernant.
Certaines donnes doivent minformer sur les salaires des diplms. Pour collecter cette
information, je peux par exemple les interroger par email ou tlphone pour leur demander
quelle est leur rmunration. Les donnes rcoltes seront des donnes primaires. Si, par contre,
ces donnes taient dj disponibles car collectes auparavant par un autre service de lcole,
alors il sagira de donnes secondaires.

On peut aussi remarquer que, pour des raisons de praticit, le type de collecte des donnes peut
varier et influencer la qualit des donnes.
Par exemple, si lon collecte les donnes concernant la moyenne et le niveau danglais des
tudiants en consultant leur dossier scolaire, elles seront de meilleure qualit (plus prcises) que
si on les collecte par questionnaire auprs de ces derniers.

Individu

Sexe

Majeure

Prpa

Moyenne Niveau

Profil

Salaire

globale

danglais

international

CDI

MO

Oui

12.3

27000

MS

Non

14.6

32000

ACG

Non

13.2

23000

FM

Non

12.8

37000

IMAP

Non

10.44

19000

RH

Oui

13.2

28000

DD

Oui

13.6

21000

On remarque galement que certaines donnes renseignent sur des quantits (salaire,
moyennes), alors que dautres ne renseignent pas sur des quantits (le sexe, la prpa, la
majeure).

1er

LAnalyse des Donnes

Comme vu prcdemment, lorsque les donnes sont collectes et stockes dans une base de
donnes, elles sont encore au stade de donnes brutes. Elles ne nous apprennent encore rien.

Pour leur donner du sens, elles doivent subir une analyse.

Lanalyse que lon fait subir des donnes va dpendre de lobjectif, exactement comme pour
les analyses de sang ; on ne fait pas les mmes analyses si lon recherche un virus ou si lon
souhaite mesurer le sucre dans le sang

Lorsque les donnes analyses sont quantitatives, les analyses ralises sont des analyses
statistiques.
Lorsque les donnes analyses sont qualitatives, les analyses peuvent tre qualitatives ou
quantitatives.

Pour simplifier, disons quil existe deux types dtudes selon que lon utilise surtout des
donnes qualitatives ou surtout des donnes quantitatives.

Les 2 principaux types dtudes : Qualitative et Quantitative


Il sagit de deux types dtude trs diffrentes et que tout spare : de lesprit, aux objectifs, aux
mthodes.

Les tudes Qualitatives

Les objectifs :

Elles ont comme objectif dexplorer, de dcouvrir, de comprendre

Elles cherchent comprendre le pourquoi, o, quand, et le comment

Elles cherchent dterminer les attentes, les valeurs, les croyances des individus

Elles cherchent dcrire les pratiques dentreprise

Les donnes utilises :

Essentiellement des donnes collectes par entretien semi-directif individuel ou de


groupe, ou par observation.

Mais galement des donnes secondaires

Les techniques dchantillonnage

A la diffrence des tudes quantitatives pour lesquelles on vise des chantillons importants,
reprsentatifs de la population tudie, les tudes qualitatives se contentent dchantillons
rduits. En effet, lexprience montre que lon obtient rapidement une redondance, une
saturation dans les donnes recueillies.
On cherche donc davantage la diversit des profils que la reprsentativit.

Les techniques danalyse de donnes

Il y en a de diffrents types, mais la plus utilise est lanalyse de contenu thmatique, qui
consiste dcouper le discours par thmes voqus et les rorganiser afin den extraire le
sens.
Lanalyse lexicale se focalise davantage sur les mots employs (types de verbes, adjectifs
etc....).

Les rsultats obtenus :

Pas de chiffres !
Mme si lon peut quantifier loccurrence des mots ainsi que dautres paramtres dans certains
cas, lesprit-mme dune tude qualitative est ailleurs.
Les rsultats prennent donc surtout la forme de texte qui prsente le fruit des dcouvertes
ralises en interrogeant les individus. Ces rsultats sont dans lidal rsums par des schmas
rcapitulatifs qui aident la comprhension par les lecteurs.

Diffrents types dtudes qualitatives

Il existe une multitude de manires de raliser une tude qualitative avec utilisation simultane
ou pas de donnes primaires et secondaires.
Pour simplifier, sachez que selon la problmatique, il peut tre ncessaire et plus pertinent de
se placer plutt du point de vue de lentreprise en interrogeant ceux qui sont lorigine dune
pratique, ou plutt du point de vue du salari/consommateur, si lon souhaite tudier lefficacit
dune pratique.

Par exemple, si lon souhaite tudier pourquoi les entreprises mettent en place telle pratique,
et comment elles la mettent en place, il est plus pertinent dinterroger des managers ou des
consultants, alors que si lon souhaite tudier les perceptions et les ractions des consommateurs
ou des salaris face une pratique de RH ou une politique marketing, il sera plus pertinent
interroger ces derniers.

Les tudes Quantitatives

Les objectifs :

Elles cherchent mesurer des phnomnes et des relations entre variables

Elles cherchent gnraliser

A vrifier des hypothses de recherche

Les donnes utilises :

Des donnes collectes par questionnaire et/ou exprimentation

Des donnes secondaires

Les techniques dchantillonnage

Lidal est de travailler sur des chantillons reprsentatifs de la population tudie. Pour des
questions de temps, de moyens et daccs aux donnes, cette exigence nest pas toujours
respecte. Il faut en tenir compte dans linterprtation des rsultats.

Les techniques danalyse de donnes

Il sagit danalyses statistiques des donnes.

Les rsultats obtenus :

Selon le type hypothse, le rsultat pourra prendre la forme dune diffrence entre deux ou
plusieurs moyennes, de corrlations, ou de tests de significativit statistique.

Diffrents types dtudes quantitatives

Une tude quantitative peut se baser exclusivement sur des donnes primaires ou secondaires,
ou sur un mix des deux.

En ce qui concerne les donnes primaires, elles peuvent tre collectes par questionnaire, par
exprimentation, ou un mix des deux.

Lexprimentation : principes gnraux et intrts.

Lexprimentation est une technique de collecte de donnes qui permet de matrialiser et de


manipuler la variable dont on souhaite tudier leffet.

Lexprimentation a 2 avantages :

Cest une technique de collecte plus efficace que les autres

Cest la seule qui permet dtablir une causalit entre une variable daction et une
variable de rsultat.

Il faut savoir que le principe-mme dune tude quantitative est dtudier leffet dune variable
daction sur une variable de rsultat.

Couleur

Niveau de
gamme
peru

Par exemple, imaginons que lon souhaite savoir si la couleur dun produit a un effet sur la
perception de son niveau de gamme par les consommateurs.

Le fait de mettre en place une exprience consistera concevoir le mme produit en diffrentes
couleurs, de les prsenter des chantillons de consommateurs semblables, et demander
chaque groupe dindividus dvaluer le niveau de gamme du produit.
On observera ainsi quelle couleur aura obtenu la meilleure note.

Quelles sont les diffrences entre exprimentation (ou exprience) et enqute par
questionnaire classique ?

* Dans lenqute, on observe des phnomnes tels quils se prsentent naturellement sans les
influencer, alors que dans lexprience, on provoque, on manipule les phnomnes auxquels
on sintresse en matrisant certains facteurs extrieurs.

* Lautre diffrence importante est que dans lenqute classique, on demande aux rpondants
dimaginer la variable explicative (variable daction), alors que dans lexprimentation cette
variable est matrialise.

Rcapitulons partir dun autre exemple :

Principe gnral : On sintresse leffet de la variation de certaines variables explicatives


(que lon fera varier dans un plan exprimental), sur certaines variables expliques.

Exemple : Imaginons que lon soit un fabricant de biscuits, et que lon souhaite savoir quelle
est la quantit de sucre prfre des consommateurs.

Nous pouvons traduire cela par le modle suivant :

Quantit
Sucre

Plaisir
ressenti

Si lon utilisait une mthode denqute classique, on demanderait aux consommateurs de


dterminer eux-mmes la quantit de sucre quils prfrent dans des gteaux, avec une modalit
de rponse de type : 1= pas du tout sucr, 5= trs sucr.
La limite de cette mthode est quun rpondant na pas forcment conscience de ses
prfrences, et quen outre, ce qui est trs sucr pour un rpondant, nest pas forcment
quivalent ce qui est trs sucr pour un autre.

Dans une exprimentation, au contraire, les modalits de la variable explicative sont


matrialises par divers gteaux contenant des quantits de sucre diffrentes.

On peut par exemple utiliser 4 types de gteaux contenant diffrentes quantits de sucre, et les
faire goter quatre chantillons dindividus en leur demandant dvaluer le got.

Pas sucr

Eval got 1

Peu sucr

Eval got 2

Moy Sucr

Eval got 3

Trs sucr

Eval got 4

Si lon utilise des groupes dindividus bien homognes, on pourra dterminer avec prcision
quelle est la quantit de sucre la mieux note en moyenne par les consommateurs.

De mme, il est possible de tester des combinaisons intgrant dautres variables comme la
couleur, la taille, la forme
Par exemple :
Rouge

Bleu

Vert

Trs petit

Rouge trs petit

Bleu trs petit

Vert trs petit

Petit

Rouge petit

Bleu petit

Vert petit

Moyen

Rouge moyen

Bleu moyen

Vert moyen

Grand

Rouge grand

Bleu grand

Vert grand

On peut galement tester le couple taille/couleur idal.

3 : La Problmatique ou Question de Recherche.


La problmatique dune recherche reprsente ce que vous souhaitez observer/comprendre de
la ralit.

On peut considrer quil existe quatre types dobjectifs principaux dans une recherche en
gestion :

- dcrire des pratiques dentreprises


- comprendre les raisons et les logiques des comportements des individus ou des pratiques
des entreprises
- tudier les dterminants dindicateurs de performance
- tudier lefficacit des pratiques de management.

1- Dcrire des pratiques dentreprises :

Dans certains cas, lorsque des pratiques nouvelles apparaissent, il peut tre intressant de les
observer et den rendre compte dans un rapport dtude.

Exemples :

- Comment se passe la conception et le lancement dune application pour Smartphone ? (sousentendu, quelles sont les spcificits par rapport la conception et au lancement dautres
produits ?)
- Comment les entreprises multinationales intgrent-elles les diffrences culturelles dans le
marketing-mix ?
- Quelles sont les nouvelles tendances en termes de pratiques de recrutement ? Dorganisation
du travail ?

Ce type de problmatiques impliquent gnralement la ralisation dune tude qualitative.

2- tudier les comportements des individus (Comment ? Pourquoi ?)

Si lon souhaite influencer le comportement des individus (salaris, consommateurs) il est


important de les comprendre. Il est galement important de comprendre les comportements
des entreprises.
Comme prcdemment, il est souvent plus intressant dtudier des comportements rcents,
que des comportements qui ont dj t tudis maintes fois.

- Quels sont les critres de choix dun employeur de la part des candidats ?
- Sur quoi se basent les investisseurs pour choisir leurs options dinvestissement ?
- Quest-ce qui dtermine la volont dentreprendre dun crateur dentreprise ?

Ici encore, le type dtude le plus adapt est ltude qualitative.

3- valuer lefficacit dune pratique de management

Les entreprises mettent en uvre un certain nombre de pratiques nouvelles dans diffrents
domaines : commercial, RH, stratgique, financier et il est typiquement intressant dtudier
lefficacit de ces pratiques.

- Lactionnariat salari permet-il rellement daugmenter la motivation, la satisfaction au travail


et limplication des salaris ?
- Le marketing sensoriel est-il efficace ? A quelles conditions ?
- Telle mthode de prvision des cours de bourse est-elle efficace ?
- Le greenwashing est-il efficace ?
- Quels sont les labels les plus efficaces ?
- A quelles conditions lutilisation de la nudit en publicit est-elle efficace ?
- Linterdiction des rseaux sociaux au travail augmente-t-elle la productivit des salaris ?

tant donn que lon tudie typiquement ici leffet de A sur B, le type dtude appropri est
ltude quantitative.

4- tudier les dterminants dindicateurs de performance.

Un quatrime type de problmatique est plus rare car plus global et plus adapt la recherche
scientifique.

Toute activit des entreprises est sanctionne par des indicateurs de performance, rsultat
ou de succs.
Au lieu dtudier les effets dune pratique sur certains indicateurs de performance, on peut
souhaiter directement tudier les dterminants de ces indicateurs, afin de mieux pouvoir les
matriser.

Par exemple, le bien-tre au travail peut tre considr comme un indicateur de performance
RH, de mme que la loyaut lentreprise.
On peut donc vouloir tudier quels sont les dterminants de la loyaut des salaris envers leur
entreprise.

De mme, le cours de bourse tant un indicateur de performance important, on peut galement


souhaiter en tudier les dterminants.

Ce type de problmatique ncessite une tude qualitative lorsque les dterminants ne sont pas
connus et que lon souhaite les dcouvrir, ou une tude quantitative lorsque les dterminants
sont contenus mais que lon souhaite en valuer limportance respective.

Quelles sont les caractristiques dune bonne problmatique ?


Caractristique 1 : Une bonne problmatique doit tre suffisamment intressante.

Il faut trouver un sujet dtude intressant, cest dire qui rponde, si possible, un problme
que les entreprises se posent ou justement quelles devraient se poser qui.
Demandez-vous, par exemple, qui serait prt payer pour obtenir les rsultats de votre tude,
ce que les rsultats apporteraient aux entreprises etc...

Caractristique 2 : Une bonne problmatique doit concerner quelque chose de concret et


dobservable.

Sachant que nous faisons de la recherche positive , nous souhaitons rendre compte de la
ralit.
Pour cela, nous allons devoir, dune manire ou dune autre observer cette ralit.

Il faut donc que, ds le dpart, la problmatique concerne quelque chose de concret et


dobservable plus ou moins directement.

Par exemple, il est impossible dtudier Quel est lavenir de car, par dfinition, lavenir
nest pas observable. Par contre, on peut tudier ce que certains individus attendent de lavenir,
car les attentes sont quelque chose de concret

Caractristique 3 : Vous devez tre en mesure de vous procurer les donnes ncessaires.

Il est inutile de vouloir traiter une problmatique dont vous ne pourrez pas vous procurer les
donnes ncessaires. Ainsi, au moment de choisir une problmatique dtude, il faut dabord se
demander sur quelles donnes on se basera pour la traiter, et si on a une raison de penser quon
pourra se procurer les donnes ncessaires.

Par exemple, si lon souhaite tudier la personnalit des PDG du CAC 40, il faudra avoir
conscience quon ne pourra pas les interviewer, et quon ne disposera au mieux que dventuels
discours trouvs dans la presse, ou de biographies

Caractristique 4 : La problmatique doit tre suffisamment gnralisable.

Dans le cadre dun mmoire, il est demand de traiter une problmatique qui intresse plusieurs
entreprises, pas une seule.

Par exemple, Pourquoi les salaris de la socit X sont-ils mcontents ? est une question
qui ne concerne que la socit X. Cest davantage une problmatique de consultant que de
charg dtudes.

Par contre, il est possible dtudier Les dterminants du mcontentement des salaris en
entreprise , car les rsultats intresseront de nombreuses entreprises.

Pour rcapituler, une problmatique doit tre :


Intressante
Concerner quelque chose de concret
Ncessiter des donnes qui vous sont accessibles
Suffisamment Gnralisable

Autres points importants :

1- Il ne faut pas confondre problmatique et terrain dtude.

Les sportifs de haut niveau, le luxe, lautomobile, les nouvelles technologies, la publicit etc
sont des terrains dtudes, pas des problmatiques.

En effet, le luxe ou lautomobile nont rien de problmatique en soi

La question quil faut se poser est Que souhaite-t-on tudier chez les sportifs de haut niveau
qui soit intressant (pourquoi ? pour qui ?), observable et dont les donnes seront accessibles ?

2- Ne pas confondre problmatique de recherche/dtude et problmatique de conseil.

Il sagit dune confusion frquente chez les tudiants novices sur les questions dtudes et de
recherche.

Pour bien saisir la diffrence, imaginez que nous soyons en mdecine : les problmatiques
traites par ceux qui travaillent dans les laboratoires sont des problmatiques de recherche,
alors que les problmatiques traites par les praticiens (gnralistes ou spcialistes) sont des
problmatiques de conseil.

Les chercheurs crent de la connaissance nouvelle, alors que les praticiens appliquent cette
connaissance.
Il est important dtre capable de bien comprendre le lien entre une connaissance et son
application.

Exemple 1 :

Question managriale : Mes salaris sont mcontents, jai envie de faire baisser leur
mcontentement.

Quai-je besoin de savoir pour mettre en place des mesures efficaces ?

Question de recherche : Pourquoi les salaris sont-ils mcontents ?

Exemple 2 :

Question managriale : Mes ventes ont chut, que dois-je faire pour les relancer ?

Question de recherche : Pourquoi les clients achtent-ils ? Ou pas ?

Exemple 3 :

Question managriale : Le cours de bourse de mon entreprise a baiss ; comment faire pour le
faire remonter ?

Question de recherche : Quest-ce qui dtermine la variation dun cours de bourse ?

Dans le cadre de votre mmoire de recherche, on vous demandera de formuler une


problmatique de recherche et partir de vos rsultats, de formuler des recommandations
c'est--dire de proposer des actions aux entreprises concernes.

Comment formuler une problmatique dans le mmoire ?


Une problmatique peut se formuler sous forme de question, mais lexprience montre quil est
plus ais de la formuler en termes dobjectif recherch.

Voici quelques exemples :

Lorsquil sagit dune recherche dont lobjectif est de dcrire la ralit:

Lobjectif de cette tude est de voir dans quelle mesure les entreprises prennent en compte
les problmatiques interculturelles lors des fusions-acquisitions. Il sagit notamment de voir si
les managers ont conscience des problmatiques interculturelles et si, ventuellement, les
entreprises mettent en place des pratiques spcifiques.

Lobjectif de cette tude est dtablir quelles sont les mthodes et les outils utiliss par les
traders dans leur activit.

Lobjectif de cette tude est dtablir une typologie de crateurs dentreprises selon leurs
motivations entreprendre.

Lobjectif principal de cette tude est danalyser en dtail chaque tape de la gestion des
expatris, c'est--dire du recrutement, en passant par la gestion, pour finir sur la repatriation,
afin den dgager les problmes majeurs. Lintrt de dfinir chaque tape de lexpatriation va
permettre davoir une rflexion totale sur le sujet et de comprendre pour quelles raisons
certaines missions dexpatriation chouent.

On peut galement souhaiter expliquer certains comportements :

Lobjectif de cette tude est de comprendre les raisons pour lesquelles les chefs de produits
font appel davantage aux tudes de marchs quantitatives plutt quaux qualitatives.

Cette recherche aura pour objectif de comprendre les dterminants du comportement des
investisseurs lors des priodes de crise boursire.

Cette tude aura pour objectif de comprendre quelle est la perception des jeunes par les
managers des entreprises franaises, et de comparer ces perceptions celles de managers
anglo-saxons.

Problmatiques portant sur les effets des pratiques de management

Lobjectif de cette tude est de voir si la transparence financire des entreprises a volu
avec lapplication de la norme comptable internationale, lIFRS 7

Cette tude aura pour objectif dtudier limpact de loctroi de stock-options aux dirigeants
dentreprise sur la performance financire.

Lobjectif de cette tude est de voir dans quelle mesure les pratiques de mobilit interne dans
lentreprise ont un effet positif sur la fidlisation des salaris.

Dans cette recherche, nous allons tenter de voir dans quelle mesure l'image de marque d'une
marque de luxe reste intacte auprs des consommateurs aprs que cette marque se soit associe
avec une marque grand public.

4 : La revue de littrature et les Hypothses de Recherche (tudes


quantitatives):
La Revue de Littrature

Il sagit de lensemble des connaissances existantes qui nous permettent de bien apprhender le
sujet dtude et dapporter un dbut de rponse logique notre problmatique de recherche.

Une revue de littrature doit comporter trois types dinformations :

une description des pratiques et des phnomnes tudis

les rsultats dtudes ayant t dj raliss sur des sujets proches

les thories/connaissances qui apportent un dbut dexplication aux phnomnes


tudis

Pour cela, il faut utiliser trois types de sources :

- des articles de presse/ magazines/web

- des manuels

- des articles de recherche

Prenons lexemple de la problmatique suivante : Quels sont les effets du Made In sur
limage de marque.

Made In

Image de
Marque

Ici, la variable explique (variable de rsultat) est limage de marque, et lon souhaite savoir si
et dans quelle mesure le made in (variable explicative daction) peut avoir un effet sur cette
image.

Nous devons dmarrer notre recherche par une revue de littrature : comment faire ?

Partons de notre variable de rsultat : limage de marque.

Il faudra la dfinir, dabord, puis en lister les dterminants.


tant donn quil sagit dun concept de base du marketing, il y a des chances quil ait une place
de choix dans les manuels de marketing.
Les articles de recherche vous permettront dobtenir des rsultats dtudes sur des
dterminants spcifiques de limage de marque ainsi que sur les consquences sur dautres
variables de rsultat.

Dans un deuxime temps, il faudra soccuper de la variable Made In , et faire de nouveau


linventaire de tout ce qui existe sur limportance du Made In en marketing, travers les trois
types de supports.

Erreur classique

Monsieur, il ny a rien sur mon sujet, je ne peux pas faire de revue de littrature !

Si le sujet que vous pensez traiter a dj t trait, cest moins intressant !

Quel que soit le sujet que vous traitez, il rentre toujours dans une problmatique plus large pour
laquelle il existe dj un corpus de connaissances et ce sont ces connaissances quil faut
sapproprier et utiliser dans la revue de littrature.

Exemple classique : Je ne trouve rien sur les applications mobiles

La question quil faut se poser est quest-ce quune application mobile ? De la communication ?
Un service ? etc... Il existe donc des connaissances sur la communication et les services qui
pourront tre utiliss pour tudier les applications mobiles....

Lerreur classique est donc de nutiliser que applications mobiles comme mots cls dans sa
recherche bibliographique, alors quil faut largir le champ de recherche, et se demander questce quune application mobile.

Diffrences entre les types de sources

Les articles de presse ou de magazines ou dinternet ont une vocation surtout descriptive et
permettent de se faire une ide des actualits, des pratiques, et des dbats existants sur un sujet
ou dans un domaine particulier.
Ces articles sont crits le plus souvent par des journalistes, voire des professionnels
dentreprises ou des bloggers, et nont donc pas de valeur scientifique, car ils ne sont pas
valus. Ils doivent tre considrs comme les opinions de leurs auteurs.

Les manuels sont des ouvrages de rfrence sur un domaine spcifique, qui rsument les
connaissances principales dans une discipline donne.

Les manuels sont raliss par des Professeurs dUniversit ou dcoles de Commerce partir
de travaux de recherche, dautres manuels, darticles de presse, et de leur exprience
personnelle.
Leur contenu est plus ou moins contrl par la communaut scientifique, ce qui leur confre
un gage de trs grande qualit. Le contenu dun manuel nest pas cens tre lexpression de
lavis de lauteur, mais faire davantage une synthse des connaissances existantes.

Les articles de recherche prsentent les rsultats dune recherche spcifique (qui peut tre
seulement bibliographique, ou galement empirique). Ils sont raliss par des professeurs
dUniversits ou dcoles de Commerce, et sont soumis des valuations draconiennes.
Ils sont publis dans des revues scientifiques, dont certaines sont spcialises dans les grandes
disciplines du management ou peuvent tre plus gnralistes.

Exemples de revues spcialises :

Finance : Journal of Finance, Finance, Contrle Stratgie, Journal of Financial Economics

Marketing : Journal of Marketing Research, Journal of Marketing, Journal of Consumer


Research, Marketing Science, Recherche et Applications en Marketing, Dcisions Marketing

Gestion des Ressources Humaines : Human Resource Management Journal, Journal of Applied
Psychology, Journal of Organizational Behavior, Personnel Psychology, Human Relations,
Revue de GRH

Entrepreneriat : Entrepreneurship: Theory and Practice, Journal of Small Business


Management, International Small Business Journal

Management des Systmes dInformations: European Journal of Information Systems


Information Systems Research, Journal of MIS, MIS Quarterly

Management International: Journal of International Business Studies, Cross-cultural


Management, Journal of Cross-cultural Psychology

Exemples de revues plus gnralistes: Academy of Management Journal, Academy of


Management Review, Organization Science, Strategic Management Journal, Journal of
Management, Journal of Management Studies, Revue Franaise de Gestion

Comment prsenter et structurer une revue de littrature ?

Cest essentiellement en lisant des articles de recherche que vous comprendrez comment
prsenter une revue de littrature.

Plus gnralement, il sagit de faire une dmonstration, de se dire quon va utiliser le matriau
collect pour apporter un dbut de rponse la problmatique et pour illustrer limportance de
raliser une tude pour combler un gap de connaissances.

Point Important : Les titres des parties de la revue de littrature doivent avoir du sens i.e.
quils doivent donner une ide du contenu de chaque section.

Exemple :

1- Le leadership : dfinition, typologies et importance pour le management.


1.1. Quest-ce que le leadership ?
1.2. Les diffrentes typologies des styles de leadership

1.3. Leadership et pratiques de management.

A proscrire absolument les titres du style :

1. Les thories du management interculturel


1.1. Hofstede
1.2. Trompenaars
1.3. Schneider

Les Hypothses de Recherche (tudes quantitatives)

Pour rappel, les tudes quantitatives servent tudier des variables.


Souvent, on ne se contente pas simplement dtudes descriptives, mais on souhaite tudier des
liens de causalit entre variables.
Ces liens de causalit concernent souvent la relation entre une variable daction et une variable
de rsultat.

Ces relations que lon souhaite tester au moyen dtudes quantitatives sappellent des
hypothses de recherche.

Les hypothses de recherche sont des relations attendues entre deux variables que lon teste
dans une tude quantitative

Do viennent ces hypothses ?


Quest-ce qui nous pousse nous attendre certaines relations entre variables ?

Les hypothses sont dduites si elles se basent sur des thories/connaissances existantes, et
induites lorsquelles se basent sur lobservation de la ralit.

En gnral, on utilise un mlange des deux pour mettre des hypothses, c'est--dire quon se
base sur une revue de littrature et sur une tude qualitative.

Les hypothses sont gnralement prsentes sous forme de schma :

Chaque case correspond une variable.

Une variable est une caractristique dune unit dtude (individu, entreprise, produits)
qui varie dun individu un autre.

- On appelle variables explicatives celles qui sont censes avoir un effet sur une ou plusieurs
autres variables. Ce sont souvent des variables daction.

- On appelle variables expliques celles dont on tudie les dterminants. Ce sont souvent des
variables de rsultat.

- On appelle variables modratrices, celles qui ont un effet sur la force ou le sens dune
relation entre deux autres variables.
tant donn quelles influencent une relation, leur flche est dirige vers une autre flche, et
non vers une autre variable.

Exemples de formulations dhypothses :

Larchtype de lhypothse de recherche est la variable 1 a un effet positif sur


la variable 2

Exemples :

Le prix (V1) a un effet positif sur limage de marque (V2)

Le degr destime quun salari a pour son suprieur (V1) a un effet positif sur le bien-tre
du salari au travail (V2)

Le nombre dadministrateurs indpendants (V1) a un effet positif sur la performance des


entreprises (V2).

Lorsque la variable explicative est nominale, il peut tre ncessaire dexpliciter la


relation attendue :

Exemples :

Le sexe du salari (V1) a un effet sur le salaire reu (V2) de telle sorte que les hommes ont
un salaire suprieur aux femmes.

Le secteur dactivit (V1) a un effet sur le risque des entreprises (V2) : le secteur financier est
plus risqu que lindustrie

Le cas des hypothses avec variables modratrices :

Intention
dAchat

Prix

Salaire

Dans le cas ci-dessus, nous faisons lhypothse selon laquelle le prix a un effet ngatif sur
lintention dachat.
Cependant, on peut considrer que plus les gens ont un salaire lev, et moins le prix aura un
effet ngatif sur lintention dachat. On considre que le salaire modre la relation entre prix
et intention dachat.

La formulation de lhypothse se prsente de la manire suivante :

Le prix a un effet ngatif sur lintention dachat, modr par le salaire, de sorte que plus le
salaire est lev et moins le prix a un effet ngatif sur lintention dachat.

Prsentation des hypothses dans un modle global

Afin de donner une image densemble de ltude, il est courant de prsenter lensemble des
hypothses de ltude dans un modle global.

Voici un exemple de modle global tir dun mmoire promo 2012 :

5 : Ltude Qualitative : les entretiens semi-directifs et lanalyse de contenu


thmatique
1- Quand Raliser une tude Qualitative ?

Une tude qualitative est ncessaire pour rpondre des questions de type qui, pourquoi,
comment, quand, o.

Plus gnralement, elle permet dtudier des processus ou des logiques sous-jacentes et
explorer un domaine spcifique.

Quels sont les principaux problmes lis une fusion/acquisition ?

Pourquoi les entreprises entreprennent-elles des restructurations, comment celles-ci sont


gnralement ralises ?

Comment les socits sassurent-t-elles contre les risques lis leurs activits internationales ?

Quel est le processus dachat des produits hdoniques ?

Fonction 1 : Comprendre en Profondeur un Phnomne

Les tudes qualitatives sont dabord utilises lorsquon souhaite comprendre des processus ou
des mcanismes.

Exemples :

Pourquoi certains salaris voluent-ils plus rapidement que dautres en entreprise ?

Pourquoi certaines entreprises rcemment cres font-elles faillite et pas dautres ?

Quelles sont les raisons de lchec de certains expatris ? Comment sont-ils recruts ? Sont-ils
forms ? De quelle manire ?

Fonction 2 : Explorer un domaine dont les informations existantes sont limites ou


inexistantes.

Les tudes qualitatives sont souvent qualifies d exploratoires , car elles permettent de
dcouvrir des univers sans avoir dides prconues.

Exemple : Aprs laffaire Kerviel, on sest pos des questions sur le travail des traders :
Plusieurs questions se sont poses : quels types dindividus souhaitent faire ce mtier ? Pour
quelles raisons ? Quont-ils comme diplmes ? Travaillent-ils seuls ou en quipe ? Avec quelles
personnes interagissent-ils ? Par qui sont-ils contrls ? Quelle est leur rmunration ?
Comment est-elle calcule ?

Fonction 3 : Concevoir des tudes quantitatives pertinentes.

Il est courant de raliser une tude qualitative exploratoire avant de raliser une tude
quantitative par questionnaire.

Les tudes qualitatives permettent en effet :


-

daffiner les hypothses de recherche,

de savoir quelles sont les variables importantes tudier,

et ventuellement, de concevoir ou daffiner les items du questionnaire.

Par exemple, imaginons que lon souhaite faire une tude quantitative des diffrentes
motivations lies la pratique de la lecture.
La revue de littrature va nous indiquer quil existe 3 motivations principales :
- La lecture de loisir (pour passer le temps)
- La lecture didactique (pour apprendre des choses)
- La lecture esthtique (pour le plaisir de lesthtique littraire).
Une tude qualitative peut permettre de faire ressortir une 4me motivation qui vient enrichir la
connaissance existante, par exemple la lecture de paratre .

Ainsi, ltude quantitative ralise sera plus pertinente et complte grce ltude qualitive
prliminaire.

2. Comment Collecter des Donnes Qualitatives ?

Il existe deux moyens principaux de collecter des donnes qualitatives primaires: il sagit des
entretiens et des observations.

Les donnes qualitatives secondaires peuvent tre de diffrents types.


Par exemple, le contenu de blogs, de forums de discussions, de pages Facebook, des rapports
annuels des entreprises ou les commentaires de consommateurs peuvent tre utiliss comme
donnes qualitatives secondaires dans une tude.

3. L Entretien Semi-Directif

Quest-ce quun entretien ?

Les entretiens sont des discussions que lenquteur mne avec des individus dont la fonction,
ou la nature sont importantes pour le sujet trait, et qui ont pour objectif de comprendre ce qui
se passe dans la tte des individus : des croyances, valeurs, attitudes, logiques.

Le type dentretien le plus utilis en sciences sociales est lentretien semi-directif.


On lappelle ainsi, parce que lenquteur se doit de rester neutre. Il ne doit en aucune manire
influencer la pense de linterview : cest le principe de non-directivit.

Cependant, il a en tte une liste pr-tablie de thmes sur lesquels il souhaite obtenir des
informations. Il faut donc quil oriente la discussion afin que linterview lui fournisse
linformation ncessaire.

Important : durant lentretien, lenquteur ne doit donner AUCUNE


information, nmettre aucune ide, aucun jugement de valeur, afin de ne
pas biaiser les rponses. Il doit se contenter de COLLECTER de
linformation.

Comment raliser un entretien semi-directif ?

La ralisation dentretiens de recherche suit un certain nombre dtapes :

1 : Dfinir ce que lon cherche

La premire tape fondamentale pralable la ralisation dentretiens est davoir une ide claire
de ce que lon cherche savoir.
Cela peut paratre vident, mais lexprience montre que les novices ne savent pas toujours ce
quils cherchent exactement lorsquils ralisent des entretiens.
La meilleure manire de sen assurer et de lcrire noir sur blanc : quest-ce que je cherche
savoir exactement ? Pourquoi ? Cette rflexion donnera lieu llaboration dun guide
dentretien dont on parlera plus loin.

2 : Dterminer les rpondants ncessaires :

Qui interroger ?

Lchantillonnage dans les tudes qualitatives se base davantage sur la diversit des profils que
sur leur reprsentativit.

Cependant, il faut aussi veiller slectionner les bons profils par rapport aux objectifs e ltude.

LErreur classique consiste privilgier les praticiens du marketing plutt que les
consommateurs, ou les managers plutt que les salaris.

- Si vous souhaitez savoir comment les consommateurs oprent certains choix, il faut interroger
les consommateurs, pas les professionnels

- Si lon interroge des professionnels, cest pour comprendre leurs propres logiques et
raisonnements, pas ceux des autres !

De mme, selon la problmatique, il faut assurer une certaine diversit de profils.

Ex : Par exemple, si lon tudie le mal-tre au travail, il faut interroger des salaris travaillant
dans diffrents secteurs et avec des niveaux hirarchiques diffrents, mais galement des
consultants, des syndicalistes, des mdecins etc.

Combien de personnes interroger ?

En thorie, il faudrait continuer les entretiens jusqu ce que lon aboutisse saturation, i.e.
jusqu ce que les interviews ne nous apprennent plus rien de nouveau.

En pratique, lexprience montre quavec 5-10 personnes par catgorie dindividus, on arrive
rapidement saturation.

Par exemple : une dizaine de consommateurs, 5/10 vendeuses en boutique, 5/10 responsables
marketing, donnent une ide globale de ce que lon peut souhaiter savoir sur un nouveau
concept ou produit.

3 : laborer le Guide dEntretien

Le guide dentretien contient la liste des thmes que lon souhaite aborder
lors des entretiens.
Autrement dit, la liste de ce que lon souhaite dcouvrir lors des entretiens.
Erreur classique : Un guide dentretien nest pas une liste de questions que lon
pose aux interviews !

vitez aussi de confondre guide dentretien et questionnaire !

Il ne faut donc pas confondre le guide dentretien, et les questions que lon va poser rellement
linterview lors de lentretien.

En effet, principe de non directivit oblige, tout lart de lentretien consiste obtenir
linformation souhaite, en lobtenant de manire dtourne, indirecte, sans que linterview se
rende compte de ce que vous souhaitiez savoir.

Nous allons voir dans la suite quelques techniques permettant de ne pas biaiser les rponses.

Afin de vous aider prparer vos entretiens, vous pouvez construire un tableau deux colonnes,
avec gauche les lments et thmes du guide dentretien, et droite la manire dont vous
pourrez, le moment venu, aborder les thmes en restant neutres.

Exemple : Guide dentretien ( gauche) comment ( droite)

Quest-ce que je souhaite savoir ?


(guide dentretien)

Lobjectif est dtudier lutilisation des


parfums par des hommes.

Utilise-t-il du parfum ?

Erreur classique : on demande utilisez-vous


du parfum ?
Pourquoi est-ce une erreur ?
Parce que linterview se dit quil y a une
bonne rponse donner, il va cogiter : Si je
rponds non, il va penser ceci, ou cela
Vous biaisez les donnes.
Ce

quil

faut

faire

cest

obtenir

linformation sans poser la question


directement.
Exemple : Pouvez-vous me dcrire les
produits prsents dans votre salle de bain ?
Ou pouvez-vous me dcrire comment vous
vous prparez avant de sortir le matin avant
daller au travail et le soir avant de sortir ?

On verra ainsi si lindividu parle de parfum


ou pas.

Soit il en parle et on continue sur le reste, soit


il nen parle pas, et pour viter que
lentretien sarrte on peut se permettre
dtre un peu plus directifs.

Vous utilisez du parfum ? est prfrable


Vous nutilisez pas de parfum ? car plus
neutre.
En a-t-il un seul ou plusieurs ?

Il se peut quil ait dj donn linformation


au pralable, si ce nest pas le cas, il faut
lobtenir.

Ici, il faut viter de lui faire croire dans la


question quon est un plouc si on na quun
seul parfum. On fera donc comme si ctait
normal de nen avoir quun, et sil en a
plusieurs, il le dira spontanment, car il sait
que ce nest pas honteux den avoir
plusieurs

Quelle est la marque de votre parfum ?

Est-ce quil utilise le mme parfum pour tous Erreur classique : Utilisez-vous le mme
les jours et pour sortir le soir ?

parfum pour tous les jours et pour sortir le


soir ?

En effet, linterview comprend quil faut


rpondre non pour ne pas passer pour un

plouc, alors il rpondra non, mme si la vraie


rponse est oui

Que faut-il donc demander ?

Sil nous a dit prcdemment quil avait


plusieurs parfums, on peut lui demander :

Lequel avez-vous utilis la dernire fois ?

Sil en a un pour le soir et un pour tous les


jours, il y a des chances pour quil le prcise
spontanment ce moment l.

Achte-t-il lui-mme ses parfums ?

Vous lavez compris, viter absolument la

Si non, qui les lui achte ?

question : Achetez-vous vous mmes vos


parfums ?

Il peut tre plus ou moins facile de trouver


une bonne question qui nous permet
dobtenir notre information sans biaiser la
rponse.

On peut par exemple demander ici combien


valent les parfums dont il dispose.

Ainsi, le rpondant dira quil ne connat pas


le prix dun parfum car cest un cadeau

4 : La Conduite de lEntretien :

Les 4 paramtres grer.

La dure de lentretien

En gnral, il faut prvoir une dure dentretien denviron une heure minimum.
En effet, il faut un minimum de temps pour que lentretien entre dans le vif, et que
linterview se laisse aller et commence vaincre ou oublier les mcanismes de dfense
quil met en place

En effet, les interviews commencent souvent par donner une rponse banale, politiquement
correcte, ou la rponse quils pensent que linterviewer attend, ou dont ils pensent quelle les
mettra le plus en valeur.

Ce nest quau bout de 10-15 minutes quils se laissent aller, quils oublient quils sont
tudis , et quils commencent dire vraiment ce quils pensent

Le Lieu de lentretien

Lidal est que lentretien ait lieu dans un contexte o la personne peut sexprimer librement
et o elle nest pas trop drange, afin quelle puisse bien rentrer dans lentretien et se
concentrer. Il faut donc viter absolument les lieux bruyants, ou la prsence dun collgue de
travail.
Lentretien tlphonique est possible, mme sil ne permet pas de voir la communication non
verbale comme les mimiques, la gne ventuelle face une question etc, mais la pratique
montre quil sagit dune option qui donne des rsultats corrects.

Sadapter aux interviews

Afin de limiter les rticences des personnes vous livrer des informations profondes et
personnelles, il est important de sadapter vos interlocuteurs.
Il sagit notamment dadapter son langage et sa tenue vestimentaire.

Par exemple, pas de costume/cravate pour interroger des stylistes de mode ou des
adolescents

Le Cadre Contractuel

3 points importants :

Lorsque vous contactez les personnes interroger :

- Dites qui vous tes et ce que vous allez faire des entretiens (un mmoire de recherche)
- Nvoquez pas la problmatique du mmoire, restez vague pour ne pas biaiser les
rponses !

Par exemple, si vous travaillez sur le harclement moral au travail, ne le dites surtout pas ! Dites
que vous travaillez sur la motivation au travail, la place des managers dans lentreprise
Si linterview souhaite obtenir les rsultats de ltude, vous lui expliquerez a posteriori que
vous aviez t oblig docculter un peu la vraie problmatique

- Rassurez linterview sur le respect de son anonymat afin quil puisse sexprimer de la
manire la plus libre possible.
Dans le rapport dtude, on ne mentionne donc que les informations gnrales des interviews
(ge, fonction etc...), et surtout pas leurs noms et prnoms.
On se contente de prciser ventuellement le type dentreprise dans laquelle il travaille, mais
sans en donner non plus le nom.

Les 3 phases de lEntretien

Lentretien lui-mme suit gnralement 3 phases principales :

LOuverture

La phase dintroduction doit susciter lintrt de linterview et le mettre en confiance afin


quil vous dlivre les informations les plus intressantes et sincres possibles.

Il est conseill de dmarrer sur une question gnrale et vague car le rpondant aura tendance
commencer par voquer des lments superficiels, des clichs ou vous parler de ce quil
pense que vous souhaitez entendre.

Par exemple, si lon travaille sur lutilisation des jeux vidos, on peut commencer par
demander la personne de parler de ce quil fait durant son temps libre.

Si lon traite dun sujet de RH avec un salari, on peut commencer par lui demander de nous
parler de son parcours scolaire.

Le Centrage et lapprofondissement des thmes du guide dentretien

Aprs lintroduction, lorsque linterview est en confiance, on peut passer lvocation des
thmes principaux du guide.

Pour chaque thme, il est important dapprofondir le plus possible au moyen de relances, de
demandes de prcisions, dexemples Vous verrez que les interviews ont du mal prciser
leurs penses et rester dans le vague et labstrait. Il faut les pousser se livrer et dtailler
le plus possible chaque point du guide et transformer les lments abstraits en lments
concrets.

La Conclusion

Lorsque vous sentez que lentretien arrive sa fin, il existe une technique qui permet de
relancer les dbats et qui fournit souvent des lments trs intressants.
Il sagit de conclure en disant : coutez, en ce qui me concerne, nous avons abord tous les
thmes que je souhaitais aborder. Y-a-t-il quelque chose qui vous parat important, quelque
chose que vous tenez me dire et que nous naurions pas abord ?

La plupart du temps, la personne va rpondre non, je pense que nous avons fait le tour de la
question et juste aprs avoir termin cette phrase elle commencera vous parler de quelque
chose et vous pouvez tre certain ce moment l dtre en prsence de donnes de trs grande
qualit car toutes les barrires sont gnralement tombes ce stade.

Vous avez en effet signal que vous aviez fait le tour de la question : la personne ne se sent plus
sous le coup dune question et cest elle qui dcide de continuer ; il ny a donc plus besoin de
mettre en uvre des mcanismes de dfense.

La conclusion est galement le moment o lon peut proposer linterview de recevoir les
rsultats de ltude et de maintenir aussi le contact, surtout sil sagit dun professionnel
dentreprise qui peut savrer prcieux pour votre avenir professionnel

Limportance des relances

Il ny a pas dentretien efficace sans relances. En effet, les rponses des interviews aux
questions de lenquteur sont souvent courtes et confuses.
Les relances permettent linterview de drouler sa pense et de relcher ses mcanismes de
dfense.
Parfois, linterview na pas conscience des choses quon lui demande, et les relances sont l
pour le faire parler, et ainsi pouvoir en dduire sa pense.

Encore une fois, la difficult pour linterviewer est celle de rester neutre, et de ne pas influencer
les rponses, ainsi que de ne pas rester sur des considrations superficielles, mais au contraire
dapprofondir la pense de linterview.

Voici quelques exemples de formulation de questions et de relances :

Exemple 1, la relance simple: Vous reprenez la dernire phrase de linterview avec un ton
interrogatif :

Interview : Jaurais aim pouvoir nouer un accord avec cet industriel mais je nen avais
pas alors les moyens
Chercheur : Vous nen aviez pas les moyens ?

Exemple 2 : la relance diffre : Vous revenez sur un point voqu prcdemment par votre
interlocuteur en demandant directement des prcisions :

Interview : Les objectifs de lactionnariat des salaris cest la participation des salaris
aux fruits de lexpansion de lentreprise () il y a un deuxime point qui me semble important,
cest quune entreprise qui dispose dun actionnariat salari fort est une entreprise qui
performe mieux comme a tendance le montrer lIndice de lAS. Ce sont les deux principales
raisons pour lesquelles une entreprise va investir des sommes consquentes dans des
oprations de ce type.

Interviewer : Vous dites que ce sont les deux principales raisons, quelles sont les autres ?

Exemple 3 : La relance interprtative sert sassurer que lon a bien compris le raisonnement
de linterview :

Interview : Je prends un autre exemple : dans la presse quand on parle de Lafarge, mon
mari me dit tiens regarde, ils parlent de Lafarge dans le canard etc... je ne suis pas sre
quil laurait relev et quil me laurait fait remarquer si on ntait pas aussi actionnaires, en
tout cas sur certains articles qui parlent de lvolution du titre, il ne les aurait pas remarqus
de la mme manire.

Chercheur : Donc lAS susciterait de la part du salari, un intrt supplmentaire pour


lentreprise ?

Plus gnralement, utilisez des questions simples et neutres pour les relances :
Pourquoi ? Pouvez-vous mexpliquer ? Comment ? O ?

Comme suggr prcdemment, les interviews ont tendance utiliser des termes abstraits et
confus : il est impratif de leur faire traduire ces termes en lments concrets. Une bonne
technique est ici de demander de fournir des exemples.

Exemples :

Je nachte pas telle marque parce que ce nest pas mon style

On est sur une considration abstraite quil faudra faire prciser : C'est--dire ? Vous pouvez
prciser ? et on continue les relances jusqu stre assur davoir bien saisi la pense de
linterview.

Se fournir en Chine, ce nest pas si intressant que a

Ici aussi, intressant est un terme abstrait quil va falloir faire spcifier : Ce nest pas
intressant quel niveau ?

IMPORTANT :

Rappelez-vous quil ne faut intervenir aucun moment dans la pense des individus.

A viter donc absolument les questions qui suggrent des rponses :


Par exemple : Ce nest pas intressant quel niveau ? Au niveau prix ou au niveau qualit ?

Limportance des techniques projectives.

Les techniques projectives sont trs utiles, voire fondamentales dans les tudes qualitatives.

Elles consistent demander linterview de se mettre la place de quelquun dautre, de lui


faire endosser les penses et sentiments dun autre individu, rel ou fictif.

Cette technique a comme vertu de limiter certains freins aux rponses de peur dtre jug ou
de donner une mauvaise image, et de faire remonter la surface des lments inconscients que
linterview ne pouvait donc pas voquer parce quil nen avait justement pas conscience.

Il existe diffrents types de tests que je vous invite aller dcouvrir dans des manuels ou sur le
net.

Celui que je vous invite absolument utiliser dans toute tude par entretien, concerne ce que
lon appelle les tests de la troisime personne , et les portraits damateurs et de
dtracteurs .

Dans le premier cas, on demande linterview de se mettre la place de quelquun dautre :

A votre avis, pourquoi les gens achtent des vhicules 4x4 ?


Que recherchent les gens lorsquil vont au cinma ?
Imaginez quelquun qui vient de sengueuler avec son suprieur hirarchique... quelle tait la
raison du conflit ?

Dans ces cas, les lments qui viendront spontanment lesprit de linterview ne seront pas
anodins, condition davoir bien laiss le temps la personne de se plonger dans le personnage
imagin.

Le deuxime type de test projectif consiste demander aux personnes dimaginer et de dcrire
un amateur et/ou un dtracteur dun produit ou dune marque ou dun individu :

Imaginez quelquun qui vient de crer son entreprise... puis dcrivez-le : ge, sexe, qua-t-il
fait comme tudes, comment est-il habill...

Imaginez quelquun qui rentre dans un concessionnaire Renault. Il souhaite acheter une
Mgane... dcrivez-le...

Ce type de technique permet dtudier efficacement limage que les individus ont dune marque,
dun produit ou dune situation...

Autre exemple : Un tel est un comptable de la socit X : dcrivez-le...

La Collecte des Donnes :

Lidal est denregistrer lintgralit des dbats laide dun dictaphone et de


retranscrire lentretien mot mot.

La prise de notes souffre en effet de trois inconvnients majeurs :


-

il est impossible de se concentrer simultanment sur la conduite de lentretien et la prise


de notes ;

les donnes collectes par prise de note sont forcment limites ;

lenquteur doit distinguer instantanment ce qui est important de ce qui ne lest pas,
alors quun tel travail demande de la rflexion et une forte concentration.

Il faut donc absolument privilgier lenregistrement intgral et la retranscription mot--mot.

Lorsquon rassure linterview sur le respect de lanonymat, il est gnralement facile quil
accepte que les propos soient enregistrs.

LAnalyse de Donnes Qualitatives

Il existe diffrentes manires plus ou moins sophistiques danalyser des retranscriptions


dentretiens ou des donnes qualitatives secondaires.

Pour ceux qui souhaitent approfondir ce point, il existe diverses sources bibliographiques
comme par exemple :
http://www.escpeap.net/conferences/marketing/2005_cp/Materiali/Paper/Fr/ANDREANI_CO
NCHON.pdf
http://www.lesphinx-developpement.fr/public/upload/_FRANCE/pdf/Support/Articles-etpublications/AnalyseDonneesQualitatives.pdf
http://www.recherchequalitative.qc.ca/documents/files/revue/hors_serie/hors_serie_v3/Wanlin2.pdf

Cependant, lanalyse de continu thmatique la main reste la plus couramment utilise, la


plus simple et la plus pertinente, surtout lorsque le corpus analyser nest pas trop volumineux.

Lanalyse de contenu thmatique, principes de base :

Lide est dextraire du texte les ides importantes lies la problmatique, puis de les classer
autour dune structure qui permette de faire ressortir clairement ce que nous ont appris les
entretiens.

Le Concept de Codage

Le codage consiste dcouper des morceaux de texte voquant un thme ou une ide
particulire et de les mettre dans une case (ou une rubrique) dans laquelle on mettra tous les
extraits abordant le mme thme ou la mme ide.

Ces cases ou catgories peuvent concerner des concepts plus ou moins larges comme
pouvoir , hirarchie , segment , stratgie etc

Par exemple, tout mot, phrase ou paragraphe faisant rfrence la conception de la hirarchie
dans une entreprise sera plac sous la catgorie hirarchie .

Dmarche gnrale de codage et danalyse

Etape 1 : Lire lintgralit des interviews


Il sagit dune tape longue et dlicate qui consiste lire intgralement le corpus en sefforant
de ne pas commencer le structurer, ceci pour viter de lire la fin du corpus travers une grille
danalyse construite mentalement et inconsciemment la lecture des premires interviews.

Etape 2 : Relecture et laboration de la grille danalyse


Lors de la deuxime lecture, chaque fois quune ide ou un thme apparaissent, une catgorie
portant son nom est cre dans un tableau.

Au fur et mesure de lavancement, des sous catgories sont cres si ncessaire.

Si le nombre dentretiens est important, il est conseill de restructurer les thmes tous les 2 ou
3 entretiens afin de ne pas multiplier inutilement les thmes et sous thmes.

On saperoit en fait que des doublons apparaissent, et il est prfrable de les liminer.

tape 3 : Relecture et codage


Durant la troisime relecture, on commence connatre le texte.
A chaque fois quune ide apparat, on la dcoupe et on linsre dans la case correspondante de
la grille danalyse.

Ici encore, on peut rorganiser les catgories et sous catgories si on saperoit que la structure
peut tre amliore.

tape 4 : Extraction des rsultats.


A la fin de ltape 4, on se retrouve avec des rubriques et sous-rubriques, et dans chaque sous
rubrique, tous les extraits qui parlent de chacun des sous-thmes.

La rdaction des rsultats consistera reproduire la structure et rsumer le contenu de chaque


case.
On gardera les extraits les plus reprsentatifs pour chaque thme important, que lon appellera
des verbatims.

IMPORTANT
tant donn que nous travaillons sur de petits chantillons (15-20 individus) il nest pas trs
pertinent de raliser des quantifications, surtout en termes de % dindividus qui ont dit ceci ou
cela.
Typiquement, il nest pas pertinent de dire que 20% des individus ont dit ceci et 10% ont dit
cela.
Les ventuelles quantifications, ne peuvent concerner que la rcurrence de mots ou de thmes
dans lensemble du corpus des retranscriptions.

Ce qui est important ce sont les ides qui mergent des entretiens. Si vraiment une tendance
semble se dgager, il est possible de le mentionner mais en utilisant des pincettes : on peut par
exemple dire : Une majorit de rpondant semblent saccorder sur .

Les Schmas

Afin de faire ressortir vos rsultats et de permettre au lecteur den avoir une image globale, il
est important de les synthtiser au moyen de schmas rcapitulatifs.

Ces schmas apportent une modlisation de vos rsultats.

Exemples tirs de mmoires de la promo 2014 :

6 : Les tudes quantitatives : les principes de construction dun


questionnaire.

Rappel : Les tudes quantitatives peuvent se baser sur des donnes secondaires ou des donnes
primaires.

Les donnes primaires sont le plus souvent collectes laide dun questionnaire et
ventuellement dune exprimentation.

Dans cette section nous allons voir les principes de construction dun questionnaire.

Comme voqu prcdemment, les tudes quantitatives ont comme objectifs :


- De mesurer des scores de variables
- De comparer les scores entre groupes dindividus (units danalyses)
- Dvaluer des relations entre variables
- De gnraliser
- De tester des hypothses

Dans une tude quantitative nous avons diffrents lments :

1- Quels individus on tudie : il sagit de lunit danalyse dune tude. On peut


souhaiter tudier des humains, des entreprises, des titres financiers, des logos, des pays
etc....

Lensemble des individus qui nous intressent est appel la population mre. Par
exemple, si on tudie la bourse franaise, la population mre seront toutes les socits
cotes franaises, alors que si lon sintresse la bourse mondiale, la population mre
pourra tre lensemble des socits cotes, ou lensemble des indices boursiers
mondiaux.

Lorsque la population mre est constitue dun nombre trs important dindividus, il
nest pas souhaitable de tous les tudier ; on en tudie gnralement on chantillon que
lon souhaite le plus reprsentatif possible de la population mre.
Nous nallons pas aborder ici les techniques dchantillonnage, je vous renvoie
dautres supports pour cela.

Le nombre dindividus qui composent lchantillon est aussi appel nombre


dobservations. Par exemple, si lon tudie 1000 entreprises, on dira que ltude se base
sur 1000 observations.

2- Dans une tude quantitative, on sintresse diffrentes caractristiques des


individu , caractristiques que lon appelle des variables.
Par exemple, pour une entreprise, le CA, le secteur dactivit, le nombre de salaris, la
nationalit, le rsultat net etc sont des variables.

3- Enfin, chaque individu faisant partie de lchantillon tudi a un certain score ou une
certaine valeur pour chaque variable tudie : au croisement des individus et des
variables on trouve ce que lon appelle des donnes.

Donnes

Variable 1

Variable2

Ex : Nom

Ex : Secteur Ex
dactivit

Variable3

.....
:

Capitalisation
boursire

Individu 1

BNP Paribas

Banques

& 53

...

Assurances
Individu 2

EDF-GDF

Energie

49

...

....

...

....

...

...

Le tableau ci-dessus est un tableau de donnes, o chaque ligne correspond un individu, et


chaque colonne une variable.
Pour chaque variable, les donnes collectes peuvent tre secondaires (existantes), collectes
par questionnaire, par exprimentation ou un mix, selon les besoins.

Nous allons voir maintenant en dtail comment collecter des donnes par questionnaire.

1. Quest-ce quune variable et quels sont les diffrents types de variables


2.

Une variable est une caractristique des individus tudis, et qui varie
dun individu un autre.
Exemples

Prenons lentreprise comme unit danalyse.

Quelles peuvent tre les caractristiques des entreprises qui varient dune entreprise une
autre ?
- Le nom
- La nationalit
- La taille (nombre de salaris, capitalisation boursire, chiffre daffaires...)
- Le secteur dactivit
- La forme juridique...

Prenons ltre humain comme unit danalyse.

Quelles peuvent tre les caractristiques des humains qui varient dun humain un autre ?

- Taille
- Poids
- Couleur des yeux
- Sympathie
- Intelligence

- Got pour le cinma


- Got pour largent...

Prenons lactif financier comme unit danalyse.

- Rendement
- Risque
- Composition sil sagit d un fonds...

Avec ces quelques exemples, nous voyons quil existe divers types de variables.
Ces diffrences entre types de variables sont trs importantes, car chaque type de variable
ncessitera un type danalyse spcifique.

Pour qualifier les variables, il faut se poser les questions suivantes :

La variable concerne-t-elle des QUANTITES ou pas ?

En effet, certaines variables concernent des quantits et on peut dire quun


individu a plus ou moins de cette caractristique quun autre
Dautres variables, au contraire, ne concernent rien qui ait voir avec des
quantits.

On appelle ainsi VARIABLES QUANTITATIVES des caractristiques que les


individus ont plus ou moins par rapport aux autres, et qui concernent donc des quantits.

Peut-on tre plus ou moins grand ? Oui. Donc la taille est une variable quantitative.
Peut-on tre plus ou moins intelligent ? Oui. Donc lintelligence est une variable
quantitative.
Peut-on tre plus ou moins bien lev ? Oui. Donc le niveau dducation est une variable
quantitative.
Peut-on tre plus ou moins bavard ? Oui. Donc la tendance bavarder est une variable
quantitative.
Peut-on tre plus ou moins averse au risque ? Oui, donc laversion au risque est une
variable quantitative.

Peut-on tre plus ou moins Jacques ? Non, donc le prnom nest pas une variable
quantitative.
Peut-on tre plus ou moins dans le secteur bancaire ? Si lon parle de secteurs
dactivits, on y est ou pas, donc ce nest pas une quantit.

Il en est de mme pour certaines caractristiques comme le sexe (homme/femme), la


couleur (vert, bleu, jaune...) etc... que lon appellera VARIABLES NOMINALES.

Attention : Une variable peut tre Nominale ou Quantitative selon la manire de la


dfinir.
Ainsi, le Sexe est une variable nominale avec 2 modalits Homme et Femme.
Par contre, la masculinit et la fminit sont quantitatives, car elles concernent des
degrs, des intensits, donc des quantits.

Deuxime question importante se poser pour qualifier une variable :

Existe-t-il, pour une variable donne, une valeur objective et indiscutable que lon peut
attribuer chaque individu ?

Pour la variable ge et pour un individu donn, existe-il une valeur objective et indiscutable ?
Oui, vous avez par exemple 23 ans.
Pour la variable montant sur votre compte en banque existe-il une valeur objective et
indiscutable ? Oui, si vous disposez de 2350 euros, par exemple, cette somme est objective et
indiscutable.
Idem pour la variable nombre dannes dtudes suprieures effectues etc...

Dans tous ces cas, nous avons affaire des variables dites manifestes.

Dans les autres cas, nous avons affaire des variables dites abstraites .

Par exemple, pour la variable niveau de gamme que vous attribuez la marque Marc
Jacobs, y a-t-il un score objectif et indiscutable ? Non.

Pour la variable motivation dans votre travail, existe-t-il un score objectif et indiscutable ?
Non.
Idem pour les variables tendance manger des sucreries, attachement dun salari son
entreprise, propension au risque, got du jeu etc...
Dans tous ces cas, nous avons affaire des variables ABSTRAITES (ou latentes).
Pour rsumer, en croisant les deux principales distinctions, il existe 4 types de variables :

2- Le Questionnaire pour collecter des donnes primaires.

Le questionnaire est le principal outil de collecte de donnes primaires dans une tude
quantitative.

Il sert, pour les variables que lon souhaite tudier, attribuer une valeur chaque rpondant.

Concevoir un bon questionnaire est une activit extrmement complexe et trs fragile, cest
dire quil est trs facile dobtenir des donnes non valides, cest dire qui ne reprsentent pas
linformation que lon recherche.

Ceci est trs grave, car avec des donnes de mauvaise qualit, on aboutit des rsultats faux
donc trompeurs !

Les tapes suivantes servent maximiser les chances dobtenir des donnes de bonne qualit
avec un questionnaire.

Etape 1 : Commencer par lister les variables tudier.

tant donn quun questionnaire sert attribuer des valeurs des individus par rapport
diffrentes variables, il faut donc commencer par lister les variables que lon souhaite tudier.

Comment savoir quelles variables tudier ?

En principe, votre revue de littrature et ventuellement votre tude qualitative vous ont conduit
proposer des hypothses de recherche.
Ces hypothses prvoient des relations entre variables, et votre tude quantitative servira tester
ces hypothses.
Les variables cls de votre tude seront donc contenues dans les hypothses de recherche.

Par exemple, si lune de vos hypothses est comme suit :

La qualit du casting dun film a un effet positif sur lenvie des spectateurs de le voir .

Cette hypothse implique une relation entre 2 variables :

La qualit du casting dun film


Et
Lenvie des spectateurs de le voir

Il faudra donc tudier ces 2 variables travers le questionnaire (ou une exprimentations).

Erreur classique viter :

Ne pas confondre variable et relation entre variables.

Par exemple : leffet de la publicit sur la notorit nest pas une variable mais la relation
entre 2 variables (publicit et notorit).
Il faut mesurer chacune des variables, et cest une analyse statistique qui nous dira sil existe
une relation ou pas entre les deux (on ne le demande pas aux rpondants...).

tape 2 : Dfinir chaque variable

Pour tre certain de bien savoir ce que lon tudie, il est important de dfinir clairement chaque
variable.

Par exemple : Lesprit dentreprise est dfini comme la tendance dun individu souhaiter
crer une entreprise.

Mais on pourrait aussi vouloir dfinir comme esprit dentreprise le fait de crer rellement des
entreprises. Un choix justifi doit donc tre effectu.

Remarque : pour certaines variables manifestes, la dfinition est vidente (ge, sexe, etc). Il
est dont inutile den fournir une.

tape 3 : Qualifier les variables et prciser les modalits de variation.

Pour ne pas vous tromper, qualifiez chaque variable : Nominale ou Quantitative ? Manifeste ou
Abstraite ?

Prciser ensuite les modalits de variation : cela permet de comprendre rellement ce que vous
allez mesurer. En effet, pour une mme variable on peut avoir des modalits de variation
diffrentes.

Par exemple, pour le quotient intellectuel, on peut utiliser les mesures classiques allant de 50
150, ou les modalits suivantes :
1= trs bas
2= bas
3= moyen
4= lev
5= trs lev

Pour lge, on peut utiliser le nombre dannes ou une chelle de type :


1- Enfant
2- Adolescent

3- Adulte
4- ....

tape 4 : Choisir des items

Les items sont les questions qui vont tre utilises pour attribuer chaque individu une
valeur pour chaque variable tudie.

En gnral, 1 item est suffisant pour les variables manifestes, alors que plusieurs items sont
ncessaires pour les variables abstraites quantitatives.

O trouver ces items ?

Lidal est de partir ditems dj utiliss dans des tudes existantes (que vous aurez dj lus
dans votre revue de littrature ou rechercher sur EBSCO et Google Scholar).
Les items peuvent videmment tre adapts au contexte de votre tude.

Parfois, pour des exigences de recherche acadmique, des chercheurs peuvent tre amens
utiliser un nombre important ditems pour mesurer des variables abstraites.
Pour les besoins de votre mmoire, limitez-vous 3-4 items par variable abstraite.

Pour crer soi-mme des items, il est important de bien matriser les principes gnraux de
psychomtrie que nous verrons par la suite.

tape 5 : Choisir les modalits de rponse

Comme suggr plus haut, chaque item sert mesurer une variable : il faut donc
plusieurs modalits de rponse pour pouvoir capter la variation de cette variable.

- Parfois les modalits de rponse dcoulent de la variable elle mme (Sexe = hommes
et femmes)
- Parfois cest vous de dcider quelles seront les modalits, selon la prcision que vous
souhaitez obtenir. En gnral, plus on a de modalits et plus on obtient des donnes
prcises.

Lexemple que vous connaissez bien est celui des notes aux examens :

Dans certains pays vous avez 5 modalits (A F) dans dautres pays des notes sur 10, ou sur
20

Dans un questionnaire, des choix doivent tre faits selon les types de variables.

Variables Nominales

Les variables nominales ne mesurent pas, elles catgorisent.

Elles permettent de comparer des groupes sur des scores de variables quantitatives :
-

Y a-t-il une diffrence entre garons et filles sur les notes au mmoire de recherche ?

Y a-t-il une diffrence entre majeures ? Entre classiques et apprentis ?

Les chelles de variables nominales ne posent donc pas de problmes, si ce nest celui de
sassurer que la catgorisation est bien pertinente.

Par exemple : Quel type demploi occupez-vous ?


1- Administratif
2- Commercial
3- Services Gnraux etc...

Attention : Les entreprises ne sont pas toutes organises de la mme manire. Il est donc
important de bien se renseigner avant de crer une variable nominale dans un questionnaire.
En effet, si jamais une catgorie est oublie, toute ltude est biaise.

Remarque : pour les variables nominales, la codification en chiffres est arbitraire (2 nest pas
le double de 1, ni suprieur 1): elle ne sert qu crer des groupes.

Variables quantitatives manifestes

Il en existe en fait 2 types


- Les ordinales
- Les mtriques

Les variables ordinales se situent mi-chemin entre variable nominale et variable quantitative.
En effet, on peut les considrer comme quantitatives, car elles reprsentent des quantits en
quelque sorte, et parce quune modalit reprsente un attribut suprieur ou infrieur une autre
modalit.
Cependant, ce ne sont pas de vraies variables quantitatives car il est impossible dadditionner
ou de multiplier les modalits de rponse.

Par exemple le niveau hirarchique dans une entreprise est une variable ordinale.
En effet, imaginons quil y ait 5 niveaux (donc 5 modalits):
5. Direction gnrale
4. Cadres suprieurs
3. Cadre moyens
2. Employs
1. Ouvriers

On a bien une relation quantitative entre les niveaux. Cependant, ce ne sont pas de vritables
quantits et dailleurs, les chiffres utiliss sont arbitraires, je pourrais utiliser 10 pour DG et 1
pour ouvriers.
Du coup, je ne peux pas dire par exemple, que Direction Gnrale (5) = Cadres suprieurs (4)
+ Ouvriers (1).

Les variables mtriques sont les vraies variables quantitatives, car elles concernent de vraies
quantits : taille, poids, salaire, chiffre daffaires

Ainsi, la diffrence des variables ordinales, je peux dire que 200kg = 2*100 kg, et il existe
aussi un zro qui nexiste pas pour les variables ordinales.

Pour les variables mtriques, on peut utiliser deux types ditems : soit on utilise un item qui
demande la vraie valeur, soit on utilise des catgories.

Exemple : Veuillez indiquer votre ge :

Option 1 : Vous laissez un espace dans lequel la personne doit crire son ge

Option 2 : Vous proposez des catgories et le rpondant coche celle laquelle il appartient :
1
2
3
4
5

Moins de 10
entre 10 et 20
entre 20 et 30
entre 30 et 40
Plus de 40

Lavantage de loption 2 est que le rpondant se contente de cocher, alors que pour loption 1
il doit crire, ce qui prend plus de temps.

Linconvnient de loption 2 et quelle offre une prcision moindre.


En effet, toutes les personnes ayant entre 20 et 30 ans par exemple, auront le mme score (3)
ce qui ne permet pas de les distinguer, alors quelles ont des ges trs diffrents

Remarque : Lidal lorsquon cre ce genre de catgories, est quil y ait la mme distance entre
chaque modalit, ce qui nest pas le cas ci-dessus.

Variables quantitatives abstraites/latentes

Les variables quantitatives abstraites mesurent le plus souvent des valeurs, des prfrences, des
attitudes, des traits de personnalit etc

Pour ce type de variables, les modalits de rponse les plus adaptes prennent la forme
dchelles de Likert 5 ou 7 points.

On demande aux rpondants dtre plus ou moins daccord avec une affirmation, ou
daccorder une importante plus ou moins forte telle ou telle chose.

Exemples :

Pouvez-vous indiquer votre degr daccord vis--vis de laffirmation suivante ?

Pour des raisons qui me sont personnelles, je ne donne plus le meilleur de moi-mme

Pas du tout

Tout fait

daccord

daccord

dans mon travail

Depuis que vous occupez ce poste, (quand vous rflchissez tous les changements

Beaucoup

Beaucoup

Diminu

Augment

que vous avez connus), avez-vous le sentiment que le niveau dintensit de vos efforts
a:

Quelle importance accordez-vous :


Travailler avec des collgues qui cooprent bien les uns avec les autres.

Pas du tout
Important
1
2

Extrmement
Important
3
4
5

2 questions se posent ici :

Lchelle de likert est-elle ordinale ou mtrique ?

La question nest pas tranche, mais les donnes issues dchelles de likert sont le plus souvent
considres comme mtriques.
On peut en effet considrer que les rpondants rpondent une chelle de likert de la mme
manire quils attribuent une note /10 un film, un livre ou une personne.

La seconde question est de savoir sil faut utiliser ou pas un point neutre (ne se
prononce pas) ou sil faut carrment supprimer le point central.

partir du moment o on considre que lon est en train dattribuer un score des individus
sur une variable quantitative, le point neutre na aucun sens, et fausse mme les rsultats.

En effet, la question : Quelle importance accordez-vous au fait de partir ltranger pendant


vos vacances ?
1= Pas du tout important7=Fondamental

La modalit 3 signifie logiquement moyennement important .

Lui attribuer une valeur de type ne se prononce pas est conceptuellement faux.

Le principe de la conception des items pour les variables abstraites

Pour des raisons que nous verrons plus tard, les variables abstraites ncessitent dans lidal
plusieurs (au moins 3) items, chaque item tant un indicateur de la variable abstraite.

On sait bien, par exemple, que les mesures de quotient intellectuel sont calcules partir dune
multitude de tests et non pas en rpondant une seule question (et encore moins la question :
quel est votre QI ? ou quelle est votre intelligence ?).

Quest-ce quun indicateur ?

Un indicateur est un outil qui permet de capter des caractristiques abstraites des individus.

Par exemple, nous savons que les individus sont plus ou moins averses au risque (variable
abstraite).

Pour quantifier laversion au risque des individus, il va falloir trouver des questions qui
permettent dvaluer cette aversion.

Quels peuvent tre des indicateurs concrets de laversion au risque ?

Par exemple, quelquun qui prfre placer ses conomies sur un livret A plutt quen bourse
fait preuve dune grande aversion au risque.

Ainsi, on peut imaginer litem suivant :

Indiquez votre accord avec laffirmation suivante : Lorsque je parviens faire des conomies,
je prfre les placer sur mon livret A plutt quen bourse.
1= Tout fait daccord

7= pas du tout daccord

De mme, quelquun qui prfre un CDD mieux rmunr un CDI moins rmunr fait preuve
dune forte aversion au risque.

Indiquez votre accord avec laffirmation suivante : Je prfre un CDD rmunr 2000 euros
par mois quun CDI rmunr 1700 euros par mois
1= Tout fait daccord

7= pas du tout daccord

Il est aussi courant dutiliser, parmi les 3-4 items, un item plus direct du type :

Indiquez votre accord avec laffirmation suivante : Je pense tre quelquun qui aime bien
prendre des risques.
1= Tout fait daccord

7= pas du tout daccord

Comme les items sont-ils cres ?

Il existe 3 possibilits (complmentaires) pour crer des items :

La manire la plus rigoureuse est de raliser des entretiens semi directifs auprs dun
chantillon dindividus de la mme population que celle laquelle le questionnaire sera
administr, pour dterminer quels sont, dans leur esprit, les indicateurs concrets du
concept abstrait que lon souhaite mesurer.

La manire la moins rigoureuse et de se baser seulement sur le bon sens : il semble


logique que le fait de prendre souvent un dessert sucr au restaurant soit un indicateur
de gourmandise. Cependant, la pratique montre que souvent des items crs de cette
manire peuvent davrer tre de mauvaise qualit.

Une autre manire de procder est dutiliser des items dj utiliss dans des articles de
recherche.
Cependant, ces items doivent tre traduits en franais et adapts la population de
ltude. De mme, dans le cadre de recherches scientifiques, on est souvent amens
utiliser plus de 3 items pour la mme variable abstraite, ce qui peut conduire des
questionnaires dont ladministration est lourde.
Limitez-vous 3-4 items par variable pour votre mmoire.

Exemple :

Imaginons que lon souhaite mesurer lattractivit dentreprises pour des tudiants dcole
de Commerce afin den tudier les dterminants.

On pourrait appeler cette variable : attractivit dune socit sur le march du travail et
notamment auprs des jeunes diplms.

Comment mesurer cette attractivit par le biais dun questionnaire ? Comment savoir quels
sont les indicateurs de lattractivit des entreprises pour des tudiants ?

Si lon dcidait de se baser sur une tude qualitative pour tablir une liste ditems, on pourrait
par exemple demander des tudiants dans quelle entreprise ils aimeraient travailler, et leur
demander ensuite pour quelle raison : on obtiendrait ainsi une liste dindicateurs concrets dun
concept abstrait !

En ralisant des entretiens, on dcouvrirait par exemple que les principaux indicateurs
dattractivit sont les suivants :
-

la politique salariale

limage de marque de lentreprise

limage sociale de lentreprise

les perspectives de carrire

On pourrait alors construire lchelle de mesure suivante du concept dattractivit dune


entreprise en se basant sur ces indicateurs:

Veuillez indiquer votre accord ou dsaccord vis--vis des affirmations suivantes :

La socit X offre gnralement des salaires levs par rapport la moyenne du


march
La socit X est trs prestigieuse

Pas du tout
daccord
1
2

Tout fait
daccord
4
5

La socit X est rpute pour offrir de bonnes opportunits de carrire

La socit X a une culture trs respectueuse du bien tre de ses salaris

Notez que dautres types de questions auraient pu tre conus.


Ce quil faut avoir lesprit cest que chaque question doit tre un indicateur du concept
mesurer.

Voici dautres exemples ditems qui auraient pu tre utiliss :

Jaimerais vraiment pouvoir travailler dans la socit X


Si javais le choix entre travailler dans la socit X et un concurrent, je choisirais la

Pas du tout
daccord
1
2
1
2

3
3

Tout fait
daccord
4
5
4
5

socit X mme pour un salaire infrieur


La plupart des tudiants de lINSEEC aimeraient travailler dans la socit X

Point important : Assurez-vous que chaque item mesure bien le mme


concept cest dire que pour chaque item, un score important = forte
attractivit et score faible = faible attractivit.
La Structuration du Questionnaire tel quil sera administr aux rpondants :

Il sagit de la manire dont le questionnaire que vous soumettez aux rpondants doit tre
conu et prsent.

Le questionnaire dmarre gnralement avec un mot dintroduction dans lequel lenquteur se


prsente, voque brivement et de la manire la plus floue possible lobjet de lenqute et
remercie les rpondants pour leur participation.
On ne rvle pas la problmatique exacte pour ne pas biaiser les rponses.

Exemple :

Madame, Monsieur,
Nous ralisons une enqute sur les salaris au travail.
Les informations recueillies dans ce questionnaire sont strictement anonymes et confidentielles.
Cest votre opinion qui nous intresse. Aussi, veuillez rpondre de la manire la plus libre et la
plus sincre possible.
Il ny a pas de bonne ou de mauvaise rponse. Seul votre avis compte.
Merci de rpondre toutes les questions mme si vous ntes pas compltement sr(e) de votre
rponse, mme si certaines questions paraissent redondantes ou rptitives.
Remplir ce questionnaire ne vous prendra que 15 minutes environ.
Le questionnaire proprement parler est ensuite organis par thmes gnraux avec des
phrases de transition qui guident le rpondant :

Pour commencer, nous allons parler de votre consommation de produits frais

Nous allons maintenant parler de vos relations avec les subordonns et suprieurs au sein
de votre entreprise

Il est conseill de ne pas mettre les items mesurant la mme variable abstraite les uns la suite
des autres afin que le rpondant, sapercevant de la ressemblance des items, ne soit tent de
rpondre machinalement la mme chose sans rflchir.

Attention aux items inverss

Certains items utiliss dans des articles de recherche pour mesurer des variables abstraites
peuvent tre inverss pour sassurer que les rpondants taient bien attentifs en rpondant (ce
procd est dconseill depuis quelques annes).

Par exemple :
Jaimerais vraiment pouvoir travailler dans la socit X

Devient
Je naimerais vraiment pas travailler dans la socit X

Les scores sont alors inverss car ici 1= forte attractivit et 6= faible attractivit.

Si vous utilisez des items inverss, il ne faut pas oublier de remettre les scores dans le bon sens
avant lanalyse des donnes.

La partie sur les donnes socio-dmographiques vient en gnral en fin de questionnaire, au


moment o le rpondant commence tre fatigu, car on estime que ce sont les questions
auxquelles il est le plus facile de rpondre.

Point important :

Afin de ne pas obtenir des rsultats biaiss, il est important de rassurer le rpondant sur la
prservation de lanonymat des rponses.
Ainsi, il ne faut pas demander le nom du rpondant ni des informations permettant de
lidentifier.

Choix du support du questionnaire et du mode dadministration

Il existe un nombre important doptions concernant ladministration dun questionnaire, chacun


ayant ses avantages et inconvnients.
Le questionnaire peut tout dabord tre conu sur support papier ou lectronique.
Je vous conseille www.surveymonkey.com ou googledocs pour les questionnaires
lectroniques.

Le questionnaire peut galement tre auto-administr, administr en face--face ou par


tlphone.
Je vous renvoie des manuels classiques dtudes de march pour obtenir de plus amples
informations sur les implications du choix de ces diverses options.

La Base de Donnes Obtenue.

A lissue dune collecte de donnes par questionnaires, on obtient une base de donnes (sur
excel gnralement si on opte pour ladministration web) avec les rpondants en ligne et la
rponse chaque item en colonne.
La figure ci-dessous montre une base de donnes telle quelle apparat dans le logiciel
danalyses de donnes SPSS.

7 : Validit et fiabilit des donnes obtenues par questionnaire.


Une tude se doit de donner une bonne image de la ralit.

Dans les tudes quantitatives, lobjectif est dtudier :

- une population (individus, entreprises, actifs financiers...)


- des variables (nom, taille, bnfice, volatilit, secteur dactivit...)
- des relations entre variables

La base de donnes analyse dans une tude quantitative contient donc linformation pour
chaque individu de lchantillon, concernant chacune variable de ltude.

Comme le montre le tableau ci-dessous, nous avons chaque individu en lignes, les variables
tudies en colonnes, et les caractristiques de chaque individu aux croisements des deux : les
donnes.

V1

V2

V3

V4

V5

Donne 1V1

...

...

...

...

Donne 2V1

Donne2V2

...

...

...

3....

...

...

...

...

...

Variables
Individus

Ces donnes peuvent tre obtenues :


- par questionnaire
- par exprimentation
- par observation
- par collecte de donnes secondaires
Et toute combinaison de ces 4 sources.

81

Limportante question qui se pose ici est la suivante : comment obtenir des donnes de bonne
qualit, cest--dire qui refltent bien les caractristiques de chaque individu quelles sont
censes dcrire ?

Comme nous allons le voir, La qualit des donnes utilises dans une tude quantitative
svalue en termes de validit et de fiabilit.

Mais la qualit des rsultats dune tude quantitative dpend aussi de la qualit de lchantillon
sur lequel ltude se base : plus lchantillon est reprsentatif de la population tudie, plus les
rsultats obtenus seront gnralisables.

Qualit des
rsultats
dune tude
quanti

Qualit
(Reprsentativit
) de lchantillon

Qualit (Validit
et fiabilit) des
donnes utilises

Je vous renvoie des manuels dtude marketing pour revoir les questions relatives aux
techniques dchantillonnage.
Nous allons ici nous focaliser sur les principes et les tests qui concernent la qualit des donnes
utilises.

La validit et la fiabilit des donnes collectes.

Tout individu a une position prcise pour chaque variable que lon peut imaginer.

Par exemple, la variable Taille , tout individu dispose dun nombre de centimtres prcis.
Par exemple, pour la variable taille , Lucie se positionne 169 centimtres.

Cependant, selon les types de variables, il est plus ou moins facile dattribuer des scores des
individus.

82

Par exemple, il est plus ais dobtenir des donnes de bonne qualit pour les variables
manifestes que pour les variables latentes (abstraites).

Pour comprendre ce principe, il faut imaginer que pour chaque individu, il existe une
information relle et une information mesure qui sera celle quon aura collecte lors
de ltude.

On comprend facilement que plus la valeur mesure est proche de la valeur relle , plus
on considrera que les donnes collectes sont de bonne qualit.

Par exemple, si le poids rel dun individu est de 178 kg et que la balance qui mesure son poids
indique 178 kg, on dira que la balance fonctionne bien, quelle est prcise.
Si, au contraire, la balance indique 23 kg ou 2345 kg, on dira quelle est casse et on nattribuera
aucune valeur au score affich.

La question que nous allons nous poser est celle de la qualit des donnes collectes par
questionnaire.

En gnral, on sait que linformation collecte sur des variables manifestes est dassez bonne
qualit, i.e. quelle ressemble beaucoup linformation relle, car les rpondants connaissent
bien cette information, et qu moins davoir une bonne raison de mentir, ils donnent
linformation relle.

Nous pouvons donc dj tablir un principe :

Pour quune information collecte par questionnaire soit de bonne qualit, trois premires
conditions ncessaires (mais pas suffisantes) doivent tre runies :
1- Le rpondant doit comprendre la question (de quelle variable il sagit)
2- Le rpondant doit connatre linformation
3- Il doit souhaiter la communiquer

Exemples :
Combien de temps avez-vous pass au tlphone durant les derniers 30 jours ?
Personne ne connat la rponse !
83

Par contre : combien de films avez-vous regard cette semaine ?


Est une question laquelle peu prs tout le monde est capable de rpondre.

Autre question : tes-vous homophobe ?


Certaines personnes ne souhaiteront pas donner linformation relle, donc la qualit de
linformation collecte au moyen dun tel item risque dtre de trs mauvaise qualit

Ces premires considrations nous poussent tablir une distinction importante entre deux
types de variables : les variables manifestes et les variables abstraites.

Pour rappel, une variable manifeste concerne une caractristique que lon peut qualifier de
manire objective et indiscutable.

La couleur, la taille, le nom, le sexe etc sont des variables pour lesquelles on peut attribuer
chaque individu une valeur objective et indiscutable.

Au contraire, pour les variables abstraites, il nexiste pas de valeur objective et indiscutable.

Par exemple, les individus apprcient plus ou moins tre soumis un management autoritaire,
ou ont un intrt plus ou moins grand pour lactualit.

Les intrts, attitudes, valeurs, gots, prfrences des individus sont des variables trs
importantes des tudes, mais il nexiste pas de valeurs objectives et indiscutables qui puissent
tre attribues des individus pour dcrire ces variables.

Cest justement pour mesurer les variables abstraites que les principaux problmes de validit
se rencontrent En effet, pour ce type de variables, il nexiste par de score rel, les rpondants
ne connaissent donc pas linformation que lon souhaite obtenir deux.

84

Comment maximiser la qualit des donnes collectes par questionnaire pour des
variables abstraites ?

Il existe 2 tapes qui permettent de maximiser la qualit des donnes collectes par
questionnaires :

A priori, il faut crer de bon items/questions

A posteriori, il fait vrifier la qualit des items

a) Comment crer a priori de bons items pour mesurer des variables abstraites ?

Pour les variables abstraites comme laversion au risque, lindividualisme, limportance


accorde la culture ou la colre ressentie, il faut imaginer que chaque individu se place sur un
continuum allant de TRES PEU ENORMEMENT

Exemple : Importance accorde une alimentation saine

Faible

Forte

Ce que lon cherche faire lorsquon cre des items pour mesurer ce genre de variable est de
faire en sorte dattribuer aux individus tudis des scores, forcment subjectifs, mais qui
refltent au mieux la variable tudie, cest--dire que les individus qui accordent une forte
importance une alimentation saine obtiennent un score lev et ceux qui accordent une
importance faible une alimentation saine obtiennent un score faible.

Comme expliqu prcdemment, on utilise gnralement 2 types ditems pour mesurer des
variables abstraites :

Des items qui valuent des indicateurs de la variable mesurer (items plutt indirects)

Des items qui demandent au rpondant dvaluer directement la variable (items plutt
directs).

85

Exemple.
Variable : Attachement lentreprise pour laquelle on travaille

Exemple ditem plutt direct :


Dans quelle mesure tes-vous daccord avec laffirmation suivante :
Je suis trs attach mon entreprise
1= Pas du tout daccord7=Tout fait daccord

Exemple ditem plutt indirect :


Dans quelle mesure tes-vous daccord avec laffirmation suivante :
Lorsque je parle de mon entreprise auprs de mon entourage cest toujours pour en dire
beaucoup de bien
1= Pas du tout daccord7=Tout fait daccord

Autre exemple, si je souhaite mesurer laversion au risque (concept abstrait), je peux utiliser
des items directs, ou des items plutt indirects qui font rfrence lune des manifestations
concrtes (indicateurs) de laversion au risque :

Exemple ditem plutt direct :


Indiquez dans quelle mesure vous tes daccord avec laffirmation suivante :

En gnral, je suis quelquun qui aime prendre des risques. (item invers)
1= tout fait daccord

5 : pas du tout daccord

Exemple ditem plutt indirect :


Indiquez dans quelle mesure vous tes daccord avec laffirmation suivante :

Au choix, je prfre un emploi sr lUniversit plutt quun contrat de droit priv mieux
rmunr dans une cole de Commerce
1= tout fait daccord

5 : pas du tout daccord

Si lon voulait tre vraiment rigoureux, il faudrait raliser des entretiens auprs dindividus de
la population cible de ltude, pour dterminer les manifestations de la variable abstraite

86

tudier et crer ainsi des items (comme par exemple, le choix dun contrat de travail de droit
priv vs. Fonction publique).
Dans les tudes acadmiques, la procdure de cration de mesures de variables abstraites
prvoit, en plus des entretiens, de demander des juges dvaluer les items par rapport leur
pertinence faciale cest--dire, dans quelle mesure un item semble tre un bon indicateur de
la variable quil est cens mesur. Cest ce que lon appelle la validit faciale.

Lorsque des variables abstraites sont utilises de manire rgulire, il est plus simple de les
rutiliser, en les adaptant ventuellement au contexte de la nouvelle tude.

Cependant, la pratique montre que des items qui semblent bons peuvent ne pas ltre pour
diffrentes raisons.

La validit faciale (se documenter sur les indicateurs dune variable abstraite et demander
des juges dvaluer les items crs) reprsente un niveau de rigueur moyen dans la cration des
mesures de variables abstraites.

En effet, la pratique montre que des items qui semblaient tre de bons indicateurs, savrent au
final ne pas ltre et ce, pour diffrentes raisons :

- la question nest pas comprise


- notre raisonnement tait en fait faux (ex. on pensait que le budget dpens en vtements tait
un indicateur de passion pour le shopping, en fait, ce nest quun indicateur du fait dtre
dpensier...)

Ainsi, si lon souhaite tre plus rigoureux, on peut vrifier statistiquement la validit des items
a posteriori, cest dire aprs que le questionnaire ait t administr auprs dun chantillon de
la population cible (on appellera cela un pr-test) ou de la population entire si on na pas la
possibilit deffectuer un pr-test.

b) Lvaluation statistique de la validit dune mesure par questionnaire.

87

La psychomtrie est la science qui tudie la conception et la validation des mesures de


phnomnes psychologiques. Elle a dvelopp diffrentes techniques pour assurer et valuer la
validit et la fiabilit des mesures ralises par questionnaires.

Voici les principes de base :

Rappel :
1- lobjectif des tudes est de donner une image la plus fidle possible de la ralit
2- les tudes quantitatives tudient des variables
3- les variables sont les diffrentes caractristiques des individus tudis dans le cadre de
ltude quantitative.
4- Durant la collecte des donnes, afin que ltude offre une bonne image de la ralit, je dois
attribuer chaque individu pour chaque variable, une valeur qui soit le plus fidle possible la
ralit.

Cette valeur que je vais attribuer chaque individu doit non seulement montrer les diffrences
entre individus, mais galement lampleur de la diffrence entre individus.

Ainsi, si je souhaite mesurer laversion au risque dindividus, il faut que si lindividu A a une
aversion au risque relle suprieure lindividu B, mon questionnaire me conduise attribuer
un score daversion au risque suprieur lindividu A par rapport B, et que la diffrence de
scores entre A et B soit important, si effectivement il y a une forte diffrence daversion au
risque entre ces deux individus.

Comment faire pour valuer statistiquement la validit des items?


tant donn quil nexiste pas de score rel pour les variables abstraites, et quil est donc
difficile de les mesurer, une premire rgle est dutiliser plusieurs (3 minimum) items pour les
mesurer, de mme quon score de quotient intellectuel est calcul partir dun nombre
important de tests.

tant donn que chaque item est cens capter la mme variable, on sattend ce quils
aboutissent des scores semblables. Si tel est le cas, on considrera que ce sont de bons items,
88

et on fera la moyenne de ces 3 scores et lon pourra considrer que ce score global donne une
bonne valuation du concept que lon souhaite mesurer.

Pour bien comprendre ce principe, prenons deux exemples :

La qualit de votre mmoire ou grand oral, peut tre considre comme une variable
abstraite, car la note que lon vous donne est arbitraire.

Pour noter un mmoire ou un grand oral, on pourrait nutiliser dun seul valuateur, mais
en gnral, sil y a plusieurs valuateurs, on a davantage confiance dans la qualit de la note
obtenue

Comment choisir les valuateurs ? Si le mmoire porte sur de la finance de march, la


validit faciale des valuateurs est assure par le fait dutiliser des professeurs de finance
de march. Si on utilise des professeurs danatomie des mollusques, la validit faciale risque
dtre mauvaise.

Maintenant, nous avons un mmoire de finance de march et 3 professeurs de finance de


march. Si chacun note le mmoire sparment, on sattend ce que les trois notes attribues
soient trs proches

Cas n 1 : les notes attribues sont les suivantes : 16, 16,5, 17


On fait la moyenne des 3 notes, et on attribue un 16,5 ltudiant, en ayant limpression
davoir fait un bon travail de notation.

Cas n2 : les notes attribues sont les suivantes : 16, 16,5, 12


Dans ce cas, soit lauteur du 12 a mal valu le mmoire, soit ce sont les auteurs du 16.5.
Il est plus probable que ce soit le 12 qui soit problmatique. Que sest-il pass ?
-

Lauteur du 12 avait une relation conflictuelle avec ltudiant ;

Il est tait nerv pour des raisons personnelles

Il na pas bien lu le mmoire etc

Dans ce cas, on peut considrer que le 12 nest pas une bonne mesure de la qualit du mmoire
et ne retenir que les 2 autres notes et attribuer donc un 16.25 ltudiant.
89

Autre exemple : remplaons les items dun questionnaire censs mesurer laversion au
risque par 3 balances censes mesurer le poids.

Nous avons bien le mme cas de figure : 3 indicateurs (mesures) de la mme variable, cest
dire le poids.

Imaginons que lon demande 100 personnes de passer sur chacune des balances et que
lon enregistre les 3 mesures.
Imaginons que les poids moyens enregistrs au final soient les suivants :

Balance A

Balance B

Balance C

78kg

77.6kg

56kg

Quelle consquence peut-on en tirer ?

- On estimera dabord que la balance C ne fonctionne pas bien (sinon elle indiquerait 78 kg)

- On retiendra la moyenne entre les balances A et B i.e. 78+77.6/2= 77.8 kg

Pour les items des variables abstraites, le principe est le mme :

Imaginons maintenant que lon utilise 3 items pour mesurer laversion au risque :
1= tout fait daccord, 5= pas du tout daccord

1- Je prfre mettre des conomies dans un livret A plutt que de les placer en bourse
2- Je prfre un CDI un CDD mieux rmunr
3- En gnral, je suis quelquun qui aime bien prendre des risques

90

Aprs que 100 individus aient rpondu aux trois questions, on en arrive aux scores moyens
suivants :

Item 1 : 2.45
Item 2 : 2.67
Item 3 : 3.87

On va en dduire que litem 3 est problmatique et quil ne faut pas tenir compte de son
score (on considrera la moyenne des Items 1 et 2).
Pourquoi est-il problmatique ? Cela dpend des cas, mais dans lexemple, on remarque
que cest le seul item qui ne se base pas sur un indicateur concret mais qui reste dans
labstraction... cela peut tre une explication.

Lanalyse factorielle pour valuer la validit

Lanalyse factorielle est un type danalyse statistique qui permet de regrouper les items
ayant des scores similaires (un peu comme la segmentation en marketing).

Elle permet de raliser un test de validit convergente.

Remarque : Lorsquon utilise plusieurs items pour mesurer une variable abstraite, lensemble
de ces items est appel chelle de mesure .
Exemple : chelle de mesure de la motivation au travail= lensemble des items utiliss pour
mesurer la motivation au travail.

Si lon souhaite tre encore plus rigoureux, on peut souhaiter galement vrifier que chaque
item mesure bien une variable et une seule.
Cest ce que lon appelle un test de validit discriminante.
Le principe est le suivant : chaque item ne doit tre corrl quaux items de la mme variable
et non aux items des autres variables.

Si la validit discriminante nest pas tablie, cest que litem en question nest pas assez clair,
il ne discrimine par assez entre une variable et une autre.

91

Pour bien comprendre les principes de validit convergente et discriminante, imaginons que
lon mesure des vitesses et des tempratures, et que lon dispose de 3 thermomtres (T1, T2,
T3) et de 3 instruments de mesure de la vitesse (V1, V2, V3).

Si nous disposons dinstruments PARFAITS, les corrlations entre les valeurs relles et les
valeurs mesures sont les suivantes :
Validit
convergente
Temprature

Vitesse

T1

T2

T3

V1

V2

V3

Validit
Discriminant
e

Nous utilisons exactement le mme principe pour valuer la validit ditems mesurant des
concepts abstraits par questionnaire SAUF que, comme on mesure des variables moins dures
que des vitesses et des tempratures, on naura pas , dans la matrice ci-dessus des 1 et des 0,
mais des valeurs qui vont tendre vers 1 et vers 0.

On peut noter les rgles suivantes :

Il ny a pas de problmes de validit convergente si les items devant mesurer une variable ont
au moins une corrlation de 0.5 avec celle-ci

Il ny a pas de problme de validit discriminante si la diffrence entre la corrlation dun


item avec sa variable et la corrlation dun item avec une autre variable est au moins >0.3

Les rgles de ralisation des analyses factorielles sont complexes.


Pour les besoins de votre mmoire, nous allons fixer des rgles simples et oprationnelles.
Ceux qui souhaitent aller plus loin trouveront de nombreuses rfrences en ligne sur le sujet.

92

tapes de ralisation de lanalyse factorielle sous SPSS.

ATTENTION : avant de commencer, assurez-vous que tous les items mesurent leur variable
dans le mme sens, i.e. quun score lev = quantit leve de la variable.
On trouve en effet des items inverss dans les tudes existantes quil faut remettre dans le
bon sens.
Exemple : Mesure de laversion au risque
Item 1 : Mme si le ski est un sport dangereux, cela vaut la peine den faire parce quon samuse
beaucoup.
Item 2 : Avec la conjoncture actuelle, il est important de dpenser le moins dargent possible.

Ces deux items mesurent laversion au risque mais de manire inverse. Il faut donc remettre
les scores de litem 1 dans le bon sens.
Comment ?

Transformer> Recoder des variables> On slection litem 1 dans la liste > Ancienne et
nouvelles valeurs > Ancienne valeur =1 / Nouvelle valeur =5 > Ajouter > Ancienne valeur =2
/ Nouvelle valeur =4 etc...

Etape 1 : Analyser tous les items mesurant des variables abstraites

Remarque : si lon souhaite valuer la validit convergente et discriminante, tous les items de
toutes les variables abstraites doivent tre analyss simultanment.

Analyse> Rduction des dimensions > analyse factorielle

Dans la liste des variables ( gauche) on slectionne tous les items correspondant des variables
latentes puis on clique sur OK

tape 2 : Combien de groupes ditems homognes y-a-t-il dans un ensemble ditems ?

93

Si lon avait prvu 4 variables abstraites (chacune reprsente par 4 items par exemple), on
entre 16 items dans lanalyse, et on espre que le logiciel remettra les items mesurant la mme
variable dans les mmes paquets.

Dans les rsultats de lanalyse factorielle, diffrents tableaux apparaissent, mais cest le tableau
appel Variance totale explique qui va nous intresser en particulier.
Dans lexemple ci-dessous 9 items on t analyss reprsentant 3 variables abstraites :

La rgle pour dterminer le nombre de groupes ditems est la suivante : il faut que chaque
paquet ditems ait une valeur propre > 1 pour tre retenu.

Les valeurs propres reprsentent la quantit dinformation (de variance) contenue dans chaque
paquet ditems.
Cette rgle est programme par dfaut dans SPSS.

Dans notre exemple, le logiciel suggre de retenir 3 groupes ditems quil appelle
composantes (ce qui est une bonne nouvelle, car nos 9 items taient bien censs reprsenter
3 variables abstraites.

tape 3 : Chaque item est-il bien corrl avec les items censs mesurer la mme variable que
lui, et avec eux seuls ?

Pour le savoir, on va regarder les coefficients de corrlation des items avec chaque variable
abstraite. Mais avant cela, on va standardiser ces coefficients :
94

Analyse> Rduction des dimensions > analyse factorielle>rotation> varimax (pourquoi


varimax ? je renvoie les personnes intresses des lectures plus compltes sur les analyses
factorielles).

On se retrouve nouveau avec plusieurs tableaux, cest la Matrice des Composantes Aprs
Rotation qui nous intresse ici :

Elle nous indique quelle est la corrlation entre chaque item et chaque paquet (variable
abstraite), comme dans mon exemple de la temprature et de la vitesse.

Ce tableau tant plutt illisible, nous allons donc retourner dans les options de lanalyse
factorielle, et cocher classement des variables par taille et supprimer les faibles
coefficients .

SPSS considre par dfaut comme faibles des coefficients < 0.1.

Cependant, lorsquon travaille sur de petits chantillons (autour de 100 individus), on peut
considrer que les coefficients < 0.3 sont faibles car non significatifs ( modifier donc dans
les options).

La matrice devient ainsi plus claire : nous avons bien ici les 3 items de chaque variable abstraite
tant corrls des paquets diffrents et faiblement corrls aux autres paquets .
95

Nous pouvons dire que les validits convergente et discriminante sont tablies.

Cas o la validit convergente nest pas tablie.

Si un item est trop faiblement corrl la variable quil est cens mesurer (<0.5) ou, pire encore,
sil est plus fortement corrl une autre variable, alors il doit tre retir de lanalyse.

Il peut aussi arriver que lon ait des items censs mesurer 3 variables abstraites et que le logiciel
trouve 4 paquets au lieu de 3.

Ceci peut arriver lorsquon a beaucoup ditems par variable latente i.e. surtout dans les tudes
acadmiques, cela ne devrait pas vous arriver avec 3 ou 4 items par variable abstraite.

Cas o la validit discriminante nest pas tablie.

Rappel : la validit discriminante est tablie si la corrlation dun item avec la bonne variable
est dau moins 0.3 suprieure la corrlation entre un item et dautres variables, et que la
corrlation dun item avec une mauvaise variable soit >0.3.

96

Exemple :
1 (AR)

2 (Motivation)

Item 1 : Aversion Risque

0.82

0.45

Item 2 : Aversion Risque

0.78

0.3

Item 3 : Motivation

0.3

0.89

Item 4 : Motivation

0.3

0.81

Dans lexemple ci-dessus, on peut considrer que lon a un problme de validit discriminante
avec litem 1 qui est trop corrl la variable MOTIVATION

Comment valuer la fiabilit dune mesure ?

Lorsque la validit est tablie par lanalyse factorielle, on va ensuite valuer la fiabilit.

La fiabilit peut se dfinir comme la prcision de la mesure, c'est--dire lcart entre le score
mesur et score rel.

Encore une fois, comme il nexiste pas de scores rels pour les variables abstraites, on va
calculer lcart moyen entre les scores mesurs.

Pour reprendre lexemple des notes attribues par des professeurs, imaginons les 2 cas suivants :

17- 17,5 17 ; Validit OK, moyenne = 17.16


16- 17,5 18 ; Validit OK, moyenne = 17.16

On va considrer que la premire note est plus fiable que la deuxime, car le consensus entre
les 3 professeurs est suprieur.

Le coefficient de fiabilit le plus utilis pour les donnes collectes par questionnaire est lalpha
de Cronbach. Il value lintercorrlation entre les scores des diffrents indicateurs utiliss,
pondrs par le nombre dindicateurs utiliss, de sorte que pour une intercorrlation donne,
plus il y a dindicateurs, plus le coefficient sera lev.

Le coefficient alpha se calcule trs facilement avec le logiciel SPSS.


97

Analyse> Echelle> Analyse de la Fiabilit> pour chaque variable latente, on slectionne les
items correspondants retenus aprs lanalyse factorielle> OK

Sa valeur varie thoriquement entre 0 et 1 (aucune corrlation entre items nest jamais parfaite).

En pratique on considre que des coefficients de 0.7 sont acceptables et partir de 0.8 on
considre que la fiabilit est bonne.

Lorsquon calcule un coefficient alpha et quil savre tre trop faible, il est parfois possible de
laugmenter en liminant un ou plusieurs items qui ne sont pas eux-mmes suffisamment bons.
Ceci est possible avec au moins 4 items par variable.
Pour les dtecter, il est possible daller dans :

Statistiques (de la fentre de lAlpha) > cliquer sur Echelle sans llment > Ok

Le tableau suivant va apparatre dans les rsultats :

Dans le cas ci dessus, on voit que la suppression de litem Inf 1 fait monter lAlpha 0.695.
Cest donc lui qui pose un problme et qui doit tre supprim.

NB : La statistique ne doit pas tre utilise de manire aveugle et dogmatique. Il faut toujours
se demander pourquoi un item na pas fonctionn et prsenter une explication dans le
mmoire.
De mme, les indicateurs ne doivent pas tre utiliss de manire trop dogmatique. Ici un alpha
de 0.695 est trs proche de 0.7, donc sera considr comme acceptable.
98

Et si lalpha est < 0.7 et quon ne peut pas lamliorer en supprimant des items ?

Cela signifie que les items ont t mal conus.


Selon la gravit du problme, soit on prcisera au lecteur que les rsultats doivent tre relativiss
pour cause de faible fiabilit, soit on peut sabstenir de continuer lanalyse car on peut
considrer que lon aboutirait des rsultats faux et donc trompeurs.

Calcul du score agrg pour les variables latentes.

Lorsque les tests de validit et de fiabilit ont t raliss et que certains items ont t supprims,
nous connaissons la qualit des mesures obtenues avec le questionnaire.

On doit ensuite calculer un score global pour chaque variable latente, car cest ce score global
qui nous intresse et qui permettra de tester les hypothses de recherche.
Ce score global est gal la moyenne des scores des diffrents items qui le composent.

Le calcul est simple raliser :

Transformer> Calculer la variable > Variable cible : on donne un nom la Variable globale>
Dans groupe de fonctions on slectionne Tous , puis on recherche Mean (moyenne
en anglais) et on la slectionne> On obtient la formule suivante Mean (?;?) > On remplace
les ? par les items formant la variable latente (spars par des ;)> Ok > Une nouvelle variable
est cre dans le tableau des donnes.

99

Lexemple ci-dessus concerne une mesure de la Motivation au Travail pour laquelle 4 items
ont t utiliss (Mot 1, Mot 2, Mot 3 et Mot 4) et un score global calcul.

100

8 : Lanalyse de donnes quantitatives et le test des hypothses de recherche


Lun des intrts des tudes quantitatives est de mettre en vidence des phnomnes invisibles
lil nu.

En effet, la plupart des phnomnes qui nous entourent ne sont pas perceptibles lil nu :

- Leffet du fait de manger des fruits et lgumes sur la sant ;


- Leffet de travailler dans un open space vs dans des bureaux ferms sur la productivit ou la
sant des salaris ;
- Leffet de loctroi de stocks options aux dirigeants sur le cours de bourse ou sur le type de
stratgies mises en uvre par les dirigeants ;
- Leffet des sries amricaines ou des jeux vido sur les valeurs et les comportements ;
Etc

En fait, la plupart des principes que nous connaissons, ne peuvent tre observs qu travers
une tude quantitative.

Ltre humain tendance dvelopper des croyances partir de ses observations personnelles
de la ralit, donc partir dun nombre limit de cas particuliers, quil va gnraliser
lensemble de la population, aboutissant souvent des croyances errones.

Cest pour cette raison que la sagesse populaire conseille de ne pas gnraliser .

En fait, les gnralisations sont trs importantes pour la prise de dcision.


Par contre, il nest possible de gnraliser qu certaines conditions.

Lorsque les scientifiques disent que manger des fruits et des lgumes est bon pour la sant ,
il sagit dune rgle qui ne se vrifie que sur les grands nombres.
Il faut donc mettre en place des exprimentations sur un nombre important dindividus et en
respectant un protocole particulier, pour pouvoir montrer que la consommation rgulire de
certaines quantits de fruits et de lgumes a un effet positif significatif sur certains indicateurs
de la sant des individus.

101

Pour pouvoir tablir lexistence dun phnomne comme une relation entre variables, et tablir
la force de cette relation, il faut donc :

- Collecter des donnes valides et fiables (nous en avons dj parl).


- A partir dun chantillon reprsentatif de la population que lon souhaite tudier (un
chantillon reprsentatif est un chantillon qui ressemble, i.e. qui a les mmes caractristiques
que la population mre).
- Et montrer que leffet (ou phnomne) observ est suffisamment fort pour ne pas pouvoir
tre d au hasard (cest ce quon appelle la significativit).

Ce nest qu ces conditions que lon peut dire quun phnomne existe, ou quune relation
entre variables existe.

Je naborde pas ici les questions relatives aux techniques dchantillonnage que vous avez vues
par ailleurs, (vous pouvez aussi vous reporter des ouvrages dtudes marketing pour un
rappel).

Je vais au contraire mattarder sur les analyses statistiques ncessaires au test des principales
hypothses de recherche.

102

Avant de tester les hypothses : prsentation des statistiques descriptives.

Les statistiques descriptives permettent, comme leur nom lindique, de synthtiser ou


rcapituler les donnes collectes.
Selon quil sagisse de variables nominales ou quantitatives, les analyses descriptives sont
diffrentes.
Pour les variables nominales, on sintresse le plus souvent la frquence des modalits
(nombre et pourcentage de salaris travaillant dans le marketing, la finance, les RH etc...)

Pour les variables quantitatives, on sintresse souvent des indices de tendance centrale
comme la moyenne arithmtique ou la mdiane, et des indices de dispersion comme lcart
type.

Il est galement conseill de prsenter une matrice des corrlations des variables quantitatives,
qui montre les corrlations existant entre toutes les variables de ltude ainsi que la moyenne et
lcart type.
Table 1 Means, standard deviations and intercorrelations among variables

Variables
M
SD
1
2
3
1 Seniority in stock ownership
5.09 1.12
2 Perceived past returns
4.46 0.82 .20**
3 Compensation
4.36 1.12 -.03
.04**
4 Gender
1.08 0.27 -.16** -.14** -.14**
5 Age
6.88 0.86 .36**
.11**
.07*
6 Education level
2.99 2.19 -.14** -.05
.52**
7 Hierarchical level
4.49 1.16 .07*
.07*
.60**
8 Philosophical commitment to EO
3.54 0.84 .07*
.18**
.24**
*
**
9 Commitment
3.52 0.82 .09
.10
.07*
**
**
10 Preference for EO
3.89 0.70 .20
.30
.24**
11 Uncertainty avoidance
2.04 0.60 .09**
-.02
-.17**
12 Information
3.82 0.74 .08*
.19**
.14**
13 Turnover Intention
2.01 0.78 -.10** -.19** .01
-0.06
14 Participation in decision-making
2.29 0.89 -.01
.11**
Notes: *p < 0.05; **p < 0.01; ***p < 0.001; all other correlations are insignificant.

10

11

12

13

-,35**
.02
-.16**
.05
-.02
-.04
-.01
-.10**
.11**
.02

-.11**
.13**
-.04
.06
.00
.06
.08*
-.19**
-.04

.34**
.07
-.10**
.02
-.06
.06
.20**
.05

.15**
.10**
.17**
-.18**
.13**
-.04
.03

.41**
.39**
-.10**
.25**
-.22**
.32**

.28**
-.17**
.22**
-.55**
.24**

-.09**
.31**
-.17**
.17**

.11**
.01
-.02

-.15**
.23**

-.10**

Sur le logiciel SPSS, ces statistiques descriptives sont trs simples raliser :

- Analyses > statistiques descriptives > effectifs


On slectionne la ou les variables analyser et on peut demander galement lobtention dun
diagramme.
- Analyses > statistiques descriptives > descriptives
On slectionne les variables analyser puis les analyses descriptives que lon souhaite obtenir
(moyenne, cart type etc...).

103

Pour obtenir la matrice des corrlerions :

Analyse> corrlations bivaries

Les Statistiques Explicatives pour tester les Hypothses de recherche

Les mthodes statistiques explicatives vont plus loin quune simple description des donnes.
Elles sutilisent lorsque lon a, dans une recherche, une ou plusieurs variables expliquer
dont on souhaite comprendre et analyser les variations, et une ou plusieurs variables dites
explicatives qui sont prsumes expliquer les variations des variables expliques.

Variables
Expliques
(rsultats)

Variables
explicatives
(actions)

Les analyses explicatives permettent de savoir si certaines variables influencent dautres


variables et si cette influence observe sur un chantillon donn, est suffisamment forte pour
pouvoir tre gnralise lensemble de la population.

Le type danalyse raliser dpend du type et du nombre de variables analyser.


Voici les principales analyses, mais il en existe dautres.

Variable Explique
Nominale

Quantitative

Test dIndpendance T de Student (2 modalits)


Nominale

du Khi 2

ANOVA (>2 modalits)

Rgressions

Rgressions

Logistiques

Linaires

Quantitatives

Rgressions

Rgressions

et Nominales

Logistiques

Linaires

Variable Explicative
Quantitative

104

Les rgressions logistiques ne seront pas abordes dans ce cours car leur utilisation est
complexe et les cas dutilisation moins courants.
Les tudiants ayant besoin de les utiliser sont invits se documenter et demander conseil
des professeurs.

Rappel sur la significativit statistique

Chaque type danalyse explicative donne 2 informations :

1- Quel est la force de la relation entre les variables


2- Est-ce que cette relation est significative, c'est--dire est-ce quelle est suffisamment
forte (compte tenu de la taille de lchantillon), pour avoir du sens ?

La significativit dune relation est donne par un test statistique.

Ce test donne la probabilit que la relation entre les variables ne soit pas significative, cest
dire quelle nexiste pas dans la population mre

Ainsi, les tests de significativ (ou signification) nous indiquent quelle est la probabilit , quil
ny a en fait aucune relation dans la population mre.

Cet se lit sur les tables statistiques, et est donn automatiquement par certains logiciels.

En gnral, on considre quun seuil (appel aussi p. ou sig. ) < 0.05 est acceptable en
sciences humaines. Autrement dit, on accepte jusqu 5% de probabilits derreur.

On dira donc quune relation entre variables est significative, si la probabilit quelle ne
le soit pas est infrieure ou gale 5%.

Si p>5%, alors on dira que la relation nest pas significative, i.e. quelle est trop faible pour
pouvoir tre considre comme non fortuite.

En sciences humaines, on distingue gnralement 3 niveaux de significativit :


105

<5% que lon signale par une toile *


<1% que lon signale par deux toiles **
< 0.001 que lon signale par trois toiles ***

Plus p est faible et plus la relation entre les variables est forte.

106

Les tests des hypothses de recherche :

Selon que les variables soient quantitatives ou nominales, explicatives ou expliques, les
analyses statistiques ne sont pas les mmes.

Voici les cas les plus courants :

Cas 1 : Effet dune variable nominale dichotomique sur une variable


quantitative.
Analyse raliser : Comparaisons de Moyennes avec le t de Student.

On souhaite ici comparer 2 groupes sur une caractristique quantitative donne :

Exemples dhypothses :

Ex1 : Le sexe a un effet sur la taille des individus, de telle sorte que les hommes sont plus grands
que les femmes.

Ex2 : Le fait davoir une sparation des fonctions de prsident du conseil dadministration et
de directeur gnral a un effet sur le risque de lentreprise, de telle sorte que les entreprises
ayant une sparation des fonctions sont moins risques que les autres.

Remarque : dans ce type dhypothses nous sommes obligs de spcifier quel groupe est cens
avoir la moyenne la plus leve.

Pour valider ce type dhypothse, on calcule deux moyennes (groupe 1 vs groupe 2) puis on
regarde quelle est la diffrence de moyennes.

Le test statistique dterminera si la diffrence entre les deux moyennes est suffisamment
importante, tant donn la taille de lchantillon, pour quelle soit significative, donc quon
puisse considrer quelle a du sens.
Lorsque 2 groupes sont compars, le test statistique le plus courant est le t de Student.

Sur le logiciel SPSS :


107

Analyse> Comparer des moyennes

Il y a ici trois options. Les deux qui vont nous intresser sont les suivantes:
Test t pour chantillons indpendants : comparaison des moyennes du groupe A et du groupe
B
Test t pour chantillons apparis : comparaison des moyennes du groupe A entre t1 et t2 (ex :
avant et aprs vu une publicit, bu du Redbull etc...)

On slectionne la variable explique et on linsre dans variable tester puis la variable


explicative dans critre de regroupement .

Le logiciel vous demande quel est le groupe 1 et quel est le groupe 2 comparer. Si la variable
explicative na que deux modalits on prcise Groupe 1=1 et groupe 2= 2.
Si la variable explicative a trois modalits (ou plus) et que lon souhaite comparer les groupes
3 et 4, on prcisera : Groupe 1=3 et groupe 2= 4.

Les rsultats se prsentent sous la forme suivante.


Ici nous avons une comparaison des salaires entre hommes et femmes.
Le premier tableau donne les moyennes de chaque groupe et la taille des chantillons compars.

108

Le second tableau indique la diffrence de moyenne, et la probabilit (Sig.) que la diffrence


de moyenne ne soit pas significative.
La diffrence est donc de 0.6 sur 5 donc dun peu plus de 10% ce qui est une diffrence
dampleur modre.

La valeur 0.000 montre donc une trs forte significativit de la diffrence.

Cas 2 : Effet dune variable nominale au moins 3 modalits sur une variable
quantitative : Comparaisons de Moyennes avec lANOVA

Exemple : Je montre 3 sacs main identiques mais de couleurs diffrentes un chantillon de


femmes, et leur demande de les noter de 1 10. Je souhaite savoir si la couleur a un effet sur la
notation que ces femmes vont attribuer au sac.

Ici, lide est de comparer simultanment 3 ou davantage de moyennes.

Sous SPSS :

Analyse> Comparer des moyennes> ANOVA

Dans lexemple ci dessous, la variable explicative est la fonction dans lentreprise et la variable
explique le salaire.

Le rsultat obtenu est le suivant :

109

Comme prcdemment, la sig de 0.000 montre que la fonction a un effet trs significatif sur le
salaire.
Ici, le T de Student est remplac par le F de Fischer, mais la signification sinterprte de la
mme manire.

Vous remarquerez que les moyennes de chaque groupe ne sont pas indiques, comme ctait le
cas pour le T de Student. Pour les obtenir, ainsi que pour obtenir des diffrences de moyennes
pour tous les groupes deux par deux, il faut raliser un test postriori.

Analyse> Comparer des moyennes> Anova> Post hoc.

Il existe plusieurs options, je vous conseille le test LSD (Least Significant Difference).

Le rsultat prend la forme suivante.

110

Pour chaque paire de groupes, nous avons maintenant la diffrence de moyennes et la


significativit de la diffrence.
Par exemple, les salaris du service finance gagnent plus que les administratifs (0.911 de plus
sur une chelle de 5, ce qui est une diffrence de prs de 20%, assez importante donc) et cette
diffrente est trs significative (0.000).

Cas 3 : Effet dune variable nominale sur une autre variable nominale : Le test
dindpendance du Khi2

Exemple : Y-a-t-il une relation entre le sexe des tudiants de lINSEEC et la majeure quils
choisissent ?

Ce genre de test sappelle un test dindpendance et se ralise par un test de Khi 2.

Dans SPSS :

Analyse>Statistiques descriptives>tableaux croiss> Slection des variables (Ici, que lon mette
une variable en ligne ou en colonne ne change rien> statistiques> cocher le Chi 2

Les rsultats apparaissent sur deux tableaux :

Le premier montre les effectifs par fonction et par nationalit.

Le deuxime tableau prsente la significativit du test du Khi deux.

111

Cas 4 : Effet dune ou plusieurs variables quantitatives et/ou qualitatives sur


une autre variable quantitative : Les Rgressions Linaires

Lorsque lon souhaite tudier leffet de plusieurs variables explicatives quantitatives sur une
variable quantitative, lanalyse la plus courante est la rgression linaire multiple.

Les rgressions peuvent galement tre utilises pour prdire la valeur de la variable explique,
connaissant la valeur des variables explicatives.

Par exemple, imaginons que lon souhaite tudier les dterminants des entres un film de
cinma. Une tude qualitative a montr que les principaux dterminants sont :
- le budget de communication
- le casting
- le buzz sur internet

La variable casting est value partir du cachet moyen des acteurs, et le buzz par le nombre
de fois dont on a parl du film sur la toile le mois prcdant la sortie.

La rgression multiple donne plusieurs types dinformations :

- le poids de chaque variable explicative ainsi que leur significativit ;


- la part de la variable explique que les variables explicatives du modle permettent de prdire.

En termes mathmatiques, les rgressions se prsentent sous forme dune fonction linaire.

Y = a + bX
112

O a est une constante et b la pente de la relation entre Y la variable explique, et X la variable


explicative.
Ainsi, plus b est important, plus les variations de X permettent dexpliquer les variations dY.

A partir de lexemple ci-dessus,


Si y est le nombre dentres
a est une constante
x1 est le casting
x2 est le budget de communication
x3 est le buzz sur internet
e est un terme derreur concernant les autres paramtres explicatifs du nombre dentres, ceci
peut tre illustr par lquation suivante :

y = a + b1x1+b2x2+ b3x3 + e

o b1 montre dans quelle mesure le nombre dentres dpend du casting


b2 montre dans quelle mesure le nombre dentres dpend du budget de communication, et ainsi
de suite.

Sous SPSS :

Analyse> Rgression> Linaire.

113

La variable dpendante est la variable explique, les variables indpendantes sont les variables
explicatives.

Dans les rsultats deux indicateurs sont particulirement importants :


Le R2ajust indique la part de variance de la variable explique que les variables explicatives
permettent justement dexpliquer.
Il montre donc la qualit du modle prsent : plus le R2 est lev, plus cela signifie que lon a
insr dans le modle les principales variables explicatives. Un R2 faible indique que des
variables explicatives importantes nont pas t insres dans le modle.
En sciences humaines on considre gnralement que le R2est correct partir de 0.4 (40% de
variance explique).

Le Bta reprsente la contribution de chaque variable explique.


Il varie de -1 +1, et ressemble au coefficient de corrlation.
Chaque variable explicative a son bta : plus il est leve et plus son pouvoir explicatif est
important.

114

Dans lexemple ci-dessus, nous avons le salaire comme variable explique et lanciennet, la
fonction, le niveau hirarchique, le niveau dtudes et lge comme variables explicatives.

Les rsultats montrent dabord que toutes les variables explicatives ont un effet significatif sur
la variable explique.
En ce qui concerne la force des effets, on voit que la variable qui explique le mieux le salaire
est le niveau hirarchique (=0.45), suivie du niveau dtudes (=0.28) puis de lge (=0.17).
A noter le bta ngatif pour lanciennet, qui montre (tonnamment) que lanciennet a un effet
ngatif sur le salaire.

Remarque : en sciences humaines, linterprtation des btas est gnralement la suivante :


< 0.2 = effet faible
0.2>>0,5 = effet moyen
>0,5 effet fort

Remarque 2 : on trouve parfois des variables explicatives nominales deux modalits dans des
rgressions multiples, typiquement la variable Sexe.
Ceci est possible, mais seule la significativit doit tre interprte.

115

Towards a Comprehensive Procedure


for Developing Measurement Scales
for Cross-Cultural Management Research
Marco Caramelli
INSEEC Business School
France

Fons J. R. van de Vijver


Tilburg University, the Netherlands, North-West University,
South Africa, and University of Queensland Australia

Rsum
Nous dcrivons une procdure qui permet
de dvelopper et tester des chelles de
mesure dans le contexte de recherches
comparatives inter-culturelles en management. Cette procdure englobe des principes de conception des items dans le cas de
cration dchelles, ou dadaptation, en cas
dutilisation dinstruments existants, ainsi
que des analyses statistiques (et notamment lanalyse factorielle confirmatoire
multigroupes) pour tester la pertinence des
chelles dans tous les groupes. Cette procdure est illustre dans une tude de lesprit de comptition auprs de salaris
franais, mexicains, amricains et italiens
travaillant dans des entreprises multinationales.
Mots cls: recherche comparative, quivalence de mesure, procdure de cration
dchelles de mesure

Abstract
A procedure for developing and testing
measurement scales for use in cross-cultural comparative management research is
described. The procedure emphasizes the
combination of adequate instrument design
if a new instrument is used or adequate
adaptation procedures if working with an
existing instrument and state-of-the-art statistical analyses (notably multigroup confirmatory factor analysis) to test the
adequacy of the scales in all groups. The
procedure is illustrated in a study of competitive orientation among French,
Mexican, US and Italian employees of
multinational corporations.
Keywords: comparative research, measurement equivalence, scale development procedure

omparative organizational research consists of the systematic detection, identification, measurement and interpretation of similarities and differences of organizational
behavior among employees of different cultural groups (Adler,
1983; Boddewyn, 1965). During the past decades, there has
been a growing body of literature addressing the specific
methodological problems of this type of research, such as
the equivalence of constructs, samples, and measurement
instruments. Meaningful cross-group comparisons presuppose
that the measurement instruments used to assess attitudes,
values or behaviors, operate in an equivalent way across
groups (i.e., that they measure the same thing in the same
way). This is usually called measurement equivalence. If
measures are not equivalent, interpretations of differences
in mean levels or in the pattern of correlation of the measures
are potentially artifactual and may yield misleading or even
incorrect results (Mullen, 1995). In case of severe lack of
measurement invariance, substantive comparisons cannot
be performed, possibly even requiring the collection of new
data (Vandenberg, 2002).
Prior to a further description of the present article, a
word on terminology is needed. The field of comparative
studies uses a set of terms such as equivalence in multiple

Resumen
En este articulo, se describe un procedimiento para desarrollar y probar escalas de
medida, en el contexto de la investigacin
comparativa transcultural en gestin. Este
procedimiento incluye los principios de
elaboracin en el caso de creacin de escalas, o los principios de adaptacin, en caso
de uso de instrumentos existentes, y anlisis
estadsticos (incluyendo el anlisis factorial
confirmatorio multigrupo) para poner a
prueba la pertinencia de las escalas en todos
los grupos. Este procedimiento se ilustra en
un estudio sobre el espritu competitivo
aplicado a una muestra de empleados franceses, mexicanos, italianos y americanos de
empresas multinacionales.
Palabras claves: investigacin comparativa
intercultural, la equivalencia de medicin,
elaboracin de escalas de medicin

ways (e.g., Johnson, 1998). In order to avoid terminological confusion, we define two key terms here. Measurement
equivalence refers here to scales and to the issues related
to designing and examining whether instruments work the
same way in different cultures, whereas measurement
invariance is narrower and refers here to the statistical tests
designed to verify the measurement equivalence of scales.
Issues regarding measurement equivalence are getting
more and more popular in organizational research after the
publication of several state-of-the art articles on the topic
(e.g., Cavusgil & Das, 1997; Hui & Triandis, 1985; A. W.
Meade & Lautenschlager, 2004a; Peng, Peterson, & Shyi,
1991; Reise et al., 1993; Schaffer & Riordan, 2003; Singh,
1995; Steenkamp & Baumgartner, 1998; Vandenberg,
2002; Vandenberg & Lance, 2000). However, those articles
focus principally on the statistical methods and procedures
for assessing measurement invariance, rather than on how
to develop multigroup equivalent measures. The approach
described in the present article incorporates equivalence
issues in the scale development process. Our aim is to
describe a step-by-step procedure for developing measures
that are more likely to provide comparable scores in crossgroup comparisons. All the steps of scale development
procedures are addressed from the perspective of ensuring

72

Management international / International Management / Gestin Internacional, 17 (2)

the equivalence of the concept to be measured; recommendations on how to deal with invariance problems are
discussed.
We extend extant work in three ways. First, we integrate measurement equivalence issues in each step of classical scale development procedures whereas previous work
mainly described some of the steps implied in scale development and validation. Second, we suggest that invariance
issues could be addressed on theoretical grounds, whereas
existing research often proceeded in a data-driven fashion.
Third, we explain how to deal with invariance problems,
whereas the existing literature focuses more on the identification of these problems.
In the first section, we briefly present the conceptual
background of cross-cultural measurement equivalence. In
the second section, we describe a scale development procedure that can be useful both in the context of a derived-etic
approach (the researcher needs to develop a measurement
scale in the context of a comparative study) and in the context of an etic approach (the researcher decides to use an
existing scale for a cross-group comparison and wants to
assess whether the scale is suitable for all the groups under
study).

Conceptual Background
Validity, Reliability, and Measurement Equivalence
Measurement is a vital concern for all researchers in social
sciences. The quality of a measure is generally assessed by
its validity and reliability. The validity of a measure has
been defined as the extent to which an operationalization
measures the concept it is supposed to measure (Bagozzi,
Yi, & Phillips, 1991: 421), whereas reliability is the proportion of variance of the obtained score attributable to the true
score of a latent variable (De Vellis, 2003). Hence, the goal
of our procedure is to develop measures which are equally
valid and reliable for all the populations under study. Two
measures applied to different groups are fully equivalent if
the relationships between the observed score and the true
score are identical for all groups. This essentially implies
that the concept involves the same domain in all groups
(true scores), and that the items composing the scale are
equally appropriate in measuring the construct (observed
scores).
When is Measurement Equivalence an Issue?
In which cases are group comparisons most likely to be
threatened by a lack of measurement equivalence? Existing
articles on measurement equivalence do not clearly address
this issue. Vandenberg and Lance (2000) suggest that equivalence tests should be performed when comparing different populations or groups, whereas other authors refer
to cultural groups, cultural samples (e.g., Schaffer &

Riordan, 2003; Vandenberg, 2002), cross-national groups


(Steenkamp & Baumgartner, 1998) or ethnic groups within
countries (Van de Vijver, 1998). As suggested by Meade
and colleagues (Meade, Michels, & Lautenschlager, 2007),
tests of measurement invariance (the generic term for such
equivalence in the research tradition that uses structural
equation modeling for these tests) have often proceeded in
an atheoretical fashion in that between-group comparisons
are made without a priori notions of whether equivalence
would exist.
What we suggest here is that lack of measurement
invariance can be particularly expected in cases when the
two groups of individuals being compared are different in
a characteristic which is related to the variables being compared between the groups. So, more equivalence threats can
be expected in studies dealing with more dissimilar groups.
Cultural groups have often been described in terms of their
position (low vs. high) on a series of cultural dimensions
(Hofstede, 2001; Lytle, Brett, Barsness, Tinsley, & Janssens,
1995; Morden, 1999). Such groups can be expected to vary
on a certain construct (e.g., attitude towards participative
management), when they are different in terms of a cultural
dimension (e.g., power distance) that is likely to influence
that construct (Lytle et al., 1995).
As an example, Wasti and colleagues (Wasti, Bergman,
Glomb, & Drasgow, 2000) tested the generalizability of a
model of the antecedents and consequences of sexual harassment developed in the US and applied to Turkish employees. The authors considered that tests of equivalence were
necessary because Turkey is notably different in its cultural, political, and economic orientation toward women, as
compared with the US which could have implications for
the adequacy of the measures (Wasti et al., 2000: 767). In
the case of a comparison between Swedish and Norwegian
employees, measurement equivalence would be more likely
to occur because of the strong similarity between these two
countries concerning women issues. However, when possible (i.e. when sample size is large enough) measurement
equivalence should always be assessed as a prerequisite to
any group-based comparisons. When it is not possible, possible limitations in the validity of the substantive comparative results should be acknowledged.
Etics, Emics, and Derived-Etics
Three different research approaches have typically been
used in cross-cultural organizational research to measure
concepts and deal with equivalence. Most frequently (94%
of the studies reviewed by Schaffer & Riordan, 2003),
researchers start by using a concept and/or instrument
developed within the frame of reference of one specific
country (the US or another western country). Scales are
subsequently translated and assumed to be a valid basis for
comparison with other countries (Berry, 1989; Harkness,
Van de Vijver, & Johnson, 2003). This etic (or imposed-etic)

Towards a Comprehensive Procedure for Developing Measurement Scales for Cross-Cultural Management Research

approach is the most widely used because it requires the


fewest financial and time resources (Schaffer & Riordan,
2003) and because most researchers seek to produce generalizations across the cultural groups under study (Berry,
1989). The etic approach has been criticized on conceptual
grounds in that a construct and its operationalization may
not be valid for another group, which can lead to misleading comparisons.
The emic approach, on the other hand, attempts to
define and operationalize a phenomenon occurring in a
particular culture utilizing only insights from that culture. A researcher adopting an emic approach may obtain
a very accurate within-culture description and insight but
can easily run into equivalence problems when emically
obtained data are compared across cultures (Davidson,
Jaccard, Triandis, Morales, & Diaz-Guerrero, 1976). For
example, a researcher can ask for culture-specific indicators of customer satisfaction in different countries. There
is a fair chance that such emically developed instruments
lack cross-cultural comparability because of cultural differences in what satisfies customers in different groups (e.g.,
Laroche, Ueltschy, Abe, Cleveland, & Yannopoulos, 2004).
Because of the drawbacks of both emic and etic
approaches, researchers increasingly consider a derivedetic approach (or combined emic-etic approach; Cheung,
Van de Vijver, & Leong, 2011) as a best practice that offers
scope for both universal and culture-specific aspects of
measures (Schaffer & Riordan, 2003). Such an approach
amounts to first attaining emic knowledge about all the cultures in the study and then retaining the communality as the
basis for comparisons (Berry, 1989). The main strength of
this approach is the attention for both ecological validity
(by designing the measures on the basis of locally obtained
information) and cross-cultural comparability. In this recommended approach, the quest for equivalence starts from
the beginning of the research process and not right after
data are collected (Usunier, 1998).

Scale Development Procedure


Step 1. Specify the Domain of the Construct
Construct Equivalence
The first important step in a process of measurement development is to determine clearly what one wishes to measure:
The researcher must be exacting in delineating what is
included in the definition and what is excluded (Churchill,
1979: 67). In comparative research, it is important to establish whether the construct exists in all groups and if the core
and boundaries of the phenomenon are the same (Cavusgil
& Das, 1997). Unfortunately, many researchers tend to
address this issue only in a post hoc fashion at the stage
of measurement invariance analysis (Hambleton, 2001;
Peng, Peterson, & Shyi, 1991; Singh, 1995). We suggest
that construct equivalence should be addressed in the first

73

stages of the research process. Construct equivalence (also


referred to as conceptual/functional equivalence) concerns
the similarity of the definition of the concept, but also the
similarity of the determinants, consequences, and correlates
(Hui & Triandis, 1985). Various procedures can be used to
assess construct equivalence, such as an inspection of the
literature, collaboration with colleagues from other countries, interviews and focus groups with individuals from the
groups under study, to find out whether the concept exists in
all the subgroups and which components are universal and
culture-specific.
Step 2. Generate Items Cultural Equivalence
The items of a scale should adequately cover the domain of
the concept. In single-group research, construct coverage
can be established by open-ended interviews with representative subjects from the target population so that items can
be derived from the transcripts of the interviews, thereby
ensuring the natural context and word choice (Churchill,
1979; Dawis, 1987). Reviews of existing literature on the
concept under study and of existing measures are other
often used methods. In the latter case, items may have to
be modified or rewritten to ensure cultural adequacy and
to establish consistency in tone and perspective across all
items (Bolino & Turnley, 1999). Recommendations on item
writing, such as the need to write simple items and to avoid
double barreled items and items that refer to more than one
concept hold a fortiori in cross-cultural research.
In cross-cultural research the same process should be
conducted for each group separately and potential indicators be listed. In a second step, indicators will be selected
in order to ensure that only items that are good indicators
for all groups are retained. In order to maximize equivalence, it might be necessary to remove the cultural particulars. Imagine the case of a researcher who wants to develop
a measure of the importance of prestige in several countries with large differences in economic development. In a
poor country Owning a watch could be considered as an
indicator of prestige which would not be the case in rich
countries. Therefore, the use of more generic items such as
Success in my work is important for me should be preferred because even if success can be conceived differently
by different groups, it is more likely to be a good indicator
of prestige than owning a watch.
Items of the initial pool may have to be reformulated
to maximize their translatability. Brislin (1986) described
guidelines aimed to ensure that the translators will clearly
understand the meaning of the original language item, to
have a high probability of finding a readily available target
language equivalent, and to produce readily understandable target language items. Examples of such guidelines are
to use simple, short sentences, to employ the active rather
than the passive voice, and to repeat nouns instead of using
pronouns. Even if existing tests are employed, items may

74

Management international / International Management / Gestin Internacional, 17 (2)

require modifications so as to maximize their adequacy in


the new cultural groups or new items may need to be added
to tap into additional aspects of a phenomenon not covered
by the original test (Brislin, 1986).
Another challenge facing scale developers concerns
such response effects as social desirability or acquiescence.
A possible way to reduce acquiescence involves the use of
balanced scales with equal number of positively and negatively worded items (Billiet & McClendon, 2000; Smith,
2003). However, there is some evidence that negativelyworded items can reduce the validity of measures and introduce systematic error (Hinkin, 1995). In fact, reversals in
item polarity may be confusing to some respondents, especially when completing long surveys (De Vellis, 2003) or
when the degree of motivation in participating in the survey is low (Barnette, 2000). As a consequence, negatively
worded items should be used with care or other techniques,
such as using a bidirectional response set of alternatives
(Barnette, 2000) can also be implemented.
Step 3. Translate and/or Adapt Items Linguistic
Equivalence
This step concerns mainly but not exclusively studies
involving multiple languages. Even when a survey instrument is administered to different groups using the same
language (e.g., English), it is important to ascertain that the
vocabulary and the language style are familiar to all groups.
For instance, De Vellis (2003) reports examples showing
that the same word can have different meanings in different English-speaking countries and even within the same
country.
Translation issues are one of the most frequently
mentioned problems in the literature dealing with empirical comparative research (Harkness, 2003). Translation
equivalence comprises different categories (Usunier, 1998).
Evidence for lexical equivalence or similarity of denotation is provided by dictionaries. Grammatical-syntactical
equivalence deals with original and translated text similarities and how word order and other grammatical features are
used to convey meaning. Finally, experiential equivalence
is about what words and sentences mean for people in their
everyday experience. For example, manger des ptes
(eating pasta) has an opposite affective meaning in France
and in Italy. Whereas in France this means having a cheap
meal, in Italy, mangiare la pasta represents more the idea
of a good meal.
Different procedures have been proposed to translate
instruments. We discuss here the most common ones. The
most widely used method is the back-translation technique
(Harkness, 2003; Usunier, 1998). One bilingual translates
from the source to the target language, and another blindly
translates back to the source. The accuracy of the translation is evaluated by comparing the original and back-translated versions. Nontrivial differences between the versions

are seen as evidence of translation problems. The procedure can be iteratively repeated for several rounds and a
final target-language questionnaire is discussed and prepared by the researcher and the two translators (Brislin,
1986; Usunier, 1998; Van de Vijver & Leung, 1997). The
back-translation technique has many advantages: it is less
likely that the preliminary version is contaminated by
one single person and no language is the dominant frame
of reference (Brislin, 1986). However, some limitations
of the back-translation technique have been observed. For
instance, good back translators might automatically compensate for poorly translated texts and thus mask problems
(Brislin, 1986; Harkness, 2003). Also, Van de Vijver and
Leung (1997) point out that the procedure can produce a
stilted language that does not approach the naturalness of
the text in the original version. As a consequence, the use
of back-translation seems to be less and less recommended
by psychometric experts (Byrne & Campbell, 1999). A
second technique, called blind parallel translation, consists
of having several translators translate independently from
the source language into the target language. The different target versions are then discussed and a final version
is compiled (Harkness, 2003; Usunier, 1998). In cross-cultural research, we often need to develop surveys in more
than two languages. We propose here a modified version of
the blind parallel translation technique that may be better
suited for such multilingual studies. Suppose that a study
involves English, Italian, and Spanish participants and that
the mother tongue of the principal investigator is English. A
first step involves two bilingual English-Spanish translators
and two English-Italian translators proposing a translation
of the first English version separately. After this step, we
have two Spanish and two Italian versions of the questionnaire. The two pairs of translators then compare and discuss
their translations until they agree on a common version.
Particular attention should be paid in the translation
process to equivalence of response formats, because inadequate translation will lead to systematic cross-cultural differences. Likert scales are the most widely used response
scale in organizational research (Hinkin, 1995). Existing
evidence shows that difficulties can occur in determining
lexical equivalents in different languages of verbal descriptions for the scale and that it is difficult to ensure that the
distances between scale points are equivalent in all the languages (Usunier, 1998). Several solutions have been proposed to increase the equivalence of response scales; these
include the substitution of verbal anchors with numerical
scales and the use of local wordings based on scales developed by local researchers (Smith, 2003; Usunier, 1998).
The first option seems preferable because numbers are
more likely to operate equivalently than words; yet, the
distinction becomes very subtle or non-existent when the
numbers have to be described in words in the introduction
to the participant.

Towards a Comprehensive Procedure for Developing Measurement Scales for Cross-Cultural Management Research

Step 4: Adjudication of Judgmental Aspects


The aim of this step is to assess the quality of the previous
stages, and to improve the scales face and content validity.
When the constructs to measure are based on a well-tested
theory, the most widely used method consists of asking a
group of experts to review the item pool (De Vellis, 2003;
Hardesty & Bearden, 2004). Experts can be provided with
the definition of the constructs and then be asked to rate
each item with respect to different item performance indicators such as the clarity and the adequacy of the items in
addressing the concept as it has been defined. The best rated
items are finally retained. Furthermore, if a scale is translated, bilingual experts cannot only compare the semantic
similarity of the original and translated versions, but can
also evaluate other text features such as comprehensibility.
Step 5: Collect Pilot Data
After an initial set of items for each group has been established, a pilot test is necessary (Churchill, 1979). It is generally recommended to use development samples that are
sufficiently large and drawn from the target populations (De
Vellis, 2003). However, what sufficiently large means has
been subject of controversy among researchers. The general
belief for both EFA (exploratory factor analysis) and CFA
(confirmatory factor analysis) is that more is always better, with recommended ratios such as 10 to 20 people per
measured variable, with 100 respondents per group being
a bare minimum sample size (Meade & Lautenschlager,
2004b; Thompson, 2004). However, more recent studies,
mostly based on Monte Carlo simulations, have shown that
the minimum sample size varies depending on the level of
communalities, loadings, number of variables per factor,
and the number of factors, and that EFA can be performed
quite adequately with samples as low as 50 (see De Winter,
Dodou, & Wieringa, 2009).
It is important to maximize the equivalence in data collection and avoid method bias which encompasses three
aspects: sample bias relates to the comparability of samples; instrument bias derives from the responses to the format of the assessment instrument such as response sets and
social desirability; finally, administration bias results from
differential administration conditions such as interviewer
effects (Byrne & Watkins, 2003).
Step 6: Assessment of Psychometric Properties in
Each Sample
After data are collected, the validity and reliability of the
scales should be evaluated for each group to ensure that
appropriate items are retained to constitute the scales
(Churchill, 1979; De Vellis, 2003). In single-group research
concerning scale development, tests of validity and reliability typically start with an exploratory factor analysis
to identify a smaller number of factors or latent constructs

75

from a large number of items derived from qualitative techniques (Worthington & Whittaker, 2006). Retain all factors
with eigenvalues greater than 1.0 and perform a scree test,
are still fairly common in determining how many factors
to extract, despite the growing evidence that the Velicers
MAP criteria, and parallel analysis are more accurate
(Osborne & Costello, 2009; OConnor; 2000). Scales are
formed by taking all items together that load at least moderately on the same factor (e.g., having a standardized loading with an absolute value of at least .4) and do not load as
high on other factors (Gerbing & Anderson, 1996; Hair Jr.,
Black, Babin, Anderson, & Tatham, 2006). Items that do
not show this convergent and discriminant validity are usually dropped (Campbell & Fiske, 1959).
The validation phase typically ends with a confirmatory
factor analysis to establish the final version of the scales
(Hinkin, 1995). It is generally recommended to collect new
data so that the exploratory and confirmatory factor analyses are based on different data (Churchill, 1979; De Vellis,
2003). However, because of the difficulty of data collection
in organizational settings, authors often randomly split their
sample into two halves and perform exploratory analyses
on the first half and confirmatory analyses on the second
half. When validity is established, reliability is generally
assessed by computing coefficient alpha. Again, when possible, authors usually delete some poorly performing items
to increase coefficient alpha (Hinkin, 1995). Note that the
use of coefficient alpha has been criticized on the grounds
that it is not a measure of internal consistency (Sijtsma,
2009). Therefore, it is preferable to use other measures of
reliability such as the Mc Donalds omega (Mc Donald,
1970) which is computed from the standardized parameter
estimates (Zinbarg, Revelle, Yovel, & Li, 2005).
By factor analyzing the items for each group separately,
one can check whether the same factors appear and if the
items load on the same factors for all groups. Items failing
to show cross-group convergent and discriminant validities
can be eliminated from the cross-cultural comparison; yet,
these may contain interesting information about cross-cultural differences in that they show very different patterns
of loadings.
Although CFA is far more flexible that EFA due to its
integration to the overarching SEM framework, it is still
limited by the inherent independent cluster model that arbitrarily constrains all cross loadings to 0, resulting in inflated
factor correlations when cross-loadings even minor ones
are present. For this reason, an Exploratory Structural
Equation Model approach, combining EFA, CFA and
SEM, has recently been developed and implemented in the
Mplus statistical packages (Asparouhov & Muthn, 2009,
Marsh et al. 2011). Further studies are needed to determine
whether this approach can live up to its theoretical potential
and what its pros and cons are.

76

Management international / International Management / Gestin Internacional, 17 (2)

Step 7: Assessment of the Equivalence of the


Psychometric Properties Measurement Equivalence
Cross-cultural research usually deals with either betweengroup comparisons of the latent or observed means of some
concept (Type I or level-oriented studies; e.g., is work motivation higher in Japan than in China?) or with betweengroup comparisons of the relationships between constructs
(Type II or structure-oriented studies; e.g., is the relationship between stock-options and motivation the same for
top and middle managers?). The requirements in terms of
measurement equivalence are different for these two types
of comparisons. If differences in score levels are of interest, comparisons are only meaningful if the measurement
scales have the same origin (zero point) and the same metric (scale units). If the issue of interest involves the relationships between two or more variables, the only requirement
for meaningful comparisons is that the scale on which
the scores are expressed have the same metric (Mavondo,
Gabbott, & Tsarenko, 2003; Poortinga, 1989).
Various approaches exist for testing measurement
invariance such as the ones based on item response theory
and tests of differential item functioning, and more recently
the ones based on exploratory structural equation modeling (Millsap, 2011; Raju, Byrne, & Laffitte, 2002; Reise,
Widaman, & Pugh, 1993). However, multigroup CFA seems
to be the most commonly used approach in management
and organizational research. The procedure consists of testing the invariance of the parameters of the measurement
model as defined within the confirmatory factor analysis
framework (Vandenberg & Lance, 2000). More specifically, the procedure consists of testing the goodness of fit of
increasingly restrictive models. Models are nested meaning
that placing equality constraints on one of the models produces the other (nested) model.
The measurement model should fit the data within
any of the groups under scrutiny and, in case of a good fit
cross-group equivalence should be simultaneously assessed
for all the groups. For a long period following Merediths
(1993) seminal paper, authors have not completely agreed
on (1) which tests of measurement equivalence had to be
undertaken, (2) the sequence of the tests, (3) the substantive meaning of each level of invariance and (4) the extent
to which partial equivalence could be accepted (see for
example Vandenberg, 2002). In what follows, we present
a synthesis of the main principles concerning measurement
invariance that seem to have reached a certain consensus,
and we propose a way of dealing with the four issues mentioned above. We also go beyond past research in terms of
interpretation of substantive results in the light of the results
of the measurement invariance tests.
Researchers used to first perform an omnibus test
of the equality of the covariance matrices across groups.
If covariance matrices did not differ across groups, full
measurement equivalence was considered to be established
(Vandenberg & Lance, 2000). However, some authors

have questioned the usefulness of this particular test on the


grounds that it can indicate that measurement invariance is
supported when more specific tests of measurement invariance find otherwise (Meade & Lautenschlager, 2004a;
Raju, Byrne, & Laffitte, 2002). Then, it seems more reasonable to directly inspect each level of invariance.
The first generally advocated test is the test of configural invariance, addressing whether respondents of different groups associate the same subsets of items with the
same construct(s), meaning that the underlying cognitive
domains are the same (Riordan & Vandenberg, 1994). The
absence of nonnegligible differences in the pattern of fixed
and free factor loadings between groups is usually taken as
supportive and sufficient evidence of configural invariance
(Vandenberg, 2002). Configural invariance is a precondition
for higher levels of measurement invariance. Therefore, it is
generally viewed as a baseline model against which further
tests, based on more restrictive models, are evaluated.
If steps 1 to 6 of the presented procedure have been
followed, configural invariance would be expected. The
implications of not finding configural invariance vary
depending on how many items lack invariance. If only a
limited number of items do not load on the specified factor
in one or some groups, and there are still enough invariant
items left, removing the items from the cross-cultural comparison may be desirable. However, it is important to determine whether the remaining common items still adequately
cover the construct as defined at the beginning of the study
or the original construct has to be narrowed.
The presence of anomalous stimuli indicates that some
type of cultural specificity has been observed; for example,
certain stimuli may measure secondary constructs or the
content of the stimuli could be inappropriate in some cultures (e.g., the attitude towards living with ones parents
may be an indicator of individualism in France but not in
Italy or Spain where this refers more to a national norm). If,
on the other hand, the lack of configural invariance is a consequence of many anomalous stimuli and the factor structures turn out to be essentially different across groups, the
implications are more severe. Such an observation means
that the concept or at least some of its indicators are culture
specific and that quantitative comparisons between groups,
involving these indicators, are not meaningful.
Most authors advocate testing metric invariance after
configural invariance has been established. It involves the
equality of scale units between groups and is required
to compare relationships between variables in different groups. Metric invariance concerns the relationship
between the latent variable and its indicators and is tested
by constraining the items factor loadings to be invariant
across groups (Steenkamp & Baumgartner, 1998).
The results of the analysis can point to full metric
invariance, complete absence of metric invariance, and
partial metric invariance (if at least one but not all items

Towards a Comprehensive Procedure for Developing Measurement Scales for Cross-Cultural Management Research

failed to be invariant). Since exact measurement invariance


is unrealistic in many cases, an important question is what
to do if metric invariance for all the items is not established
(Byrne, Shavelson, & Muthen, 1989; Labouvie & Ruetsch,
1995; Raju et al., 2002).
Depending on the outcome, three aspects have to be considered: the number of items that have different loadings,
the size of the loading differences and, more specifically,
whether the differences are large enough to be consequential in terms of cross-cultural substantive comparisons, and
the size of the observed relationships between the latent
variables under study. Concerning the number of items, it
is technically possible to compare relations between constructs as soon as at least one indicator has invariant loadings. Practically speaking, however, if only very few items
have invariant loadings, such item-specific comparisons do
not convey much information about the underlying construct. Authors do not agree on how many invariant items
are needed to accept partial metric invariance (Cheung &
Rensvold, 2002; Schaffer & Riordan, 2003; Vandenberg,
2002). In business and organizational research, short, unidimensional scales (< 10 items) are common (Hinkin, 1995).
For such scales we propose to avoid comparisons of correlations between constructs if less than half of the items are
metrically invariant.
The second relevant issue in analyzing partial invariance is the size of the differences of the noninvariant loadings. There is no widely accepted rule as to when loadings
are sufficiently different to be psychologically consequential. For example, if an item loading for group A is .65 and
for group B is .75, the difference can be statistically significant given a sufficiently large sample size but the difference
is, psychologically speaking, very small.
According to Meade and Bauer (2007) when metric
invariance is not found, researchers can calculate effect
sizes and confidence intervals for the factor loading differences. If these intervals are small and close to (but exclude)
zero, then the difference in loadings is so small that substantive comparisons are still justified.
A test of scalar invariance is the most currently used
after metric invariance is established (Vandenberg & Lance,
2000). Scalar invariance concerns the consistency of the
differences between latent means and observed means
across groups. Even if an item measures the latent variable
with the same metrics for different groups, scores on that
item can still be systematically upward or downward biased
(Steenkamp & Baumgartner, 1998). Scalar invariance is
tested by imposing an equality constraint on the item intercepts. When testing for invariance of item intercepts, the
parameters that have been found to be nonequivalent in previous analyses should be freely estimated. Only the item
loadings found to be invariant and the item intercepts must
be constrained to be equal between the groups.

77

The same three outcomes can be found (complete support, partial support, and complete lack of scalar invariance)
as in the previous analysis. Again, quality and quantity have
to be taken into account. If the measurement intercepts of
different items consistently point to deviances in one or
the same small sets of groups, it is important to check for
consistencies of the bias across groups. If the bias is not
consistently pointing to a single group, it is more likely
that the bias is due to item specific issues like inadequate
translations. If there is more consistency, then systematic
sources of bias, such as social desirability or acquiescence,
may play a role.
If the test of scalar invariance indicates that differences
in item intercepts are not consistent across items, anomalies
can be examined by removing the items from the cross-cultural comparison. Another approach is to evaluate the influence of the biased items on the cross-cultural differences;
a simple way is to compare the difference in size of the
means on the original instruments with the difference on
the instruments from which all biased items are removed.
Although the differences can be very large in theory, the
removal of biased items may not have major implications
for their size and the implications for the interpretation
of the cross-cultural differences may be minimal (e.g.,
Meiring, Van de Vijver, & Rothmann, 2006). Finally, the
size of the intercept differences and the cross-groups mean
differences should be taken into account when interpreting
lack of scalar invariance. Again, if the mean difference of
two variables between two groups is small, a lack of full
scalar invariance would have more serious implications
than in the case of a large difference of means.
Other tests can concern factor variance equivalence and
error variance equivalence (Vandenberg & Lance, 2000).
However, we consider that metric and scalar invariance are
sufficient for establishing that measurement equivalence
conditions exist and that invariance of unique variances
is not an issue when differences in measurement error are
taken into account as it is the case in SEM (Byrne, 2004;
Meade & Bauer, 2007; Steenkamp & Baumgartner, 1998).
However, when other statistical analyses are used to inspect
correlations and mean differences, such as regressions and
ANOVAs, invariance of errors must be addressed because
errors can inflate or deflate relations and means (Millsap,
2011).
A further issue concerns the selection of an item as
the referent indicator for identification purposes (Little,
Slegers, & Card, 2006). Typical practice is simply to select
an item and fix its loading to the value of 1 and its intercept
value to the value of zero. This way, all latent variances and
means can be freely estimated. However, this practice can
lead to biased results if the researcher inadvertently selects
as the referent indicator an item that is not metrically invariant (Little et al., 2006; Vandenberg, 2002). In order to avoid
such an issue, researchers can inspect the item loadings from
the EFA and select, as the referent indicator, the one whose

78

Management international / International Management / Gestin Internacional, 17 (2)

loadings are the most similar across groups. An alternative


method relies on the standardization of the latent variables.
More specifically, when testing for configural invariance,
factor variances are constrained to 1 and means to 0. For
tests of metric invariance, all loadings are constrained to
equality, and all variances are estimated, except those from
the first group that are fixed to one. Finally, for tests of scalar invariance, intercepts are constrained to be identical and
all means are freely estimated except those from the referent group that are fixed to zero. This way, the latent means
in the other groups are expressed as deviations from the
first group. Finally, Little et al. (2006) also presented an
effects coding identification method that allows estimating the latent parameters in a nonarbitrary metric, by using
model constraints forcing the loadings to average 1 and the
intercepts to sum up to 0.

systematic variance than unsystematic variance, while in


the parallel test, factors are retained as long as the ith eigenvalue from the actual data is greater than the ith eigenvalue
from the random data. The results showed that the number
of factors to extract for all groups was 1. Also, as shown
in Table 2, all items loaded in excess of .40 on the factor
confirming convergent validity (Hair Jr. et al., 2006; Peter,
1981). Reliabilities, as assessed by coefficients alpha and
omega, were respectively of .84 and .82 for France, .80 and
.77 for Italy, .80 and .78 for the US, and .77 and .78 for
Mexico, suggesting good reliabilities for all groups.
Multigroup confirmatory factor analysis. Because
chi-square-based tests of measurement invariance are
highly sensitive to sample size (Meade & Bauer, 2007),
we extracted three random subsamples of 150 individuals

Table 1
Scale of Competition (US English Version)

Indicate your degree of agreement or disagreement with the following statements:


1 = strongly agree, 5 = strongly disagree
(Item 1) Competition between employees usually does more harm than good (reverse score)
(Item 2) I enjoy working in situations involving competition with others
(Item 3) I believe I have a highly competitive spirit
(Item 4) When we compete against others, we give the best of ourselves
(Item 5) Competition makes us improve our skills

Example
The scale used in this example is a measure of competitive orientation, defined as the extent to which individuals
perceive competition as something positive and desirable,
which was used in a previous study performed by the first
author. The sample comprises 368 French, 138 Mexican,
246 US, and 276 Italian employees of 3 French multinational corporations. The survey was developed in English
and then translated into French, Spanish, and Italian using
the blind parallel translation procedure described above.
Table1 presents the US English version of this 5-item scale.
Exploratory factor analysis and coefficient omega.
Principal axis factoring was used to determine the selected
items factor structure for each group separately (Hair Jr. et
al., 2006). We used the Velicers Minimum Average Partial
(MAP) Test and Parallel Analysis routines as presented in
OConnor (2000), to determine the number of components
for each group. In the MAP test, factors are retained as long
as the variance in the correlation matrix represents more

Table 2
Exploratory Factor Analysis,
Coefficients Alpha and Omega

Items

France Italy

United States Mexico

.73

.68

.68

.68

.82

.81

.76

.78

.75

.69

.74

.68

.83

.80

.80

.67

.79

.78

.77

.80

Alpha

.84

.80

.80

.77

Omega .82

.77

.78

.78

Towards a Comprehensive Procedure for Developing Measurement Scales for Cross-Cultural Management Research

for the French, Italian, and US groups, in order to compare


groups of similar sample sizes. We assessed the multivariate normality of our data through Mardias coefficients of
skewness and kurtosis. The results showed that normality
did not hold for any group with Mardia coefficients of 3.63
(CR (Critical Ratio) = 2.66) for France, 5.07 (CR = 3.71)
for Italy, 2.05 (CR = 1.50) for the United States and 5.43
(CR = 3.91) for Mexico. Moreover, the kurtosis index varied between -.85 and 1.22, and the skewness index varied
between -.95 and .14. Thus, the univariate and multivariate
distributions can be considered to depart from normality
only slightly.
We used AMOS 18.0 to assess the validity of the hypothesized factor structure as well as measurement invariance
between French, Italian, US and Mexican employees.
Because 2 statistic as a models indicator of goodness-offit is complicated by several factors (such as sample size),
researchers have developed a number of alternative goodness-of-fit measures. In this study, we have used four of
such indices which are widely recommended on the basis of
research evidence (Cheung & Rensvold, 2002; A. Meade,
Johnson, & Braddy, 2008): the Comparative Fit Index
(CFI), the Tucker Lewis Index (TLI), the Root Square Error
of Approximation (RMSEA), and the Standardized Room
Mean Residual (SRMR).
Four levels of invariance were assessed: configural,
metric, scalar, and unique variances invariance. As a prerequisite to testing for factorial invariance, it is customary
to assess for each group the measurement model which
best represents the observed data. Afterwards, when testing for measurement invariance, equality constraints are
imposed on particular parameters, and thus, data for all
groups are analyzed simultaneously to obtain efficient estimates (Byrne, 2004). Table 3 shows the fit indices when
the model is tested for each group separately. All fit indices suggested that the model fitted poorly in the French,
Italian, and US groups (Hair Jr. et al., 2006). An inspection
of the modification indices suggested a strong correlation
between the error variances of items 2 and 3 for all groups.
This can be explained by the fact that items 2 and 3 refer to
the respondents personal competitive spirit (items starting
with I enjoy and I believe), while other items refer to
collective competition. A conservative decision would be
to drop one of the two items because of the high correlated
error variances. However, in the present case, there does not
seem to be a large redundancy between the items. The fit
indices improved strongly after including error covariances,
leading to well fitting models for the four groups (models
1 to 7). It is important to note that model respecifications
must be limited and avoided when possible, because they
may be driven by characteristics of the particular sample
on which the model is tested (MacCallum, Roznowski, &
Necowitz, 1992).
As shown in table 4, all standardized loadings were
highly significant and ranged from .42 to .86. We then

79

fitted the model for the four groups simultaneously to test


for configural invariance and again we needed to estimate
the error covariance between items 2 and 3 to yield good
fit, with a CFI value of .974 and a RMSEA value of .052
(model 8). Thus, it could be concluded that the Competition
scale showed configural invariance across the four groups.
The 2 value of 41.89 with 16 degrees of freedom provides the baseline value against which the subsequent tests
of invariance are compared. Having established configural
invariance, the next logical test concerns metric invariance
(i.e., a test of invariant factor loadings). Model 9 in Table
3 shows the fit indices of the model where the factor loadings are constrained to be equal across groups. However,
of primary importance is the comparison of its 2 value of
62.04 (df = 28) with that for the baseline model (2 = 41.89,
df = 16). In fact, when models are nested, this difference in
2 values (in large samples) follows a 2 distribution, with
degrees of freedom equal to the difference in degrees of
freedom (Van de Vijver & Leung, 1997). Given that the chi
square sensitivity to sample size, minor model misspecifications and minor deviations from multivariate normality,
Cheung and Rensvold (2002) and Chen (2007) suggested
complementing the emanations of chi-squares difference
test by the examination of changes in CFI and RMSEA,
with changes lower than respectively .01 and .015 suggesting that invariance assumptions are reasonably met. This
comparison yielded a 2 difference value of 20.15 with 12
df, which is not significant (p >.05), a drop of CFI of .008,
and a drop of RMSEA of .007 which gave evidence of metric invariance.
We then tested for scalar invariance by constraining
all item intercepts to be equal. This yielded a 2 difference
value of 34.33 with 12 degrees of freedom, which is statistically significant at the .001 level. From here on, several strategies could have been implemented to determine
which item intercepts were noninvariant between which
groups. As shown by Byrne (2001), when working with
more than two groups, one approach is to determine, first,
if the constrained model is possibly invariant across two of
the groups. This is done by testing measurement invariance
between groups taken two by two. However, if one wishes
to know which parameters are non-invariant among all
groups, modification indexes (MI) can be used to detect the
noninvariant parameters. An inspection of MIs revealed that
the item intercept of item 3 was the only parameter with a
relevant MI (8,095, EPC = -.160). Relaxing the equality of
intercepts for item 3 yielded a 2 difference value of 15.89
with 8 degrees of freedom, which is statistically significant
at the .05 probability level. However, drops in CFI (-.007)
and RMSEA (-.002) were both low, showing that partial
scalar invariance held.
We finally constrained uniquenesses to be invariant (in
addition to maintaining metric and partial scalar invariance
constraints) and found that error variance equivalence did
not hold, with a statistically significant 2 difference value

7.76
36.66
11.25
39.16
20.03
4.82

2-Covariance error items 2&3

3-Italy

4- Covariance error items 2&3

5-United States

6- Covariance error items 2&3

7-Mexico

62.04
96.37
77.93
129.05
101.64
91.93

9- Metric Equivalence

10-Scalar Equivalence

11-Partial Scalar Equivalence (item3)

12- Error Variance Equivalence

13- Partial Error Variance Equivalence


(item 3)

14- Partial Error Variance Equivalence


(items 2&3)

*p < .05. **p < .01. ***p < .001

41.89

8- Configural Equivalence

Multigroup Analyses

30.10

1-France

Monogroup Analyses

Model Description

46

49

52

37

40

28

16

df

.954

.947

.922

.959

.943

.966

.974

.931

.852

.973

.882

.989

.925

CFI

.960

.957

.940

.955

.943

.951

.935

.827

.705

.933

.764

.972

.849

TLI

.044

.048

.051

.040

.037

.045

.023

.027

.048

.048

.036

.071

.023

.050

SRMS

.041

.043

.050

.043

.049

.045

.052

0.00

.164

.214

.110

.206

.079

.184

RMSEA

Summary of Fit Statistics for Tests of Invariance

Table 3

12

15

12

12

DF

14

23.71*

51.12***

15.89*

34.33***

20.15

-.005

-.012

-.037

-.007

-.023

-.008

CFI

-.002

-.007

-.002

.004

-.007

RMSEA

80
Management international / International Management / Gestin Internacional, 17 (2)

81

Towards a Comprehensive Procedure for Developing Measurement Scales for Cross-Cultural Management Research

Table 4
Unstandardized Factor Loadings () and Intercepts () for France, Italy, the United States and Mexico

France

Italy

United States

Mexico

Items

Item 1

.73

2.95

.58

2.60

.57

2.89

.50

3.70

Item 2

.67

3.22

.66

2.81

.56

3.03

.62

3.94

Item 3

.53

3.47

.50

3.28

.58

3.42

.42

4.34

Item 4

.78

3.63

.86

3.23

.78

3.35

.44

4.30

Item 5

.62

3.82

.82

3.44

.67

3.71

.52

4.34

of 51.12 with 15 degrees of freedom. Again, an inspection


of MIs suggested that the uniqueness of item 3 for the group
of Italians was different from the same parameter for other
groups. Relaxing the constrained uniqueness improved the
models fit significantly. However, when compared with the
partial scalar equivalence model, the 2 difference value of
23.71 with 12 degrees of freedom was still statistically significant at the .05 probability level, and the drop in CFI was
larger than .01 even though there was no increase in the
RMSEA. A new inspection of MIs suggested that the error
variance invariance for item 2 and the group of Mexicans
did not hold. We then relaxed this constraint, and found a
nonsignificant 2 difference between this new model and
the model of partial scalar equivalence.
Overall, our analyses of measurement invariance
showed that the Competition scale was fully metrically
invariant among the four groups, that the intercept and
uniqueness of item 3 were not invariant among the four
groups, and that the uniqueness of item 2 was not equivalent among the four groups. At this point, one could have
decided to drop item 3 from the scale. In fact, it seems that
the use of the word spirit in the wording of the item may
have been perceived differently by respondents from different countries. However, because only one item out of 5
failed to show scalar equivalence and only 2 items out of
five did not show error variance equivalence, partial measurement equivalence held, and one could confidently use
the Competition scale for all analyses comparing two or
more of the four groups.

Conclusion
Comparing the attitudes and behaviors of different groups
of employees or consumers is one of the most common
aims of organizational research. However, meaningful
cross-group comparisons presuppose that the measurement

instruments used to assess attitudes, values or behaviors in


organizations, operate in an equivalent way across groups.
Otherwise, differences in mean levels or in the pattern of
correlation of the variables are potentially artifactual and
may be substantively misleading. In the organizational literature, the issue of measurement equivalence has become
increasingly popular in particular when the groups being
compared are composed of individuals from different countries. We have argued here that the issue of measurement
equivalence should be addressed for any group comparison, in particular when there are some reasons to expect
between-group differences in the existence and definition of the constructs themselves, and in the capacity of
a set of items to cover the domain of the constructs in an
equivalent way. Moreover, based on an extensive review
of the literature on the topic, we argued that researchers
tend to address measurement equivalence in a post hoc
fashion (that is, after data were collected). In this article,
we suggested that researchers should start incorporating
equivalence issues from the scale development process to
increase the likelihood of getting equivalent measures. We
integrated measurement equivalence issues in each step
of classical procedures of scale development to propose a
step-by-step procedure of scale development for comparative research which would be useful for both researchers
who need to develop a measurement scale and for researchers who want to use an existing scale in the context of a
comparative study and want to assess whether the scale is
suitable for all the groups under study. In this procedure,
we described how a combination of instrument design or
adaptations and statistical analyses can go a long way to
enhance the validity of substantive results in comparative
studies. We finally presented an example of measurement
equivalence analysis based on multigroup confirmatory factor analysis, and went beyond past research by suggesting
how to deal with measurement non-invariance. As an example, we suggested that the degree of inequivalence between

82

Management international / International Management / Gestin Internacional, 17 (2)

parameters as well as the strength of the substantive effects


being studied (correlation between variables and mean differences) had to be analyzed. It is an important aspect of
our approach that we try to link statistical methods to substantive theories. The psychometric tools that we described
have a high level of sophistication and it is probably fair to
say that the level of theorizing about cross-cultural differences and similarities has advanced less than the way of
treating data. In our view, this imbalance does not imply
that we should capitalize on the psychometric aspects of
cross-cultural comparisons. The theoretical poverty of an
instrument cannot be remedied by statistical sophistication. Analogously, a theoretically well based instrument
cannot reveal cross-cultural differences adequately unless
the data obtained with it are analyzed adequately. Bias and
equivalence have become central concepts in cross-cultural
studies. Our paper has outlined procedures about how to
integrate ideas about equivalence in cross-cultural studies.
We believe that the overall framework presented in this article will help researchers dealing with such complex issues
in a straightforward and effective way.

Byrne, B. M. (2001). Structural equation modeling with AMOS Basic concepts, applications, and programming. Mahwah, NJ,
USA: Lawrence Erlbaum Associates.

Bibliographie

Chen, F.F. (2007). Sensitivity of goodness of fit indexes to lack


of measurement. Structural Equation Modeling, Vol. 14,
pp.464-504

Adler, N. J. (1983). A typology of management studies involving


culture. Journal of International Business Studies, Vol. 14,
No. 2, pp. 29-47.
Asparouhov, T., & Muthn, B. (2009). Exploratory structural
equation modeling. Structural Equation Modeling, Vol. 16,
pp.397-438.
Bagozzi, R. P., Yi, Y., & Phillips, L. W. (1991). Assessing construct validity in organizational research. Administrative
Science Quarterly, Vol. 36, No. 3, pp. 421-458.
Barnette, J. J. (2000). Effects of stem and Likert response option
reversals on survey internal consistency: If you feel the need,
there is a better alternative to using those negatively worded
stems. Educational and Psychological Measurement, Vol.60,
No.3, pp. 361-370
Berry, J. W. (1989). Imposed etics-emics-derived etics: The
operationalization of a compelling idea. International Journal
of Psychology, Vol. 24, No. 6, pp. 721-735.
Billiet, J. B., & McClendon, M. J. (2000). Modeling acquiescence in measurement models for two balanced sets of items.
Structural Equation Modeling, Vol.7, No.4, pp.608-628.
Boddewyn, J. (1965). The comparative approach to the study of
business administration. Academy of Management Journal,
Vol. 8, No. 4, pp. 261-267.
Bolino, M. C., & Turnley, W. H. (1999). Measuring impression
management in organizations: A scale development based on
the Jones and Pittman taxonomy. Organizational Research
Methods, Vol. 2, No. 2, pp. 187-206.
Brislin, R. W. (1986). The wording and translation of research
instruments. In W. J. Lonner & J. W. Berry (Eds.), Fields
methods in cross-cultural research (Vol. 8, pp. 291-324).
Beverly Hills, CA: Sage.

Byrne, B. M. (2004). Testing for multigroup invariance using


AMOS graphics: A road less traveled. Structural Equations
Modeling, Vol. 11, No. 4, pp. 272-300.
Byrne, B. M., Shavelson, R. J., & Muthen, B. (1989). Testing
for the equivalence of factor covariance and mean structures:
The issue of partial measurement equivalence. Psychological
Bulletin, Vol. 105, No. 3, pp. 456-466.
Byrne, B. M., & Campbell, T. L. (1999). Cross-cultural comparisons and the presumption of equivalent measurement and
theoretical structure: A look beneath the surface. Journal of
Cross-Cultural Psychology, Vol. 30, No. 5, pp. 555-574.
Byrne, B. M., & Watkins, D. (2003). The issue of measurement
invariance revisited. Journal of Cross-Cultural Psychology,
Vol. 34, No. 2, pp. 155-175.
Campbell, D. T., & Fiske, D. W. (1959). Convergent and discriminant validation by the multitrait-multimethod matrix.
Psychological Bulletin, Vol. 56, pp. 81-105.
Cavusgil, S. T., & Das, A. (1997). Methodological issues in
empirical cross-cultural research: A survey of the management literature and a framework. Management International
Review, Vol. 37, No. 1, pp. 71-96.

Cheung, G. W., & Rensvold, R. B. (2002). Evaluating goodnessof-fit indexes for testing measurement invariance. Structural
Equation Modeling, Vol.9, No.2, pp.233-255.
Cheung, F. M., van de Vijver, F. J. R., & Leong, F. T. L. (2011).
Toward a new approach to the study of personality in culture.
American Psychologist. Advance online publication.
Churchill, G. A. (1979). A paradigm for developing better measures of marketing constructs. Journal of Marketing Research,
Vol. 16, No. 1, pp. 64-73.
Davidson, A. R., Jaccard, J. J., Triandis, H. C., Morales, M. L.,
& Diaz-Guerrero, R. (1976). Cross-cultural model testing:
Toward a solution of the etic-emic dilemma. International
Journal of Psychology, Vol. 11, No. 1, pp. 1-13.
Dawis, R. V. (1987). Scale construction. Journal of Counselling
Psychology, Vol. 34, No.4, pp. 481-489.
De Vellis, R. F. (2003). Scale development, theory and applications (Vol. 26). Thousand Oaks, CA: Sage.
De Winter, J., Dodou, D., & Wieringa, P. (2009). Exploratory
factor analysis with small sample sizes. Multivariate
Behavioral Research, Vol.44, pp.147181.
Gerbing, D. W., & Anderson, J. C. (1996). An updated paradigm
for scale development incorporating unidimensionality and its
assessment. Journal of Marketing Research, Vol. 25, No.5,
pp.186-192.
Hair Jr., J. F., Black, W. C., Babin, B. J., Anderson, R. E., &
Tatham, R. L. (2006). Multivariate data analysis (6th ed.).
Upper Saddle River, NJ: Pearson.
Hambleton, R. K. (2001). The next generation of the ITC test
translation and adaptation guidelines. European Journal of
Psychological Assessment, Vol. 17, No. 3, pp. 164-172.

Towards a Comprehensive Procedure for Developing Measurement Scales for Cross-Cultural Management Research

83

Hardesty, D. M., & Bearden, W. O. (2004). The use of expert


judges in scale development: Implications for improving face
validity of measures of unobservable constructs. Journal of
Business Research, Vol. 57, pp. 98-107.

Meade, A.W, Johnson, E., & Braddy, P. (2008). Power and


sensitivity of alternative fit indices in tests of measurement
invariance. Journal of Applied Psychology, Vol. 93, No. 3,
pp.568-592.

Harkness, J. (2003). Questionnaire translation. In J. A.


Harkness, F. J. R. Van de Vijver & P. P. Mohler (Eds.), Crosscultural survey methods. Hoboken, NJ: Wiley.

Meade, A.W, Michels, L., & Lautenschlager, G. (2007). Are


internet and paper-and-pencil personality tests truly comparable? An experimental design measurement invariance study.
Organizational Research Methods, Vol. 10, No. 2, pp.322-345.

Harkness, J., Van de Vijver, F. J. R., & Johnson, T. P. (2003).


Questionnaire design in comparative research. In J. A.
Harkness, F. J. R. Van de Vijver & P. P. Mohler (Eds.), Crosscultural survey methods. Hoboken, NJ: Wiley.
Hinkin, T. R. (1995). A review of scale development practices in
the study of organizations. Journal of Management, Vol. 21,
No.5, pp. 967-988.
Hofstede, G. (2001). Cultures consequences - comparing values,
behaviors, institutions and organizations across nations (2nd
ed.). Thousand Oaks, CA: Sage.
Hui, C. H., & Triandis, H. C. (1985). Measurement in crosscultural psychology. Journal of Cross-Cultural Psychology,
Vol.16, No. 2, pp. 131-152.
Johnson, T. P. (1998). Approaches to equivalence in cross-cultural and cross-national survey research. ZUMA-Nachrichten
spezial, Vol.3, pp. 1-40.
Labouvie, E., & Ruetsch, C. (1995). Testing for equivalence of
measurement scales: Simple structure and metric invariance
reconsidered. Multivariate Behavioral Research, Vol. 30,
No.1, pp.63-76
Laroche, M., Ueltschy, L. C., Abe, S., Cleveland, M., &
Yannopoulos, P. (2004). Service quality perceptions and customer satisfaction: Evaluating the role of culture. Journal of
International Marketing, Vol.12, No.3, pp.58-85.
Little, T. D., Slegers, D. W., & Card, N. A. (2006). A non-arbitrary method of identifying and scaling latent variables in SEM
and MACS models. Structural Equation Modeling, Vol. 13,
No.1, pp.59-72.
Lytle, A. L., Brett, J. M., Barsness, Z. I., Tinsley, C. H., &
Janssens, M. (1995). A paradigm for confirmatory crosscultural research in organizational behavior. Research in
Organizational Behavior, Vol.17, pp.167-214.
MacCallum, R., Roznowski, M., & Necowitz, L. (1992). Model
modifications in covariance structure analysis: The problem
of capitalization on chance. Psychological Bulletin, Vol.111,
No.3, pp.490-504.
Marsh, H.W., Nagengast, B., Morin, A.J.S., Parada, R.H.,
Craven, R.G., & Hamilton,
L.R. (2011). Construct validity of the multidimensional structure of bullying and victimization: An application of exploratory structural equation modeling. Journal of Educational
Psychology, Vol.103, pp.701-732.
Mavondo, F., Gabbott, M., & Tsarenko, Y. (2003). Measurement
invariance of marketing instruments: An implication across
countries. Journal of Marketing Management, Vol.19, No.5/6,
pp.523-540.
Mc Donald, R.P. (1970). Theoretical foundations of principal factor analysis, canonical factor analysis, and alpha factor analysis. British Journal of Mathematical & Statistical
Psychology, No23, pp.1-21

Meade, A. W., & Bauer, D. J. (2007). Power and precision in


confirmatory factor analyic tests of measurement invariance.
Structural Equation Modeling, Vol. 14, No. 4, pp. 611-635.
Meade, A. W., & Lautenschlager, G. J. (2004a). A comparison
of item response theory and confirmatory factor analytic methodologies for establishing measurement equivalence/invariance. Organizational Research Methods, Vol. 7, No. 4, pp.
361-388.
Meade, A. W., & Lautenschlager, G. J. (2004b). A MonteCarlo study of confirmatory factor analytic tests of measurement equivalence/invariance. Structural Equation Modeling,
Vol.11, No.1, pp. 60-72.
Meiring, D., Van de Vijver, F.J.R., & Rothmann, S. (2006). Bias
in an adapted version of the 15FQ+ in South Africa. South
African Journal of Psychology, Vol.36, pp. 340-356.
Meredith, W. (1993). Measurement invariance, factor analysis, and factorial invariance. Psychometrika, Vol. 58, No. 4,
pp.525-543.
Millsap, R. E. (2011). Statistical approaches to measurement
invariance. New York, NY: Routledge.
Morden, T. (1999). Models of national culture - a management
review. Cross Cultural Management, Vol.6, No.1, pp.19-44.
Mullen, M. R. (1995). Diagnosing measurement equivalence
in cross-national research. Journal of International Business
Studies, Vol.26, No.3, pp.573-596.
OConnor, B. P. (2000). SPSS and SAS programs for determining the number of components using parallel analysis and
Velicers MAP test. Behavior Research Methods, Vol. 32,
No.3, pp.396-402.
Osborne, J. W., & Costello, A. B. (2009). Best practices in
exploratory factor analysis: Four recommendations for getting the most from your analysis. Pan-Pacific Management
Review, Vol.12, No.2, pp.131-146.
Peng, T. K., Peterson, M. F., & Shyi, Y. P. (1991). Quantitative
methods in cross-national management research: Trends and
equivalence issues. Journal of Organizational Behavior,
Vol.12, No.2, pp. 87-107.
Peter, J. P. (1981). Construct validity: A review of basic issues
and marketing practices. Journal of Marketing Research, 18,
133-145. Poortinga, Y. H. (1989). Equivalence of cross-cultural data: An overview of basic issues. International Journal
of Psychology, Vol. 24, pp. 737-756.
Poortinga, Y. H. (1989). Equivalence of cross-cultural data: An
overview of basic issues. International Journal of Psychology,
Vol.24, pp.737-756.
Raju, N. S., Byrne, B. M., & Laffitte, L. J. (2002). Measurement
equivalence: A comparison of methods based on confirmatory
factor analysis and item response theory. Journal of Applied
Psychology, Vol. 87, pp. 517-529.

84

Management international / International Management / Gestin Internacional, 17 (2)

Reise, S. P., Widaman, K. F., & Pugh, R. H. (1993). Confirmatory


factor analysis and item response theory: Two approaches for
exploring measurement invariance. Psychological Bulletin,
Vol. 114, No. 3, pp. 552-566.
Riordan, C. M., & Vandenberg, R. J. (1994). A central question in cross-cultural research: Do employees of different cultures interpret work-related measures in a equivalent manner?
Journal of Management, Vol. 20, No. 3, pp. 643-673.
Schaffer, B. S., & Riordan, C. M. (2003). A review of cross-cultural methodologies for organizational research: A best-practices approach. Organizational Research Methods, Vol. 6,
No.2, pp. 169-216.
Sijtsma, K. (2009). On the use, the misuse, and the very limited usefulness of Cronbachs Alpha. Psychometrika, Vol.74,
No.1, pp.107-120.
Singh, J. (1995). Measurement issues in cross-national research.
Journal of International Business Studies, Vol. 26, No. 3,
pp.597-619.
Smith, T. W. (2003). Developing comparable questions in crossnational surveys. In J. A. Harkness, F. J. R. Van de Vijver &
P. P. Mohler (Eds.), Cross-cultural survey methods (pp. 69-92).
Hoboken, NJ: Wiley.
Steenkamp, J.-B. E. M., & Baumgartner, H. (1998). Assessing
measurement invariance in cross-national consumer research.
The Journal of Consumer Research, Vol.25, No.1, pp.78-90.
Thompson, B. (2004). Exploratory and confirmatory factor analysis: Understanding concepts and applications. Washington,
DC: American Psychological Society.
Usunier, J.-C. (1998). International & cross-cultural management
research. Thousand Oaks, CA: Sage.
Van de Vijver, F. J. R. (1998). Towards a theory of bias and
equivalence. In J. Harkness (Ed.), ZUMA-Nachrichten
Spezial No.3. Cross-Cultural Survey Equivalence. Mannheim,
Germany: ZUMA.
Van de Vijver, F. J. R., & Leung, K. (1997). Methods and data
analysis for cross-cultural research. Thousand Oaks, CA:
Sage.
Vandenberg, R. J. (2002). Toward a further understanding of
and improvement in measurement invariance methods and
procedures. Organizational Research Methods, Vol. 5, No.2,
pp.139-158.
Vandenberg, R. J., & Lance, C. E. (2000). A review and synthesis of the measurement invariance literature: suggestions,
practices, and recommendations for organizational research.
Organizational Research Methods, Vol. 3, No.1, pp.4-70.
Wasti, S. A., Bergman, M. E., Glomb, T. M., & Drasgow, F.
(2000). Test of the generalizability of a model of sexual
harassment. Journal of Applied Psychology, Vol. 85, No. 5,
pp. 766-778.
Worthington, R. L., & Whittaker, T. A. (2006). Scale development research: A content analysis and recommendations
for best practices. The Counseling Psychologist, Vol. 34,
pp.806-838.
Zinbarg, R. E., Revelle, W., Yovel, I., & Li, W. (2005).
Cronbachs , Revelles , and Mcdonalds : Their relations
with each other and two alternative conceptualizations of reliability. Psychometrika, Vol.70, No.1, pp.1-11.

You might also like