Professional Documents
Culture Documents
Dcembre 2013
http://www.lareq.com
papier
prsente
un
outil
danalyse
des
donnes,
lanalyse
factorielle
des
Abstract
This paper focuses on the correspondence analysis, based on the notion of chi-squared
distance metric.
Introduction
Lanalyse en composantes principales [ACP] permet de produire dans un espace de faible
dimension une ou plusieurs reprsentations graphiques cherchant mettre en vedette les
principales caractristiques des donnes initiales [Mavita, 2013, One pager vol.8, num. 11]. De ce
fait, son efficacit dpend fortement de la nature des donnes, dans le sens o cette mthode
devient inapproprie en face des donnes qualitatives. Cest sous cet angle que ce papier propose
un outil alternatif de lanalyse factorielle, lanalyse factorielle des correspondances [AFC],
permettant de trancher sur lanalyse des donnes qualitatives. Contrairement lACP, lAFC
sintresse plus au lien entre ces variables qu leur intensit.
Prcisons dores et dj que cette mthode des correspondances, permettant la visualisation et la
hirarchisation de linformation a t mise au point ds 1941 par Louis Guttman. Cependant, cest
en 1962 que le statisticien franais Jean Paul Benzcri
correspondances particulire sur base de la mtrique de Chi deux. Depuis lors, cette mthode
est devenue trs pratique du fait de sa particularit de faire recours une distribution classique.
Lobjet de ce papier est de procder une prsentation succincte et pratique de lAFC et plus
particulirement de lAFC de Benzcri. A cet effet, deux sections seront retenues dont la premire
rappelle la mtrique de Chi deux et la seconde expose la mthode AFC.
Jean Paul Benzcri est un statisticien franais n en 1932 et il est le fondateur de lcole franaise danalyse
des donnes.
Yannick Mavita Mukwanga
Laboratoire dAnalyse Recherche en Economie Quantitative
101
modalits.
Ainsi, cest la recherche de lexplication de liaison entre deux variables qualitatives que Pearson
a pu proposer la mtrique de Chi deux. Ce test est connu sous le nom dindpendance des
caractres tudis dans un tableau de contingence. . Nous en prsentons la dmarche.
Considrons un tableau de contingence1 de deux variables polytomiques X et Y sur un chantillon
de taille T et des modalits respectives
et
Tableau 1
Modalits de Y
Total
Modalits de X
Total
Ainsi, on peut prsenter ce tableau sur base des frquences qui sont dtermines par :
et
Pour plus de dtails sur le tableau de contingence, nous pensons Tombola (2013, p. 55).
102
la probabilit conditionnelle.
Il convient de noter que lavantage de cette transformation est quelle autorise une pondration de
chaque frquence par la frquence marginale de sorte que la comparaison entre deux lignes ne
soit pas influence par la diffrence de leurs effectifs.
Tableau 2 : Tableau des profils colonnes
Modalits de Y
Distribution
Modalits de X
marginale selon X
Total
Pour question de dtails et dapplications numriques sur la mthode AFC, lire Delgado (2001) et Zouhhad
(2002).
Yannick Mavita Mukwanga
Laboratoire dAnalyse Recherche en Economie Quantitative
103
et les
de coordonnes
, les probabilits
Figure 1
F2
j2
jn
Bj
F1
j3
j1
Cette carte factorielle indique que les modalits j1 et j2 sont voisines, la modalit jn est proche du
barycentre tandis que la modalit j3 est un point extrme et oppos tous les autres.
Reprsentation graphique des profiles lignes
Cependant, lAFC en tant une des mthodes danalyse factorielle cherche des axes principaux en
projetant tous ces points sur un mme plan. Le premier axe factoriel
des moindres carrs qui ajuste tous
points
suit naturellement la direction dinertie maximale de tous ces points, passe par
dtermine dans
et lquation est
Comme les profiles colonnes, les profiles lignes peuvent tre galement reprsents dans
et n axes reprsentant les catgories. Chaque profil ligne donne un point de coordonnes les
probabilits conditionnelles de chaque ligne du tableau des profils lignes.
104
En projetant ces points sur un mme plan, le premier axe factoriel F3 est donn par la droite des
moindres carrs qui ajuste ces points. Cette droite est dans ce plan de projection, suit
naturellement la direction dinertie maximale de tous ces points, passe par
dtermine dans
et lquation est
.
Figure 2
F4
i2
in
Bi
F3
i3
i1
Cette carte factorielle montre que les modalits i1 et i2 sont voisines, la modalit in est proche du
barycentre tandis que la modalit i3 est un point extrme et oppos tous les autres.
Dualit des profils lignes et des profils - colonnes
Il sagit de reprsenter sur mme graphique les deux cartes factorielles prcdentes.
Figure 3
F2
F4
j1
i1
F1
Bj
j3
i3
Bi
i2
F3
j2
105
Les zones encercles selon les proximits montrent les correspondances entre les modalits. La
figure indique que la zone M fait apparatre deux sous zones particulires avec videmment deux
correspondances particulires.
Somme toute, le prsent papier a donn une vision plus ou moins simplifie de la mthode
danalyse factorielle des correspondances (AFC). Par ailleurs, il reste une srie de mthodes
danalyse factorielle qui seront abordes dans des publications ultrieures, et ce sera galement
de fournir des illustrations plus pratiques laide des logiciels appropris.
106
Rfrences bibliographiques
DELGADO Jean pierre, 2001, Mathmatiques appliques, ESKA, 2 Edition, Paris, 165p.
KLOTZ Grard, 2000, Mathmatiques pour les sciences conomiques et sociales, Edition
Presses universitaires de France, Paris, 344p.
PEARSON, Karl, 1901, On Lines and Planes of Closest Fit to Systems of points in Space,
Philosophical Magazine, 2 (6): 559 572.
107