Professional Documents
Culture Documents
Quelques rappels
Prsentation gnrale
mthodes dites multidimensionnelles
reprsentations gomtriques
Trois mthodes classiques
ACP: Analyse en composantes principales.
Individus et variables numriques
ACM: Analyse des correspondances multiples
Individus et codages de valeurs qualitatives.
AFC: Analyse factorielle des correspondances.
tableaux de frquence
Un exemple:
Exemple
Taille
Exemple
Taille
Exemple
Age (4 classes)
Activit (8 classes)
Exemple
Age
Activit
Exemple
Age
Activit
Exemple
Age
Activit
Exemple
Age
Activit
Exemple
Taille
Poids
Age
Exemple
Taille
Poids
Age
Exemple
Taille
Poids
Age
Taux cholestrol
Consommation dalcool
CSP
Sexe
???
Exemple
???
Espace multi-dimensionnel
Multi-paramtrique
Comment qualifier, quantifier, et surtout
visualiser ces phnomnes ?
Comment diffrencier les interactions
essentielles des rencontres fortuites ?
Exemple
projections de ces hyper-nuages sur
des plans.
Ombres portes
Dformer le moins possible
= Conserver linertie
Choisir le bon angle
= Axes factoriels
Exemple
Baguette
Allongement
Aplatissement
75% de la variance
1 plan = 2 axes
Prcisions
Variance, dispersion, inertie ???
Individus et modalits superposs
Une reprsentation est une
description, pas une preuve !!!
Mthode et hop!
Avec 2 I\J htel locat propri parent amis tente villag divers total
variables
CSP Agricult 160 28 0 321 36 141 45 65 796
Lieux de
vacances Salaris 35 34 1 178 8 0 4 0 260
Patrons 700 354 229 959 185 292 119 140 2978
Cad sup 961 471 633 1580 305 360 162 148 4620
Cadre 572 537 279 1689 206 748 155 112 4298
moy
Ouvriers 783 1114 387 4052 497 1464 525 387 9209
Non 741 332 327 1789 311 236 102 102 3940
actifs
Total 4535 3377 2232 12780 1858 3856 1336 1105 31079
Et hop!
Patrons
Agriculteur htel
villag locat
tente
Employs
divers
Total
Cadre moy
total
Cadre sup
Ouvriers amis
Non actifs
propri
parent
Personnels
Salaris
Autres actif
Moins vite
chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108
chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108
chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108
sombre
chtainnoisette
roux
verts
blond
bleus
noir
chauve
marrons
blanc
Encore plus fort
chtain sombre
noisette
roux
verts
blond
bleus
chauve noir
marrons
blanc
Est-ce bien clair ?
Chtains
noisette
chtain
Blonds bleus
sombre
noisette
Verts roux
Mais roux
verts
Axe 1: des blond
cheveux blonds
aux cheveux
bleus
roux ou des chauve noir
yeux bleus aux
yeux verts?
Axe 2: du blanc marrons
au chtain, ou
des yeux blanc
marrons aux
yeux noisette?
Un peu daide les contributions absolues
La contribution absolue
rsume le poids dune
modalit par rapport
lensemble des modalits
dcrites par un facteur.
On les lit en colonne et par
facteur. Total = 100
Elle permet de reprer les
modalits qui ont le plus
cr le facteur.
F1: Y verts, C roux, C noirs
F2: Y noisette, Y marrons, C
blancs, C chtain & sombre
Un peu plus daide: les contributions relatives.
Facteur 1:
Femmes aux yeux
noisettes, aux
cheveux chtains
ou sombres,
Hommes aux yeux
marrons, chauves
ou cheveux
blancs.
Facteur 2:
Les irlandais vs les
scandinaves.
Reprsentation graphique des contributions absolues
Les rectangles se
lisent dans la
dimension du facteur.
Contributions
horizontales,
seulement facteur 1
Contributions
verticales, facteur 2
Carr (blanc), un peu
des deux, mais pas
beaucoup.
Et les yeux verts?
Et les chauves?
Interprter : prudence
difficile interprter quand le nombre de questions et de
modalits est trs lev
tendance mettre en valeur les carts sur les modalits
aux effectifs faibles.
Linterprtation dun mapping (reprsentation graphique
des modalits sur 2 axes) est assez dlicate.
Le fait que deux modalits soient proches ne signifie pas
ncessairement quelles sont en attraction. Il est rare en
effet que tous les liens entre modalits puissent tre
reprsents en deux dimensions.
Interprter : prudence
lanalyse factorielle peut se rduire une technique
permettant de reprsenter de manire suggestive le
maximum dinformations sur les attractions entre
modalits
Elle devient une technique exploratoire qui permet un
premier dbroussaillage des donnes et qui peut
suggrer des pistes fructueuses.
Il faut toujours revenir aux tris croiss ou aux profils
de modalits pour vrifier les suggestions de
lapproche graphique.
Le fait que lAFC rvle peu dattractions entre
variables peut tre un rsultat intressant en tant que
tel.
Dcrire / prdire
Echantillon Probabilits
1 rponse = 1 estimateur
(valeur dune moyenne, dune variance, dune
proportion, dun pourcentage)
+ un intervalle de confiance
+ une probabilit
Dcrire / prdire
Description: la moyenne est m.
Prdiction: jai une probabilit p de
ne pas me tromper en affirmant que
la moyenne est comprise entre (m-i)
et (m+i).
Dcrire / prdire
Hypothses sur les distributions des
paramtres de la population totale,
des paramtres des chantillons
Ambiguts des thories en
probabilit.
Les probabilits, ce nest pas intuitif.
Benzecri: prouver lexistence de Dieu.