You are on page 1of 98

ECOLE PREPARATOIRE EN SCIENCES ECONOMIQUES COMMERCIALES ET

DES SCIENCES DE GESTION DE CONSTANTINE





Introduction la
Statistique Descriptive

DAKHMOUCHE Meghlaoui


Ecole Prparatoire en Sciences Economiques
Commerciales et des Sciences de Gestion
de Constantine
Introduction la Statistique Descriptive
Dr. Meghlaoui Dakhmouche
Anne Universitaire 2010/2011
Table des matires
1 Notions fondamentales de la statistique descriptive 4
1.1 Concepts de base de la statistique descriptive . . . . . . . . . 4
1.1.1 Population - Individu . . . . . . . . . . . . . . . . . . . 5
1.1.2 Caractre - Modalit . . . . . . . . . . . . . . . . . 5
1.1.3 Tableau statistique . . . . . . . . . . . . . . . . . . . . 6
1.2 Les dirents types de caractres . . . . . . . . . . . . . . . . 6
1.2.1 Caractre qualitatif . . . . . . . . . . . . . . . . . . . . 6
1.2.2 Caractre quantitatif . . . . . . . . . . . . . . . . . . . 7
1.2.3 Notion de classe . . . . . . . . . . . . . . . . . . . . . . 8
2 Les distributions statistiques une dimension 9
2.1 Prsentation gnrale des tableaux statistiques . . . . . . . . . 9
2.2 Les distributions caractre qualitatif . . . . . . . . . . . . . 11
2.2.1 Reprsentation par tuyaux dorgue . . . . . . . . . . . 11
2.2.2 Reprsentation par secteur . . . . . . . . . . . . . . . . 12
2.3 Les distributions caractre quantitatif . . . . . . . . . . . . . 13
2.3.1 Variable discrte . . . . . . . . . . . . . . . . . . . . . 13
2.3.2 Variable continue . . . . . . . . . . . . . . . . . . . . . 18
3 Caractristiques de tendance centrale 26
3.1 Les direntes caractristiques de tendance centrale . . . . . . 27
3.1.1 Le mode . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.2 Calcul du mode pour une distribution en classes din-
ngales amplitudes . . . . . . . . . . . . . . . . . . . . 28
3.1.3 La mdiane . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.4 La mdiale . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2 La moyenne arithmtique . . . . . . . . . . . . . . . . . . . . . 34
3.2.1 Moyenne arithmtique simple . . . . . . . . . . . . . . 35
1
3.2.2 Moyenne arithmtique pondre . . . . . . . . . . . . . 35
3.3 Calcul pratique de la moyenne arithmtique . . . . . . . . . . 36
3.3.1 Cas dune variable discrte . . . . . . . . . . . . . . . . 36
3.3.2 Cas dune variable continue . . . . . . . . . . . . . . . 38
3.3.3 Proprits de la moyenne arithmtique . . . . . . . . . 40
3.4 Autres types de moyennes . . . . . . . . . . . . . . . . . . . . 42
3.4.1 Moyenne gomtrique . . . . . . . . . . . . . . . . . . . 42
3.4.2 Proprits de la moyenne gomtrique . . . . . . . . . 43
3.4.3 Moyenne harmonique . . . . . . . . . . . . . . . . . . . 44
3.4.4 Gnralisation de la notion de moyenne . . . . . . . . . 45
3.4.5 Proprits compares des direntes moyennes . . . . . 46
4 Les caractristiques de dispersion 48
4.1 Les direntes caractristiques de dispersion . . . . . . . . . . 48
4.1.1 Ltendue . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.1.2 Les quartiles et lintervalle interquartile . . . . . . . . . 49
4.1.3 Gnralisation de la notion de quartile . . . . . . . . . 51
4.1.4 Lcart absolu moyen . . . . . . . . . . . . . . . . . . . 52
4.1.5 La variance et lcart-type . . . . . . . . . . . . . . . . 52
4.2 Calcul pratique de la variance et de lcart-type . . . . . . . . 53
4.2.1 Cas dune variable discrte . . . . . . . . . . . . . . . . 53
4.2.2 Cas dune variable continue . . . . . . . . . . . . . . . 56
4.3 Autres caractristiques dune distribution statistique . . . . . 60
4.3.1 Coecient de variation . . . . . . . . . . . . . . . . . . 60
4.3.2 Courbe de concentration . . . . . . . . . . . . . . . . . 61
4.3.3 Indice de concentration ou indice de Gini . . . . . . . . 62
4.3.4 Calcul pratique de lindice de Gini . . . . . . . . . . . 63
4.4 Les caractristiques de forme . . . . . . . . . . . . . . . . . . . 65
4.4.1 Coecient dasymtrie (skewness) . . . . . . . . . . . . 65
4.4.2 Coecient daplatissement (Kurtosis) . . . . . . . . . . 67
5 Distributions statistiques deux dimensions 68
5.1 Prsentation gnrale dun tableau double entre . . . . . . 68
5.2 Distributions marginales . . . . . . . . . . . . . . . . . . . . . 70
5.3 Distributions conditionnelles . . . . . . . . . . . . . . . . . . . 71
5.3.1 Proprits des frquences marginales et conditionnelles 72
5.4 Reprsentations graphiques des distributions deux caractres 73
5.4.1 Cas des caractres qualitatifs . . . . . . . . . . . . . . 73
2
5.4.2 Cas des caractres quantitatifs . . . . . . . . . . . . . . 73
5.5 Covariance entre deux variables statistiques . . . . . . . . . . 75
5.5.1 Covariance . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.5.2 Coecient de corrlation . . . . . . . . . . . . . . . . . 76
5.5.3 Dirents genres de corrlation . . . . . . . . . . . . . 77
5.6 Ajustement linaire ou droite des moindres carrs . . . . . . . 78
6 Les sries chronologiques 83
6.1 Gnralits . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.2 Analyse empirique dune srie chronologique . . . . . . . . . . 85
6.2.1 Dcomposition dune srie chronologique . . . . . . . . 85
6.2.2 Les modles de composition des trois composantes . . . 86
6.2.3 Choix du modle . . . . . . . . . . . . . . . . . . . . . 87
6.3 Les indices statistiques . . . . . . . . . . . . . . . . . . . . . . 87
6.3.1 Les indices lmentaires . . . . . . . . . . . . . . . . . 88
6.3.2 Les indices synthtiques . . . . . . . . . . . . . . . . . 90
6.3.3 Les dirents types dindices statistiques . . . . . . . . 91
3
INTRODUCTION
Dun point de vue pdagogique, il nous apparat ncessaire de distinguer
trois tapes naturelles pour lenseignement des probabilits et des statis-
tiques : la statistique descriptive, le calcul des probabilits lmentaires et
thoriques, et la statistique thorique ou infrencielle. La statistique des-
criptive vise rsumer quantitativement et graphiquement linformation re-
cueillie sur un ensemble concret au moyen dune investigation exhaustive.
Son but nest pas dexpliquer mais de dcrire et de dgager lessentiel de lin-
formation vhicule par les donnes. Elle synthtise numriquement et gra-
phiquement cette information. Le calcul de probabilit, quant lui, a pour
objet ltude des phnomnes alatoires. Il est fond sur une axiomatique ap-
proprie et se dveloppe suivant une logique mathmatique trangre toute
proccupation concrte immdiate. Enn, la statistique thorique se rapporte
ltude de linduction statistique, cest dire lanalyse de linformation ob-
tenue partir dun mcanisme alatoire. Tandis que la statistique descriptive
"constate" laide dune analyse exhaustive, en gnral coteuse et parfois
impossible entreprendre, la statistique mathmatique vise cerner les ca-
ractristiques de la population mre sur la base de ltude dchantillons
alatoires. Le dveloppement historique de la connaissance dans ce domaine
a plus ou moins respect ces trois tapes. Souvent, on introduit la notion
de probabilit comme une frquence relative avant mme la dnition de la
notion lmentaire de frquence. Les lments du langage des probabilits
tels que, ensemble fondamental, vnement, probabilit, sont des gnralisa-
tions naturelles des notions de population, caractre, frquence. De mme,
la variable alatoire est un prolongement naturel de la variable statistique.
Comme le cheminement de la pense va de lobservation des faits vers leur
idalisation abstraite, la statistique descriptive apparat, par les problmes
quelle pose et les limites de ses possibilits, comme une introduction heuris-
tique pour aborder le calcul des probabilits.
La statistique descriptive est, comme son nom lindique, une mthode des-
criptive base sur les observations recueillies propos de ltude de certains
phnomnes dordre conomique, sociologique ou exprimental. Lanalyse des
donnes se fait essentiellement dans deux directions principales. La premire,
dessence gomtrique, consiste les classer et les disposer de la manire la
plus explicite possible, sous forme de tableaux, de graphiques ou de courbes.
4
La seconde a pour but de rsumer linformation contenue dans les donnes
laide de certaines caractristiques numriques. Ces deux axes ne sont pas
exclusifs et sont souvent utiliss simultanment.
Le premier chapitre est consacr aux dnitions des notions et des concepts
fondamentaux de la statistique descriptive. Dans le deuxime chapitre nous
proposons une mthode gnrale pour ltude des distributions statistiques
une dimension. Nous y verrons les direntes faons de prsenter des donnes
statistiques et de les visualiser graphiquement. Au troisime chapitre on sin-
tresse trs sommairement ltude des distributions deux caractres. On
y dnit aussi les notions de distributions marginales et conditionnelles. Le
quatrime chapitre de ce cours est consacr ltude des caractristiques de
tendance centrale. Et on insistera plus spcialement sur le calcul pratique de
la moyenne arithmtique et on introduira dautres types de moyennes. Quant
aux caractristiques de dispersion, elles seront abordes dans lavant-dernire
partie de cet expos o on dnira les notions fondamentales de variance et
dcart-type. De mme, il y sera fait allusion aux caractristiques de forme.
Enn on termine cet expos par la dnition de la notion de srie chronolo-
gique et par la dnition des indices statistiques et leurs calculs pratiques.
5
Chapitre 1
Notions fondamentales de la
statistique descriptive
La statistique est une mthode danalyse des ensembles comportant un
grand nombre dlments. Cest une science qui permet de traiter et dana-
lyser les rsultats des mesures eectues sur les individus dune population
relativement un certain nombre de caractres. Les rsultats des mesures
sont, en gnral, appels observations. Pour extraire linformation contenue
dans ces observations il est ncessaire dutiliser un certain nombre dopra-
tions logiques qui caractrisent les mthodes statistiques. Les lments soumis
lanalyse doivent appartenir un ensemble homogne et tre dlimits avec
prcision. Par la suite, ces lments sont ordonns et classs relativement
leurs mesures.
Pour tre ecace, les mthodes statistiques doivent formaliser simple-
ment le problme pos en utilisant des concepts mathmatiques abstraits.
Par exemple, tous les lments classs dans le mme sous-groupe sont consi-
drs comme quivalents.
1.1 Concepts de base de la statistique des-
criptive
Les observations constituent la source principale de linformation sta-
tistique. Le statisticien doit dnir avec prcision lensemble tudi et les
critres qui permettent sa description chire. De ses origines historiques,
la statistique a conserv en partie la terminologie de la dmographie. On y
6
parle, par exemple, de population pour dsigner un ensemble, et dindividus
pour nommer les lments de cet ensemble.
1.1.1 Population - Individu
Denition 1 On appelle population lensemble des units statistiques ou in-
dividus tudis par le statisticien.
Remarque 2 Chaque observation porte sur un individu. On emploiera les
termes de population et dindividu aussi bien lorsquil sagit dun ensemble
dtres humains (population algrienne la date du recensement, lves dun
tablissement scolaire, etc) ou dun ensemble dobjets inanims (production
de pices dune usine, stocks de marchandises, etc) ou mme dun ensemble
plus ou moins abstrait (ensemble des accidents de la route survenus au cours
dun mois de lanne, ensemble des jours ouvrables de lanne, etc). Les in-
dividus dune population peuvent donc tre, selon les cas, des tres humains,
des objets ou des vnements.
1.1.2 Caractre - Modalit
Pour dcrire une population on classe les individus qui la composent en
un certain nombre de sous-ensembles. Le classement peut se faire relative-
ment un ou plusieurs caractres. Par exemple, pour dcrire la population
algrienne on pourra retenir les caractres sexe, ge, tat matrimonial, ca-
tgorie socioprofessionnelle, etc. Sil sagit du personnel dune entreprise, le
sexe et lge restent des caractres intressants et on pourra y rajouter la
profession, la qualication, etc.
Le choix dun caractre dtermine le critre qui servira classer les indi-
vidus de la population en deux ou plusieurs sous-ensembles. Le nombre de
ces derniers correspond aux direntes situations possibles ou modalits du
caractre. An que le classement dun individu soit toujours possible sans
ambigut, les direntes modalits dun caractre doivent tre la fois ex-
haustives et incompatibles. Un individu ne doit appartenir qu un et un
seulement des sous-ensembles obtenus. Ainsi, le caractre sexe a deux mo-
dalits qui dterminent dans une population le sous-ensemble des individus
masculins et le sous-ensemble des individus fminins. Le nombre de modalits
selon lesquelles on considre un caractre est x plus ou moins convention-
nellement.
7
1.1.3 Tableau statistique
Ltude dune population suivant un seul caractre est rsume dans un
tableau statistique une seule dimension ou simple entre, dont chaque
case correspond lune des modalits du caractre. Dans chacune de ces
dernires on y inscrit le nombre dindividus prsentant cette modalit. Mais
une population peut aussi tre tudie simultanment suivant deux ou plu-
sieurs caractres. Le nombre de cases, donc de sous-ensembles incompatibles
et exhaustifs, est alors gal au produit du nombres de modalits des di-
rents caractres. Ainsi, le croisement du caractre sexe avec le caractre tat
matrimonial (en deux modalits) nous donne le tableau suivant :
Etat Matr/Sexe Homme Femme
Mari H. maries F. maries
Non Mari H.n. maries F.n. maries
Il est possible de croiser trois caractres, quatre caractres ou plus. Ainsi,
on obtient des tableaux statistiques trois, quatre dimensions ou plus. Mais
en pratique, on ne peut croiser un trop grand nombre de caractres, car le
nombre de cases du tableau augmente trs vite et son utilisation devient
fastidieuse.
1.2 Les dirents types de caractres
Un caractre peut tre qualitatif ou quantitatif. Les mthodes danalyse
dune population dirent suivant la nature du caractre tudi.
1.2.1 Caractre qualitatif
Denition 3 Un caractre qualitatif est un caractre dont les modalits chappent
la mesure.
Remarque 4 On ne peut pas quantier numriquement les caractres qua-
litatifs, on ne peut que les constater. Par exemple, le sexe, la nationalit, la
profession, etc.
Example 5 Considrons la rpartition par nationalit des trangers vivants
en France (en Milliers) :
Nat. All Bene Esp Ita Pol Port Autres Eu Alg Mar Tun Autres Etr
Nb 25 60 120 80 100 210 140 650 310 60 420
8
1.2.2 Caractre quantitatif
Denition 6 Un caractre est quali de quantitatif lorsquil est mesurable
ou reprable.
Denition 7 A chaque unit statistique ou individu correspond un nombre
reprsentant la mesure ou la valeur du caractre. Cette mesure est alors ap-
pele variable statistique et est note en gnral r.
Remarque 8 Les modalits du caractre sont les valeurs possibles ou en-
semble de variation de la variable statistique.
Une variable statistique peut tre discrte ou continue.
Variable statistique discrte
Denition 9 Une variable statistique est dite discrte lorsquelle ne peut
prendre que des valeurs isoles dans son intervalle de variation.
Remarque 10 Les valeurs prises par une variable discrte sont en gnral
des valeurs entires, par exemple le nombre denfants charge dans une
famille.
Example 11 Considrons la rpartition du nombre de ventes dun certain
type dappareil sur les jours ouvrables de lanne. Soit r la variable statistique
"le nombre de ventes par jour ouvrable" :
Nombre de ventes r 0 1 2 3 4 5 6
Nombre de jours :
i
24 57 75 53 33 7 4
Variable statistique continue
Denition 12 Une variable statistique est dite continue lorsquelle peut prendre
toutes les valeurs lintrieur de son intervalle de variation.
Remarque 13 Le nombre des valeurs possibles dune variable statistique
continue est toujours inni. Ainsi, on prendra pour modalits du caractre
des classes de valeurs.
Example 14 La taille, le poids, lge dune personne. La dure de vie dune
lampe, la distance sparant deux points.
9
Remarque 15 Souvent, la distinction entre variable statistique continue et
variable statistique discrte est dicile. Par exemple, toute mesure est dis-
crte du fait de sa prcision limite, alors que la nature intrinsque de la
variable statistique est continue (par exemple le diamtre dune pice usi-
ne).
Rciproquement, une variable de nature discrte pouvant prendre un trs
grand nombre de valeurs possibles, est considre comme une variable sta-
tistique continue et ainsi ses valeurs sont regroupes en classes.
Example 16 Le salaire dun ouvrier, les bnces annuels des entreprises,
la date de naissance dune personne, la note dun tudiant, le diamtre dune
pice usine.
1.2.3 Notion de classe
Pour tudier une variable statistique continue on divise son ensemble de
variation en intervalles ou classes de valeurs ayant une amplitude constante
ou variable.
Example 17 La variable "ge" est souvent dcoupe en classes quinquen-
nales : 0 moins de 5 ans, de 5 ans moins de 10 ans, etc.
Remarque 18 Le choix du nombre de classes et de leur amplitude se fait
en fonction de leectif de la population et de la prcision des mesures. Les
eectifs des classes doivent tre signicatifs pour liminer les variations ac-
cidentelles qui apparaissent lorsquon considre de trop faibles eectifs. Par
ailleurs, le nombre de classes doit aussi tre susant et leurs amplitudes
pas trop grandes pour ne pas masquer certaines particularits de la distribu-
tion statistique. Toute diminution inconsidre du nombre de classes ou toute
augmentation exagre des amplitudes de celles-ci, induit une perte dinfor-
mation.
En conclusion, on remarque que la statistique descriptive porte sur une
population sur laquelle aucun modle statistique nest dni a priori. On ne
dispose que dun ensemble de mesures sans structuration a priori.
10
Chapitre 2
Les distributions statistiques
une dimension
Aprs la dnition du caractre tudier sur la population, les observa-
tions obtenues sont ordonnes et forment ainsi une distribution statistique.
Les distributions les plus simples sont naturellement celles relatives un seul
caractre. Elles sont gnralement prsentes sous forme de tableaux statis-
tiques simple entre. Linformation synthtise dans un tableau statistique
nest pas souvent facile obtenir par simple lecture. Alors la reprsentation
de cette distribution statistique sous forme de diagramme rend plus simple
laccs cette information. Selon que le caractre tudi soit qualitatif ou
quantitatif, et suivant quil soit de nature discrte ou continue, on est amen
utiliser des reprsentations graphiques de dirents types.
2.1 Prsentation gnrale des tableaux sta-
tistiques
Considrons une population 1 compose de : individus. Sur chacun de ces
individus on eectue une observation concernant un caractre C. Supposons
que le caractre C admet / modalits :
`
1
. `
2
. .... `
k
Lopration prliminaire est la mise en ordre des observations. Cela consiste
classer chacun des : individus de la population dans les / sous-ensembles
11
dnis par les diverses modalits du caractre C. Pour chaque modalit `
i
,
i = 1. 2. .... / , on inscrira dans le tableau statistique le nombre dlments
(i.e. le cardinal) du sous-ensemble de la population correspondant.
Denition 19 Le cardinal du sous-ensemble de la population correspondant
la modalit `
i
est appel eectif ou frquence absolue et est not :
i
.
Remarque 20 Tous les individus de la population prsentant la modalit
`
i
sont considrs comme quivalents relativement au caractre C. On ne
retient alors que leur nombre.
Denition 21 La frquence relative ,
i
de la modalit `
i
est dnie par le
rapport :
,
i
=
:
i
:
Remarque 22 La frquence ,
i
est la proportion des individus de la popula-
tion prsentant la modalit `
i
. Alors, les frquences permettent de comparer
les structures des populations deectifs dirents relativement un carac-
tre commun. Les modalits sont incompatibles, i.e. deux modalits distinctes
dun caractre donn ne peuvent pas tre prsentes chez un mme individu en
mme temps . Elles sont aussi exhaustives, i.e. chaque individu de la popula-
tion est class dans un et un seul sous-groupe correspondant une modalit.
Donc chaque observation gure dans un et un seul sous-groupe de la popula-
tion.
Consquence
La somme des eectifs :
i
est gale leectif total : de la population ,
i.e.
: = :
1
+ :
2
+ ... + :
k
=
k

i=1
:
i
Alors, il en rsulte que la somme des frquences relatives ,
i
est gale 1 , i.e.
k

i=1
,
i
=
k

i=1
:
i
:
=
1
:
k

i=1
:
i
= 1
12
Un tableau statistique dcrivant une population 1 relativement un carac-
tre C, sera prsent sous la forme gnrale suivante :
Modalits du caract. C Eectifs :
i
`
1
:
1
`
2
:
2
... ...
`
i
:
i
... ...
`
k
:
k
2.2 Les distributions caractre qualitatif
La prsentation dun tableau statistique concernant un caractre qualita-
tif suit les rgles gnrales. Une premire synthse de linformation contenue
dans un tableau statistique est fournie par un graphique. Le principe de la
reprsentation graphique des caractres qualitatifs est la proportionnalit des
surfaces reprsentatives aux eectifs (ou aux frquences) reprsents. Il existe
deux types de reprsentations frquemment utilises.
2.2.1 Reprsentation par tuyaux dorgue
Cette reprsentation fait gurer les direntes modalits du caractre
sous forme de rectangle ou de cylindres dont la base est constante et dont la
hauteur est proportionnelle leectif (ou la frquence).
Remarque 23 Gnralement, les direntes modalits sont ordonnes sur
le graphique dans le sens des eectifs croissants ou dcroissants.
Example 24 Reprenons lexemple 5 et achons la reprsentation par tuyaux
dorgue de la distribution des trangers en France.
13
Fig. 2.1 Rpartition par tuyaux dorgues des trangers en France
2.2.2 Reprsentation par secteur
Dans cette reprsentation les aires et par consquent les angles au centre
sont proportionnels aux eectifs (ou aux frquences) des direntes modali-
ts. En eet,
o
i
= 360

:
i
:
= 360

,
i
Example 25 Mieux que les tuyaux dorgue, ce mode de guration permet de
visualiser limportance relative de chaque modalit dans lensemble de la po-
pulation. Pour des comparaisons dans lespace, la reprsentation par secteur
permet de mieux faire apparatre les dirences entre les classes dindividus
en valeurs absolues et en valeurs relatives.
Example 26 Reprenons lexemple 5 et achons la reprsentation par sec-
teur de la distribution des trangers en France.
14
Fig. 2.2 Reprsentation par secteur des trangers en France
2.3 Les distributions caractre quantitatif
2.3.1 Variable discrte
Tableau statistique
Les direntes modalits sont constitues par les valeurs possibles r
i
de la
variable statistique r. En face de chacune de ces valeurs on inscrit leectif :
i
correspondant. Pour permettre les comparaisons entre populations deectifs
dirents, le tableau est complt par lindication de la frquence relative ,
i
correspondant chaque valeur r
i
.
Denition 27 La frquence cumule croissante, note 1
i
, est la somme des
frquences correspondantes aux valeurs de la variable statistique infrieures
ou gales r
i
, i.e.
1
i
= ,
1
+ ,
2
+ ... + ,
i
=
i

h=1
,
h
15
La distribution statistique dune variable quantitative discrte est en g-
nral prsente dans un tableau statistique tel que :
`odc|it c: 1,,ccti,: 1: cnc:cc: 1: cnc:cc: cn:n| cc:
r
1
:
1
,
1
1
1
= ,
1
r
2
:
2
,
2
1
2
= ,
1
+ ,
2
... ... ... ...
r
i
:
i
,
i
1
i
= ,
1
+ ,
2
+ ... + ,
i
... ... ... ...
r
k
:
k
,
k
1
k
= 1
1otc| : 1
Tableau statistique : variable discrte
Remarque 28 La frquence cumule croissante 1
i
indique la frquence ou la
proportion des individus de la population pour lesquels la variable statistique
r est infrieure ou gale r
i
.
Denition 29 Leectif cumul croissant, not `
i
, est dni, similairement
la frquence cumule croissante, par la formule suivante :
`
i
= :
1
+ :
2
+ ... + :
i
=
i

h=1
:
h
Proposition 30 La frquence cumule croissante et leectif cumul crois-
sant sont lis par la relation :
1
i
=
`
i
:
Dmonstration : En eet,
`
i
=
i

h=1
:
h
==
`
i
:
=
i

h=1
:
h
:
=
i

h=1
,
h
= 1
i
Denition 31 Il est parfois utile de dnir les eectifs cumuls dcroisants,
nots `
0
i
, tels que :
`
0
i
= :
k
+ :
k1
+ ... + :
i
16
Remarque 32 Leectifs cumul dcroissant est le rsultat de laddition, de
proche en proche, des eectifs dune distribution observe en commenant par
le dernier eectif, i.e.
`
0
k
= :
k
; `
0
k1
= :
k
+ :
k1
; ... ; `
0
i
= :
k
+ :
k1
+ ... + :
i
En dautres termes, `
0
i
est le nombre dindividus prsentant une mesure du
caractre r infrieure ou gale r
i
, i.e.
`
0
i
= nombre de valeurs de r _ r
i
Il est clair que lon peut dnir les frquences cumules dcroissantes,
notes G
i
, telles que :
G
i
=
`
0
i
:
=
:
k
+ :
k1
+ ... + :
i
:
= ,
k
+ ,
k1
+ ... + ,
i
Example 33 Considrons la distribution des jours douverture dun maga-
sin suivant le nombre de ventes dun certain appareil .
Nombre de ventes r
i
nombre de jours ,
i
`
i
1
i
0 24 0. 096 24 0. 096
1 57 0. 228 81 0. 324
2 75 0. 300 156 0. 624
3 53 0. 212 209 0. 836
4 33 0. 132 242 0. 968
5 4 0. 016 246 0. 984
6 3 0. 012 249 0. 996
7 1 0. 004 250 1. 00
Totaux 250 1
Reprsentation graphique Dans le cas des sries statistiques discrtes il
existe deux types de reprsentations graphiques.
17
La reprsentation en diagramme en btons
Denition 34 La reprsentation en diagramme en btons est la reprsenta-
tion de la distribution des frquences ou des eectifs dune variable discrte.
A chaque valeur r
i
porte en abscisse on fait correspondre un segment ver-
tical de longueur proportionnelle leectif :
i
ou la frquence ,
i
de cette
valeur.
Example 35 Reprenons lexemple prcdent et reprsentons la distribution
des jours de lanne en fonction du nombre de ventes.
Fig. 2.3 Reprsentation en diagramme en batns
Courbe cumulative
Denition 36 La courbe cumulative est la reprsentation graphique des ef-
fectifs cumuls ou des frquences cumules. Cest un graphique en escalier
dont les paliers horizontaux ont pour ordonnes respectivement 1
i
ou `
i
. Les
marches de lescalier correspondent aux valeurs possibles r
i
de la variable
statistique r et sont des hauteurs proportionnelles aux eectifs cumuls ou
aux frquences cumules.
18
Fig. 2.4 Courbe cumulative
Example 37 Reprenons lexemple 31 et traons la courbe cumulative de la
distribution des jours de lanne en fonction du nombre de ventes.
Remarque 38 La courbe cumulative est la reprsentation graphique de la
proportion 1(r) des individus de la population pour lesquels la valeur de la
variable statistique est infrieure ou gale r . Cette fonction, dnie pour
toute valeur de r , est appele fonction cumulative ou fonction de rpartition.
Elle est constante dans chaque intervalle sparant deux valeurs de la variable
statistique, i.e. 1(r) = 1
i
, r
i
_ r < r
i+1
, elle est nulle pour toutes les valeurs
de r infrieures la plus petite valeur des r
i
et est gale 1 pour toutes les
valeurs de r suprieures la plus grande valeur des r
i
. On peut aussi dnir
la fonction de rpartition de la variable statistique r, note aussi 1(r), comme
la ligne brise qui joint les milieux des paliers de la courbe cumulative.
Example 39 On reprend lexemple prcdent et on trace la fonction de r-
partition sur le graphe de la courbe cumulative.
19
Fig. 2.5 Fonction de rpartition
2.3.2 Variable continue
Tableau statistique
Dans le cas dun caractre quantitatif continu r, ltablissement du ta-
bleau de frquences implique deectuer au pralable une rpartition en
classes des donnes. Cela ncessite de dnir le nombre de classes attendu
et donc lamplitude associe chaque classe ou intervalle de classe. En rgle
gnrale, on choisit des classes de mme amplitude. Pour que la distribution
des frquences ait un sens, il faut que chaque classe comprenne un nombre
(:
i
) susant de valeurs. Diverses formules empiriques permettent dtablir
le nombre de classes pour un chantillon de taille :. Les plus frquemment
utilises sont :
La rgle de Sturge : `o:/:c dc c|c::c: = 1 + (3. 3 ln :)
La rgle de Yule : `o:/:c dc c|c::c: = 2. 54
4
_
:
Lamplitude c des classes est obtenue de la manire suivante :
c =
r
max
r
min
`o:/:c dc c|c::c:
20
avec r
max
et r
min
respectivement la plus grande et la plus petite valeur de r
dans la srie statistique.
Les modalits du caractre sont reprsentes par les direntes classes. Si lon
dsigne respectivement par c
i1
et c
i
les extrmits infrieure et suprieure
de la classe :

i , on dnit cette dernire comme suit :


c
i1
_ r < c
i
Remarque 40 Les frquences et les frquences cumules sont dnies de
la mme faon que dans le cas discret, ainsi que les eectifs et les eectifs
cumuls.
En gnral, les rsultats des observations dune variable statistique conti-
nue r sont disposs dans un tableau statistique tel que :
C|c::c :

i 1i: dc: c|c::c: :


i
,
i
`
i
1
i
1 c
0
_ r < c
1
:
1
,
1
`
1
1
1
2 c
1
_ r < c
2
:
2
,
2
`
2
1
2
3 c
2
_ r < c
3
:
3
,
3
`
3
1
3
... ... ... ... ... ...
i c
i1
_ r < c
i
:
i
,
i
`
i
1
i
... ... ... ... ... ...
/ c
k1
_ r < c
k
:
k
,
k
`
k
= : 1
k
= 1
1otc|
k

i=1
:
i
= :
k

i=1
,
i
= 1
Tableau statistique : Cas continu
Reprsentation graphique
Comme pour les variables discrtes il existe pour les variables statistiques
contines deux types de reprsentations graphiques utiliss frquemment.
Histogramme
Denition 41 Lhistogramme est la reprsentation graphique de la distri-
bution des eectifs ou des frquences dune variable statistique continue. A
chaque classe de valeurs de la variable statistique porte en abscisse, on fait
correspondre un rectangle bas sur cette classe. Alors chaque modalit est re-
prsente par un rectangle dont laire (et non la hauteur) est proportionnelle
la frquence ou leectif de cette classe.
21
Remarque 42 En gnral les classes de valeurs ont la mme amplitude.
Mais dans le cas contraire, on prendra pour unit damplitude n le 1.G.C.1
des direntes amplitudes c
i
= c
i
c
i1
. Ensuite, on exprime lamplitude des
classes dans la nouvelle unit telle que :

i
=
c
i
n
=
c
i
c
i1
n
Par suite, la hauteur du rectangle reprsentatif de chaque classe sera gale
/
i
=
f
i
A
i
de telle sorte que la surface du rectangle soit gale la frquence de
la classe correspondante, i.e.
o =
i
_
,
i

i
_
= ,
i
Example 43 Considrons la rpartition des ouvriers dune entreprise sui-
vant leur salaire mensuel net :
C|c::c dc oc|ci:c(1) :
i
,
i
`
i
1
i
12000 _ r < 14000 26 0. 186 26 0. 186
14000 _ r < 16000 33 0. 235 59 0. 421
16000 _ r < 20000 64 0. 458 123 0. 879
20000 _ r < 24000 7 0. 050 130 0. 929
24000 _ r < 30000 10 0. 071 140 1. 000
1otc| 140 1. 000
Traons lhistogramme des frquences de cette distribution.
22
Fig. 2.6 Histogramme des frquences
Denition 44 La courbe des frquences est la fonction en escalier dont les
paliers sont constitus par les bases suprieures des rectangles formant lhis-
togramme des frquences.
Denition 45 Le polygne des frquences est la ligne brise qui relie les
milieux des cots suprieurs des rectangles de lhistogramme des frquences.
Example 46 Reprenons lexemple de la rpartition des ouvriers dune en-
treprise suivant leur salaire mensuel net et traons la courbe des frquences
et le polygne des frquences de cette distribution.
23
Fig. 2.7 Courbe des frquences et polygne des frquences
Au moment de ltude des lois de probabilit on comprendra mieux la si-
gnication de cette courbe des frquences. Elle reprsente une approximation
(ou estimation) de la distribution de probabilit thorique de la population
relativement au caractre tudi.
Courbe cumulative
Denition 47 Comme pour les variables discrtes, la coube cumulative ou
histogramme des frquences cumules, est la reprsentation graphique de la
fonction cumulative ou fonction de rpartition 1(r).
Les observations tant regroupes en classes, on ne connait de cette fonc-
tion que les valeurs correspondant aux extrmits suprieures des classes,
i.e.
1 (c
i
) = 1
i
i = 1. 2. .... /
Elle est estime par le polygne des frquences cumules qui est la ligne brise
joignant les milieux des cots suprieurs des rectangles de lhistogramme des
frquences cumules.
24
Remarque 48 Dans une certaine littrature on parle de frquence "cumule
descendante" G
i
et de frquence "cumule ascendante" 1
i
. Cette dnomina-
tion implique une confusion. En eet, on a tendance admettre implicitement
que G
i
est gale 1 1
i
, ce qui nest le cas. Par contre, quand on parle de
fonction cumulative 1(r) qui est dnie sur lensemble R en entier et telle
que lim
x!+1
1(r) = 1 et lim
x!1
1(r) = 0, on peut dnir la fonction G(r) telle
que :
G(r) = 1 1(r)
Ainsi, sachant que 1(`
e
) =
1
2
alors G(`
e
) =
1
2
, i.e. lintersection des fonc-
tions 1(r) et G(r) a lieu au point dabscisse r = `
e
. Lutilit de la fonction
G(r) intervient dans la dtermination graphique de la mdiane condition
que les tracs de 1(r) et G(r) soient trs prcis.
Example 49 Repenons lexemple 41 et traons lhistogramme des frquences
cumules et le polygne des frquences cumules.
Fig. 2.8 Histogramme et polygne des frquences cumules
Conclusion 50 La notion de courbe des frquences (resp. la courbe des fr-
quences cumules) dcoule de lide suivante : si les amplitudes des classes
diminuent et si le nombre des observations est susamment grand pour vi-
ter les irrgularits dues la faiblesse des eectifs, alors lhistogramme des
25
frquences (resp. lhistogramme des frquences cumules) tend, en tant que
fonction en escalier, vers une courbe continue appele courbe des frquences
(resp. courbe des frquences cumules) et qui, la limite, converge vers la den-
sit de la distribution thorique (resp. la fonction de rpartition thorique) de
la population.
Example 51 On a mesur la taille en centimtres dune population de 8585
hommes. Les rsultats sont rsums dans le tableau suivant :
r r < 145 [145. 148[ [148. 151[ [151. 154[ [154. 157[ [157. 160[ [160. 163[
:
i
2 4 14 41 83 169 394
`
i
2 6 20 61 144 313 707
[163. 166[ [166. 169[ [169. 172[ [172. 175[ [175. 178[ [178. 181[ [181. 184[
669 990 1223 1329 1230 1063 640
1376 2366 3589 4918 6148 7211 7851
[184. 187[ [187. 190[ [190. 193[ [193. 196[ [196. 199[ [199. 202[ 202 _ r
392 202 84 33 16 5 2
8243 8445 8529 8562 8578 8583 8585
En traant la courbe des frquences de cette distribution statistique, on
peut remarquer que lallure de cette courbe a une forme qui se raproche trs
nettement de celle dune courbe normale. De mme, si on trace la courbe
des frquences cumules de cette distribution, on remarque que son allure est
trs voisine de celle de la fonction de rpartition dune loi normale.
.
26
Fig. 2.9 Courbe des frquences
Fig. 2.10 Courbe des frquences cumules
27
Chapitre 3
Caractristiques de tendance
centrale
La reprsentation graphique des distributions statistiques a permis une
premire synthse de linformation contenue dans les tableaux statistiques.
On peut comparer les direntes sries statistiques par simple comparaison
de leurs reprsentations graphiques. Cette comparaison reste toutefois in-
commode et devient quasi-impossible si elle doit porter sur un grand nombre
de distributions statistiques. Il est inconcevable de classer 1500 candidats
un concours de grandes coles au vu de la reprsentation graphique des 1500
sries de 25 notes obtenues aux diverses preuves par chaque candidat. Il
est videmment plus commode de calculer une note moyenne pour chacun
des candidats et ensuite faire un classement. La tendance centrale caractrise
lordre de grandeur de la variable statistique. Quant la notion de dispersion,
elle mesure la uctuation des observations autour de cette tendance centrale.
Le statisticien Yule a prcis les proprits souhaitables que doit satisfaire
une caractristique de tendance centrale ou de dispersion : elle doit tre d-
nie de faon objective ; elle doit dpendre de toutes les observations ; elle doit
avoir une signication concrte ; elle ne doit pas tre sensible aux uctuations
dchantillonnage ; elle doit tre simple calculer et doit se prter aisment
au calcul algbrique.
Trois caractristiques de tendance centrale sont couremment utilises : le
mode, la mdiane et la moyenne arithmtique. Dans certains cas,usage dautres
caractristiques de tendance centrale telles que la moyenne gomtrique ou la
moyenne harmonique, simpose. Mais la caractristique de tendance centrale
la plus couramment utilise est la moyenne arithmtique.
28
3.1 Les direntes caractristiques de tendance
centrale
3.1.1 Le mode
Denition 52 Le mode dune distribution statistique, quon notera `
o
, est
la valeur de la variable statistique pour laquelle la frquence est la plus grande.
Remarque 53 Le mode est donc la valeur de la variable statistique la plus
frquente.
Dtermination graphique
Lorsque la variable est discrte le mode est dni avec prcision. Si, par
exemple, deux valeurs successives de la variable statistique ont la mme fr-
quence maximum, on dit quil y a un intervalle modal dont les extrmits
correspondent ces deux valeurs.
Dtermination du mode : variable discrte
Lorsque la variable est continue, la dtermination du mode est beaucoup
moins prcise car les frquences dpendent du dcoupage en classe. Lutili-
sation de la courbe des frquences ajuste sur lhistogramme, bien que peu
29
prcise, conduit une bonne estimation du mode dans le cas o les classes
sont dgale amplitude.
Dtermination du mode : variable continue
Il est possible dtablir une formule dinterpolation linaire pour le calcul
exacte du mode dans le cas dune rpartition en classes damplitude quel-
conque.
3.1.2 Calcul du mode pour une distribution en classes
dinngales amplitudes
Considrons une srie statistique continue regroupe en classes dampli-
tudes ingales. Le mode est alors dtermin lintrieure de la classe modale
(correspondant la frquence ou leectif le plus grand). On peut identier
le mode comme la valeur mdiane de la classe modale ou bien eectuer une
interpolation linaire pour obtenir la valeur exacte du mode comme suit :
`
o
= c
i1
+
c
i
(:
i
:
i1
)
(:
i
:
i+1
) (:
i
:
i1
)
(3.1)
o
c
i1
est la limite infrieure de la classe modale
30
c
i
est lamplitude de la classe modale
:
i
est leectif de la classe modale
:
i1
est leectif de la classe infrieure la plus proche de la classe modale
:
i+1
est leectif de la classe suprieure la plus proche de la classe modale
En adoptant les notations suivantes :

m
= :
i
:
i1
et
s
= :
i
:
i+1
la relation (3.1) peut tre prsente telle que :
`
o
= c
i1
+
c
i

m
Example 54 Soit r la variable statistique taille dune exploitation (en
ha) . Les rsultats dobservations sont rsums dans le tableau statistique
suivant :
r :
i
`
i
]0; 2[ 2 2
[2; 6[ 20 22
[6; 21[ 80 102
[21; 41[ 50 152
[41; 81[ 98 250
[81; 121[ 30 280

280
La valeur du mode est calcule telle que :
- Valeur approche :
La classe modale [41; 81[ est deectif :
i
= 98, do
`
o
= 61 hectares
- Valeur exacte :
On utilise la formule dinterpolation linaire :
`
o
= 41 +
40 48
48 + 68
= 41 +
1920
116
= 57. 55 hectares
avec c
i1
= 41, c
i
= 40,
m
= 98 50 = 48 et
s
= 98 30 = 68
Remarque 55 Une distribution de frquences peut prsenter un seul mode
(distribution unimodale) ou plusieurs modes (distribution bi ou trimodale).
31
Proprits
Les principaux avantages du mode font quil est facile dterminer et
quil a une signication immdiate. Par contre sa dtermination nest pas
assez prcise dans le cas continu. Elle dpend en partie du dcoupage en
classes. Ainsi, il est sensible aux uctuations dchantillonnage et se prte
trs mal au calcul algbrique.
3.1.3 La mdiane
Denition 56 La mdiane dune distribution statistique, note `
e
, est la
valeur de la variable statistique telle que le nombre des observations qui pr-
sentent une valeur infrieure `
e
soit gal au nombre des observations qui
prsentent une valeur suprieure `
e
.
Remarque 57 La mdiane partage en deux eectifs gaux les observations
ranges par ordre croissant ou dcroissant. La mdiane est la valeur `
e
de
la variable statistique pour laquelle la frquence cumule est gale
1
2
, i.e.
1 (`
e
) =
1
2
Dtermination pratique
Cas dune variable discrte
Dans une srie statistique compose de 2/ + 1 observations et dispose
par ordre croissant ou dcroissant, la valeur de la (/ + 1)
i eme
observation
correspond la mdiane.
Example 58 Considrons une srie statistique compose de 9 mesures :
18; 17; 13; 9; 8; 24; 19; 23; 28. Alors, la srie dispose par ordre croissant donne :
8; 9; 13; 17; 18; 19; 23; 24; 28. Donc la mdiane est `
e
= 18.
Dans le cas dune srie statistique comportant 2/ observations, il ny a
pas proprement parler de mdiane. Ainsi, on introduit la notion dintervalle
mdian dont les extrmits correspondent aux valeurs de la /
ieme
et de la
(/ + 1)
i eme
observations.
32
Example 59 Supposons que la srie statistique soit : 8; 9; 13; 15; 17; 18; 19; 23; 24; 28.
On convient de retenir pour valeur mdiane la valeur `
e
telle que :
1 (r
i
) <
1
2
< 1 (r
i
+)
i.e telle que :
,
1
+ ,
2
+ ... + ,
i1
<
1
2
< ,
1
+ ,
2
+ ... + ,
i
Graphiquement cette dtermination est simple partir de la courbe des
eectifs cumuls ou celle des frquences cumules.
Example 60 Considrons une distribution statistique reprsente par le ta-
bleau suivant :
r
i
0 1 2 3 4 5 6
`
i
24 81 156 205 240 248 250
1
i
0. 096 0. 324 0. 624 0. 820 0. 960 0. 992 1. 00
Dtermination graphique de la mdiane : variable discrte
Cas dune variable continue
Dans le cas dune variable statistique continue la mdiane est dnie avec
exactitude. Mais, en raison du regroupement par classe on ne peut gn-
ralement que la situer lintrieur dune classe quon qualiera de classe
mdiane.
33
Denition 61 La classe :

i est une classe mdiane si :


1
i1
<
1
2
< 1
i
Dtermination exacte de la mdiane La solution de lquation
1(`) =
1
2
est trs simple graphiquement. On va montrer que la valeur de
`
e
est la mme que celle obtenue par le calcul algbrique.
Proposition 62 Lestimation de la valeur exacte de la mdiane peut tre
obtenue par interpolation linaire lintrieur de la classe mdiane laide
de la relation suivante :
`
e
= c
i1
+ c
i
n
2
`
i1
:
i
o c
i1
est la borne infrieure de la classe mdiane
c
i
est lamplitude de la classe mdiane
`
i1
est leectif cumul de la classe prcdant la classe mdiane
:
i
est leectif de la classe mdiane
: est leectif total de la population tudie
Dmonstration : Considrons la gure suivante :
Dtermination graphique de la mdiane : variable continue
34
Alors, en utilisant quelques proprits de gomtrie euclidienne on remarque
que :
C` = C
0
+
0
`
Mais en vertu du thorme de Thals :

0
`

0
1
0
=
C
1
=

00
C
00

00
1
00
do

0
` =
0
1
0

00
C
00

00
1
00
et par suite
C` = C
0
+
0
1
0

00
C
00

00
1
00
En remplaant ces quantits par leurs mesures algbriques, on obtient :
C` = c
i1
+ c
i
n
2
:1 (c
i1
)
:1 (c
i
) :1 (c
i1
)
Do
`
e
= c
i1
+ c
i
n
2
`
i1
:
i
Proprits La mdiane rpond assez bien la plupart des conditions
de Yule. Elle sinterprte aisment et se calcule facilement. Elle dpend de
lensemble des observations. La valeur de la mdiane nest pas inuence par
les observations aberrantes. Mais elle est sensible aux uctuations dchan-
tillonnage et elle se prte mal au calcul algbrique en tant que solution de
1(`) =
1
2
.
3.1.4 La mdiale
Denition 63 La mdiale est la valeur de la variable statistique qui divise
en deux la somme des valeurs de la variable.
35
Example 64 Considrons la rpartition des employs dune entreprise selon
leur salaire mensuel net.
oc|ci:c: (cn:o:) :
i
1
i
oo::c dc: :c|ci:c: 1Q
i
: 1c:t cn:n.dc: :c|ci:c:
[800; 900[ 25 0,212 21250 0,164
[900; 1000[ 30 0,466 28500 0,385
[1000; 1100[ 28 0,703 29400 0,613
[1100; 1500[ 25 0,915 32500 0,865
[1500; 2000[ 10 1 17500 1

118 129150
Alors, la mdiale est dterminer par interpolation dans la classe [1000; 1100[,
i.e.
` cdic|c = 1000 + (1100 1000)
0. 5 0. 385
0. 613 0. 385
= 1050. 4 euros
Par comparaison, la mdiane est dtermine par interpolation telle que :
` cdic|c = 1000 + (1100 1000)
0. 5 0. 466
0. 703 0. 466
= 1014. 3 euros
Remarque 65 La mdiale ne peut tre infrieure la mdiane. La mdiale
est dautant suprieure la mdiane que la distribution est plus concentre.
Dans lexemple, lcart mdiale mdiane = 1050. 4 1014. 3 = 36. 1 euros.
Do, le ratio
: cdic|c : cdic:c
ctc:dnc
=
1050. 4 1014. 3
2000 800
= 0. 03
3.2 La moyenne arithmtique
Denition 66 La moyenne arithmtique dune variable statistique r, note
r, est gale la somme des valeurs prises par cette variable divise par le
nombre des observations.
Example 67 Les 8 ouvriers dune petite entreprise ont peru en janvier 1990
les salaires suivants : 7500; 8300; 9100; 9600; 10700; 11300; 12000; 12500 1..
Le salaire moyen des ouvriers de cette entreprise en janvier 1990 est alors :
7500 + 8300 + 9100 + 9600 + 10700 + 11300 + 12000 + 12500
8
= 10125 1.
36
3.2.1 Moyenne arithmtique simple
Denition 68 Considrons une srie statistique comportant : observations
r
1
. r
2
. .... r
i
. .... r
n
. Alors la moyenne arithmtique simple est calcule laide
de lexpression suivante :
r =
r
1
+ r
2
+ ... + r
i
+ ... + r
n
:
=
1
:
n

i=1
r
i
Remarque 69 A chaque valeur prise par la variable statistique correspond
un seul individu. Cette moyenne arithmtique est dite simple par opposition
la moyenne arithmtique pondre.
3.2.2 Moyenne arithmtique pondre
Example 70 Reprenons lexemple prcdent et supposons que les 8 ouvriers
de lentreprise aient peru les salaires suivants : 8300; 8300; 9600; 9600; 9600; 10800; 10800;
12500 1.. Le calcul du salaire moyen peut tre eectu comme prcdem-
ment. Cependant, on aurait pu prsenter les observations dans un tableau
statistique tel que :
Salaire r Eectif :
i
8300 2
9600 3
10800 2
12500 1
1otc| 8
Il serait bien entendu erron de dire que le salaire moyen des ouvriers est :
8300 + 9600 + 10800 + 12500
4
= 10300 1.
Les salaires doivent tre pondrs par les eectifs correspondants, et donc :
r =
2 8300 + 3 9600 + 2 10800 + 12500
8
= 9937. 50 1.
La moyenne ainsi calcule est appele moyenne arithmtique pondre. Les
coecients de pondration sont les frquences absolues des direntes valeurs
de la variable statistique. Ce type de calcul de la moyenne est naturellement
utilis dans le cas dobservations regroupes en classe.
37
Denition 71 Soit r une variable statistique pouvant prendre les / valeurs
r
1
. r
2
. .... r
i
. .... r
k
auquelles correspondent respectivement les / frquences ab-
solues ou eectifs :
1
. :
2
. .... :
i
. .... :
k
. Alors la moyenne arithmtique pond-
re de cette variable a pour expression :
r =
1
:
k

i=1
:
i
r
i
Remarque 72 r peut aussi scrire :
r =
k

i=1
:
i
:
r
i
r =
k

i=1
,
i
r
i
o ,
i
reprsente la frquence relative des direntes valeurs de la variable
statistique. Les ,
i
, i = 1. 2. .... / sont appels coecients de pondration.
3.3 Calcul pratique de la moyenne arithm-
tique
3.3.1 Cas dune variable discrte
Example 73 Reprenons lexemple du nombre de ventes dun certain type
dappareil par jour ouvrable. Le nombre moyen de ventes nest autre que la
moyenne arithmtique des ventes. Pour calculer cette moyenne, il est toujours
possible dutiliser directement la formule de la dnition. Mais souvent on
utilise le tableau statistique o lon dispose les direntes tapes des calculs
tel que :
r
i
:
i
:
i
r
i
0 24 0
1 57 57
2 75 150
3 53 159
4 33 132
5 7 35
6 4 24
1otcnr

k
i=1
:
i
= 253

k
i=1
:
i
r
i
= 557
38
Alors,
r =
1
253
k

i=1
:
i
r
i
=
557
253
- 2. 20
Le nombre moyen de ventes par jour ouvrable est donc 2. 20.
Souvent les calculs qui rsultent de lapplication de la formule de dnition
sur les valeurs brutes, peuvent savrer assez fastidieux. Il est alors possible
dallger ces calculs en procdant une transformation des donnes brutes,
par exemple en choisissant une nouvelle origine r
0
pour la variable statistique
r. On dnit ainsi une nouvelle variable r
0
i
appele variable auxiliaire telle
que :
r
0
i
= r
i
r
0
(3.2)
Thorme 74 En adoptant le changement dorigine r
0
i
= r
i
r
0
, on obtient
la mme relation entre r
0
et r, i.e :
r
0
= r r
0
Dmonstration : En eet, chaque valeur r
i
correspond une nouvelle
valeur r
0
i
. Et daprs (3.2) on a :
:
i
r
0
i
= :
i
r
i
:
i
r
0
i = 1. 2. .... / (3.3)
Et en sommant les / quations (3.3), on obtient :
k

i=1
:
i
r
0
i
=
k

i=1
:
i
r
i

i=1
:
i
r
0
Comme

k
i=1
:
i
= :, alors en divisant par : les deux membres de lgalit
ci-dessus, il vient :
1
:
k

i=1
:
i
r
0
i
=
1
:
k

i=1
:
i
r
i
r
0
Do
r
0
= r r
0
Remarque 75 Ainsi on pourra calculer r
0
et en dduire r.
39
Example 76 Reprenons lexemple 84 ci-dessus et prenons pour nouvelle ori-
gine r
0
= 2. La variable auxiliaire est alors dnie par :
r"
i
= r
i
2
On obtient ainsi le tableau statistique suivant :
r
i
:
i
r
0
i
:
i
r
0
i
0 24 2 48
1 57 1 57
2 75 0 0
3 53 1 53
4 33 2 66
5 7 3 21
6 4 4 16
1otcnr

k
i=1
:
i
= 253

k
i=1
:
i
r
0
i
= 51
Alors, r
0
=
1
n

k
i=1
:
i
r
0
i
=
51
253
- 0. 20.
Do
r = r
0
+ 2 = 2. 20
3.3.2 Cas dune variable continue
La distribution dune variable statistique continue est prsente, en g-
nral, sous forme de classes. La formule de dnition de la moyenne ne peut
tre applique directement car on ne connait pas les valeurs exactes prises
par la variable statistique, mais seulement le nombre dobservations lint-
rieur de chaque classe. On supposera alors que les observations sont rparties
uniformment dans chaque classe. Cest dire nimporte quelle valeur lin-
trieur de la classe peut reprsenter cette dernire. Par convention et sans
trop de perte dinformation, on prendra le centre de la classe comme repr-
sentant. Cette convention implique un biais systmatique dans le calcul de
la moyenne. Le centre de la classe :

i sera not en gnral A


i
, et il est donn
par la relation suivante :
A
i
=
c
i
+ c
i1
2
o c
i
et c
i1
dsignent respectivement la borne suprieure et la borne inf-
rieure de la classe :

i.
40
Ainsi on est ramen au calcul de la moyenne arithmtique dans le cas dune
variable discrte que lon peut eectuer directement partir de la dnition
ou en utilisant une variable auxiliaire.
Example 77 Reprenons la distribution des ouvriers dune entreprise suivant
leur salaire mensuel.
On prendra pour origine le centre de la classe modale, i.e. A
Mo
= 18000. On
remarque aussi que les nombres
i
= A
i
18000, i = 1. 2. .... / sont divisibles
par 1000. Donc on prendra pour variable auxiliaire telle que :
r
0
i
=
A
i
18000
1000
Les calculs seront toujours disposs dans un tableau du genre ci-dessous :
C|c::c dc oc|ci:c :
i
A
i
A
0
i
:
i
A
0
i
12000 _ r < 14000 26 13000 2 52
14000 _ r < 16000 33 15000 1 33
16000 _ r < 20000 64 18000 0 0
20000 _ r < 24000 7 22000 1 7
24000 _ r < 30000 10 27000 2 20
1otc| 140

k
i=1
:
i
r
0
i
= 58
Do
A
0
=
1
148
5

i=1
:
i
A
0
i
=
58
140
- 0. 414
Et par consquent
A = 1000A
0
+ 18000 - 17586 1.
Dune faon gnrale, le choix dune nouvelle origine A
Mo
et dune nou-
velle chelle de mesure n va permettre de rduire le volume des calculs.
On dnit une variable auxiliaire A
0
i
par la transformation linaire :
A
0
i
=
A
i
A
Mo
n
(3.4)
o A
Mo
est, en gnral, le centre de la classe modale et n est le 1GC1 des
amplitudes de classes.
En suivant le mme raisonnement que pour le cas discret, on remarque que
41
si lon adopte le changement de variable (3.4) il existe la mme relation entre
A et A
0
, i.e.
A = nA
0
+ A
Mo
3.3.3 Proprits de la moyenne arithmtique
La moyenne arithmtique rpond assez bien lensemble des conditions
de Yule. Elle se prte facilement au calcul algbrique et a une signica-
tion concrte. Mais elle est sensible aux uctuations dchantillonnage.
La somme algbrique des carts des observations la moyenne est nulle,
i.e.
k

i=1
:
i
(r
i
r) = 0
En eet
k

i=1
:
i
(r
i
r) =
k

i=1
:
i
r
i
r
k

i=1
:
i
= :r :r = 0
La somme des carrs des carts des observations la moyenne est inf-
rieure la somme des carrs des carts par rapport toute autre valeur.
En eet, soit :
o(/) =
k

i=1
:
i
(r
i
/)
2
o o(/) est un polynme du second degr en /.
Le polynme o(/) est minimum au point o sa drive par rapport b
est nulle, i.e.
do(/)
d/
= o
0
(/) = 2
k

i=1
:
i
(r
i
/) = 0
Do
k

i=1
:
i
r
i
/
k

i=1
:
i
= :/
Et par consquent
/ =
1
:
k

i=1
:
i
r
i
= r
42
La moyenne r dune population compose de deux sous-populations 1
1
de moyenne r
1
et 1
2
de moyenne r
2
, sexprime simplement en fonction
de r
1
et r
2
.
Supposons que la population 1 possde un eectif de : individus, et
que les sous-populations 1
1
et 1
2
ont des eectifs respectifs :
1
et :
2
tels
que :
1
+:
2
= :. Soit :
1i
le nombre dindividus de la sous-population 1
1
prsentant la modalit r
i
du caractre et soit :
2i
le nombre dindividus
prsentant la mme modalit dans la sous-population 1
2
. Donc, dans
la population 1 leectif des individus prsentant la modalit r
i
est
:
i
= :
1i
+ :
2i
.
Dautre part
r
1
=
1
:
1
k

i=1
:
1i
r
i
et r
2
=
1
:
2
k

i=1
:
2i
r
i
Alors, la moyenne r de la population est :
r =
1
:
k

i=1
:
i
r
i
=
1
:
1
+ :
2
k

i=1
(:
1i
+ :
2i
) r
i
=
1
:
1
+ :
2
_
k

i=1
:
1i
r
i
+
k

i=1
:
2i
r
i
_
=
:
1
:
1
+ :
2
1
:
1
k

i=1
:
1i
r
i
+
:
2
:
1
+ :
2
1
:
2
k

i=1
:
2i
r
i
Do
r =
1
:
(:
1
r
1
+ :
2
r
2
)
Donc la moyenne de la population totale apparait comme la moyenne
pondre des moyennes des sous populations.
Plus gnralement, pour / populations on a :
r =
1
:
h

i=1
:
i
r
i
43
Positions respectives du mode, de la mdiane et de la moyenne
arithmtique
Pour les distributions symtriques on a :
r = `
e
= `
o
Pour les distributions asymtriques on a deux situations selon que la distri-
bution est plus plate gauche qu droite et vice versa :
r < `
e
< `
o
ou bien `
o
< `
e
< r
3.4 Autres types de moyennes
En plus de la moyenne arithmtique, il existe dautres types de moyennes.
On les rencontre beaucoup moins frquemment, mais leur utilisation est ce-
pendant recommande dans certains cas.
3.4.1 Moyenne gomtrique
Denition 78 La moyenne gomtrique simple dune srie de valeurs r
1
. r
2
. .... r
n
,
note G, est dnie par :
G =
_
n

i=1
r
i
_1
n
(3.5)
Remarque 79 En prenant le logarithme de la relation (3.5), on obtient une
autre formule pour la moyenne gomtrique simple :
ln G =
1
:
n

i=1
ln r
i
(3.6)
Example 80 Considrons une srie de neuf nombres : 18; 17; 13; 9; 8; 24; 19; 23; 28.
Leur moyenne gomtrique est alors :
G = (18 17 13 9 8 24 19 23 28)
1
9
= 16. 36
On peut aussi calculer la moyenne gomtrique en utilisant la formule (3.6).
En eet
ln G =
1
9
ln (18 17 13 9 8 24 19 23 28) = 2. 795
44
Alors
c
ln G
= c
2;795
= 16. 36
Denition 81 Soit r une variable statistique pouvant prendre les / valeurs
r
1
. r
2
. .... r
n
. On dispose dune srie statistique de taille : comportant :
1
fois r
1
, :
2
fois r
2
,..., :
k
fois r
k
. Alors la moyenne gomtrique pondre est
donne par lexpression :
G =
_
k

i=1
r
n
i
i
_
1
n
(3.7)
Remarque 82 En prenant le logarithme dans la formule (3.7) on obtient
une autre expression pour la moyenne gomtrique pondre :
ln G =
1
:
k

i=1
:
i
ln r
i
(3.8)
Par ailleurs, la formule (3.7) peut aussi scrire :
G =
_
k

i=1
r
n
i
n
i
_
=
_
k

i=1
r
f
i
i
_
o ,
i
=
n
i
n
est la frquence de la modalit r
i
.
3.4.2 Proprits de la moyenne gomtrique
Considrons deux sries statistiques de mme taille :, de deux variables
statistiques r et :
r
1
. r
2
. .... r
n
et
1
.
2
. ....
n
Formons les produits .
i
= r
i

i
, i = 1. 2. .... : et calculons moyenne
gomtrique G(.) de ces produits :
G(.) =
_
n

i=1
.
i
_1
n
=
_
n

i=1
r
i

i
_1
n
=
_
n

i=1
r
i
_1
n
_
n

i=1

i
_1
n
= G(r)G()
Donc la moyenne gomtrique du produit r est gale au produit de
moyennes gomtriques de r et de .
45
Formons les rapports
i
=
x
i
y
i
et calculons leur moyenne gomtrique
G() telle que :
G() =
_
n

i=1

i
_1
n
=
_
n

i=1
_
r
i

i
_
_1
n
=
_
n

i=1
r
i
_1
n
_
n

i=1

i
_1
n
=
G(r)
G()
Donc la moyenne gomtrique du rapport
x
y
est le rapport des moyennes
gomtriques de r et de .
3.4.3 Moyenne harmonique
Denition 83 La moyenne harmonique dune srie de valeurs r
1
. r
2
. .... r
n
,
note H, est dnie par lexpression :
H =
:
1
x
1
+
1
x
2
+ ...
1
xn
=
:

n
i=1
1
x
i
Example 84 Reprenons lexemple 88 et calculons la moyenne harmonique :
H =
9
1
18
+
1
17
+
1
13
+
1
9
+
1
8
+
1
24
+
1
19
+
1
23
+
1
28
= 14. 97
Example 85 Un spculateur a consacr pendant 4 annes la mme somme
o lachat de lingots dor aux prix respectifs 5400 ; 5500 ; 5800 et 6400 l le
kg. Le prix moyen dachat du kilogramme dor par le spculateur nest pas la
moyenne arithmtique. En eet, la dpense totale eectue par le spculateur
est 4o. La premire anne il a achet
1
=
S
5400
kg dor, la deuxime anne

2
=
S
5500
kg dor, etc. Au total il a achet la quantit dor suivante :

1
+
2
+
3
+
4
= o
_
1
5400
+
1
5500
+
1
5800
+
1
6400
_
Le prix dachat moyen du kg dor est donc :
1 =
4o

1
+
2
+
3
+
4
=
4
1
5400
+
1
5500
+
1
5800
+
1
6400
= 5750. 6
46
Denition 86 Considrons une variable statistique pouvant prendre les va-
leurs r
1
. r
2
. .... r
k
. Et supposons que lon a obtenu : ralisations de cette
variable avec les eectifs respectifs :
1
. :
2
. .... :
k
tels que

k
i=1
:
i
= :. Alors
la moyenne harmonique pondre est donne par lexpression suivante :
H =
:
n
1
x
1
+
n
2
x
2
+ ...
n
k
xn
=
:

k
i=1
n
i
x
i
Example 87 Une entreprise de transport possde 10 camions qui font la
rotation entre un endroit et un endroit 1. Au cours dune de ces rotations le
trajet 1 (distance 1) a t couvert par ces vhicules aux vitesses moyennes
suivantes :
Vitesse Moy (Km/h) 40 60 70
Nombre de camions 3 5 2
Au total les camions ont parcouru une distance 101. Pour couvrir le trajet
1, 3 camions ont mis un temps 1
1
=
D
40
, 5 camions un temps 1
2
=
D
60
et
les deux autres un temps 1
3
=
D
70
. Au total le temps 1 mis par lensemble des
camions pour parcourir la distance 101 a t :
1 = 31
1
+ 51
2
+ 21
3
= 1
_
3
40
+
5
60
+
2
70
_
Donc, pour lensemble des camions la vitesse moyenne \ a t :
\ =
101
31
1
+ 51
2
+ 21
3
=
10
3
40
+
5
60
+
2
70
= 53. 5 1:,/
3.4.4 Gnralisation de la notion de moyenne
Toutes les moyennes tudies ont t dnies suivant un principe commun.
En eet, pour le calcul de chaque type de moyenne les observations ont
t introduites sous une forme particulire. Par exemple, pour la moyenne
harmonique ce fut linverse des observations, pour la moyenne gomtrique
ce fut leur logarithme. Dune manire gnrale, la dnition dune moyenne
fait intervenir une fonction , des observations.
Denition 88 Soit ,(r) une fonction monotone de la variable statistique
r. On appelle ,moyenne le nombre C dni tel que :
,(C) =
1
:
k

i=1
:
i
,(r
i
) (3.9)
47
Remarque 89 A partir de cette dnition gnrale on retrouve facilement
les formules des direntes moyennes :
1. Si on considre la fonction ,(r) =
1
x
. Daprs la relation (3.9), ,(H) =
1
n

k
i=1
:
i
,(r
i
) o H est la moyenne harmonique. Alors
1
H
=
1
:
k

i=1
:
i
r
i
== H =
:

k
i=1
n
i
x
i
2. Si on prend ,(r) = ln r, alors on retrouve la moyenne gomtrique :
ln G =
1
:
k

i=1
:
i
ln r
i
== G =
_
k

i=1
r
n
i
i
_
1
n
3. La fonction Identit ,(r) = r redonne, bien entendu, la moyenne arith-
mtique r :
r =
1
:
k

i=1
:
i
r
i
4. A partir de cette formule gnrale on peut construire de nouvelles moyennes.
Par exemple, si on considre la fonction ,(r) = r
2
, on dnit ainsi la
moyenne quadratique `Q :
(`Q)
2
=
1
:
k

i=1
:
i
r
2
i
== `Q =

_
1
:
k

i=1
:
i
r
2
i
3.4.5 Proprits compares des direntes moyennes
De toutes les moyennes cest certainement la moyenne arithmtique qui
rpond le mieux aux conditions de Yule. En particulier, elle est dun calcul
ais et rapide, et sa signication est facile concevoir. Les moyennes arith-
mtique et quadratique sont inuences par les lments le plus frquents
de la srie. Au contraire, les moyennes hamonique et gomtrique tendent
rduire linuence des valeurs les plus frquentes en faveur des valeurs les
plus rares. Les moyennes harmonique H, gomtrique G, arithmtique r et
quadratique `Q dune mme srie statistique sont, en gnral, classes dans
lordre suivant :
H _ G _ r _ `Q
48
Example 90 Pour la srie des nombres 18; 17; 13; 9; 8; 24; 19; 23 et 28, les
dirents types de moyennes sont telles que :
H = 14. 97 _ G = 16. 36 _ r = 17. 66 _ `Q = 18. 78
49
Chapitre 4
Les caractristiques de
dispersion
Les caractristiques de dispersion les plus frquemment utilises sont
ltendue, lintervalle interquartile, lcart absolu moyen, la variance et lcart-
type. Ces deux dernires caractristiques sont les plus couramment utilises.
Le calcul de lindice de concentration peut tre recommand dans certains
cas. Ltendue et lintervalle interquartile sont, dans leur principe, du type
de la mdiane. Les observations y interviennent par leurs rangs et non par
leurs valeurs. Lcart absolu moyen et lcart-type, au contraire, font inter-
venir lcart la moyenne arithmtique de chacune des observations. Ceux
sont des moyennes dcart la moyenne. Lindice de concentration repose,
quant lui, sur un principe tout fait dirent.
4.1 Les direntes caractristiques de disper-
sion
4.1.1 Ltendue
Denition 91 Ltendue dune distribution statistique, note n, est la dif-
frence entre la plus grande et la plus petite des valeurs observes, i.e.
n = r
(n)
r
(1)
o r
(n)
= max
i
(r
i
) et r
(1)
= min
i
(r
i
).
50
Proprits
La signication de ltendue est vidente et son calcul est immdiat.
Mais cette caractristique prsente des inconvnients. Elle ne dpend que
des termes extrmes de la srie et elle est donc trs sensibles aux uctua-
tions dchantillonnage. La forme de la distribution entre les extrmes nest
pas prise en compte. Donc, ltendue est une caractristique de dispersion
imparfaite.
4.1.2 Les quartiles et lintervalle interquartile
Pour remdier aux inconvnients de ltendue, on a pens minimiser
linuence des termes extrmes de la srie sur le calcul de la caractristique de
dispersion. Pour cela, on dnit les quartiles Q
1
, Q
2
et Q
3
. Ces derniers sont
les valeurs de la variable statistique telles que, les observations tant ranges
par ordre croissant, un quart de celles-ci est infrieur Q
1
, un quart est
compris entre Q
1
et Q
2
, un quart compris entre Q
2
et Q
3
, et le dernier quart
est suprieur Q
3
. En dautres termes Q
1
, Q
2
et Q
3
sont les valeurs de la
variable statistique pour lesquelles la fonction cumulative est respectivement
est telle que :
1 (Q
1
) = 0. 25 ; 1 (Q
2
) = 0. 50 ct 1 (Q
3
) = 0. 75
Remarque 92 Le deuxime quartile Q
2
est donc gal la mdiane.
Denition 93 On appelle intervalle interquartile, not 1Q, la dirence
entre les valeurs du troisime et du premier quartile, i.e.
1Q = Q
3
Q
1
Remarque 94 Lintervalle interquartile est donc lintervalle qui contient
50% des observations tout en laissant 25% sa droite et 25% sa gauche.
Dtermination pratique des quartiles
Le quartile se dtermine de la mme manire que la mdiane. Soit il
est dtermin graphiquement partir de la courbe des eectifs cumuls ou
celle des frquences cumules, Soit il est calcul par interpolation linaire. La
51
formule de dtermination des quartiles est la mme que celle utilise pour la
dtermination de la mdiane `
e
= Q
2
. En eet,
Q
h
= c
h1
+ c
h
hn
4
`
h1
:
h
o c
h1
est la borne infrieure de la classe contenant le quartile :

/, / =
1. 2. 3. 4
c
h
est lamplitude de la classe contenant le quartile :

/, / = 1. 2. 3. 4
`
h1
est leectif cumul de la classe prcdant celle contenant le quartile
:

/, / = 1. 2. 3. 4
:
h
est leectif de la classe contenant le quartile :

/, / = 1. 2. 3. 4
: est leectif total de la population tudie
Proprits
Les avantages de lintervalle interquartile sont la rapidit de son calcul et
sa signication immdiate. Sa dtermination nest pas prcise et il se prte
mal au calcul algbrique.
Diagramme en bote (ou bote moustaches) Il sagit dun dia-
gramme permettant de positionner les quartiles Q
1
, Q
2
, Q
3
, au moyen de
rectangles de largeur arbitraire, prolongs par des "moustaches" de part et
dautre, de longueur au plus gale une fois et demie Q
3
Q
1
.
Si la plus petite ou la plus grande valeur observe se trouvent lintrieur, on
raccourcit les moustaches correspondantes ; si elles se trouvent lextrieur,
on positionne part les valeurs "aberrantes" qui dpassent des moustaches :
Ces diagrammes sont surtout utiles pour comparer rapidement lallure gn-
rale de plusieurs distributions.
52
4.1.3 Gnralisation de la notion de quartile
Les dciles
Pour obtenir les quartiles on a divis en quatre parties gales leectif de la
srie statistique pralablement ordonne par ordre croissant. Les dciles, au
nombre de 9, sparent leectif de la population tudie en 10 parties gales.
Le premier dcile 1
1
est tel que
1
10
des observations lui est infrieur et dune
faon gnrale
1
10
des observations est compris entre deux dciles successifs
et on a :
1 (1
1
) = 0. 1 ; 1 (1
2
) = 0. 2 ; 1 (1
3
) = 0. 3 ; ...; 1 (1
9
) = 0. 9
Remarque 95 Les dciles sont dtermins de la mme manire que les quar-
tiles. La formule de dtermination des dciles est la mme que celle utilise
pour la dtermination de la mdiane `
e
= Q
2
. En eet,
Q
h
= c
h1
+ c
h
hn
10
`
h1
:
h
o c
h1
est la borne infrieure de la classe contenant le dcile :

/, / = 1. 2. ...
c
h
est lamplitude de la classe contenant le quartile :

/, / = 1. 2. ...
`
h1
est leectif cumul de la classe prcdant celle contenant le dcile :

/,
/ = 1. 2. ...
:
h
est leectif de la classe contenant le quartile :

/, / = 1. 2. ...
: est leectif total de la population tudie
Les percentiles
Pour des sries comportant susamment dobservations on peut dnir les
percentiles tels que 1% des observations est compris entre deux percentiles
successifs, i.e.
1 (1
1
) = 0. 01 ; 1 (1
2
) = 0. 02 ; ...; 1 (1
99
) = 0. 99
Les quantiles
Plus gnralement, on peut dnir les quantiles.
Denition 96 Le quantile dordre c (0 _ c _ 1), not

, est la solution de
lquation 1(r) = c. Ainsi, en dsignant par 1
1
la fonction inverse de la
fonction 1 on a alors :

= 1
1
(c)
53
Remarque 97 Une proportion c des individus de la population possde un
caractre C de mesure infrieure

.
4.1.4 Lcart absolu moyen
Denition 98 Soit r une variable statistique pouvant prendre les / valeurs
r
1
. r
2
. .... r
k
auxquelles correspondent les eectifs respectifs :
1
. :
2
. .... :
k
. Lcart
absolu moyen, not c, est alors la moyenne arithmtique des valeurs absolues
des carts la moyenne arithmtique, i.e.
c =
1
:
n

i=1
:
i
[r
i
r[
Proprits
Lcart absolu moyen satisfait assez bien aux premires conditions de
Yule. Mais il se prte trs mal au calcul algbrique. Lcart absolu moyen est
minimum lorsquon prend les carts par rapport la mdiane.
4.1.5 La variance et lcart-type
Lcart-type sera dni partir des carrs des carts des observations
leur moyenne arithmtique. On dterminera de cette faon une sorte de dis-
tance moyenne des observations la moyenne arithmtique. Cette distance,
au sens mathmatique du terme, servira comme mesure de dispersion de la
variable statistique autour de sa caractristique de tendance centrale.
Denition 99 Considrons une variable statistique r pouvant prendre / va-
leurs r
1
. r
2
. .... r
k
auxquelles correspondent les eectifs :
1
. :
2
. .... :
k
tels que

k
i=1
:
i
= :. Alors la variance de la variable statistique r , note \ c:(r)
ou bien o
2
x
, est la moyenne arithmtique des carrs des carts la moyenne
arithmtique :
\ c: (r) = o
2
x
=
1
:
k

i=1
:
i
(r
i
r)
2
Denition 100 Lcart-type, not o
x
, est gal la racine carre de la va-
riance :
o
x
=
_
\ c: (r) =

_
1
:
k

i=1
:
i
(r
i
r)
2
54
Remarque 101 Lcart-type est appel parfois cart quadratique moyen (1Q`).
Example 102 Considrons la srie des salaires horaires de sept ouvriers
dune entreprise : 30; 45; 51; 62; 70; 78; 84 D.A. Alors
r = 60 1.
Les carts la moyenne arithmtique (r
i
r) sont : 30; 15; 9; 2; 10; 18; 24.
Leurs carrs (r
i
r)
2
sont : 900; 225; 81; 4; 100; 324; 576.
Do
\ c: (r) =
2210
7
= 315. 71 et o
x
=
_
\ c: (r) =
_
315. 71 = 17. 76 1
4.2 Calcul pratique de la variance et de lcart-
type
Les calculs de la moyenne arithmtique et de lcart-type vont gnra-
lement de pair. On conservera le tableau dj utilis dans le calcul de la
moyenne.
4.2.1 Cas dune variable discrte
Calcul au moyen de la formule brute
Example 103 Considrons le tableau statistique suivant et calculons lcart-
type.
r
i
:
i
:
i
r
i
r
i
r :
i
(r
i
r)
2
1 25 25 2. 18 136. 81
2 55 110 1. 18 76. 582
3 75 225 0. 18 2. 43
4 50 200 0. 82 33. 62
5 35 175 1. 82 115. 934
6 10 60 2. 82 79. 524
1otcnr

k
i=1
:
i
= 250

k
i=1
:
i
r
i
= 795

k
i=1
:
i
(r
i
r)
2
= 444. 9
Leectif : = 250 et r = 3. 18, alors
\ c:(r) = o
2
x
= 1. 78 ct o
x
=
_
1. 78 = 1. 335
Notons que mme pour une distribution statistique aussi simple que celle
tudie, le calcul de lcart-type est assez long et fastidieux
55
Calcul au moyen de la formule dveloppe
Il est possible de dvelopper la formule de dnition de la variance telle
que :
\ c: (r) =
1
:
k

i=1
:
i
(r
i
r)
2
=
1
:
k

i=1
:
i
_
r
2
i
2rr
i
+ r
2
_
=
1
:
k

i=1
:
i
r
2
i

2r
:
k

i=1
:
i
r
i
+
r
2
:
k

i=1
:
i
Do
\ c: (r) =
1
:
k

i=1
:
i
r
2
i
r
2
(4.1)
Remarque 104 La relation (4.1) est appele formule dveloppe de la va-
riance.
Remarque 105 Reprenons lexemple 111 et calculons lcart-type :
r
i
:
i
:
i
r
i
:
i
r
2
i
1 25 25 25
2 55 110 220
3 75 225 675
4 50 200 800
5 35 175 875
6 10 60 360
1otcnr

k
i=1
:
i
= 250

k
i=1
:
i
r
i
= 795

k
i=1
:
i
r
2
i
= 2955
Alors , r = 3. 18 et \ c:(r) = o
2
x
= 11. 82 (3. 18)
2
= 1. 71.
Do
o
x
=
_
1. 71 = 1. 31
Remarque 106 Le rsultat ainsi obtenu est plus prcis que celui obtenu par
la mthode prcdente, car lapproximation nintervient qu travers le terme
r. Il est encore possible de simplier les calculs en utilisant une translation
dorigine.
56
Calcul avec changement de variable
Considrons le changement de variable (changement dorigine) suivant :
r
0
i
= r
i
r
0
(4.2)
Nous avons dj tabli quil existe la mme relation entre r
0
et r, i.e.
r
0
= r r
0
(4.3)
Do, en retranchant les relations (4.2) et (4.3) membre membre, on ob-
tient :
r
0
i
r
0
= r
i
r
Par suite, et daprs la dnition de la variance :
o
2
x
=
1
:
k

i=1
:
i
(r
i
r)
2
=
1
:
k

i=1
:
i
_
r
0
i
r
0
_
2
= o
x
0
Thorme 107 La valeur de lcart-type est invariante par translation sur
lorigine de la variable statistique.
Example 108 On considre toujours lexemple 111. Prenons pour nouvelle
origine de la variable statistique r
0
= 3 et considrons le changement de
variable r
0
i
= r
i
3. On obtient alors le tableau statistique suivant :
r
i
:
i
r
0
i
:
i
r
0
i
:
i
r
02
i
1 25 2 50 100
2 55 1 55 55
3 75 0 0 0
4 50 1 50 50
5 35 2 70 140
6 10 3 30 90
1otcnr

k
i=1
:
i
= 250

k
i=1
:
i
r
0
i
= 45

k
i=1
:
i
r
2
= 435
Alors, r
0
= 0. 18 do r = 0. 18 + 3 = 3. 18
Et
\ c: (r") = o
2
x"
=
435
250
(0. 18)
2
= 1. 70
Do
o
x
= o
x
0 = 1. 3
57
4.2.2 Cas dune variable continue
Les observations lintrieur dun mme intervalle sont reprsentes par
la valeur mdium A
i
(centre de la classe :

i) dnie telle que :


A
i
=
c
i
+ c
i1
2
o c
i
et c
i1
dsignent respectivement les extrmits suprieure et infrieure
de la classe :

i.
Ainsi la variable A
i
joue le mme rle quune variable discrte aecte dun
eectif gale au nombre des valeurs de la variable statistique appartenant
lintervalle [c
i1
. c
i
[. On ramne ainsi le calcul de la moyenne et de lcart-
type dans le cas continu celui utilis dans le cas discret. La moyenne est
alors A =
1
n

k
i=1
:
i
A
i
et la variance est o
2
X
=
1
n

k
i=1
:
i
_
A
i
A
_
2
. Dans
la suite, on ntudiera que la mthode de changement de variable.
Calcul avec changement de variable
Il est souvent intressant de considrer le changement de variable suivant :
A
0
i
=
A
i
A
Mo
n
(4.4)
o n est le 1GC1 des amplitudes des classes et A
Mo
est gnralement le
centre de la classe modale.
Daprs les rsultats prcdents, il existe entre les moyennes A et A
0
la mme
relation que celle entre A
i
et A
0
i
, i.e.
A
0
=
A A
Mo
n
(4.5)
En retranchant les relations (4.4) et (4.5) membre membre, il vient :
A
0
i
A
0
=
A
i
A
Mo
n

A A
Mo
n
=
A
i
A
n
Par suite, en remplaant (A
i
A) par n
_
A
0
i
A
0
_
dans la dnition de o
2
X
,
on obtient :
o
2
X
=
1
:
k

i=1
:
i
_
A
i
A
_
2
=
n
2
:
k

i=1
:
i
_
A
0
i
A
0
_
2
= n
2
o
2
X
0
Do
o
2
X
= n
2
o
2
X
0
58
Thorme 109 Si A
i
et A
0
i
sont en relation fonctionnelle telle que A
i
=
nA
0
i
+ A
Mo
, alors o
X
et o
X
0 sont tels que :
o
X
= no
X
0
Example 110 Reprenons lexemple 85 de la distribution des ouvriers dune
entreprise suivant leur salaire mensuel.
C|c::c dc oc|ci:c :
i
A
i
A
0
i
:
i
A
0
i
:
i
A
02
i
12000 _ r < 14000 26 13000 2 52 104
14000 _ r < 16000 33 15000 1 33 33
16000 _ r < 20000 64 18000 0 0 0
20000 _ r < 24000 7 22000 1 7 7
24000 _ r < 30000 10 27000 2 20 40
1otc| 140

k
i=1
:
i
r
0
i
= 58 184
Le centre de la classe modale est A
Mo
= 18000. Alors le changement de
variable eectu est A
0
i
=
X
i
18000
1000
. Ainsi, A
0
= 0. 414 do A = 17586.
Par ailleurs, \ c: (A
0
) = o
2
X
0 = 1. 143, do
o
X
= 10
3
o
X
0 = 1069
Correction de Sheppard
Lorsque les observations sont regroupes par classe, lhypothse de la
concentration au centre de la classe des observations se situant dans le mme
intervalle (i.e. quand le centre de la classe est substitu aux direntes valeurs
observes) implique une approximation dans le calcul de lcart-type. Pour le
calcul de la moyenne arithmtique en gnral les erreurs se compensent, alors
que pour celui de lcart-type elles se rajoutent . Si la distribution statistique
est unimodale et support compact (i.e. si la courbe de la distribution est
tangente laxe des abscisses aux extrmits), alors on peut corriger la valeur
de lecart-type calule partir des observations regroupes en classe, avec la
formule propose par W.F. Sheppard :
o
corrig e
=
_
o
2
X

n
2
12
o n reprsente le 1GC1 de lamplitude des classes.
59
Proprits de lcart-type
Lcart-type satisfait assez bien lensemble des conditions de Yule. Il
tient compte de toutes les observations. Il se prte facilement au calcul alg-
brique. Cest la caractristique de dispersion la moins sensible aux uctua-
tions dchantillonnage.
Proprits de la variance
La variance dune population 1 compose de deux sous-populations 1
1
et 1
2
de moyennes respectives r
1
et r
2
, et de variances respectives o
2
1
et o
2
2
,
peut sexprimer simplement en fonction de r
1
, r
2
, o
2
1
et o
2
2
. Supposons que
leectif de la population 1 soit : et que les eectifs des sous-populations
sont respectivement :
1
et :
2
tels que :
: = :
1
+ :
2
et :
i
= :
1i
+ :
2i
i = 1. 2. .... /
Par dnition, la variance de la sous-population 1
1
a pour expression :
o
2
1
=
1
:
1
k

i=1
:
1i
(r
1i
r
1
)
2
Que lon peut mettre sous la forme :
o
2
1
=
1
:
1
k

i=1
:
1i
(r
1i
r)
2
(r
1
r)
2
(4.6)
De mme, la variance de la sous-population 1
2
a pour expression :
o
2
2
=
1
:
2
k

i=1
:
2i
(r
2i
r
2
)
2
que lon peut mettre sous la forme :
o
2
2
=
1
:
2
k

i=1
:
2i
(r
2i
r)
2
(r
2
r)
2
(4.7)
60
Par ailleurs, la variance de la population 1 est dnie telle que :
o
2
=
1
:
k

i=1
:
i
(r
i
r)
2
=
1
:
k

i=1
(:
1i
+ :
2i
) (r
i
r)
2
=
1
:
k

i=1
:
1i
(r
i
r)
2
+
1
:
k

i=1
:
2i
(r
i
r)
2
=
:
1
:
_
1
:
1
k

i=1
:
1i
(r
1i
r)
2
_
+
:
2
:
_
1
:
2
k

i=1
:
2i
(r
2i
r)
2
_
Et daprs les relations (4.6) et (4.7), la vriance o
2
peut tre crite telle que :
o
2
=
:
1
:
_
o
2
1
+ (r
1
r)
2
_
+
:
2
:
_
o
2
2
+ (r
2
r)
2
_
Finalement
o
2
=
1
:
_
:
1
o
2
1
+ :
2
o
2
2
_
+
1
:
_
:
1
(r
1
r)
2
+ :
2
(r
2
r)
2
_
(4.8)
La relation (4.8) se gnralise aisment une population constitue dun
nombre ni / quelconque de sous-populations. En eet, en dsignant par :
i
,
i = 1. 2. .... /, les eectifs des sous-populations 1
i
tels que :
: =
h

i=1
:
i
et :
i
=
k

j=1
:
ij
La variance totale de la population 1 est alors :
o
2
=
1
:
h

i=1
:
i
o
2
i
+
1
:
h

i=1
:
i
(r
i
r)
2
Ainsi, on vient de dmontrer le thorme suivant :
Thorme 111 La variance totale dans une population constitue dun nombre
ni quelconque de sous-populations, est une somme de la moyenne des va-
riances dans les sous-populations et de la variance entre les sous-populations,
i.e
o
2
=
1
:
h

i=1
:
i
o
2
i
+
1
:
h

i=1
:
i
(r
i
r)
2
61
o r
i
, i = 1. 2. .... / est la moyenne arithmtique dans la sous-population :

i,
r est la moyenne arithmtique de la population totale et o
2
i
, i = 1. 2. .... / est
la variance de la sous-population :

i
Denition 112 Le terme
1
n

h
i=1
:
i
o
2
i
est appel variance intra-groupe et
est note o
2
intra
. Le terme
1
n

h
i=1
:
i
(r
i
r)
2
est appel variance inter-groupe
et est not o
2
inter
.
Remarque 113 La variance totale o
2
peut tre exprime alors telle que :
o
2
= o
2
intra
+ o
2
inter
Dune manire gnrale, la variance dune population compose de plusieurs
sous-populations rsulte de deux facteurs : la variabilit interne chaque
sous-population et la variabilit entre les direntes sous-populations.
4.3 Autres caractristiques dune distribution
statistique
4.3.1 Coecient de variation
En gnral, lcart-type et la moyenne sexpriment dans la mme unit
de mesure que la variable statistique. Or, on peut avoir comparer des dis-
persions de distributions qui ne sont pas exprimes dans la mme unit de
mesure ou bien qui dirent par leurs moyennes. Alors, on introduit une
caractristique de dispersion relative.
Denition 114 On appelle coecient de variation, et on note C\ , le rap-
port de lcart-type la moyenne arithmtique, i.e.
C\ =
o
r
Remarque 115 Le coecient de variation est un nombre sans dimension.
Il est par consquent indpendant des units de mesure choisies.
Example 116 Les distributions des salaires dans deux entreprises semblables
1
1
et 1
2
ont les caractristiques suivantes :
r
1
= 19600 1 et o
1
= 2500 1
62
r
2
= 18000 1 et o
2
= 1400 1
Les coecients de variation sont donc :
C\
1
=
2500
19600
= 0. 1275 et C\
2
=
1400
18000
= 0. 0778
Supposons que lon dsire comparer ces distributions avec celle observe
propos dune entreprise amricaine comparable, avec les caractristiques :
r = 2800 $ ; o = 450 $
C\ =
450
2800
= 0. 0143
4.3.2 Courbe de concentration
La courbe de concentration exige comme pour la mdiale, la connaissance
pour chaque classe du nombre dobservations et de la somme des valeurs
correspondantes.
Soit 1
i
la frquence cumule des observations et 1Q
i
le pourcentage cumul
de la somme des valeurs. Alors, la courbe de concentration est obtenue en
traant le graphe de 1Q
i
(ordonne) en fonction de 1
i
(abscisse). On obtient
alors la courbe suivante :
Courbe de concentration ou courbe de Lorenz
63
Remarque 117 La courbe de concentration ou courbe de Lorenz est no-
tamment utilise en conomie pour mesurer les ingalits de possession de
richesse (on supposera donc que r reprsente un certain bien possd par les
individus de la population). Elle est fabrique de la faon suivante. Soit r
i
une valeur prise par r. On note 1(r) la proportion de la population pour
laquelle r < r
i
(1 est donc la courbe cumulative (fonction de rpartition)
de r). On note 1Q(r
i
) la proportion du bien possd par ces individus par
rapport au bien total. Alors la courbe de Lorenz est la courbe joignant tous
les points (1(r
i
). 1Q(r
i
)). La courbe de Lorenz joint donc toujours le point
(0. 0) au point (1. 1). Elle est situe sous le segment joignant ces deux points.
Denition 118 La diagonale du carr circonscrit la courbe de Lorenz sap-
pelle droite dqui-rpartition.
Remarque 119 La diagonale principale du graphique (droite dquirpartition)
reprsente une distribution parfaitement galitaire. Plus la courbe de concen-
tration scarte de la droite dquirpartition, plus la distribution est ingali-
taire. Dautre part, plus la dispersion est faible plus la courbe de concentration
sapplatit sur la diagonale.
4.3.3 Indice de concentration ou indice de Gini
Cest une mesure de dispersion propose par le statisticien italien Corrado
Gini. Lindice de concentration ou indice de Gini, not G, est une mesure de
dispersion relative dune srie statistique. Cette caractristique ne sapplique
quaux variables statistiques continues et valeurs positives. Son calcul exige
la connaissance pour chaque classe du nombre dobservations et de la somme
des valeurs correspondantes. Lindice de concentration est dni en gnral
partir de la courbe de Lorenz dune variable statistique positive r.
Denition 120 Lindice de Gini dune distribution statistique est le double
de laire de la surface dlimite par la courbe de Lorenz et la premire diago-
nale du carr unit.
Remarque 121 Du fait que 1(r) et 1Q(r) varient dans lintervalle [0. 1]
et quils sont nuls ou gaux 1 en mme temps, la courbe de concentration
sinscrit dans un carr unitaire. Elle se situe en dessous de la diagonale
du carr car, en gnral, 1(r) est suprieur 1Q(r). Lindice de Gini est
64
toujours compris entre 0 et 1.
Lindice de Gini est trs utilis en conomie comme mesure des ingalits
dans une population. Supposons par exemple que la variable r correspond
aux revenus dans une population. Si lindice de Gini est proche de 0, ceci
signie que les dirences relatives sont en moyenne faible par rapport
la moyenne des revenus, i.e. les ingalits dans la population sont faibles.
Si lindice de Gini est proche de 1, au contraire il y a de fortes dirences
relatives en moyenne, i.e. les ingalits sont fortes.
4.3.4 Calcul pratique de lindice de Gini
Laire comprise entre la courbe de Lorenz et la diagonale du carr est
calcule par approximation. Pour rappel, laire dun trapze est telle que :
hauteur (petite base + grande base)
2
Pour obtenir laire entre la courbe de Lorenz et la diagonale du carr, il faut
soustraire laire des trapzes en dessous de la courbe de concentration 0. 5.
Alors en posant 1
0
= 1Q
0
= 0 et 1
k
= 1Q
k
= 1 o / est le nombre de
classes, lidice de Gini est donn par la formule suivante :
G = 2
_
0. 5
k

i=1
(1
i
1
i1
) (1Q
i1
+ 1Q
i
)
2
_
Que lon peut crire aussi sous la forme :
G = 1
k

i=1
(1
i
1
i1
) (1Q
i1
+ 1Q
i
)
Example 122 Reprenons lexemple de la rpartition des employs dune en-
treprise selon leur salaire mensuel net.
oc|ci:c: (cn:o:) :
i
1
i
1Q
i
1
i
1
i1
1Q
i1
+ 1Q
i
(1
i
1
i1
) (1Q
i1
+ 1Q
i
)
[800; 900[ 25 0. 212 0. 164 0. 212 0. 164 0. 034768
[900; 1000[ 30 0. 466 0. 385 0. 254 0. 549 0. 139446
[1000; 1100[ 28 0. 703 0. 613 0. 237 0. 998 0. 236526
[1100; 1500[ 25 0. 915 0. 865 0. 212 1. 478 0. 313336
[1500; 2000[ 10 1 1 0. 085 1. 865 0. 158525

118 0. 882601
65
Fig. 4.1 Calcul de lindice de Gini
Alors, lindice de Gini est tel que :
G = 1 0. 8826 - 0. 117
66
4.4 Les caractristiques de forme
En plus des caractristiques de tendance centrale et de dispersion, il se-
rait instructif de dnir des indices pour rsumer linformation vhicule par
les donnes, sur lallure et la forme de la distribution dune srie statistique.
Pour une distribution statistique symtrique la moyenne, le mode et la m-
diane concident. Il est donc naturel de considrer la dviation de la moyenne
par rapport au mode ou bien par rapport la mdiane, comme mesure dasy-
mtrie de la distribution statistique. K. Pearson a propos comme mesure de
lasymtrie une quantit fonction du mode. Mais cette quantit est sujette
linconvnient dterminer le mode. Cependant, pour une large classe de
distributions de frquences, la mesure dasymtrie peut tre dtermine exac-
tement laide des quatre premiers moments de la distribution.
Denition 123 Soit r
1
. r
2
. .... r
n
une distribution statistique dune variable
r. On appelle moment centr dordre : de la variable statistique r, not j
r
,
la quantit dnie telle que :
j
r
=
1
:
n

i=1
(r
i
r)
r
4.4.1 Coecient dasymtrie (skewness)
Une distribution statistique symtrique a tous ses moments centrs im-
pairs nuls et a fortiori la moyenne j
1
.
Denition 124 Soit j
3
et j
2
les moments centrs dordre respectifs 3 et
2 de la distribution statistiques. On appelle caractristique dasymtrie le
coecient
1
dni tel que :

1
=
j
3
o
3
=
j
3
j
3
2
2
67
Distributions asymtriques
Distribution symtrique
Remarque 125 Le coecient
1
est sans dimension, invariant par change-
ment dorigine et dchelle. Il est nul pour les distributions symtriques.
On utilise galement comme indice dasymtrie le rapport :
d =
Q
1
+ Q
3
2`
e
2`
e
o Q
1
et Q
3
sont les quartiles, et `
e
la mdiane.
Pour les distributions unimodales
1
et d sont de mme signe et ils sannulent
pour les distributions symtriques.
68
4.4.2 Coecient daplatissement (Kurtosis)
Denition 126 On appelle caractristique daplatissement le coecient
2
dni tel que :

2
=
j
4
j
2
2
3 =
j
4
o
4
3
o j
4
et j
2
sont les moments centrs dordre respectifs 4 et 2 de r.
Remarque 127 Le coecient
2
est sans dimension. Il est invariant par
changement dorigine et dchelle. La constante 3 est choisie de telle sorte
que le coecient
2
soit nul pour les distributions normales.
Le coecient
2
est positif si la distribution est moins aplatie que la distri-
bution normale et il est ngatif dans le cas contraire.
Les courbes pour lesquelles
2
= 0 sont dites msokurtiques, celles pour
lesquelles
2
0 sont dites leptokurtiques et celles pour lesquelles
2
< 0
sont dites platicurtiques.
Du fait de lingalit j
4
_ j
2
2
, le coecient daplatissement est toujours su-
prieur 2.
69
Chapitre 5
Distributions statistiques
deux dimensions
Pour ltude de certains phnomnes complexes, il savre insusant de
prendre en compte un seul caractre. Alors il en faut considrer deux ca-
ractres ou plus. Lanalyse et la reprsentation des tableaux statistiques ob-
tenus deviennent videmment plus complexes. La reprsentation graphique,
par exemple, nest possible que dans un espace trois dimensions au plus. En
dnissant les distributions marginales et conditionnelles, on peut ramener
la reprsentation dune distribution plusieurs dimensions quelques repr-
sentations unidimensionnelles. Dans la suite, on ne considrera que les sries
statistiques deux dimensions.
5.1 Prsentation gnrale dun tableau double
entre
Considrons une population de : individus. Chacun de ces derniers est
identi par deux caractres et 1. Le caractre comporte / modalits

1
.
2
. ....
k
et le caractre 1 en comporte : , 1
1
. 1
2
. .... 1
m
. Lopration
prliminaire consiste classer les : individus dans / : cases dun tableau
o gurent en ligne les modalits de et en colonne les modalits de 1.
Dans chaque case (i. ,). i = 1. 2. .... / et , = 1. 2. .... :, on inscrira le nombre
:
ij
des lments du sous-ensemble de la population contenant les individus
prsentant simultanment la modalit
i
du caractre et la modalit 1
j
du caractre 1.
70
Pour allger les notations on indiquera par un point (.) la sommation eec-
tue suivant lindice i ou lindice ,, i.e.
m

j=1
:
ij
= :
i:
; i = 1. 2. .... /
k

i=1
:
ij
= :
:j
; , = 1. 2. .... :
k

i=1
:
i:
=
m

j=1
:
:j
=

i;j
:
ij
= :
::
= :
Nous donnons ci-aprs la forme gnrale dun tableau statistique double
entre, appel aussi tableau de contingence :
/ 1 1
1
1
2
... 1
j
... 1
m
1otc|

1
:
11
:
12
:
1j
:
1m
:
1:

2
:
21
:
22
:
2j
:
2m
:
2:
...

i
:
i1
:
i2
:
ij
:
im
:
i:
...

k
:
k1
:
k2
:
kj
:
km
:
k:
1otc| :
:1
:
:2
:
:j
:
:m
:
::
= :
Tableau statistique double entre
Denition 128 On appelle frquence de lvnement (
i
. 1
j
) la proportion
des observations qui prsentent simultanment les modalits
i
et 1
j
. Elle
est note ,
ij
et est dnie telle que :
,
ij
=
:
ij
:
Remarque 129 Si on adopte les mmes conventions dcriture que pour les
eectifs, en indiquant par un point les sommations eectues par rapport
lindice i ou par rapport lindice ,, alors ,
i:
est la somme des frquences
de la ligne :

i.
71
Proposition 130 Il est vident que daprs la dnition de la frquence ,
i
,
on a :
,
i:
=
:
i:
:
i = 1. 2. .... / et ,
:j
=
:
:j
:
, = 1. 2. .... :
Dmonstration :
,
i:
=
m

j=1
,
ij
=
m

j=1
:
ij
:
=
:
i:
:
et
,
:j
=
k

i=1
,
ij
=
k

i=1
:
ij
:
=
:
:j
:
Remarque 131 Comme pour les distributions un caractre la somme des
frquences est gale lunit. En eet ,
k

i=1
m

j=1
,
ij
=
k

i=1
,
i:
=
m

j=1
,
:j
= 1
5.2 Distributions marginales
Denition 132 La sommation suivant les lignes ou les colonnes des eectifs
ou des frquences, dnit la distribution marginale du caractre ou celle de
1 respectivement.
Remarque 133 La distribution marginale est la distribution statistique de
lun des caractres indpendamment de lautre. Elle est lue sur lune ou
lautre des marges du tableau, do son nom. Par exemple, la distribution
marginale associe au caractre est :
:
1:
. :
2:
. .... :
k:
on /ic: ,
1:
. ,
2:
. .... ,
k:
et la distribution marginale associe au caractre 1 est :
:
:1
. :
:2
. .... :
:m
on /ic: ,
:1
. ,
:2
. .... ,
:m
72
Example 134 Ltude dune population de 50 individus suivant le poids (ca-
ractre 1) et la taille (caractre ), a donn les rsultats suivants :
/ 1 60 70 80 90 `c:qc
160 2 5 4 1 12
170 2 8 9 4 23
180 0 4 6 5 15
`c:qc 4 17 19 10 50
/ 1 60 70 80 90 `c:qc
160 0. 04 0. 10 0. 08 0. 02 0. 24
170 0. 04 0. 16 0. 18 0. 08 0. 46
180 0. 00 0. 08 0. 12 0. 10 0. 30
`c:qc 0. 08 0. 34 0. 38 0. 20 1. 00
Les rsultats peuvent tre rsums dans un tableau statistique double entre
en fonction des ectifs ou des frquences relatives.
5.3 Distributions conditionnelles
Denition 135 Considrons la sous population des individus prsentant la
modalit 1
j
. Sur cette sous-population la distribution du caractre est ap-
pele distribution conditionnelle de sachant 1
j
ralis.
Remarque 136 Considrons les :
:j
individus prsentant la modalit 1
j
.
Parmi ceux-ci, il y a une proportion
n
ij
n
:j
dindividus qui prsentent en mme
temps la modalit
i
.
Denition 137 On dit que la frquence conditionnelle de la modalit
i
lie
par la modalit 1
i
est :
,
i=j
= , (
i
,1
j
) =
:
ij
:
:j
, = 1. 2. .... :
Remarque 138 Lensemble des frquences conditionnelles du caractre
lies la mme modalit 1
j
du caractre 1 constitue la distribution condi-
tionnelle de sachant 1
j
ralis. Cest une distribution un seul caractre
et il y a autant de distributions conditionnelles de quil y a de modalits
de 1, i.e. autant que de colonnes du tableau statistique.
73
Denition 139 On dnit de faon analogue la distribution conditionnelle
de 1 lie par les modalits
i
tel que :
,
j=i
= , (1
j
,
i
) =
:
ij
:
i:
i = 1. 2. .... /
Remarque 140 Les distributions conditionnelles conservent les mmes pro-
prits que les distributions statistiques normales, i.e.
k

i=1
,
i=j
= 1 , , = 1. 2. .... :
m

j=1
,
j=i
= 1 , i = 1. 2. .... /
Example 141 On reprend lexemple 55 et on dtermine les distributions
conditionnelles.
/ 1 60 70 80 90
160 0. 50 0. 30 0. 211 0. 10
170 0. 50 0. 47 0. 474 0. 40
180 0. 00 0. 23 0. 315 0. 50
`c:qc 1. 00 1. 00 1. 00 1. 00
Distributions conditionnelles de sachant 1
j
. , = 1. 2. 3. 4
1/ 160 170 180
60 0. 167 0. 087 0. 00
70 0. 416 0. 350 0. 267
80 0. 334 0. 391 0. 400
90 0. 083 0. 172 0. 333
`c:qc 1. 00 1. 00 1. 00
Distributions conditionnelles de 1 sachant
i
. i = 1. 2. 3. 4
5.3.1 Proprits des frquences marginales et condi-
tionnelles
Il est facile dtablir que :
,
ij
= , (1
j
/
i
) ,
i:
= , (
i
/ 1
j
) ,
:j
= ,
j=i
,
i:
= ,
i=j
,
:j
74
En eet,
:
ij
:
=
:
ij
:
i:
:
i:
:
=
:
ij
:
:j
:
:j
:
On retrouvera cette formule plus tard en calcul de probabilit sous le nom
daxiome des probabilits conditionnelles.
Moyennes conditionnelles
Il nous est possible de dnir plus tard la notion de moyenne condi-
tionnelle. Les moyennes conditionnelles sont les moyennes des distributions
conditionnelles. On peut parler, par exemple, de la moyenne du caractre 1
chez les individus prsentant la modalit
i
, i = 1. 2. .... / du caractre ou
bien de la moyenne du caractre prsentant la modalit 1
j
, , = 1. 2. .... :
du caractre 1.
5.4 Reprsentations graphiques des distribu-
tions deux caractres
Le mode de reprsentation graphique dune distribution deux caractres
nest strictement possible que dans un espace trois dimensions. Chacun des
caractres est port sur une dimension et la troisime est aecte aux eectifs
ou aux frquences.
5.4.1 Cas des caractres qualitatifs
Il nest pas toujours possible de reprsenter les deux caractres de faon
absolument symtrique. Cependant, on peut reprsenter la famille des distri-
butions conditionnelles / 1
j
, , = 1. 2. .... : (ou bien 1/
i
, i = 1. 2. .... /),
de telle sorte que :
ij
soit reprsent par un rectangle de base :
:j
(ou :
i:
)
et que la hauteur soit proportionnelle la frquence conditionnelle ,
i=j
(ou
,
j=i
).
5.4.2 Cas des caractres quantitatifs
Dans ce cas aussi on peut utiliser le mode de reprsentation nonc plus
haut. De plus, soient r et les deux variables statistiques quantitatives dis-
crtes. Soit :
ij
leectif correspondant la modalit (r
i
.
j
), on peut repr-
75
senter cet eectif par un cercle centr au point (r
i
.
j
) et de surface propor-
tionnelle :
ij
.
Denition 142 La reprsentation graphique dune distribution deux va-
riables continues regroupes par classes est appele strogramme. Cest un
solide constitu par un ensemble de paralllpipdes rectangles dont la base
est forme par les couples dintervalles de classe et dont les volumes sont
proportionnels aux frquences ,
ij
ou aux eectifs :
ij
.
Remarque 143 Le paralllpipde relatif la classe :

i damplitude c
i
de
r, et la classe :

, damplitude /
i
de , a pour hauteur :
/
ij
=
,
ij
c
i
/
j
de telle sorte que le volume de ce paralllpipde soit :
\
ij
= c
i
/
j
_
,
ij
c
i
/
j
_
= ,
ij
Ainsi le strogramme apparat comme la gnralisation de lhistogramme.
Example 144 Reprenons lexemple 55 et reprsentons par un strogramme
la distribution du poids (caractre 1) et de la taille (caractre ) des indi-
vidus de la population.
Reprsentation par strogramme
76
5.5 Covariance entre deux variables statistiques
Dans le cas des variables statistiques deux dimensions, il est intressant
de pouvoir quantier la variabilit de la population due leet conjugu
des variables considres simultanment. Pour cela on introduit la notion de
covariance.
5.5.1 Covariance
En gnral, la distribution des observations dune population suivant deux
caractres (r. ) sont disposes dans un tableau de contingence, alors la co-
variance est dnie telle que :
Denition 145 Soit (r. ) un couple de variables statistiques pouvant prendre
les valeurs (r
i
.
j
), i = 1. 2. .... / et , = 1. 2. .... : avec les eectifs respectifs
(:
ij
), i = 1. 2. .... / et , = 1. 2. .... :. On appelle covariance des variables
statistiques r et , note Co(r. ), la quantit dnie telle que :
Co (r. ) =
1
:
k

i=1
m

j=1
:
ij
(r
i
r) (
j
)
Remarque 146 Pour le calcul pratique, on utilisera souvent la formule d-
veloppe de la covariance dnie telle que :
Co (r. ) =
1
:
k

i=1
m

j=1
:
ij
r
i

j
r
Dans certaines situations il arrive que que les observations dune popula-
tion suivant deux caractres (r. ) soient apparies, i.e. les observations sont
disponibles sous forme dune suite (r
i
.
i
), i = 1. 2. .... :, alors dans cette
situation la covariance est dnie telle que :
Denition 147 Soit (r
i
.
i
), i = 1. 2. .... : une srie dobservation dun
couple de variables statistiques (r. ). On appelle covariance des variables
statistiques r et , note Co(r. ), la quantit dnie telle que :
Co (r. ) =
1
:
n

i=1
(r
i
r) (
i
)
77
Remarque 148 Pour le calcul pratique, on utilisera souvent la formule d-
veloppe de la covariance dnie telle que :
Co (r. ) =
1
:
n

i=1
r
i

i
r
5.5.2 Coecient de corrlation
Il arrive souvent de vouloir comparer la variation dune variable statis-
tique par rapport une autre dnie sur les mmes individus dune quel-
conque population. Mais ces variables ne sexpriment pas souvent dans la
mme unit. Pour cela on dnit le coecient de corrlation qui est un
coecient normalis sans dimension.
Denition 149 On appelle coecient de corrlation de deux variables sta-
tistiques r et , et on le note Co::(r. ) ou j , la quantit dnie telle que :
j = Co::(r. ) =
Co (r. )
o
x
o
y
Remarque 150 Le coecient de corrlation j est, une constante prs, le
cosinus de langle entre les vecteurs

r et

.
Proprit
Quelque soit le couple de variables statistiques (r. ) leur coecient de
corrlation j = Co:: (r. ) vrie lingalit suivante :
1 _ j = Co:: (r. ) _ +1 (5.1)
Les galits ont lieu si et seulement si il existe deux constantes c ,= 0 et /
telles que = cr + / ou bien r = c + /.
Example 151 Reprenons lexemple 55 et calculons la covariance et le co-
ecient de corrlation entre les caractres et 1 que lon noteras r et
respectivement.
Posons (
i
. 1
j
) = (r
i
.
j
) . i = 1. 2. 3 et , = 1. 2. 3. 4. Alors : r = 170. 6 ;
= 77 ; o
x
= 7. 32 et o
y
= 8. 77 Par ailleurs
1
:
3

i=1
4

j=1
:
ij
r
i

j
= 13156
Do
Co (r. ) = 19. 8 et j = Co:: (r. ) = 0. 3
78
5.5.3 Dirents genres de corrlation
Corrlations positives
Corrlation nulle
79
Corrlations ngatives
5.6 Ajustement linaire ou droite des moindres
carrs
Soient r et deux variables statistiques dnies sur la mme population.
Les observations du couple (r. ) peuvent tre prsentes sous forme dune
srie brute (r
i
.
i
), i = 1. 2. .... : ou bien sous forme dun tableau de contin-
gence. On sait (5.1) que si le coecient de corrlation entre r et est voisin
de +1 ou 1, il existe deux nombres rels c ,= 0 et / tels que = cr + / ou
bien r = c + /.
Denition 152 Soient r et deux variables statistiques dnies sur la mme
population. Lquation = cr + / (rep. r = c
0
+ /
0
) est appele droite de
rgression ou ajustement linaire de en r (resp. de r en ).
Sachant que les constantes c et / existent, comment peut-on les dtermi-
ner ?
Les observations sur une population par rapport deux caractres ou va-
riables statistiques r et nous fournissent une suite de couples (r
i
.
i
),
i = 1. 2. .... :. En gnral, en raison des erreurs de mesure, les points (r
i
.
i
)
ne sont pas aligns, mais sont "presque" sur une mme droite. Il faut alors
choisir c et / de sorte que la droite soit la meilleure possible. Pour cela, il
faut choisir une mesure de lcart entre une droite = cr +/ et le nuage de
80
points exprimentaux (r
i
.
i
). On choisit en gnral le carr de la dirence
entre le point thorique et le point exprimental, cest--dire (
i
(cr
i
+/))
2
.
Lcart total est donc :
,(c. /) =
n

i=1
(
j
cr
i
/)
2
(5.2)
Eectuer une rgression linaire, cest trouver la droite qui minimise lcart
total, i.e. la somme des carrs des dirences. On parle alors de droite des
moindres carrs.
Proposition 153 Soient r et deux variables statistiques dnies sur la
mme population. La fonction numrique dnie sur R
2
par lquation (5.2) admet
un minimum au point (c. ,) tel que :
c =
Co (r. )
\ c: (r)
= Co:: (r. )
o
y
o
x
, = cr
Dmonstration : Le minimum de la fonction ,(c. /) est obtenu au point
(c. ,) solution du systme dquations :
_
@f(a;b)
@a
= 0
@f(a;b)
@b
= 0
Nous allons considrer deux situations.
. Les observations sont prsentes sous forme dune srie statistique brute
(i.e. elle na pas t ordonne dans un tableau). On dit, en gnral, que cest
une srie dobservations couples.
Alors, ,(c. /) =

n
i=1
(
i
cr
i
/)
2
et donc
J,(c. /)
Jc
= 2
n

i=1
r
i
(
i
cr
i
/)
= 2
n

i=1
r
i

i
+ 2c
n

i=1
r
2
i
+ 2/
n

i=1
r
i
= 0
Sachant que
n

i=1
r
i

i
= :Co (r. ) + r.
81
et
n

i=1
r
2
i
= :
_
\ c: (r) + r
2
_
et
n

i=1
r
i
= :r
On dduit
Co (r. ) + r. c
_
\ c: (r) + r
2
_
/r = 0 (5.3)
Dautre part
J,(c. /)
J/
= 2
n

i=1
(
i
cr
i
/)
= 2
n

i=1

i
+ 2c
n

i=1
r
i
+ 2
n

i=1
/ = 0
Sachant que
n

j=1

j
= : et
n

i=1
r
i
= :r
On dduit
cr / = 0 (5.4)
1. Les observations sont prsentes dans un tableau de contingence.
Alors
J,(c. /)
Jc
= 2
k

i=1
m

j=1
:
ij
r
i
(
j
cr
i
/)
= 2
k

i=1
m

j=1
:
ij
r
i

j
+ 2c
k

i=1
m

j=1
:
ij
r
2
i
+ 2/
k

i=1
m

j=1
:
ij
r
i
= 2
k

i=1
m

j=1
:
ij
r
i

j
+ 2c
k

i=1
:
i:
r
2
i
+ 2/
k

i=1
:
i:
r
i
= 0
Sachant que
k

i=1
m

j=1
:
ij
r
i

j
= :Co (r. ) + r.
et
k

i=1
:
i:
r
2
i
= :
_
\ c: (r) + r
2
_
et
k

i=1
:
i:
r
i
= :r
82
On dduit
Co (r. ) + r. c
_
\ c: (r) + r
2
_
/r = 0 (5.5)
Dautre part
J,(c. /)
J/
= 2
k

i=1
m

j=1
:
ij
(
j
cr
i
/)
= 2
k

i=1
m

j=1
:
ij

j
+ 2c
k

i=1
m

j=1
:
ij
r
i
+ 2/
k

i=1
m

j=1
:
ij
= 2
m

j=1
:
:j

j
+ 2c
k

i=1
:
i:
r
i
+ 2:/ = 0
Sachant que
m

j=1
:
:j

j
= : et
k

i=1
:
i:
r
i
= :r
On dduit
cr / = 0 (5.6)
La solution du systme dquations (5.5) ; (5.6) est le point (c. ,) tel que :
c =
Co (r. )
\ c: (r)
, = cr
Remarque 154 Il est vident que les couples dquations (5.3) ; (5.4) et
(5.5) ; (5.6) sont les mmes. Donc, que lon utilise les donnes brutes ou les
donnes disposes dans un tableau de contingence, le minimum de la fonction
,(c. /) est le mme.
La quantit c =
Cov(x;y)
V ar(x)
peut tre exprime telle que :
c =
Co (r. )
\ c: (r)
= Co:: (r. )
o
y
o
x
83
En eet
c =
Co (r. )
\ c: (r)
=
Co (r. )
o
x
o
x
o
y
o
y
=
_
Co (r. )
o
x
o
y
_
o
y
o
x
= Co:: (r. )
o
y
o
x
On peut constater que la pente de la droite de rgression est proportionnelle
au cecient de corrlation et est de mme signe. Le point de coordonnes
(r. ) appartient toujours la droite de rgression.
84
Chapitre 6
Les sries chronologiques
6.1 Gnralits
Denition 155 On appelle srie chronologique ou temporelle une suite 1
t
,
t = 1. 2. 3. ..., dobservations chires et ordonnes dans le temps dun mme
phnomne.
Example 156 Nombre mensuel de vente de voitures neuves.
Nombre annuel de naissance en Algrie.
Remarque 157 Les dates dobservations sont gnralement ordonnes de
manire rgulire dans le temps : on manipule des sries journalires, men-
suelles, trimestrielles, annuelles. Plus gnralement, pour les sries statis-
tiques deux dimensions, lorsque lun des caractres est le temps, la srie
statistique est alors appele srie chronologique. Le deuxime caractre est
quelconque.
Reprsentation graphique
Pour la reprsentation graphique des sries chronologiques un certain
nombre de prcautions doivent tre prises :
Sil sagit dun stock de leectif de la population une date dtermine,
le point reprsentatif se place exactement laplomb de la date de
rfrence.
Sil sagit dun ux comme la production mensuelle dnergie lectrique
par exemple, ou dune moyenne comme le prix moyen mensuel du ki-
logramme de pomme de terre par exemple, le point reprsentatif sera
alors plac la verticale du milieu de la plage.
85
Le temps est toujours port en abscisse et le deuxime caractre en
ordonne.
On reprsente les points (t; 1
t
), que lon relie par des segments de
droites. On reprsente lvolution de la grandeur considre sur len-
semble de la priode observe.
Example 158 Considrons la srie trimestrielle du chire daaires en mil-
liers de DA des ventes dun magasin de 1978 1982.
t 1
t
1 2614
2 3010
3 2765
4 4856
5 3010
6 3397
7 3168
8 5624
9 3406
Reprsentation graphique de Y(t)
86
6.2 Analyse empirique dune srie chronolo-
gique
6.2.1 Dcomposition dune srie chronologique
Le but de la dcomposition dune srie chronologique est de distinguer
dans lvolution de la srie, une tendance gnrale, des variations saison-
nires qui se rptent chaque anne, et des variations accidentelles imprvi-
sibles. Lintrt de ceci est dune part de mieux comprendre, de mieux dcrire
lvolution de la srie, et dautre part de prvoir son volution ( partir de
la tendance et des variations saisonnires).
La tendance ou trend
Denition 159 La tendance dune srie chronologique, note C
t
, est lvo-
lution long terme de la srie ou lvolution fondamentale de la srie.
Example 160 Laugmentation du chire daaire de 1978 2005.
Les variations saisonnires ou saisonnalits
Denition 161 Les variations saisonnires ou saisonnalits, nots o
t
, sont
des uctuations priodiques lintrieur dune anne, et qui se reproduisent
de faon plus ou moins permanente dune anne sur lautre.
Example 162 Ces variations sont dues au rythme des saisons : climat, ma-
tires premires, congs, . . .
Proprits
Les variations saisonnires se caractrisent par deux principes :
Principe de rptition lidentique : Les variations saisonnires sont
priodiques de priode j (nombre de mois) :
o
t+p
= o
t
Principe de conservation des aires : Par an, linuence des variations
saisonnires est nulle. Cela sera traduit laide de la moyenne des o
t
.
87
Les variations accidentelles ou rsiduelles
Denition 163 Les variations accidentelles ou rsiduelles, notes
t
, sont
des uctuations irrgulires et imprvisibles. Elles sont supposes en gnral
de faible amplitude. Cest la composante alatoire dune srie chronologique.
Example 164 Les variations rsiduelles proviennent de circonstances non
prvisibles : catastrophes naturelles, crise boursire, grves . . .
6.2.2 Les modles de composition des trois compo-
santes
Le modle additif
Denition 165 Un modle additif suppose que les trois composantes : ten-
dance, variations saisonnires et variations accidentelles sont indpendantes
les unes des autres. La srie 1
t
scrit comme la somme de ces 3 composantes :
1
t
= C
t
+ o
t
+
t
Remarque 166 Graphiquement, lamplitude des variations est constante
autour de la tendance. En eet, si on joint les minima et les maxima de
la srie chronologique on obtient deux droites parallles la tendance.
Le modle multiplicatif
Il ya deux forme de modles multiplicatifs.
Denition 167 (1re forme) Les variations saisonnires sont supposes
dpendre de la tendance. Alors, on considre que 1
t
scrit de la manire
suivante :
1
t
= C
t
o
t
+
t
Remarque 168 Graphiquement, lamplitude des variations (saisonnires)
varie. En eet, en joignant les minima et les maxima de la srie chronologique
on constate que les deux droites ne sont pas parallles entre elles.
Denition 169 (2me forme) On suppose que les variations saisonnires
et les variations accidentelles dpendent de la tendance. Alors, on considre
que 1
t
scrit de la manire suivante :
1
t
= C
t
o
t

t
88
Remarque 170 1) Dans le cas dune srie chronologique 1
t
valeurs po-
sitives, le deuxime modle multiplicatif se ramne un modle additif en
considrant la srie des logarithmes de 1
t
:
ln (1
t
) = ln (C
t
) + ln (o
t
) + ln (
t
)
2) La seule dirence entre les deux modles multiplicatifs rside dans lesti-
mation des
t
, qui na pas une grande importance pour linstant.
6.2.3 Choix du modle
Mthode de la bande
On utilise le graphe de la srie et la droite passant par les minima et celle
passant par les maxima.
Si ces 2 droites sont peu prs parallles : le modle est additif.
Si ces 2 droites ne sont pas parallles : le modle est multiplicatif.
Mthode du tableau de Buys et Ballot
On calcule, pour chacune des annes, la moyenne et lcart type. On
reprsente les points dabscisse la moyenne et dordonne lcart type de la
mme anne sur un plan. On trace la droite des moindres carrs de ces points.
Si lcart type est indpendant de la moyenne le modle est additif. La
pente (c) de la droite des moindres carrs est trs proche de 0.
Si lcart type est fonction de la moyenne le modle est multiplicatif.
La pente (c) de la droite des moindres carrs nest pas nulle.
En conclusion pour dcomposer une srie chronologique on doit commen-
cer par tracer son graphique, choisir un modle de composition (additif ou
multiplicatif), estimer la tendance C
t
, estimer les variations saisonnires.
6.3 Les indices statistiques
Pour ltude de certains phnomnes conomiques et sociaux, on est sou-
vent amen dcrire ou comparer les variations de grandeurs simples telles
que le prix du bl, la production dacier ou le taux de fcondit dune certaine
population, etc. Pour les comparaisons dans le temps et dans lespace de ces
grandeurs, on introduit la notion dindice statistique lmentaire. Ceux sont
gnralement des rapports de ces grandeurs. Mais il est plus instructif de
89
pouvoir suivre les volutions de grandeurs plus complexes telles que le ni-
veau gnral des prix, la production industrielle, le volume des importations,
etc. Ces volutions sont rsumes par lune ou lautre des caractristiques
de tendance centrale de la srie des indices lmentaires correspondants. On
parle dans ce cas dindices synthtiques.
6.3.1 Les indices lmentaires
Example 171 a) Le prix du kilogramme dun certain produit a t de 151
en moyenne en 1980 et il est de 321 en Octobre 1998. Lindice lmentaire
du prix de ce produit en Octobre 1998, base 100 en 1980, est le rapport des
deux prix exprim en pourcentage :
J
Oct98=Moy80
=
32
15
100 = 213. 33
b) La consommation dlectricit a t de 16500 Millions de Kwh en 1988
et de 6200 Millions de Kwh en 1973. Lindice lmentaire de la consommation
dlectricit en 1988, base 100 en 1973, est le rapport des consommations des
deux annes exprim en % :
J
1988=1973
=
16500
6200
100 = 266. 13
Plus gnralement, considrons la variation dans le temps dune gran-
deur simple A, prenant les valeurs A
0
. A
1
. .... A
t
. ..., aux dates (ou priodes)
successives 0. 1. 2. .... t. ....
Denition 172 On appelle indice lmentaire de la grandeur A la date
(ou priode) t par rapport la date (ou priode) 0, le rapport :
J
t=0
=
A
t
A
0
Remarque 173 La date ou priode 0 est appele date de rfrence ou
base de lindice. La date ou priode t est appele date courante. En g-
nral, ce rapport est exprim en % tel que :
J
t=0
=
A
t
A
0
100
On dit alors que lindice la date t est exprim base 100 la date de rfrence
0.
90
Les indices statistiques lmentaires sont utiliss surtout pour retracer
lvolution des grandeurs simples dans le temps. Mais ils peuvent aussi servir
des comparaisons dans lespace.
Example 174 La densit de la population algrienne a t de 14. 6 /,1:
2
en 1996, alors que pour la rgion algroise elle a t de 1540 /,1:
2
. Lindice
de densit de la rgion algroise, lensemble de lAlgrie tant choisi comme
base, est :
J
RA=Al
=
1540
14. 6
100 = 10580
Lindice de densit du sud algrien dont la densit de la population est de
0. 5 /,1:
2
, par rapport celle du pays, est alors :
J
SA=Al
=
0. 5
14. 6
100 = 3. 4
Proprits
Les indices lmentaires possdent deux proprits fondamentales, la cir-
cularit et la rversibilit.
La circularit On dit quun indice statistique J est circulaire si \ t, t/on
a :
J
t=0
= J
t=t
0 J
t
0
=0
En eet,
A
t
A
0
=
A
t
A
t
0

A
t
0
A
0
Remarque 175 On peut comparer les grandeurs aux dates t et t/en prenant
le quotient des indices J
t=0
et J
t
0
=0
. On obtient ainsi un changement de base
(la date de rfrence t/a t substitue la date 0) . La proprit de circularit
peut tre gnralise une suite dindices, i.e.
J
t=0
= J
t=t1
J
t1=t2
... J
2=1
J
1=0
91
Rversibilit On dit quun indice statistique J est rversible si \ t, on a :
J
0=t
=
1
J
t=0
En eet,
A
0
A
t
=
1
Xt
X
0
Remarque 176 Lvolution dun phnomne est souvent prsente sous forme
dune augmentation ou dune diminution en pourcentage laide de la for-
mule suivante :
\ c|cn: :onc||c \ c|cn: j:i:itic
\ c|cn: j:i:itic
100
Le pourcentage de variation ne possde pas les proprits de circularit et
de rversibilit des indices, et est donc moins maniable. Les pourcentages de
variation ne se rajoutent pas.
6.3.2 Les indices synthtiques
Les grandeurs complexes sont fonction de quelques grandeurs simples.
Ainsi le niveau gnral des prix est constitu des prix des divers aliments
et boissons, du logement, de lquipement mnager, de lhabillement, des
services mdicaux, des transports, des loisirs, etc. La construction dun indice
synthtique relatif la variation dune grandeur complexe consiste rsumer
une srie dindices lmentaires.
Position du problme
Soit A une grandeur complexe compose des lments A
1
. A
2
. .... A
j
. .... A
h
.
La variable complexe A est, par exemple, le niveau gnral des prix, et
A
1
. A
2
. .... A
j
. .... A
h
reprsentent les prix des dirents produits ou services
oerts au public . Les indices lmentaires des constituants A
j
, , = 1. 2. .... /,
de A sont calculs par la formule J
j
t=0
=
X
j
t
X
j
0
, , = 1. 2. .... /. Mais cette suite
dindices napporte aucune information sur lvolution du niveau gnral des
prix. Il serait judicieux de les rsumer ou de les synthtiser par un seul indice
quon appellera indice synthtique de la grandeur complexe A.
Les direntes formules dindices synthtiques
Trois formules dindices synthtiques sont utilises en pratique. Ceux sont
les formules de Laspeyres, de Paasche et de Fisher.
92
Soit c
j
0
le poids ou limportance relative du constituants :

, dans la grandeur
complexe A la date 0, et par c
j
t
son poids la date t. Si A reprsente le
niveau gnral des prix, c
j
t
peut reprsenter, par exemple, la proportion des
dpenses dans lhabillement ou dans lachat des viandes, par rapport la
dpense totale des mnages la date t. Ces importances relatives ou poids
sont soumis la contrainte suivante :

j
c
j
0
=

j
c
j
t
= 1
Remarque 177 Les coecients c
j
0
et c
j
t
sont appels coecients de pond-
ration.
Indice de Laspeyres
Denition 178 Lindice de Laspeyres, not /, est la moyenne arithmtique
des indices lmentaires pondrs par les coecients c
j
0
la date de rf-
rence :
/
t=0
=

j
c
j
0
J
t=0
=

j
c
j
0
A
j
t
A
j
0
Indice de Paasche
Denition 179 Lindice de Paasche, not T, est la moyenne harmonique
des indices lmentaires pondrs par les coecients c
j
t
la date courante :
T
t=0
=
1

j
a
j
t
I
t=0
=
1

j
c
j
t
X
j
0
X
j
t
Indice de Fisher
Denition 180 Lindice de Fisher, not T, est la moyenne gomtrique
simple des indices de Laspeyres et de Paasche :
T
t=0
=
_
/
t=0
T
t=0
6.3.3 Les dirents types dindices statistiques
Dsignons par j
j
0
, j
j
t
et
j
0
,
j
t
respectivement les prix et les quantits
(volumes) correspondant au constituant , entrant dans le calcul dindice.
93
Indice de valeur
Denition 181 La valeur, pour un constituant ,, est le produit du prix par
la quantit correspondante.
Denition 182 Lindice de valeur, not 1, est le rapport de la somme des
valeurs relatives la priode courante, la somme des valeurs relatives la
priode de base :
1
t=0
=

j
j
j
0

j
t

j
j
j
0

j
0
Indice des prix
Lindice des prix comme lindice de quantit peut tre calcul selon lune
des formules de Laspeyres , de Paasche ou de Fisher .
Denition 183 Lindice de Laspeyres des prix est donn par la formule sui-
vante :
/
t=0
(j) =

j

j
0
j
j
0

p
j
t
p
j
0

j

j
0
j
j
0
Remarque 184 Les coecients de pondration sont constitus par la part
de la dpense totale des familles consacre la consommation des dirents
constituants pendant la priode de base :
c
j
0
=

j
0
j
j
0

j

j
0
j
j
0
Dans le cas dun indice de prix de dtail, les coecients de pondration sont
appels coecients budgtaires.
Lindice de Laspeyres des prix peut aussi tre dni tel que :
/
t=0
(j) =
1 cjc::c totc|c dc |c j c:iodc dc /c:c cc|n cc cn j:ir con:c:t
1 cjc::c totc|c dc |c j c:iodc dc /c:c
Denition 185 Lindice de Paasche des prix est donn par la formule sui-
vante :
T
t=0
(j) =

j

j
t
j
j
t

j

j
t
j
j
t

p
j
0
p
j
t
94
Remarque 186 Les coecients de pondration sont constitus par la part
de la dpense totale des familles consacre la consommation des dirents
constituants pendant la priode courante :
c
j
t
=

j
t
j
j
t

j

j
t
j
j
t
Lindice de Paasche des prix peut aussi tre dni tel que :
T
t=0
(j) =
1 cjc::c totc|c dc |c j c:iodc con:c:tc
1 cjc::c totc|c dc |c j c:iodc con:c:tc cc|n cc cn j:ir dc |
0
c:: cc dc /c:c
Indice de quantit ou de volume
Denition 187 Lindice de Laspeyres de volume est dni tel que :
/
t=0
() =

j
j
j
0

j
t

j
j
j
0

j
0
Denition 188 Lindice de Paasche de volume est dni tel que :
T
t=0
() =

j
j
j
t

j
t

j
j
j
t

j
0
Proprits
Les indice de Laspeyres et de Paasche nont pas les proprits de circula-
rit et de rversibilit. Lindice de Fisher na pas la proprit de circularit,
mais il est rversible :
T
0=t
=
_
/
0=t
T
0=t
=
1
_
/
t=0
T
t=0
=
1
T
t=0
Les trois types dindices sont ordonns de la faon suivante :
/
t=0
_ T
t=0
_ T
t=0
95
Bibliographie
[1] Calot, G. (1969) Cours de statistique descriptive, Dunod.
[2] Delmas, B. (2009) Statistique descriptive pour lconomie et la gestion,
Presses universitaires du Septentrion, 978-2-7574-0074-6
[3] Delmas, J. F. (2010) Introduction au calcul des probabilits et la
statistique, ENSTA, 978-2-7225-0922-1
[4] Duthil, G. (1998) Initiation la statistique descriptive , Ellipse Marke-
ting
[5] Grais, B. (2003) Statistique descriptive : Techniques statistiques , Du-
nod.
[6] Lejeune, M. (2010) Statistique : la thorie et ses applications, Springer,
978-2-8178-0156-8
[7] Olivier, E. (2008) Lessentiel de statistique descriptive, Gualino, 978-2-
297-01103-7
[8] Mazerolle, F. (2005) Statistique descriptive : sries statistiques une et
deux variables, sries chronologiques, indices, Gualino, 2-84200-891-X
[9] Moore, D. and McCABE G. P. (2002) Introduction to the Practice of
Statistics, 4me dition, W.H. Freeman & Company.
[10] Morgenthaler, S. (2007) Introduction la statistique, Presses polytech-
niques et universitaires romandes, 978-2-88074-734-3
[11] Spiegel, M. et Stephens, L. Statistique : Cours et problmes, 3me di-
tion, Srie Schaum/McGraw Hill
[12] Tassi, P. (2004) Mthodes statistiques, Economica, 2-7178-4859-2
96

You might also like