You are on page 1of 3

M.S.

G Formation distance Techniques quantitatives et analyse des donnes Devoir 1

Premier cas : le cas "achat de bouteilles de vin chez un ngociant" Donnes tlcharger sur le site Internet
Un ngociant de vin connat, parmi ses milliers de clients, les revenus mensuels nets exacts de 111 de ces client (variable "revenu"). En plus, il connat le nombre de bouteilles de vin que ces mmes clients lui ont achet durant l'anne 1997. Il calcule le nombre de bouteilles achetes en moyenne par mois pour chaque client, arrondi au chiffre entier le plus proche (variable " achat de vin"). Il saisit ces donnes sur une feuille de calcul Excel :
Client i=1 i=2 i=3 i=4 i=5 i=6 i=7 i=8 i=9 i=10 i=11 i=12 i=13 i=14 i=15 i=16 i=17 i=18 i=19 i=20 i=21 i=22 i=23 i=24 i=25 i=26 i=27 i=28 Revenu 2 566 3 000 3 210 3 500 3 560 3 562 4 000 5 000 5 622 5 646 5 698 6 000 6 322 6 412 6 422 6 456 6 500 6 500 6 542 6 547 6 555 6 558 6 566 6 589 6 621 6 744 6 874 6 875 Achat 0 5 0 2 1 1 1 4 0 2 2 5 1 6 1 2 0 0 0 2 3 0 0 6 5 6 15 3 Client i=29 i=30 i=31 i=32 i=33 i=34 i=35 i=36 i=37 i=38 i=39 i=40 i=41 i=42 i=43 i=44 i=45 i=46 i=47 i=48 i=49 i=50 i=51 i=52 i=53 i=54 i=55 i=56 Revenu 6 888 6 899 6 958 6 987 6 988 6 988 7 200 7 455 7 500 7 612 7 899 7 922 7 955 8 000 8 122 8 148 8 233 8 455 8 714 8 732 8 765 8 936 8 964 9 211 9 322 9 566 9 654 9 874 Achat 2 5 5 4 2 6 7 6 0 5 3 3 8 5 2 15 5 9 6 5 7 12 8 5 3 2 8 7 Client i=57 i=58 i=59 i=60 i=61 i=62 i=63 i=64 i=65 i=66 i=67 i=68 i=69 i=70 i=71 i=72 i=73 i=74 i=75 i=76 i=77 i=78 i=79 i=80 i=81 i=82 i=83 i=84 Revenu 9 877 10 200 10 230 10 230 10 356 10 356 10 987 11 222 11 235 12 125 12 235 12 356 12 500 12 551 12 555 12 560 12 658 12 698 13 225 13 225 14 444 14 500 14 520 14 560 14 890 15 221 15 445 15 624 Achat 10 13 9 9 5 6 4 1 6 2 12 15 5 12 4 12 8 10 14 9 5 6 4 12 24 8 15 3 Client i=85 i=86 i=87 i=88 i=89 i=90 i=91 i=92 i=93 i=94 i=95 i=96 i=97 i=98 i=99 i=100 i=101 i=102 i=103 i=104 i=105 i=106 i=107 i=108 i=109 i=110 i=111 Revenu 15 662 16 000 16 000 16 556 16 880 17 452 17 890 18 236 19 125 20 123 21 556 21 556 21 556 22 122 22 123 23 112 23 562 23 564 23 569 24 556 25 444 25 666 26 500 26 564 28 900 30 230 32 556 Achat 4 6 10 16 9 3 14 8 9 14 12 15 14 5 5 12 24 12 15 12 10 15 10 14 12 15 12

a) b) c) d) e)

Quelles est la nature de ces deux variables ? Faire une table de distribution de la variable "revenu" en 7 classes (d'une amplitude de 5.000 francs o la premire classe s'arrte 4.999,99 francs etc.) Cette table comporte les tris suivants : effectifs, frquences en %, effectifs cumuls, frquences cumules. Reprsenter cette distribution sous forme d'histogramme simple et cumulatif - Quel est le % de personnes qui gagne moins de 20.000 francs ? - Quel est le % de personnes qui gagne plus de 10.000 francs (10.000 inclus) ? Calculer les paramtres de tendance centrale pour la variable "revenus" et reportez sur l'histogramme; calculez successivement : le mode par estimation graphique ; interprtation ? la mdiane, d'abord sur donnes ponctuelles ou par interpolation linaire dans le tableau de distribution; contrler sa valeur sur la courbe cumulative; estimer graphiquement les quartiles; interprtation ? la moyenne sur les donnes ponctuelles (ou sur table de distribution si les donnes ne sont pas saisies sur une feuille Excel). Interprter.

M.S.G Formation distance Techniques quantitatives et analyse des donnes Devoir 1 f) Calculer les paramtres de dispersion pour la variable "revenus" et plus particulirement la variance et l'cart-type sur les donnes ponctuelles (ou sur table de distribution si les donnes ne sont pas saisies sur une feuille Excel). Interprter.

Considrons ensuite le tri crois des deux variables :


Achat de vin [moins de 5[ classes de revenus [moins de 5000[ [5.000, 10.000[ [10.000, 15.000[ [15.000, 20.000[ [20.000, 25.000[ [25.000, 30.000[ [plus de 30.000[ Total [5, 10[ [10, 15[ [15, 20[ [20, 25[ Total

6 24 5 3 0 0 0 38

1 22 10 5 2 0 0 40

0 2 7 2 6 4 1 22

0 2 1 2 2 1 1 9

0 0 1 0 1 0 0 2

7 50 24 12 11 5 2 111

g) h)

Calculer les moyennes conditionnelles de la variable nombre de bouteilles achetes en fonction des classes de revenus. Calculer la covariance sur les donnes ponctuelles (ou sur table de distribution si les donnes ne sont pas saisies sur une feuille Excel). Reporter dans le tableau en fin d'exercice. On trouve dans ce tableau galement les paramtres y y pour la variable "bouteilles achetes"). Interprter. Calculez le coefficient de corrlation linaire. Calculer la droite d'ajustement selon le principe des moindres carrs. Reporter la droite d'ajustement sur le graphique de corrlation (ci-dessous ou en crant un graphe de dispersion dans Excel).

i) j) k)

Diagramme de corrlation
25

20

achat de bouteilles de vin par mois

15

10

0 0 5000 10000 15000 20000 25000 30000 35000

revenus mensuels

M.S.G Formation distance Techniques quantitatives et analyse des donnes Devoir 1


Paramtre Tableau de distribution 7,36 Donnes ponctuelles 7,01

x
y (nombre de bouteilles achetes)
cart-type de X ( x ) cart-type de Y ( y ) covariance coefficient de corrlation coefficient directeur de la rgression 5,05 5,15

Deuxime cas : "les aliments biologiques" (Donnes tlcharger sur le site Internet)
Une entreprise dsire se lancer dans une srie d'aliments biologiques (gteaux, riz, ptes, etc.). Elle dsire connatre un peu mieux ses clients potentiels. Elle fait une enqute par sondage auprs de 392 consommateurs potentiels la sortie d'un supermarch. La premire question est : "Est-ce qu'il vous arrive d'acheter des produits biologiques ?" Les rponses possibles sont au nombre de 4 : 1. Jamais 2. Rarement 3. De temps autre 4. Souvent

Dans la fiche signaltique on trouve, parmi d'autres, une question concernant la classe d'ge du rpondant. Le tableau suivant est un tri crois sous forme de table de contingence des deux questions ( reproduire aprs tlchargement des donnes) : :

Achat de produits biologiques souvent Age 15-19 20-24 25-34 35-44 45-59 60+ Total de temps autre rarement jamais Total

3 2 5 8 10 14 42

6 13 18 42 46 20 145

24 49 19 33 36 9 170

9 6 9 3 4 4 35

42 70 51 86 96 47 392

a) b) c) d)

Quelles est la nature de ces deux variables? Faites deux tris simples sous forme de camembert (en %). Faites un tableau de frquences du tri crois ; quelle est la signification des % ? Crez le tableau de profils-lignes; reprsenter sous forme de graphique barres doubles. Interprter. Calculez le khi-deux d'indpendance. Est-ce qu'on peut conclure une dpendance statistique au seuil de 5% d'erreur ? Est-ce qu'on peut envisager une analyse factorielle ?Si oui, laquelle ?

You might also like