You are on page 1of 842

SPSS Base 14.

0 Guide de lutilisateur

Pour plus dinformations sur les logiciels SPSS, visitez notre site Web ladresse suivante : http://www.spss.com ou contactez SPSS Inc. 233 South Wacker Drive, 11th Floor Chicago, IL 60606-6412 Tl : (312) 651-3000 Fax : (312) 651-3668 SPSS est une marque dpose et les autres noms de produit sont des marques commerciales de SPSS Inc. pour son logiciel informatique propritaire. La distribution ou la production de matriel dcrivant ce type de logiciel est interdite sans lautorisation crite des propritaires de la marque commerciale et des droits de licence dans le logiciel, et des copyrights dans les diffrentes documentations. Le LOGICIEL et sa documentation sont soumis des DROITS RESTREINTS. Lutilisation, la reproduction ou la divulgation par le Gouvernement des Etats-Unis est sujette des restrictions telles quelles sont dcrites dans la sous-division (c)(1)(ii) de la clause The Rights in Technical Data and Computer Software , alina 52.227-7013. Le contractant et fabricant est SPSS Inc., 233 South Wacker Drive, 11th Floor, Chicago IL 60606-6412, Etats-Unis. Remarque gnrale : Les autres noms de produit mentionns dans ce document sont utiliss des fins dillustration uniquement et peuvent tre des marques commerciales de leurs dtenteurs respectifs. TableLook est une marque commerciale de SPSS Inc. Windows est une marque dpose de Microsoft Corporation. DataDirect, DataDirect Connect, INTERSOLV et SequeLink sont des marques dposes de DataDirect Technologies. Certaines parties de ce produit ont t cres laide de LEADTOOLS 19912000, LEAD Technologies, Inc. TOUS DROITS RESERVES. LEAD, LEADTOOLS et LEADVIEW sont des marques dposes de LEAD Technologies, Inc. Sax Basic est une marque commerciale de Sax Software Corporation. Copyright 19932004 Polar Engineering and Consulting. Tous droits rservs. Certaines parties de ce produit ont t bases sur le travail du FreeType Team (http://www.freetype.org). Une partie du logiciel SPSS contient la technologie zlib. Copyright 19952002 Jean-Loup Gailly et Mark Adler. Le logiciel zlib est fourni en ltat , sans garantie expresse ou implicite. Une partie du logiciel SPSS contient des bibliothques Sun Java Runtime. Copyright 2003 Sun Microsystems, Inc. Tous droits rservs. Les bibliothques Sun Java Runtime comprennent un code sous licence de RSA Security, Inc. Certaines parties de ces bibliothques sont concdes sous licence par IBM et sont disponibles ladresse suivante : http://oss.software.ibm.com/icu4j/. SPSS Base 14.0 Guide de lutilisateur 2005 SPSS Inc. Tous droits rservs. Toute reproduction, tout stockage dans un systme de rcupration et toute transmission, mme partiels, de quelque forme ou par quelque moyen que ce soit, lectronique, mcanique, par photocopie, enregistrement ou autre sont interdits sans le consentement pralable crit de lditeur. 1234567890 08 07 06 05

ISBN 1-56827-680-X

Prface

SPSS 14.0
SPSS 14.0 est un systme complet danalyse de donnes. SPSS peut utiliser les donnes de presque tout type de fichier pour gnrer des rapports mis en tableau, des diagrammes de distributions et de tendances, des statistiques descriptives et des analyses statistiques complexes. Ce guide, SPSS Base 14.0 Guide de lutilisateur, documente linterface utilisateur graphique de SPSS pour Windows. Le systme daide install avec le logiciel contient des exemples dutilisation des procdures statistiques du systme SPSS Base 14.0. Les algorithmes utiliss dans les procdures statistiques sont disponibles au format PDF partir du menu Aide. En outre, sous les menus et les botes de dialogue, SPSS utilise un langage de commande. Certaines fonctions tendues du systme sont accessibles uniquement via une syntaxe de commande. (Ces fonctions ne sont pas disponibles dans la version Student.) Un guide de rfrence dtaill sur la syntaxe des commandes est disponible sous deux formes diffrentes : guide intgr dans le systme daide global et comme document distinct au format PDF dans SPSS 14.0 Command Syntax Reference, aussi disponible partir du menu Aide.

Options SPSS
Les options suivantes sont fournies comme amliorations complmentaires du systme de base complet SPSS Base (pas de la version Student) : Le module Modles de rgression SPSS fournit des techniques danalyse des donnes non adaptes aux modles statistiques linaires classiques. Il contient des procdures pour les modles de choix binaire, la rgression logistique, la pondration estime, la rgression par les doubles moindres carrs et la rgression non linaire gnrale.
iii

Le module Modles avancs SPSS dcrit les techniques souvent utilises dans la recherche biomdicale et exprimentale avance. Il inclut des procdures pour les modles linaires gnraux (GLM), les modles mixtes linaires, lanalyse des composantes de variance, lanalyse log-linaire, la rgression ordinale, la dure de vie actuarielle, lanalyse de survie de Kaplan-Meier, et la rgression de Cox de base et tendue. Le module Tableaux SPSS cre toute une gamme de rapports en tableau de qualit prsentation, y compris des tableaux croiss complexes et les affichages de donnes de rponses multiples. Le module Sries SPSS effectue des prvisions et des analyses de sries chronologiques compltes avec plusieurs modles dajustement aux courbes, des modles de lissage et des mthodes destimation des fonctions autorgressives. Le module Modalits SPSS excute des procdures de codage optimal comme lanalyse des correspondances. Le module Conjoint SPSS effectue des analyses Conjoint. Le module Tests exacts SPSS calcule les valeurs p exactes pour les tests statistiques lorsque de petits chantillons ou des chantillons distribus de faon trs ingale risquent de fausser la prcision des tests habituels. Le module Analyse des valeurs manquantes SPSS dcrit les types des donnes manquantes, value les moyennes et dautres statistiques, et affecte des valeurs aux observations manquantes. Le module SPSS Maps transforme vos donnes distribues gographiquement en cartes de haute qualit comportant des symboles, des couleurs, des diagrammes en btons ou en secteurs, et des combinaisons de thmes, ce qui permet de reprsenter ce qui se passe et o cela se passe. Le module Echantillonnage SPSS permet aux chercheurs chargs deffectuer des enqutes (notamment dopinion), des tudes de march, ou travaillant dans le domaine de la sant, ainsi quaux spcialistes des sciences sociales qui utilisent une mthodologie dtude fonde sur les chantillons, dincorporer leurs propres plans dchantillonnage complexes dans lanalyse des donnes. Le module Arbres de segmentation SPSS cre un modle darbre de segmentation. Elle classe les observations en groupes ou estime les valeurs dune variable (cible) dpendante partir des valeurs de variables (explicatives) indpendantes. Cette procdure fournit des outils de validation pour les analyses de classification dexploration et de confirmation.
iv

Validation des donnes SPSS fournit un clich visuel rapide de vos donnes. Il

permet dappliquer des rgles de validation qui identifient les valeurs de donnes invalides. Vous pouvez crer des rgles qui reprent les valeurs hors plage, les valeurs manquantes et les valeurs vides. Vous pouvez galement enregistrer des variables qui enregistrent les violations de rgles individuelles et le nombre total de violations de rgles par observation. Un ensemble limit de rgles prdfinies que vous pouvez copier ou modifier vous est fourni. La famille des produits SPSS comprend galement des applications pour la saisie de donnes, lanalyse de texte, la classification, les rseaux neuronaux et ltablissement dorganigrammes.
Installation

Pour installer le SPSS Base system, lancez lassistant dattribution de licence laide du code correspondant fourni par SPSS Inc. Pour plus dinformations, reportez-vous aux instructions dinstallation fournies avec le SPSS Base system.
Compatibilit

SPSS est conu pour fonctionner sous de nombreux systmes dexploitation. Pour plus dinformations sur la configuration minimale ou recommande, reportez-vous aux instructions dinstallation de votre systme.
Numros de srie

Le numro de srie permet de vous identifier auprs de SPSS Inc. Vous en aurez besoin lors de tout appel SPSS Inc. pour des informations relatives au support, au paiement ou la mise niveau de votre systme. Le numro de srie est fourni avec le systme de base.
Service clients

Si vous avez des questions concernant votre envoi ou votre compte, contactez votre bureau local, dont les coordonnes figurent sur le site Web de SPSS ladresse suivante : http://www.spss.com/worldwide. Veuillez prparer et conserver votre numro de srie porte de main pour lidentification.
v

Sminaires de formation

SPSS Inc. propose des sminaires de formation, publics et sur site. Tous les sminaires font appel des ateliers de travaux pratiques. Ces sminaires seront proposs rgulirement dans les grandes villes. Pour plus dinformations sur ces sminaires, contactez votre bureau local dont les coordonnes sont indiques sur le site Web de SPSS ladresse suivante : http://www.spss.com/worldwide.
Support technique

Les services du support technique de SPSS sont disponibles pour les utilisateurs inscrits. Les clients peuvent contacter le support technique pour obtenir de laide concernant lutilisation de SPSS ou linstallation dans le cadre de lun des environnements matriels pris en charge. Pour contacter le support technique, visitez le site Web de SPSS ladresse http://www.spss.com ou contactez votre bureau local dont les coordonnes figurent sur le site Web de SPSS ladresse suivante : http://www.spss.com/worldwide. Votre nom ou celui de votre socit, ainsi que le numro de srie de votre systme, vous seront demands.
Documents supplmentaires

Vous pouvez faire lacquisition dautres copies des manuels du produit SPSS directement auprs de SPSS Inc. Visitez le magasin de notre site Web ladresse http://www.spss.com/estore ou contactez votre bureau SPSS local dont les coordonnes figurent sur le site Web de SPSS ladresse suivante : http://www.spss.com/worldwide. Pour passer commande par tlphone aux Etats-Unis et au Canada, appelez SPSS Inc. au numro 800-543-2185. Dans les autres pays, contactez votre bureau local dont les coordonnes figurent sur le site Web de SPSS. Le module supplmentaire de procdures statistiques SPSS, cr par Marija Noruis, a t publi par Prentice Hall. Une nouvelle version de ce manuel, mise jour pour SPSS 14.0, est prvue. Le module supplmentaire de procdures statistiques SPSS avances, qui repose galement sur SPSS 14.0, sera disponible prochainement. Le manuel danalyse des donnes SPSS Guide to Data Analysis de SPSS 14.0 est galement en prparation. Lannonce des publications disponibles uniquement auprs de Prentice Hall pourra tre consulte sur le site Web de SPSS ladresse suivante : http://www.spss.com/estore (slectionnez le pays de votre choix, puis cliquez sur Books).
vi

Votre avis nous intresse

Vos remarques sont importantes. Veuillez nous envoyer une lettre nous dcrivant votre exprience de lutilisation des produits SPSS. Nous apprcions tout particulirement les informations sur des applications nouvelles et intressantes utilisant SPSS Base system. Veuillez nous envoyer un message lectronique ladresse suggest@spss.com ou crivez : Director of Product Planning, 233 South Wacker Drive, 11th Floor, Chicago, IL 60606-6412, U.S.A.
A propos de ce manuel

Ce manuel prsente linterface graphique des procdures de SPSS Base system. Les illustrations des botes de dialogue sont issues de SPSS for Windows. Les botes de dialogue des versions conues pour les autres systmes dexploitation sont similaires. Vous trouverez plus dinformations sur la syntaxe de commande des fonctions de SPSS Base system est disponible sous deux formes diffrentes : guide intgr dans le systme daide global et comme document distinct au format PDF dans SPSS 14.0 Command Syntax Reference, disponible partir du menu Aide.
Contacter SPSS

Si vous souhaitez tre inscrit sur notre liste de mailing, contactez lun de nos bureaux, dont les coordonnes figurent sur notre site Web ladresse http://www.spss.com/worldwide.

vii

Index
1 Sommaire 1

Nouveauts de SPSS 14.0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Fentres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Menus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Barre dtat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Botes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Noms de variables et tiquettes de variable dans les listes de botes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Commande des botes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Sous-botes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Slection de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Icnes de la liste Variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Obtenir des informations sur les variables dans les botes de dialogue . . . . 13 Procdures de base dans lanalyse des donnes . . . . . . . . . . . . . . . . . . . . 14 Assistant statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 En savoir plus sur SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

Obtention dAide

17

Utilisation du sommaire de laide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Utilisation de lindex de laide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Utilisation de la recherche dans laide . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Aide sur les commandes des botes de dialogue . . . . . . . . . . . . . . . . . . . . . 22

ix

Aide sur les termes utiliss dans les rsultats . . . . . . . . . . . . . . . . . . . . . . . 23 Utilisation de loption Etudes de Cas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Copie de texte daide partir dune fentre contextuelle. . . . . . . . . . . . . . . 24

Fichiers de donnes

25

Ouverture dun fichier de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Pour ouvrir un fichier de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Types de fichier de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Ouvrir les options de fichier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Lecture de fichiers Excel version 5 ou ultrieure . . . . . . . . . . . . . . . . . . . . . 27 Lecture de fichiers Excel antrieurs ou autres tableurs avec lditeur de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Lecture de fichiers dBASE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Lecture de fichiers Stata. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Lire des fichiers de base de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Assistant de texte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Lecture des donnes de dimension. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Informations sur les fichiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Enregistrement des fichiers de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Pour enregistrer des fichiers de donnes modifis . . . . . . . . . . . . . . . . . . . 68 Enregistrement de fichiers de donnes au format Excel . . . . . . . . . . . . . . . 68 Enregistrement de fichiers de donnes au format SAS . . . . . . . . . . . . . . . . 69 Enregistrement de fichiers de donnes au format Stata . . . . . . . . . . . . . . . 71 Pour enregistrer des fichiers de donnes sous des formats diffrents. . . . . 73 Enregistrement de donnes : Types de fichier de donnes . . . . . . . . . . . . . 73 Enregistrement de sous-ensembles de variables . . . . . . . . . . . . . . . . . . . . 76 Enregistrement de fichier : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 Protection des donnes dorigine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

Fichier actif virtuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

Mode danalyse distribue

83

Analyse distribue et analyse locale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

Editeur de donnes

95

Affichage des donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Affichage des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 Saisie de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 Modification de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 Aller lobservation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Etat de la slection de lobservation dans lditeur de donnes . . . . . . . . . 116 Options daffichage de lditeur de donnes . . . . . . . . . . . . . . . . . . . . . . . 117 Impression de lditeur de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

Utilisation des sources de donnes multiples 119


Manipulation de base de plusieurs sources de donnes . . . . . . . . . . . . . . 120 Copie et collage dinformations entre les ensembles de donnes . . . . . . . 122 Attribution dun nouveau nom aux ensembles de donnes . . . . . . . . . . . . 122

Prparation des donnes

123

Proprits de variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

xi

Dfinition des proprits de variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Vecteurs de rponses multiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 Copier les proprits de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 Identification des observations dupliques . . . . . . . . . . . . . . . . . . . . . . . . 147 Outil visuel de regroupement en bandes . . . . . . . . . . . . . . . . . . . . . . . . . . 150

Transformations de donnes

163

Calcul de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 Fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 Valeurs manquantes dans les fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . 167 Gnrateurs de nombres alatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 Compter occurrences des valeurs par observation . . . . . . . . . . . . . . . . . . 169 Recodage de valeurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 Recodage de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 Cration de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 Ordonner les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 Recoder automatiquement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 Assistant Date et heure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 Transformation de donnes pour srie chronologique. . . . . . . . . . . . . . . . 203 Notation de donnes avec des modles de prvision . . . . . . . . . . . . . . . . 211

Gestion et transformations de fichiers

217

Trier les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 Transposer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 Fusionner des fichiers de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 Ajouter des observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220

xii

Ajouter des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 Agrger les donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 Scinder un fichier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 Slectionner des observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 Pondrer les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 Restructuration des donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240

10 Utilisation du rsultat

265

Rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 Utilisation de rsultats dans dautres applications . . . . . . . . . . . . . . . . . . 274 Collage dobjets dans le Rsultats. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278 Collage spcial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278 Collage dobjets dune autre application dans le Rsultats . . . . . . . . . . . . 278 Exporter rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 Impression de documents du Rsultats. . . . . . . . . . . . . . . . . . . . . . . . . . . 291 Enregistrement des rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298

11 Viewer en mode brouillon

301

Pour crer un rsultat en mode brouillon . . . . . . . . . . . . . . . . . . . . . . . . . 302 Contrle du format du rsultat en mode brouillon . . . . . . . . . . . . . . . . . . . 303 Attributs de polices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 Pour imprimer un rsultat en mode brouillon. . . . . . . . . . . . . . . . . . . . . . . 308 Pour enregistrer une sortie du Viewer en mode brouillon . . . . . . . . . . . . . 310

xiii

12 Tableaux pivotants

311

Manipulation dun tableau pivotant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311 Utilisation des strates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 Signets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320 Montrer ou masquer des cellules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 Modification des rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323 Modification de laspect des tableaux. . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 Proprits du tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326 Pour modifier les proprits dun tableau pivotant . . . . . . . . . . . . . . . . . . 326 Proprits de tableau : Gnral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 Proprits de tableau : Notes de bas de page. . . . . . . . . . . . . . . . . . . . . . 328 Proprits de tableau : Formats de cellule . . . . . . . . . . . . . . . . . . . . . . . . 329 Proprits de tableau : Bordures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 Proprits de tableau : Impression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332 Polices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 Largeur des cellules de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334 Proprits de la cellule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335 Proprits des cellules : Valeur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 Proprits des cellules : Alignement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 Proprits des cellules : Marges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338 Proprits des cellules : Ombrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 Marque de bas de page . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340 Slection des lignes et des colonnes dans les tableaux pivotants . . . . . . . 341 Pour slectionner une ligne ou une colonne dans un tableau pivotant. . . . 341 Modification des rsultats dun tableau pivotant . . . . . . . . . . . . . . . . . . . . 341 Impression des tableaux pivotants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 Pour imprimer les strates masques dun tableau pivotant . . . . . . . . . . . . 343 Contrle des sauts de tableau pour les tableaux longs et larges . . . . . . . . 343

xiv

13 Utilisation de la syntaxe de commande

345

Rgles de syntaxe de commande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346 Cration dune syntaxe depuis les botes de dialogue . . . . . . . . . . . . . . . . 348 Utilisation de la syntaxe depuis le fichier de rsultat . . . . . . . . . . . . . . . . . 349 Utilisation de la syntaxe dans un fichier-journal . . . . . . . . . . . . . . . . . . . . 351 Excuter une syntaxe de commande. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353 Commandes Execute multiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353

14 Effectifs

355

Statistiques des effectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358 Diagrammes des effectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360 Format des effectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361

15 Descriptives

363

Options Descriptives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365 Fonctionnalits supplmentaires de la commande DESCRIPTIVES . . . . . . 366

16 Explorer

369

Statistiques dExplorer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373 Diagrammes dExplorer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374 Options dExplorer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376 Fonctionnalits supplmentaires de la commande EXAMINE . . . . . . . . . . 376

xv

17 Tableaux croiss

379

Strates de tableaux croiss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382 Diagrammes en btons juxtaposs de tableaux croiss . . . . . . . . . . . . . . 383 Statistiques de tableaux croiss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383 Affichage de cellules (cases) de tableaux croiss. . . . . . . . . . . . . . . . . . . 387 Format de tableau crois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389

18 Rcapituler

391

Options de Rcapituler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394 Rcapituler les statistiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395

19 Moyennes

399

Moyennes : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402

20 Cubes OLAP

405

Cubes OLAP : Statistiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 408 Cubes OLAP : Diffrences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411 Cubes OLAP : Titre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412

21 Tests T

413

Test T pour chantillons indpendants . . . . . . . . . . . . . . . . . . . . . . . . . . . 413

xvi

Test T pour chantillons apparis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 418 Test T pour chantillon unique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421 Fonctionnalits supplmentaires de la commande T-TEST . . . . . . . . . . . . 423

22 ANOVA 1 facteur

425

Contrastes ANOVA 1 facteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428 Tests Post Hoc ANOVA 1 facteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429 Options ANOVA 1 facteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432 Fonctionnalits supplmentaires de la commande ONEWAY . . . . . . . . . . . 433

23 Analyse GLM Univari

435

Modle GLM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439 Contrastes GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442 Diagrammes de profils GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443 Comparaisons post hoc GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445 Enregistrement GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447 Options GLM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449 Fonctionnalits supplmentaires de la commande UNIANOVA . . . . . . . . . 451

24 Corrlations bivaries

453

Options de corrlations bivaries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456 Proprits supplmentaires des commandes CORRELATIONS et NONPAR CORR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457

xvii

25 Corrlations partielles

459

Options Corrlations partielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462 Fonctionnalits supplmentaires de la commande PARTIAL CORR . . . . . . 463

26 Distances

465

Distances : Mesures de dissimilarit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467 Indices : Mesures de similarit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 468 Fonctionnalits supplmentaires de la commande PROXIMITIES . . . . . . . 469

27 Rgression linaire

471

Mthodes de slection des variables de rgression linaire . . . . . . . . . . . 476 Rgression linaire : Dfinir la rgle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 477 Diagrammes de rgression linaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478 Rgression linaire : Enregistrer de nouvelles variables . . . . . . . . . . . . . . 479 Statistiques de rgression linaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483 Rgression linaire : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485 Fonctionnalits supplmentaires de la commande REGRESSION . . . . . . . 486

28 Ajustement de fonctions

487

Modles dajustement de fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 491 Enregistrement de lajustement de fonctions. . . . . . . . . . . . . . . . . . . . . . . 492

xviii

29 Analyse discriminante

495

Dfinition dintervalles pour lanalyse discriminante . . . . . . . . . . . . . . . . . 499 Slection des observations pour lanalyse discriminante . . . . . . . . . . . . . 499 Statistiques de lanalyse discriminante . . . . . . . . . . . . . . . . . . . . . . . . . . . 500 Mthode pas pas de lanalyse discriminante . . . . . . . . . . . . . . . . . . . . . 501 Analyse discriminante : Classement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 Enregistrement de lanalyse discriminante . . . . . . . . . . . . . . . . . . . . . . . . 505 Fonctionnalits supplmentaires de la commande DISCRIMINANT. . . . . . 505

30 Analyse factorielle

507

Slection des observations pour lanalyse factorielle . . . . . . . . . . . . . . . . 513 Descriptives danalyse factorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514 Extraction danalyse factorielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515 Rotation danalyse factorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 517 Scores danalyse factorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519 Options danalyse factorielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 520 Fonctionnalits supplmentaires de la commande FACTOR. . . . . . . . . . . . 520

31 Choix dune procdure de classification 32 Analyse TwoStep Cluster

523 525

Options de la procdure danalyse TwoStep Cluster . . . . . . . . . . . . . . . . . 529 Diagrammes de lanalyse TwoStep Cluster . . . . . . . . . . . . . . . . . . . . . . . . 532 Rsultats de lanalyse TwoStep Cluster. . . . . . . . . . . . . . . . . . . . . . . . . . . 533

xix

33 Classification hirarchique

535

Mthode de classification hirarchique . . . . . . . . . . . . . . . . . . . . . . . . . . 539 Statistiques de la classification hirarchique . . . . . . . . . . . . . . . . . . . . . . 540 Diagrammes (graphiques) de classification hirarchique . . . . . . . . . . . . . 541 Enregistrement des nouvelles variables de classification hirarchique . . . 541 Fonctionnalits supplmentaires de la syntaxe de commande CLUSTER . . 542

34 Nues dynamiques

543

Efficacit de la classification en nues dynamiques . . . . . . . . . . . . . . . . . 548 Itration de la classification en nues dynamiques . . . . . . . . . . . . . . . . . . 549 Enregistrement des analyses de classes de nues dynamiques . . . . . . . . 550 Options danalyses des classes de nues dynamiques . . . . . . . . . . . . . . . 551 Fonctionnalits supplmentaires de la commande QUICK CLUSTER . . . . . 552

35 Tests non paramtriques

553

Test du Chi-deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554 Test binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 558 Suites en squences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 561 Test Kolmogorov-Smirnov pour un chantillon . . . . . . . . . . . . . . . . . . . . . 565 Tests pour deux chantillons indpendants. . . . . . . . . . . . . . . . . . . . . . . . 568 Tests pour deux chantillons lis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573 Tests pour plusieurs chantillons indpendants . . . . . . . . . . . . . . . . . . . . 577 Tests pour plusieurs chantillons lis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581

xx

36 Analyse des rponses multiples

585

Dfinition de vecteurs multirponses . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586 Tableaux de frquences des rponses multiples . . . . . . . . . . . . . . . . . . . . 588 Tableaux croiss des rponses multiples . . . . . . . . . . . . . . . . . . . . . . . . . 590 Dfinir Intervalles Tableaux croiss De rponses multiples . . . . . . . . . . . . 592 Options Tableaux croiss de rponses multiples . . . . . . . . . . . . . . . . . . . . 593 Fonctionnalits supplmentaires de la commande MULT RESPONSE . . . . 594

37 Tableaux de Rsultats

595

Tableaux de bord en lignes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595 Tableaux de bord en colonnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604 Fonctionnalits supplmentaires de la commande REPORT. . . . . . . . . . . . 611

38 Analyse de fiabilit

613

Statistiques de lanalyse de fiabilit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616 Fonctionnalits supplmentaires de la commande RELIABILITY . . . . . . . . 618

39 Positionnement multidimensionnel

621

Forme des donnes du positionnement multidimensionnel . . . . . . . . . . . . 623 Positionnement multidimensionnel : crer une mesure . . . . . . . . . . . . . . . 624 Modle de positionnement multidimensionnel . . . . . . . . . . . . . . . . . . . . . 625 Positionnement multidimensionnel : Options . . . . . . . . . . . . . . . . . . . . . . . 626 Fonctionnalits supplmentaires de la commande ALSCAL. . . . . . . . . . . . 627

xxi

40 Statistiques de ratio

629

Statistiques de ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 631

41 Prsentation de lutilitaire de diagramme

633

Cration et modification dun diagramme . . . . . . . . . . . . . . . . . . . . . . . . . 633 Options de dfinition du diagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641

42 Courbes ROC

647

Courbe ROC : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650

43 Outils

651

Informations de la variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 651 Commentaires de fichier de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 652 Groupes de Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653 Dfinir des groupes de variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653 Utiliser les groupes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 655 Rordonner Listes Variables Cible. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656

44 Options

659

Options gnrales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 660 Options Viewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662

xxii

Options du Viewer en mode brouillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . 663 Options Etiquettes Rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665 Options de diagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667 Options diagrammes interactifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 672 Options tableaux pivotants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673 Options de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 676 Options montaires (devises) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677 Options script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 679

45 Personnalisation des menus et des barres doutils

681

Editeur de menu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 681 Personnalisation des barres doutils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 682 Montrer barres doutils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683 Pour personnaliser les barres doutils . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683

46 Systme de production

691

Utilisation de lUtilitaire de Production . . . . . . . . . . . . . . . . . . . . . . . . . . . 693 Options dexportation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 694 Invites utilisateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 696 Sollicitation de macros de production . . . . . . . . . . . . . . . . . . . . . . . . . . . . 698 Options de production . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 699 Contrle du format des tches de production . . . . . . . . . . . . . . . . . . . . . . 700 Excution de tches de production partir dune ligne de commande . . . 703 Publication sur le Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705 Connexion au serveur Web SmartViewer . . . . . . . . . . . . . . . . . . . . . . . . . 706

xxiii

47 Utilitaire de script SPSS

707

Excution dun script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 707 Scripts livrs avec SPSS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 708 Autoscripts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 709 Cration et modification de scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 711 Modification dun script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 712 Fentre de script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 712 LAssistant script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 715 Cration de scripts automatiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 716 Fonctionnement des scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 721 Table des classes dobjet et conventions dappellation . . . . . . . . . . . . . . . 723 Nouvelle procdure (Script) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 728 Ajout dune description un script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 731 Botes de dialogue de script personnalises . . . . . . . . . . . . . . . . . . . . . . . 731 Mise au point des scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 736 Fichiers de script et de syntaxe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 739

48 Systme de gestion des rsultats

743

Types dobjet de sortie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 747 Identificateurs de commande et sous-types de tableau. . . . . . . . . . . . . . . 749 Etiquettes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 751 Options OMS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 752 Journalisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 758 Exclusion de laffichage des rsultats du Viewer. . . . . . . . . . . . . . . . . . . . 758 Acheminement des rsultats vers des fichiers de donnes SPSS . . . . . . . 759 Structure de tableau OXML. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 769 Identificateurs OMS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 773

xxiv

Annexes A Administrateur daccs de base de donnes B Personnalisation de documents HTML 777 779

Pour ajouter du code HTML personnalis des documents de rsultat exports . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779 Contenu et format du fichier texte pour code HTML personnalis . . . . . . . 780 Pour utiliser un autre fichier ou emplacement pour le code HTML personnalis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 780

Index

783

xxv

Chapitre

Sommaire

SPSS pour Windows vous offre un puissant systme danalyse statistique et de gestion de donnes dans un environnement graphique, avec des menus descriptifs et des botes de dialogue simples, pour faire presque tout le travail votre place. La plupart des tches seffectuent par simple pointage et cliquage de la souris. Outre la simple interface de pointage et cliquage permettant lanalyse statistique, SPSS pour Windows offre les fonctions suivantes :
Editeur de donnes. Data Editor est un systme polyvalent de type tableur pour dfinir,

saisir, modifier et afficher des donnes.


Viewer. Le nouveau Viewer permet de parcourir les rsultats, dafficher et de masquer

les rsultats de faon slective, de modifier lordre daffichage des rsultats, de dplacer des tableaux et diagrammes pour prsentation entre SPSS et dautres applications.
Tableaux pivotants multidimensionnels. Vos rsultats prennent vie avec les tableaux pivotants multidimensionnels. Explorez vos tableaux en rorganisant les lignes, colonnes et strates. Rvlez des conclusions importantes qui peuvent se perdre dans des rapports standard. Comparez facilement les groupes en clatant votre tableau de faon ce quun seul groupe soit affich la fois. Graphismes haute rsolution. SPSS inclut de nombreuses caractristiques standard comme par exemple des diagrammes haute rsolution et secteurs unis, des diagrammes en btons, des histogrammes, des diagrammes de dispersion, des graphiques 3D et plus. Accs aux bases de donnes. Rcuprez des informations partir des bases de donnes en utilisant lassistant de base de donnes au lieu davoir poser des questions SQL complexes.

2 Chapitre 1

Transformations de donnes. Les fonctionnalits de transformation vous aident rendre vos donnes prtes lanalyse. Vous pouvez, entre autres, grouper les donnes en sous-ensembles, combiner des modalits, ajouter, agrger, fusionner, scinder et transposer des fichiers en toute facilit. Distribution lectronique. Envoyez des rapports lectroniques aux autres utilisateurs laide dun simple clic ou exportez des tableaux et des diagrammes au format HTML pour la distribution lectronique par Internet et intranet. Aide en ligne. Des didacticiels dtaills offrent un aperu complet ; les rubriques

daide contextuelle des botes de dialogue vous guident dans les tches spcifiques ; les dfinitions contextuelles dans les rsultats de tableaux pivotants expliquent les termes statistiques. LAssistant statistique vous aide trouver les procdures que vous recherchez et les tudes de cas fournissent des exemples concrets sur lutilisation des procdures statistiques et linterprtation des rsultats.
Langage de commande. Vous pouvez effectuer la plupart des tches laide dun

simple clic, mais SPSS fournit galement un langage de commande puissant qui vous permet denregistrer et dautomatiser de nombreuses tches courantes. Le langage de commande fournit galement certaines fonctions non disponibles dans les menus et les botes de dialogue. Une documentation complte de la syntaxe de commande est intgre dans le systme daide global et galement disponible dans un document PDF spar, SPSS Command Syntax Reference, galement disponible partir du menu Aide.

Nouveauts de SPSS 14.0


Gestion des donnes

Le fait davoir plusieurs sources de donnes ouvertes en mme temps rend plus facile la comparaison des fichiers de donnes, la copie des donnes et des attributs dun fichier un autre et la fusion de plusieurs sources de donnes sans devoir enregistrer chaque source de donnes en tant que fichier de donnes SPSS tri. Lire et crire des fichiers de donnes au format Stata. Vous pouvez lire des fichiers de donnes Stata version 48 et crire des fichiers de donnes Stata version 58. Pour plus dinformations, tapez Stata dans longlet Index du systme daide. Lire les donnes partir des sources de donnes de dimension SPSS, y compris Quanvert, Quancept, et mrInterview. Pour plus d'informations, reportez-vous Lecture des donnes de dimension dans Chapitre 3 p. 62.

3 Sommaire

Lire des donnes partir des sources de donnes OLE DB. Pour plus d'informations, reportez-vous Slectionner une source de donnes dans Chapitre 3 p. 31. Dfinir des tiquettes de valeur descriptive jusqu 120 octets de long (auparavant limites 60 octets). Crer des valeurs de donnes partir dtiquettes de valeurs ou les utiliser dans une logique de transformation avec la fonction VALUELABEL. Rechercher et remplacer les valeurs de chane avec la fonction REPLACE. Dfinir des attributs de variables personnalises et de fichiers de donnes avec les commandes VARIABLE ATTRIBUTE et DATAFILE ATTRIBUTE. Ecrire des donnes dans des tables de bases de donnes ou dans dautres formats en utilisant les noms de champ/colonne non soumis aux rgles dappellation des variables SPSS. SAVE TRANSLATE a t amlior pour vous permettre dutiliser des valeurs entre guillemets pour les noms de champs/colonnes qui contiennent des espaces, des virgules et dautres caractres non autoriss dans les noms de variables SPSS. Ajoutez de nouvelles colonnes aux tableaux de bases de donnes, modifiez les attributs des colonnes des tableaux de bases de donnes, joignez des tableaux et ralisez dautres actions autorises avec des instructions SQL valides grce la nouvelle sous-commande SQL de la commande SAVE TRANSLATE.
Diagrammes

Construisez des diagrammes partir de diagrammes prdfinis de la galerie ou partir de diffrents lments individuels (par exemple, des systmes de coordonnes et des btons) laide de la nouvelle interface Gnrateur de diagrammes (menu Graphes). Crez des types de diagrammes personnaliss en utilisant la syntaxe de commande performante GGRAPH et GPL.
Enrichissement statistique

Le nouveau modlisateur expert de loption Tendances identifie automatiquement et estime le modle le mieux ajust pour une ou plusieurs sries chronologiques, liminant ainsi le besoin didentifier un modle appropri via une suite de tentatives et derreurs. Le modlisateur expert est accessible partir de la bote de

4 Chapitre 1

dialogue Modlisateur de sries chronologiques ou via la syntaxe de commande (commande TSMODEL). La nouvelle option de validation des donnes offre un instantan visuel rapide de vos donnes et permet dappliquer les rgles de validation qui identifient les valeurs de donnes non valides. Vous pouvez crer des rgles qui reprent les valeurs hors plage, les valeurs manquantes et les valeurs vides. Vous pouvez galement enregistrer des variables qui enregistrent les violations de rgles individuelles et le nombre total de violations de rgles par observation. Un ensemble limit des rgles prdfinies que vous pouvez copier ou modifier vous est fourni. La validation des donnes est disponible via la bote de dialogue Valider donnes du menu Donnes ou via la syntaxe de commande (commande VALIDATEDATA). La nouvelle procdure de dtection des anomalies dans loption Validation des donnes recherche les observations inhabituelles qui risqueraient daffecter les modles prdictifs. Certaines de ces observations loignes sont des observations tout fait uniques et savrent donc inexploitables en termes de prdiction, alors que dautres observations sont dues des erreurs de saisie de donnes dans lesquelles les valeurs sont techniquement correctes sans pouvoir toutefois tre prises en compte par les procdures de validation de donnes. La dtection des anomalies est disponible via la bote de dialogue Identifier les observations inhabituelles dans le menu Donnes ou via la syntaxe de commande (commande DETECTANOMALY). La nouvelle procdure de dpliage multidimensionnel (PREFSCAL) de loption Modalits tente de dterminer la structure dun groupe de mesures de proximit entre les objets de ligne et de colonne. Ce procd est effectu en transmettant des observations des positions particulires dans un espace conceptuel de petite dimension de telle sorte que les distances entre les points dans lespace correspondent le mieux possible aux (dis)similarits donnes. Le rsultat est une reprsentation moindres carrs des objets dans cet espace de petite dimension, qui vous aidera, dans de nombreux cas, mieux comprendre vos donnes. Cette procdure est actuellement disponible avec la syntaxe de commande PREFSCAL. La nouvelle procdure de slection des variables indpendantes (SELECTPRED) du serveur SPSS recherche parmi un trs grand nombre de variables indpendantes qualitatives et continues. La procdure slectionne un sous-ensemble plus petit pour une utilisation dans des procdures de modles de prcision ne pouvant pas accpter autant de variables indpendantes. Cette procdure est actuellement disponible avec la syntaxe de commande SELECTPRED.

5 Sommaire

La nouvelle procdure Nave Bayes (NAIVEBAYES) du serveur SPSS produit un modle simple et stable pour la slection et le classement des variables indpendantes. Cette procdure est actuellement disponible avec la commande de syntaxe NAIVEBAYES. Les capacits de test de signification amliores dans loption Tableaux vous permettent dexcuter des tests de signification sur les sous-totaux et les vecteurs multirponses. Plus de flexibilit dans la dfinition de vecteurs multirponses pour les dichotomies multiples.
Rsultats

Les rsultats de tableau pivotant sont maintenant fournis pour Ordonner les observations (RANK), Remplacer les valeurs manquantes (RMV) et Crer la srie chronologique (CREATE) dans le systme Base ; toutes les procdures dans loption Conjoint ; Slection du modle log-linaire (HILOGLINEAR) dans loption Modles avancs et enfin Modles de choix binaire (PROBIT), Pondration estime (WLS) et Doubles moindres carrs (2SLS) dans loption Modles de rgression.
Amlioration des performances

Les structures des tableaux qui taient auparavant longues crer ou qui arrivaient court de mmoire avec loption Tableaux personnaliss (CTABLES) peuvent maintenant tre cres rapidement et efficacement.
Aspect amlior

Icnes de variables amliores qui offrent plus dinformations sur les variables du premier coup doeil, y compris le niveau de mesure (nominal, ordinal ou dchelle) et le type de donnes (chanes, numriques, date, heure). Prise en charge complte de lapparence et des paramtres de thme pour Windows XP.

Compatibilit de SPSS 14.0 avec les versions prcdentes


Fonctions ANY et RANGE.

6 Chapitre 1

Dans les versions prcdentes, les fonctions ANY et RANGE donnaient uniquement une valeur manquante si le premier argument avait pour rsultat une valeur manquante. Pour des raisons de cohrence avec les autres fonctions et calculs, ces fonctions donneront galement une valeur manquante si lun des arguments restants est une valeur manquante par dfaut ou une valeur manquante utilisateur et si la valeur du premier argument ne correspond aucun des autres arguments non manquants. Ainsi :
COMPUTE newvar=ANY(var1, var2, var3)

est maintenant fonctionnellement quivalent :


COMPUTE newvar=(var1=var2 or var1=var3).

Rgression logistique

Dans les versions prcdentes de SPSS, lordre des valeurs de chanes recodes dpendait de lordre des valeurs dans le fichier de donnes ; par exemple, lors du recodage des variables dpendantes, la premire valeur de chane rencontre tait recode sur 0 et la seconde sur 1. La procdure recode maintenant les variables de chane afin que lordre des valeurs recodes soit lordre alphanumrique des valeurs de chanes. Ainsi, la procdure peut recoder des variables chane diffremment que dans les versions prcdentes. La rgression logistique est disponible dans loption Modles de rgression.
Utilitaire macro

Les amliorations apportes lutilitaire macro peut produire des erreurs dans les travaux qui sexcutaient prcdemment sans erreurs. En ce qui concerne, plus prcisment, la syntaxe traite avec des rgles interactives, si un appel de macro se produit la fin dune commande et quaucun caractre de fin de commandes na t insr (un point ou une ligne blanche), la prochaine commande suivant lexpansion de la macro sera interprte comme une ligne de suite au lieu dune nouvelle commande, comme indique ci-dessous :
DEFINE !macro1() var1 var2 var3 !ENDDEFINE. FREQUENCIES VARIABLES = !macro1 DESCRIPTIVES VARIABLES = !macro1.

En mode interactif, la commande DESCRIPTIVES sera interprte comme la suite de la commande FREQUENCIES et aucune des deux commandes ne sexcutera.

7 Sommaire

Fentres
Il existe beaucoup de types de fentres diffrents dans SPSS :
Editeur de donnes. Data Editor affiche le contenu du fichier de donnes actif. Vous pouvez crer de nouveaux fichiers de donnes ou modifier des fichiers de donnes existants avec Data Editor. Si vous avez plus dun fichier de donnes douvert, alors il y a une fentre Data Editor distinctes pour chaque fichier de donnes. Viewer. Tous les rsultats, tableaux et diagrammes diffrents saffichent dans le

Viewer. Vous pouvez modifier les rsultats et les enregistrer pour une utilisation ultrieure. Une fentre du Viewer souvre automatiquement la premire fois que vous excutez une procdure qui gnre des rsultats.
Viewer en mode brouillon. Vous pouvez afficher un rsultat en texte simple (plutt que sous forme de tableaux pivotants interactifs) dans le Viewer en mode brouillon. Editeur de tableaux pivotants. Les rsultats affichs dans les tableaux pivotants peuvent tre modifis de diverses manires grce lditeur de tableaux pivotants. Vous pouvez modifier le texte, permuter les donnes dans les lignes et colonnes, ajouter de la couleur, crer des tableaux multidimensionnels, et masquer et afficher les rsultats de faon slective. Editeur de diagrammes. Vous pouvez modifier les diagrammes haute rsolution dans

les fentres de graphique. Vous pouvez changer les couleurs, slectionner des polices de taille ou de type diffrent, permuter les axes horizontal et vertical, faire pivoter les diagrammes de dispersion 3D, et mme changer le type de diagramme.
Editeur de rsultats texte. Les rsultats texte qui ne sont pas affichs dans les tableaux pivotants peuvent tre modifis grce lditeur de rsultats. Vous pouvez modifier les rsultats et changer les caractristiques des polices (type, style, couleur, taille). Editeur de syntaxe. Vous pouvez coller les choix des botes de dialogue dans une

fentre de syntaxe, lorsque vos choix apparaissent sous forme de syntaxe de commande. Vous pouvez alors modifier la syntaxe de commande pour utiliser les fonctions spciales de SPSS qui ne sont pas disponibles dans les botes de dialogue. Vous pouvez enregistrer ces commandes dans un fichier pour les utiliser dans des sessions SPSS ultrieures.
Editeur de script. Le script et lautomatisation OLE vous permettent de personnaliser et dautomatiser de nombreuses tches de SPSS. Utilisez lditeur de script pour crer et modifier des scripts de base.

8 Chapitre 1 Figure 1-1 Editeur de donnes et Viewer

Fentre dsigne et fentre active


Si vous avez plusieurs fentres du Viewer ouvertes, le rsultat est dirig vers la fentre Viewer dsigne. Si vous avez plusieurs fentres Editeur de syntaxe ouvertes, la syntaxe de commande est colle dans la fentre Editeur de syntaxe dsigne. Les fentres dsignes seront indiques par un signe plus dans licne de la barre de titres. Vous pouvez changer les fentres dsignes tout moment. Il ne faut pas confondre fentre dsigne et fentre active, qui est la fentre slectionne. Si plusieurs fentres se chevauchent, la fentre active apparat en premier plan. Si vous ouvrez une fentre, elle devient automatiquement la fentre active et la fentre dsigne.

Changer la fentre dsigne


E Activez la fentre de votre choix (en cliquant nimporte o dans la fentre).

9 Sommaire E Cliquez sur loutil Fentre dsigne dans la barre doutils (licne du signe plus).

ou
E A partir des menus, slectionnez : Outils Dsigner la fentre

Remarque : A partir des fentres de Data Editor, la fentre de donnes active dtermine lensemble de donnes qui est utilis dans les analyses et calculs suivants. Il ny a pas de fentre Data Editor dsigne . Pour plus d'informations, reportez-vous Manipulation de base de plusieurs sources de donnes dans Chapitre 6 p. 120.

Menus
Un grand nombre des tches effectues avec SPSS sont disponibles via des slections de menus. Dans SPSS chaque fentre a sa propre barre de menus avec les slections de menus propres ce type de fentre. Les menus Analyse et Graphes sont disponibles dans toutes les fentres, ce qui facilite la gnration de nouveaux rsultats sans changer de fentre.

Barre dtat
La barre dtat affiche en bas de chaque fentre SPSS donne les informations suivantes :
Etat de commande. Pour chaque procdure ou commande que vous excutez, un

compteur dobservations indique le nombre dobservations dj traites. Pour les procdures statistiques qui demandent un traitement itratif, le nombre ditrations saffiche.
Etat du filtre. Si vous avez slectionn un chantillon alatoire ou un sous-ensemble

dobservations analyser, le message Filtre activ indique quun certain type de filtrage dobservations est en vigueur et que lanalyse ne prend pas en compte toutes les observations du fichier de donnes.
Etat de la pondration. Le message Pondration active indique quune variable de pondration est utilise pour pondrer les observations prises en compte dans lanalyse.

10 Chapitre 1

Etat de Fichier divis. Le message Fichier scind activ indique que le fichier de donnes a t spar en groupes distincts pour lanalyse, daprs les valeurs dune ou de plusieurs variables de regroupement.

Afficher ou masquer la barre dtat


E A partir des menus, slectionnez : Affichage Barre dtat

Botes de dialogue
La plupart des slections de menu dclenchent louverture de botes de dialogue. Les botes de dialogue permettent de slectionner des variables et des options pour effectuer des analyses. Les botes de dialogue des procdures statistiques et des diagrammes comportent deux lments de base :
Liste des variables sources. Une liste de variables dans lensemble de donnes actif.

Seuls les types de variables autoriss par la procdure slectionne apparaissent dans la liste source. Lutilisation des variables alphanumriques courtes et alphanumriques longues est limite dans de nombreuses procdures.
Liste(s) des variables cible. Une ou plusieurs listes indiquant les variables que vous avez choisies pour lanalyse, comme par exemple les listes de variables dpendantes et explicatives.

Noms de variables et tiquettes de variable dans les listes de botes de dialogue


Vous pouvez afficher soit des noms de variables, soit des tiquettes de variable dans les listes de botes de dialogue. Pour contrler laffichage des noms de variables ou les tiquettes, choisissez Options dans le menu Edition de nimporte quelle fentre. Pour dfinir ou modifier des tiquettes de variable, utilisez laffichage des variables de lditeur de donnes.

11 Sommaire

Pour des donnes importes partir de sources de bases de donnes, les noms de champs sont utiliss comme tiquettes de variable. Pour de longues tiquettes, positionnez le pointeur de la souris sur ltiquette dans la liste pour visualiser ltiquette dans sa totalit. Si aucune tiquette de variable nest dfinie, le nom de la variable est affich.
Figure 1-2 Etiquettes de variables affiches dans une bote de dialogue

Commande des botes de dialogue


La plupart des botes de dialogue comportent cinq commandes standard :
OK. Excute la procdure. Une fois que vous avez slectionn vos variables et ventuellement choisi des spcifications supplmentaires, cliquez sur OK pour excuter la procdure et fermer la bote de dialogue. Coller. Ce bouton gnre la syntaxe de commande partir des slections de la

bote de dialogue et colle la syntaxe dans une fentre de syntaxe. Vous pouvez alors personnaliser les commandes avec dautres fonctions SPSS qui ne sont pas disponibles partir des botes de dialogue.
Restaurer. Dslectionne des variables dans la ou les listes de variables slectionnes

et remet toutes les spcifications de la bote de dialogue et des sous-botes de dialogue ventuelles ltat par dfaut.

12 Chapitre 1

Annuler. Annule les modifications apportes aux paramtres de la bote de dialogue

depuis sa dernire ouverture et ferme la bote de dialogue. Au sein dune session, les paramtres de la bote de dialogue restent tels quels. Une bote de dialogue conserve lensemble de spcifications le plus rcent jusqu ce que vous les ayez annules.
Aide. Aide sensible au contexte. Ce bouton vous permet daccder une fentre

daide qui contient des informations sur la bote de dialogue active. Vous pouvez aussi obtenir de laide sur des commandes individuelles des botes de dialogue en cliquant sur la commande avec le bouton droit de la souris.

Sous-botes de dialogue
Etant donn que la plupart des procdures SPSS prsentent une grande flexibilit, il nest pas possible dinclure tous les choix possibles dans une seule bote de dialogue. La bote de dialogue principale contient gnralement le minimum dinformations ncessaires pour excuter une procdure. Les spcifications supplmentaires se font dans les sous-botes de dialogue. Dans la bote de dialogue principale, les commandes dont le nom est suivi de points de suspension (...) indiquent quune bote de dialogue secondaire va apparatre.

Slection de variables
Pour slectionner une seule variable, il suffit de la mettre en surbrillance dans la liste des variables sources et de cliquer sur la flche droite ct de la liste des variables cibles. Sil ny a quune liste de variables cible, vous pouvez double-cliquer sur des variables individuelles pour les faire passer de la liste source vers la liste cible. Vous pouvez aussi slectionner plusieurs variables : Pour slectionner plusieurs variables qui sont groupes dans la liste de variables, cliquez sur la premire puis, tout en appuyant sur Maj, cliquez sur la dernire du groupe. Pour slectionner plusieurs variables qui ne sont pas regroupes dans la liste de variables, cliquez sur la premire puis, tout en appuyant sur Ctrl, cliquez sur la variable suivante et ainsi de suite.

13 Sommaire

Icnes de la liste Variable


Les icnes affiches ct des variables dans les listes de la bote de dialogue fournissent des informations sur le type de variable et le niveau de mesure.
Niveau de mesure Echelle Ordinale Nominale Type de donnes Numrique Chane n/a Date Heure

Obtenir des informations sur les variables dans les botes de dialogue
E Cliquez avec le bouton droit de la souris sur une variable dans la liste des variables

sources ou cibles.
E Slectionnez Informations sur les variables.

14 Chapitre 1 Figure 1-3 Informations sur les variables

Procdures de base dans lanalyse des donnes


Avec SPSS lanalyse de donnes est une tche simple. Il suffit de :
Rentrer les donnes dans SPSS. Vous pouvez ouvrir un fichier de donnes SPSS pralablement enregistr, lire une feuille de calcul, un fichier de base de donnes ou un fichier texte, ou saisir des donnes directement dans Data Editor. Slectionner une procdure. Slectionnez une procdure dans les menus pour calculer

des statistiques ou crer un diagramme.


Slectionner des variables analyser. Les variables du fichier de donnes apparaissent

dans une bote de dialogue.


Excutez la procdure et examinez les rsultats. Les rsultats sont affichs dans le

Viewer.

Assistant statistique
Si vous ne connaissez pas bien SPSS ou les procdures statistiques disponibles dans SPSS, lAssistant statistique peut vous aider dmarrer en vous posant des questions simples, dans des termes non techniques, et en vous donnant des exemples visuels qui

15 Sommaire

vous aideront slectionner les fonctions statistiques et de reprsentation graphique de base convenant le mieux vos donnes. Pour utiliser lAssistant statistique, choisissez dans les menus dune fentre SPSS quelconque :
Aide Assistant statistique

LAssistant statistique (prof de statistiques) ne traite quun certain nombres de procdures du systme SPSS de base. Il a t conu pour fournir une assistance dordre gnral pour de nombreuses statistiques de base parmi les plus courantes.

En savoir plus sur SPSS


Pour avoir une vue densemble complte des principes SPSS de base, consultez le didacticiel en ligne. Dans une barre de menus SPSS quelconque choisissez :
Aide Didacticiel

Chapitre

Obtention dAide
Laide apparat sous plusieurs formes :

Menu Aide. Le menu Aide de la plupart des fentres SPSS permet daccder au

systme daide principal, ainsi quaux didacticiels et aux informations de rfrence technique.
Rubriques. Les rubriques permettent daccder aux onglets Sommaire, Index

et Rechercher, que vous pouvez utiliser pour chercher des rubriques daide particulires.
Didacticiel. Instructions illustres et dtailles tape par tape vous expliquant

comment utiliser de nombreuses fonctions de base de SPSS. Il nest pas ncessaire de visualiser le didacticiel du dbut la fin. Vous pouvez choisir les rubriques visualiser, ignorer et visualiser des rubriques dans lordre de votre choix, et utiliser lindex ou le sommaire pour rechercher des rubriques donnes.
Etudes de cas. Exemples pratiques indiquant comment crer diffrents types

danalyse statistique et comment interprter les rsultats. Les fichiers de donnes dexemple utiliss dans ces cas pratiques vous sont galement fournis afin que vous puissiez voir exactement comment les rsultats ont t gnrs. Vous pouvez choisir partir du sommaire les procdures sur lesquelles vous souhaitez obtenir des informations ou rechercher des rubriques appropries dans lindex.
Assistant statistique. Vous aide rechercher la procdure que vous souhaitez

utiliser. Une fois vos slections effectues, lAssistant statistique ouvre la bote de dialogue de la procdure statistique, de rapport ou de diagramme qui correspond aux critres slectionns. LAssistant statistique permet daccder la plupart des procdures statistiques et de rapport du systme de base, et de nombreuses procdures de diagramme.

17

18 Chapitre 2

Command Syntax Reference. Un guide de rfrence dtaill sur la syntaxe des

commandes est disponible sous deux formes diffrentes : guide intgr dans le systme daide global et comme document distinct au format PDF dans SPSS Command Syntax Reference, aussi disponible partir du menu Aide.
Algorithmes statistiques. Les algorithmes utiliss pour la plupart des procdures

statistiques sont disponibles au format PDF depuis le menu Aide et depuis les rubriques daide de linterface de la bote de dialogue associe.
Aide sensible au contexte. Plusieurs emplacements de linterface utilisateur vous permettent daccder laide contextuelle. Boutons Aide de bote de dialogue. La plupart des botes de dialogue disposent

dun bouton Aide qui vous conduit directement la rubrique daide relative la bote de dialogue. La rubrique daide fournit des informations gnrales et propose des liens vers les rubriques apparentes.
Aide du menu contextuel de la bote de dialogue. De nombreuses botes de dialogue

fournissent une aide contextuelle pour les commandes et les fonctions. Cliquez avec le bouton droit sur nimporte quel contrle dune bote de dialogue et slectionnez A propos de... dans le menu contextuel. Une description du contrle saffiche alors, ainsi que son mode dutilisation. (Si A propos de napparat pas dans le menu contextuel, ce type daide nest pas disponible pour cette bote de dialogue.)
Aide du menu contextuel du tableau pivotant. Cliquez sur le bouton droit de la

souris sur les termes du tableau pivotant dans le Viewer et slectionnez A propos de dans le menu contextuel afin dafficher les dfinitions de ces termes.
Etudes de cas. Cliquez avec le bouton droit de la souris sur un tableau pivotant,

puis slectionnez Etudes de cas dans le menu contextuel pour accder directement un exemple dtaill relatif la procdure qui a gnr ce tableau. (Si Etudes de cas napparat pas dans le menu contextuel, ce type daide nest pas disponible pour cette procdure.)
Syntaxe de commande. Dans une fentre de synatxe de commande, positionnez

le curseur nimporte o lintrieur du bloc de syntaxe pour une commande et appuyez sur F1 sur le clavier. Un diagramme complet de syntaxe de commande pour cette commande saffiche. La documentation complte de la syntaxe de

19 Obtention dAide

commande est disponible partir des liens des rubriques lies et depusi longlet Contenu de laide.
Script et automatisation OLE. Dans une fentre de script (menu Fichier, Nouveau

ou Ouvrir, Script), le menu Aide offre laccs aux informations sur le langage de script et sur les objets, mthodes et proprits dautomatisation OLE SPSS. Une aide contextuelle est disponible dans une fentre de script via les touches F1 ou F2 (navigateur dobjets).
Paramtres Microsoft Internet Explorer

La plupart des fonctions daide de cette application utilisent la technologie de Microsoft Internet Explorer. Par dfaut, certaines versions dInternet Explorer (notamment la version fournie avec le service pack 2 de Windows XP) bloqueront ce quelles considrent tre du contenu actif dans les fentres dInternet Explorer de votre ordinateur local. Ce paramtre par dfaut peut entraner le blocage du contenu situ dans les fonctions daide. Pour afficher lintgralit du contenu de laide, vous pouvez modifier le comportement par dfaut dInternet Explorer.
E Dans les menus dInternet Explorer, slectionnez : Outils Internet Options... E Cliquez sur longlet Avanc. E Faites dfiler la page jusqu la section intitule Scurit. E Slectionnez (cochez) Autoriser le contenu actif excuter dans les fichiers du Poste de travail.

Autres ressources

Si vous ne trouvez pas les informations souhaites dans le systme daide, les ressources suivantes peuvent disposer des rponses que vous attendez.
Guide de dveloppement SPSS pour Windows. Fournit des informations et

des exemples relatifs aux outils de dveloppement de SPSS pour Windows, parmi lesquels lautomatisation OLE, linterface de programmation tiers, une bibliothque de liens dynamiques (entre/sortie), une fonction de production et

20 Chapitre 2

un utilitaire de script. Le Guide de dveloppement est disponible au format PDF dans le rpertoire SPSS\developer sur le CD dinstallation.
Site Web du support technique. Vous trouverez les rponses de nombreux

problmes courants ladresse suivante : http://support.spss.com. (Pour accder au site Web du support technique, vous devez entrer un ID de connexion et un mot de passe. LURL ci-dessus vous permettra dobtenir des informations sur lobtention dun ID et dun mot de passe.)

Utilisation du sommaire de laide


E A partir du menu de nimporte quelle fentre, slectionnez : Aide Rubriques E Cliquez sur longlet Sommaire. E Double-cliquez sur les lments avec une icne reprsentant un livre pour tendre

ou rduire le sommaire.
E Cliquez sur un lment pour accder la rubrique dAide. Figure 2-1 Fentre Aide avec onglet Index

21 Obtention dAide

Utilisation de lindex de laide


E A partir du menu de nimporte quelle fentre, slectionnez : Aide Rubriques E Cliquez sur longlet Index. E Entrez le terme rechercher dans lindex. E Double-cliquez sur la rubrique que vous souhaitez consulter.

Lindex de laide utilise la recherche incrmentale pour chercher le texte que vous saisissez et slectionne la rubrique la plus proche dans lindex.
Figure 2-2 Onglet Index et recherche incrmentale

Utilisation de la recherche dans laide


Longlet Rechercher permet deffectuer une recherche dans tout le texte y compris dans les titres de rubrique, le texte des rubriques et le texte de lindex. Les rubriques sont tries sur la base de la frquence laquelle le ou les termes recherchs apparaissent dans la rubrique et/ou son index.

22 Chapitre 2 Figure 2-3 Onglet Rechercher dans laide

La recherche dans tout le texte est la plus efficace si vous pouvez affiner vos critres de recherche afin de limiter le nombre de rubriques dans la liste. Par exemple, si vous savez que recherchez une fonction pour les valeurs numriques tronques, la recherche sur tronquer fonction produira une meilleure liste de rubriques potentielles que la recherche simple tronquer . Les rubriques avec un nom de commande entre parenthses indiquent que la rubrique daide concerne la syntaxe de commande. Les rubriques sans nom de commande entre parenthses sont gnralement des rubriques daide pour les botes de dialogue et les autres rubriques de linterface graphique utilisateur.

Aide sur les commandes des botes de dialogue


E Cliquez sur le bouton droit dans la bote de dialogue sur laquelle vous souhaitez

obtenir des informations.


E Slectionnez A propos de dans le menu contextuel.

23 Obtention dAide

La fentre qui saffiche prsente une description du contrle ainsi que la faon de lutiliser. Les informations gnrales sur la bote de dialogue sont disponibles partir du bouton Aide de cette bote de dialogue.
Figure 2-4 Aide sur les contrles de bote de dialogue en cliquant sur le bouton droit de la souris

Aide sur les termes utiliss dans les rsultats


E Double-cliquez sur le tableau pivotant pour lactiver. E Cliquez sur le bouton droit sur le terme dont vous souhaitez obtenir une explication. E Slectionnez A propos de dans le menu contextuel.

La fentre qui saffiche prsente une dfinition du terme.

24 Chapitre 2 Figure 2-5 Glossaire du tableau pivotant activ partir du bouton droit de la souris

Utilisation de loption Etudes de Cas


E Dans la fentre du Viewer, cliquez avec le bouton droit de la souris sur un tableau

pivotant.
E Choisissez Etudes de Cas dans le menu contextuel.

Copie de texte daide partir dune fentre contextuelle


E Cliquez avec le bouton droit de la souris dans la fentre contextuelle. E Slectionnez Copier dans le menu contextuel.

Lintgralit du texte de la fentre contextuelle est copie.

Chapitre

Fichiers de donnes

Les fichiers de donnes se prsentent sous une grande diversit de formats et SPSS a t conu pour traiter nombre dentre eux, dont : Feuilles de calcul cres sous Excel et Lotus Tableaux de bases de donnes issus de plusieurs sources de bases de donnes, notamment Oracle, SQLServer, Access, dBASE, etc. Fichiers texte dlimits par des tabulations et autres types de fichiers texte simples les fichiers de donnes au format SPSS crs avec dautres systmes dexploitation ; Fichiers de donnes SYSTAT Fichiers de donnes SAS Fichiers de donnes Stata

Ouverture dun fichier de donnes


Outre les fichiers sauvegards au format SPSS, vous pouvez ouvrir les fichiers Excel, SAS, Stata, ainsi que les fichiers tabuls et autres sans avoir convertir les fichiers en un format intermdiaire ni entrer dinformations de dfinition de donnes.

Pour ouvrir un fichier de donnes


E A partir des menus, slectionnez : Fichier Ouvrir Donnes E Dans la bote de dialogue Ouvrir un fichier, slectionnez le fichier ouvrir. 25

26 Chapitre 3 E Cliquez sur Ouvrir.

Sinon, vous pouvez : lire les noms de variables partir de la premire ligne dans le cas des feuilles de calcul et des fichiers dlimits par des tabulateurs ; spcifier une plage de cellules lire dans le cas de fichiers de feuilles de calcul. spcifier une feuille lire dans un fichier Excel (version Excel 5 ou suprieure).

Types de fichier de donnes


SPSS. Ouvre les fichiers de donnes enregistrs en format SPSS, y compris SPSS

pour Windows, Macintosh, UNIX, et galement le produit DOS SPSS/PC+.


SPSS/PC+. Ouvre les fichiers de donnes SPSS/PC+. SYSTAT. Ouvre les fichiers de donnes SYSTAT. SPSS portable. Ouvre les fichiers de donnes SPSS sauvegards en format portable.

Sauvegarder un fichier en format portable prend bien plus de temps que de sauvegarder le fichier en format SPSS.
Excel. Ouvre les fichiers Excel. Lotus 1-2-3. Ouvre les fichiers de donnes enregistrs au format 1-2-3 pour les versions

3.0 et 2.0, ainsi que pour la version 1A de Lotus.


SYLK. Ouvre les fichiers de donnes sauvegards en format SYLK (lien symbolique),

format utilis par quelques applications de tableurs.


dBASE. Ouvre des fichiers de format dBASE pour dBASE IV, dBASE III ou III PLUS,

ou pour dBASE II. Chaque observation est un enregistrement. Les tiquettes de variable et de valeurs ainsi que les spcifications de valeurs manquantes sont perdues lorsque vous sauvegardez un fichier dans ce format.
Nom de fichier SAS long. SAS version 79 pour Windows, extension longue. Nom de fichier SAS court. SAS version 79 pour Windows, extension courte. SAS version 6 pour Windows. SAS version 6.08 pour Windows et OS2. SAS version 6 pour UNIX. SAS version 6 pour UNIX (Sun, HP, IBM). SAS transfert. Fichier de transfert SAS.

27 Fichiers de donnes

Stata. Version Stata 48. Texte. Fichier texte ASCII.

Ouvrir les options de fichier


Lire les noms de variables. Dans le cas des feuilles de calcul, vous pouvez lire le

nom des variables partir de la premire ligne du fichier ou de la premire ligne de la plage dfinie. En fonction de vos besoins, vous pouvez convertir les valeurs pour crer des noms de variables valides, en noubliant pas de convertir les espaces en traits de soulignement.
Feuille de calcul. Les fichiers de la version Excel 5 ou suprieure peuvent contenir plusieurs feuilles de calcul. Par dfaut, lditeur de donnes lit la premire feuille. Pour lire une autre feuille de calcul, slectionnez-la dans la liste droulante. Intervalle. Pour les fichiers de donnes sous forme de feuilles de calcul, vous pouvez

galement lire une plage de cellules. Utilisez la mme mthode pour spcifier des intervalles de cellules comme vous le feriez pour des applications tableur.

Lecture de fichiers Excel version 5 ou ultrieure


Les rgles suivantes sappliquent la lecture de fichiers Excel version 5 ou ultrieure :
Type de donnes et largeur. Chaque colonne reprsente une variable. Le type et la

largeur de donnes de chaque variable sont dtermins par le type et la largeur de donnes dans le fichier Excel. Si la colonne contient plusieurs types de donnes (par exemple, des dates et des valeurs numriques), le type de donnes est converti en chane et toutes les valeurs sont lues comme des valeurs de chanes valides.
Cellules blanches. En ce qui concerne les variables numriques, les cellules vides sont converties en valeurs manquantes par dfaut et identifies par un point. En ce qui concerne les variables chane, un blanc est une valeur de caractre valide, et les cellules vides sont traites comme des valeurs de chane valides. Noms des variables. Si vous lisez la premire ligne du fichier Excel (ou la premire ligne de la plage spcifie) en tant que noms de variable, les valeurs qui ne sont pas conformes aux rgles de dnomination de variable sont converties en noms de variable valides et les noms initiaux sont utiliss comme tiquettes de variable. Si

28 Chapitre 3

vous ne lisez pas les noms de variables partir du fichier Excel, des noms de variables par dfaut sont affects.

Lecture de fichiers Excel antrieurs ou autres tableurs avec lditeur de donnes


Les rgles applicables la lecture de fichiers Excel antrieurs la version 5 et celle de fichiers dautres tableurs sont les suivantes :
Type de donnes et largeur. Le type de donnes et la largeur de chaque variable sont dtermins par la largeur de la colonne et le type de donnes de la premire cellule de donnes de la colonne. Les valeurs dautres types sont converties en valeurs manquantes par dfaut. Si, dans la colonne, la premire cellule de donnes est vide, le type gnral de donnes par dfaut pour la feuille de calcul (habituellement numrique) est utilis. Cellules blanches. En ce qui concerne les variables numriques, les cellules vides sont converties en valeurs manquantes par dfaut et identifies par un point. En ce qui concerne les variables chane, un blanc est une valeur de caractre valide, et les cellules vides sont traites comme des valeurs de chane valides. Noms des variables. Si, partir de la feuille de calcul, vous ne pouvez pas lire le nom des variables, SPSS utilise les lettres des colonnes (A, B, C, etc.) comme noms de variable pour les fichiers Excel et Lotus. En ce qui concerne les fichiers SYLK et Excel enregistrs au format daffichage R1C1, le programme utilise le numro de la colonne, prcd par la lettre C (C1, C2, C3, etc.).

Lecture de fichiers dBASE


Les fichiers de base de donnes sont logiquement trs semblables aux fichiers de donnes au format SPSS. Les rgles gnrales suivantes sappliquent aux fichiers dBASE : Les noms de champ sont convertis en noms de variable valides.

29 Fichiers de donnes

Les signes deux points utiliss dans les noms de champ dBASE sont convertis en traits de soulignement. Les enregistrements indiqus comme devant tre supprims, mais qui nont pas t purgs, sont inclus. SPSS cre une nouvelle variable chane, D_R, qui contient un astrisque pour les observations indiques comme devant tre supprimes.

Lecture de fichiers Stata


Les rgles gnrales suivantes sappliquent aux fichiers de donnes Stata :
Noms des variables. Les noms des variables Stata sont convertis en noms de

variables SPSS dans un format sensible la casse. Les noms de variables Stata qui sont identiques mais avec une casse diffrente sont convertis en noms de variables SPSS et comportent en suffixe un trait de soulignement et une lettre squentielle ( _A, _B, _C, ..., _Z, _AA, _AB, ..., etc.).
Etiquettes de variable. Les tiquettes de variables Stata sont converties en

tiquettes de variables SPSS.


Les tiquettes de valeurs. Les tiquettes de valeurs Stata sont converties en

tiquettes de valeurs SPSS, lexception des tiquettes de valeurs Stata assignes aux valeurs manquantes tendues .
Valeurs manquantes. Les valeurs manquantes tendues Stata sont converties en

valeurs manquantes par dfaut.


Conversion des donnes. Les valeurs de format de date Stata sont converties en valeurs de format de DATE SPSS (j-m-a). Les valeurs de format de date de

srie chronologique Stata (semaines, mois, trimestres, etc.) sont converties au simple format numrique (F), en prservant la valeur entire originale interne qui reprsente le nombre de semaines, mois, trimestres, etc. depuis le dbut de 1960.

Lire des fichiers de base de donnes


Vous pouvez lire des donnes partir de nimporte quel format de base de donnes pour laquelle vous avez un pilote adapt. En mode danalyse locale, les pilotes ncessaires doivent tre installs sur votre ordinateur local. En mode danalyse distribue (disponible avec le serveur SPSS), les pilotes doivent tre installs sur le serveur distant. Pour plus d'informations, reportez-vous Mode danalyse distribue dans Chapitre 4 p. 83.

30 Chapitre 3

Lire des fichiers de base de donnes


E A partir des menus, slectionnez : Fichier Ouvrir base de donnes Nouvelle requte... E Slectionnez la source des donnes. E Si ncessaire (selon la source de donnes), slectionnez le fichier de base de donnes

et/ou entrez un nom de connexion, un mot de passe et dautres informations.


E Slectionnez les tables et les champs. (Pour les sources de donnes OLE DB, vous ne

pouvez slectionner quun seul tableau.)


E Spcifiez toute relation existante entre vos tables. E Eventuellement :

Spcifier les critres ventuels de slection de vos donnes. Ajouter une invite pour que lutilisateur puisse y entrer un paramtre de requte. Enregistrer la requte que vous avez cre avant de lexcuter.

Pour modifier une requte de base de donnes enregistre


E A partir des menus, slectionnez : Fichier Ouvrir base de donnes Modifier requte... E Slectionnez le fichier requte (*.spq) modifier. E Suivez les instructions de cration dune nouvelle requte.

Pour lire des fichiers de base de donnes avec des requtes enregistres
E A partir des menus, slectionnez : Fichier Ouvrir base de donnes Excuter requte... E Slectionnez le fichier requte (*.spq) excuter.

31 Fichiers de donnes E Si ncessaire (en fonction du fichier de base de donnes), entrez un nom de connexion

et un mot de passe.
E Si la requte a une invite imbrique, vous pourrez avoir besoin dentrer dautres

informations (par exemple, le trimestre pour lequel vous voulez rcuprer les chiffres de ventes).

Slectionner une source de donnes


Dans le premier cran de lassistant de base de donnes, slectionnez le type de source de donnes lire.
Sources de donnes ODBC

Si vous navez pas de sources de donnes ODBC configures ou si vous voulez ajouter une nouvelle source de donnes, cliquez sur Ajouter source donnes ODBC. En mode danalyse distribue (disponible avec le serveur SPSS), ce bouton nest pas disponible. Pour ajouter des sources de donnes en mode danalyse distribue, consultez votre administrateur systme. Une source de donnes ODBC est compose de deux principaux lments dinformations : Le pilote qui sera utilis pour accder aux donnes et lemplacement de la base de donnes laquelle vous souhaitez accder. Pour spcifier des sources de donnes, vous devez installer les pilotes appropris. En mode danalyse locale, vous devez installer les pilotes partir du CD-ROM pour ce produit :
SPSS Data Access Pack. Installe les pilotes de diffrents formats de base de

donnes. Cette fonctionnalit est disponible dans le menu AutoPlay.


Microsoft Data Access Pack. Installe les pilotes pour les produits Microsoft,

notamment Microsoft Access. Pour installer Microsoft Data Access Pack, double-cliquez sur Microsoft Data Access Pack dans le dossier Microsoft Data Access Pack qui se trouve sur le CD-ROM.

32 Chapitre 3 Figure 3-1 Bote de dialogue Assistant de base de donnes

Sources de donnes OLE DB

Pour accder aux sources de donnes OLE DB, vous devez avoir install les lments suivants sur lordinateur excutant SPSS : .NET framework modle de donnes de dimension et accs OLE DB Les versions des composants compatibles avec cette version de SPSS peuvent tre installes partir du CD dinstallation SPSS et sont disponibles dans le menu AutoPlay.

33 Fichiers de donnes

Vous pouvez galement ajouter des sources de donnes OLE DB en mode danalyse locale. Pour ajouter des sources de donnes OLE DB en mode danalyse distribue sur un serveur Windows, consultez votre administrateur systme. En mode danalyse distribue (disponible avec le serveur SPSS), les sources de donnes OLE DB sont uniquement disponibles sur des serveurs Windows et .NET et le modle de donnes de dimensions ainsi que laccs OLE DB doivent tre installs sur le serveur.
Figure 3-2 Assistant de base de donnes avec accs aux sources de donnes OLE DB

Pour ajouter une source de donnes OLE DB :


E Cliquez sur Ajouter source donnes OLE DB.

34 Chapitre 3 E Dans la bote de dialogue Proprits du lien de donnes, cliquez sur longlet Fournisseur et slectionnez le fournisseur OLE DB. E Cliquez sur Suivant ou cliquez sur longlet Connexion. E Slectionnez la base de donnes en entrant lemplacement du rpertoire et le nom de

la base de donnes ou en cliquant sur le bouton pour accder la base de donnes. (Un nom dutilisateur et un mot de passe peuvent vous tre demands.)
E Cliquez sur OK aprs avoir saisi les informations ncessaires. (Vous pouvez vrifier que la base de donnes indique est bien disponible en cliquant sur le bouton Tester la connexion.) E Entrez un nom pour les informations de connexion la base de donnes. (Ce nom

saffichera dans la liste des sources de donnes OLE DB disponibles.)


Figure 3-3 Bote de dialogue Enregistrer les informations de connexion OLE DB en tant que

E Cliquez sur OK.

Cette opration vous renvoie au premier cran de lassistant de base de donnes sur lequel vous pouvez ensuite slectionner le nom enregistr partir de la liste des sources de donnes OLE DB puis passer ltape suivante de lassistant.

Procdure dentre dans la base de donnes


Si votre base de donnes ODBC ncessite un mot de passe, lAssistant de base de donnes vous en demandera un avant de pouvoir ouvrir la source des donnes.

35 Fichiers de donnes Figure 3-4 Bote de dialogue de la procdure dinitialisation

Slectionner des champs de donnes


Le bote de dialogue Slectionner des donnes contrle les tableaux et les champs lus. Les champs base de donnes (colonnes) sont lus comme des variables. Si une table comporte un ou plusieurs champ(s) slectionn(s), tous ses champs seront visibles dans les fentres de lAssistant de base de donnes suivantes, mais seuls les champs slectionns dans cette bote de dialogue seront imports comme variables. Cela vous permet de crer des jointures de tables et de spcifier les critres dutilisation des champs que vous nimportez pas.

36 Chapitre 3 Figure 3-5 Bote de dialogue Slectionner base de donnes

Affichage des noms de champs. Pour lister les champs dans une table, cliquez sur le signe plus (+) gauche du nom dune table. Pour masquer les champs, cliquez sur le signe moins () gauche du nom dune table. Pour ajouter un champ. Double-cliquez sur un champ de la liste des tables disponibles ou faites-le glisser dans les champs Extraction de cette liste de commandes. Les champs peuvent tre rangs de nouveau en les glissant et en les laissant dans la liste des champs. Pour retirer un champ. Double-cliquez sur nimporte quel champ Extraction de cette

liste de commandes ou faites-le glisser jusqu la liste des tables disponibles.


Trier les noms de champs. Si cette case est coche, lassistant de base de donnes

affiche les champs disponibles dans lordre alphabtique.

37 Fichiers de donnes

Remarque : Pour les sources de donnes OLE DB, vous ne pouvez slectionner les champs qu partir dun seul tableau. Les jointures de tables multiples ne sont pas prises en charge par les sources de donnes OLE DB.

Crer une relation entre des tables


La bote de dialogue Spcifier les relations vous permet de dfinir les relations existant entre les tables pour les sources de donnes ODBC. Si les champs de plus dune table sont slectionns, vous devez dfinir au moins une jointure.
Figure 3-6 Bote de dialogue Spcifier relations

38 Chapitre 3

Etablir des relations. Pour crer une relation, faites glisser un champ de nimporte quelle table vers le champ auquel vous souhaitez le lier. LAssistant de base de donnes tire un trait de jointure entre les deux champs pour indiquer leur relation. Ces champs doivent tre du mme type de donnes. Jointure automatique de tables. Essaie de joindre automatiquement deux tables daprs les cls primaire/trangre, ou de mettre en correspondance le nom des champs et le type de donnes. Spcifier les types de jointures. Si votre pilote prend en charge les jointures externes,

vous pouvez spcifier soit des jointures internes, soit des jointures externes gauches ou droites. Pour slectionner le type de jointure, double-cliquez sur la ligne de jointure entre les champs et lassistant affichera la bote de dialogue Proprits de relations.

Proprits de la relation
Cette bote de dialogue vous permet de spcifier quels types relations lient vos tables.
Figure 3-7 Bote de dialogue Proprits des relations

Jointures internes. Une jointure interne ninclut que les lignes dont les champs relis sont gaux. Dans cet exemple, toutes les lignes dont les valeurs ID sont identiques dans les deux tables seront inclues.

39 Fichiers de donnes

Jointures externes. En plus des jointures internes dont les lignes correspondent

une une, vous pouvez galement fusionner les tables laide du systme de correspondance une ligne vers plusieurs en utilisant les jointures externes. Vous pouvez, par exemple, fusionner un tableau contenant quelques enregistrements seulement et reprsentant des valeurs de donnes et des tiquettes descriptives associes avec les valeurs dun tableau contenant des centaines ou des milliers denregistrements reprsentant des personnes interroges. Une jointure externe gauche inclut tous les enregistrements de la table de gauche et seulement les enregistrements de la table de droite dont les champs relis sont gaux. Dans une jointure externe droite, la jointure importe tous les enregistrements de la table de droite et seulement les enregistrements de la table de gauche dont les champs relis sont gaux.

Limiter les observations rcupres


La bote de dialogue Limiter les observations rcupres vous permet de spcifier les critres pour slectionner des sous-groupes dobservations (lignes). Limiter les observations consiste gnralement remplir la grille de critres avec un ou plusieurs critres. Les critres consistent en deux expressions et des relations entre elles. Celles-ci renvoient la valeur True, False ou missing pour chaque observation. Si le rsultat est vrai, lobservation est slectionne. Si le rsultat est faux ou manquant, lobservation nest pas slectionne. La plupart des critres utilisent un ou plusieurs des six oprateurs relationnels (<, >, <=, >=, = et <>). Les expressions conditionnelles peuvent inclure des noms de champs, des constantes, des oprateurs arithmtiques, des fonctions numriques et autres, des variables logiques et des oprateurs relationnels. Vous pouvez utiliser des champs que vous ne prvoyez pas dimporter comme variables.

40 Chapitre 3 Figure 3-8 Bote de dialogue Limiter les observations rcupres

Pour tablir vos critres, vous avez besoin dau moins deux expressions et dune relation les connectant.
E Pour construire une expression, choisissez lune des mthodes suivantes :

Dans une cellule Expression, vous pouvez taper les noms de champs, constantes, oprateur arithmtiques, fonctions numriques et autres fonctions ou variables logiques. Double-cliquez sur le champ dans la liste des champs. Faites glisser le champ de la liste jusqu une cellule Expression. Slectionnez un champ dans le menu droulant de nimporte quelle cellule Expression active.

41 Fichiers de donnes E Pour choisir loprateur relationnel (comme = or >), placez votre curseur dans la

cellule Relation et tapez loprateur ou slectionnez-le dans le menu droulant. Les dates et les heures employes dans les expressions doivent tre indiques de manire spcifique (y compris les accolades utilises dans les exemples) : Les littraux de date doivent tre spcifis dans le format gnral : {d aaaa-mm-jj}. Les littraux dheure doivent tre spcifis dans le format standard : {h hh:mm:ss}. Les littraux de date et dheure (horodatages) doivent tre spcifis dans le format standard : {dh aaaa-mm-jj hh:mm:ss}.
Fonctions. Une slection de fonctions SQL intgres (arithmtique, logique, chane,

date et heure) est fournie. Vous pouvez glisser une fonction de la liste dans une expression ou entrer nimporte quelle fonction SQL valide. Consultez votre documentation sur les bases de donnes pour les fonctions SQL valides. La liste des fonctions standard est disponible dans le rpertoire suivant : http://msdn.microsoft.com/library/en-us/odbc/htm/odbcscalar_functions.asp
Utiliser chantillon alatoire. Cette option slectionne un chantillon alatoire dobservations dans la source de donnes. Pour les sources de donnes volumineuses, vous pouvez limiter le nombre dobservations un chantillon restreint et reprsentatif afin de rduire la dure dexcution des procdures. Lchantillonnage alatoire natif, sil est disponible pour la source de donnes, est plus rapide que lchantillonnage alatoire de SPSS ; en effet, ce dernier doit lire la totalit de la source de donnes pour extraire un chantillon alatoire. Environ. SPSS gnre un chantillon alatoire d'observations dont le nombre

correspond approximativement au pourcentage indiqu. Comme cette routine gnre une dcision indpendante pseudo-alatoire pour chaque observation, le pourcentage d'observations slectionnes peut seulement approcher le pourcentage spcifi. Plus il y a d'observations dans le fichier de donnes, plus le pourcentage des observations slectionnes sera proche de la valeur indique.
Exactement. Slectionne un chantillon alatoire du nombre d'observations

spcifi dans le nombre total d'observations indiqu. Si le nombre total d'observations spcifi est suprieur au nombre total d'observations dans le fichier de donnes, l'chantillon contiendra proportionnellement moins d'observations que le nombre demand.

42 Chapitre 3

Remarque : Si vous utilisez lchantillonnage alatoire, la fonction dagrgation (disponible en mode distribu avec le serveur SPSS) nest pas disponible.
Demander une valeur. Vous pouvez imbriquer une invite dans votre requte pour crer une requte de paramtre. Lorsque les utilisateurs utilisent la requte, il leur est demand dentrer des informations (en fonction de ce qui est prcis ici). Cette mthode peut savrer utile lorsque vous avez besoin par exemple de voir diffrents affichages des mmes donnes. Par exemple, vous voulez excuter la mme requte pour voir les chiffres de ventes des diffrents trimestres fiscaux.
E Placez votre curseur dans une cellule Expression et cliquez sur Demander une valeur

pour crer une invite.

Crer une requte de paramtre


Utilisez la bote de dialogue Demander une valeur pour crer une bote de dialogue sollicitant des informations auprs des utilisateurs chaque fois que quelquun excute votre requte. Cette fonctionnalit est utile si vous souhaitez effectuer une requte sur les mmes sources de donnes en utilisant des critres diffrents.
Figure 3-9 Bote de dialogue Demander une valeur

43 Fichiers de donnes

Pour tablir une invite, entrez une chane dinvite et une valeur par dfaut. La chane dinvite est affiche chaque fois quun utilisateur excute votre requte. La chane doit indiquer le type dinformations entrer. Si lutilisateur nutilise pas de liste pour effectuer sa slection, la chane doit indiquer la syntaxe de la saisie. Voir lexemple comme suit : Entrez un trimestre (T1, T2, T3, ...).
Autoriser lutilisateur slectionner une valeur dans la liste. Si la case est coche, vous pouvez limiter laccs de lutilisateur aux valeurs que vous avez places dans la liste. Assurez-vous de sparer les valeurs par des retours chariot. Type de donnes. Choisissez ici le type de donnes (Nombre, Chane ou Date).

Le rsultat final ressemble ceci :


Figure 3-10 Bote de dialogue Invite dfinie par lutilisateur

Agrgation de donnes
Si vous tes en mode distribu et connect un serveur distant (disponible avec le serveur SPSS), vous pouvez agrger les donnes avant de les lire dans SPSS.

44 Chapitre 3 Figure 3-11 Bote de dialogue Agrger les donnes

Il est galement possible dajouter des donnes aprs les avoir lues dans SPSS mais, si lagrgation a lieu avant la lecture, vous pouvez gagner du temps pour les sources de donnes volumineuses.
E Slectionnez un ou plusieurs critres dagrgation qui dfinissent la faon dont les

observations sont groupes pour crer des donnes agrges.


E Slectionnez une ou plusieurs variables agrges. E Slectionnez une fonction dagrgation pour chaque variable dagrgation. E Vous pouvez galement crer une variable qui contienne le nombre dobservations

dans chaque agrgat.

45 Fichiers de donnes

Remarque : Si vous utilisez lchantillonnage alatoire, la fonction dagrgation nest pas disponible.

Dfinition de variables
Noms de variables et tiquettes. La totalit du nom de champ de la base de donnes (colonne) est utilise en tant qutiquette de variable. A moins que vous ne modifiez le nom de variable, lAssistant de base de donnes affecte des noms de variables chaque colonne partir de la base de donnes de lune des manires suivantes :

Si le nom du champ de la base de donnes constitue un nom unique et valide de variable, il est utilis comme nom de variable. Si le nom du champ de la base de donnes ne constitue pas un champ unique et valide de variable, un nom unique est automatiquement cr. Cliquez sur nimporte quelle cellule pour modifier le nom de variable.
Conversion des chanes en valeurs numriques. Cochez la case Recoder en numrique

dune variable chane pour la convertir automatiquement en variable numrique. Les valeurs de chane sont converties en valeurs entires conscutives dans lordre alphabtique des valeurs dorigine. Les valeurs dorigine sont conserves comme tiquettes de valeurs pour les nouvelles variables.
Largeur des champs de chanes largeur variable. Dtermine la largeur des valeurs chane largeur variable. Par dfaut, la largeur est de 255 octets. Seuls les 255 premiers octets (en gnral, 255 caractres dans les langues sur un octet) sont lus. La largeur peut slever jusqu 32 767 octets. Bien que vous ne souhaitiez probablement pas tronquer les valeurs de chane, vous ne voulez pas non plus spcifier une valeur importante superflue, car des valeurs trop leves rendent le traitement SPSS inefficace.

46 Chapitre 3 Figure 3-12 Bote de dialogue Dfinir variables

Tri des observations


Si vous tes en mode distribu et connect un serveur distant (disponible avec le serveur SPSS), vous pouvez trier les donnes avant de les lire dans SPSS.

47 Fichiers de donnes Figure 3-13 Bote de dialogue Trier les observations

Il est galement possible de trier ces donnes aprs les avoir lues dans SPSS mais, si le tri a lieu avant la lecture, vous pouvez gagner du temps pour les sources de donnes volumineuses.

Rsultats
La bote de dialogue Rsultats affiche linstruction SQL Select ncessaire votre requte. Si vous modifiez linstruction SQL Select avant dexcuter la requte et cliquez sur le bouton Prcdent pour apporter des modifications aux tapes prcdentes, les dernires modifications de linstruction Select seront perdues.

48 Chapitre 3

Utilisez la section Enregistrer la requte dans le fichier pour enregistrer la requte pour une future utilisation. Slectionnez Coller dans lditeur de syntaxe pour coller la syntaxe complte GET DATA dans une fentre de syntaxe. Le fait de copier-coller linstruction Select depuis la fentre Rsultats ne collera pas la syntaxe de commande ncessaire. Remarque : La syntaxe colle contient un espace avant la parenthse fermante sur chaque ligne SQL cre par lassistant. Cet espace nest pas superflu. Lorsque la commande est traite, toutes les lignes de linstruction SQL sont fusionnes de faon trs littrale. Si cet espace ntait pas utilis, il ny en aurait aucun entre le dernier caractre dune ligne et le premier caractre de la ligne suivante.
Figure 3-14 Bote de dialogue Rsultats

49 Fichiers de donnes

Assistant de texte
LAssistant de texte permet de lire des fichiers de donnes texte formats de diffrentes faons Fichiers dlimits par des tabulations Fichiers dlimits par des espaces Fichiers dlimits par des virgules Fichiers de format fixe Dans le cas des fichiers dlimits, vous pouvez choisir dautres caractres en guise de sparateurs entre les valeurs et spcifier plusieurs sparateurs.

Lire des fichiers de donnes texte


E A partir des menus, slectionnez : Fichier Lire les donnes texte... E Slectionnez le fichier texte dans la bote de dialogue Ouvrir fichier. E Suivez les tapes de lAssistant de texte pour dfinir le mode de lecture du fichier de

donnes.

50 Chapitre 3

Assistant de texte : Etape 1


Figure 3-15 Assistant de texte : Etape 1

Le fichier texte est affich dans une fentre daperu. Vous pouvez appliquer un format prdfini (prcdemment enregistr dans lAssistant de texte) ou suivre les tapes de lAssistant de texte pour spcifier la faon dont les donnes doivent tre lues.

51 Fichiers de donnes

Assistant de texte : Etape 2


Figure 3-16 Assistant de texte : Etape 2

Cette tape offre des informations sur les variables. Dans une base de donnes, une variable est similaire un champ. Par exemple, chaque lment dun questionnaire est une variable.
Disposition de vos variables. Pour lire correctement vos donnes, lassistant de texte doit dterminer o finit la valeur dune variable et o commence la valeur de la variable suivante. La disposition des variables dfinit la mthode utilise pour diffrencier les variables entre elles.

52 Chapitre 3

Dlimit. Les variables sont spares laide despaces, de virgules, de tabulations

ou dautres caractres. Les variables sont enregistres dans le mme ordre pour chacune des observations, mais pas ncessairement dans les mmes positions de colonnes.
Largeur fixe. Pour chaque observation dans le fichier de donnes, chaque variable

est enregistre dans la mme position de la colonne, sur le mme enregistrement (ligne). Aucun sparateur nest requis entre les variables. En fait, dans la plupart des fichiers de donnes texte gnrs par des programmes informatiques, les valeurs de donnes peuvent sembler se chevaucher sans mme tre spares par des espaces. Cest la position des colonnes qui dtermine la variable lue par lAssistant.
Les noms de variable sont-ils inclus dans la partie suprieure de votre fichier ? Si la premire ligne du fichier de donnes contient des tiquettes descriptives pour chaque variable, vous pouvez utiliser ces tiquettes comme noms de variable. Les valeurs qui ne sont pas conformes aux rgles de dnomination de variable sont converties en noms de variable valides.

53 Fichiers de donnes

Assistant de texte : Etape 3 (Fichiers dlimits)


Figure 3-17 Assistant de texte : Etape 3 (pour les fichiers dlimits)

Cette tape offre des informations sur les observations. Dans une base de donnes, une observation est similaire un enregistrement. Par exemple, chaque rpondant pour un questionnaire est un enregistrement.
La premire observation commence la ligne Indique la premire ligne du fichier de donnes contenant des valeurs de donnes. Si les lignes suprieures du fichier de donnes contiennent des tiquettes descriptives ou tout autre type de texte ne correspondant pas des valeurs de donnes, elles ne seront pas considres comme la premire ligne du fichier. Reprsentation de vos observations Contrle la faon dont lassistant de texte dtermine o finit chaque observation et o commence la suivante.

54 Chapitre 3

Chaque ligne reprsente une observation. Chaque ligne ne contient quune

observation. Il est assez courant que chaque observation soit contenue sur une seule ligne, mme sil peut sagir dune trs longue ligne dans le cas de fichiers de donnes comportant un grand nombre de variables. Si les lignes ne contiennent pas toutes le mme nombre de valeurs, le nombre de variables pour chaque observation est dtermin par la ligne comportant le plus grand nombre de valeurs. Les observations contenant moins de valeurs recevront alors des valeurs manquantes pour les variables supplmentaires.
Un nombre spcifique de variables reprsente une observation. Le nombre spcifi

de variables pour chaque observation indique lAssistant de texte o terminer la lecture dune observation et o commencer la lecture de la suivante. La mme ligne peut contenir plusieurs observations ; en outre, les observations peuvent commencer au milieu dune ligne et se poursuivre sur la ligne suivante. LAssistant de texte dtermine la fin de chaque observation en fonction du nombre de valeurs lues, quel que soit le nombre de lignes. Chaque observation doit contenir des valeurs de donnes (ou des valeurs manquantes indiques par des sparateurs) pour toutes les variables ; dans le cas contraire, le fichier de donnes ne sera pas lu correctement.
Combien dobservations souhaitez-vous importer ? Vous pouvez importer toutes les observations du fichier de donnes, les n premires observations (n tant un nombre que vous avez dfini) ou encore un chantillon alatoire dun pourcentage spcifi. Cette routine gnrant une dcision indpendante pseudo-alatoire pour chaque observation, le pourcentage dobservations slectionnes ne peut quapprocher le pourcentage spcifi. Plus il y a dobservations dans le fichier de donnes, plus le pourcentage des observations slectionnes sera proche de la valeur indique.

55 Fichiers de donnes

Assistant de texte : Etape 3 (Fichiers de largeur fixe)


Figure 3-18 Assistant de texte : Etape 3 (pour les fichiers de largeur fixe)

Cette tape offre des informations sur les observations. Dans une base de donnes, une observation est similaire un enregistrement. Par exemple, chaque rpondant pour un questionnaire est un enregistrement.
La premire observation commence la ligne Indique la premire ligne du fichier de donnes contenant des valeurs de donnes. Si les lignes suprieures du fichier de donnes contiennent des tiquettes descriptives ou tout autre type de texte ne correspondant pas des valeurs de donnes, elles ne seront pas considres comme la premire ligne du fichier. Combien de lignes reprsente une observation ? Contrle la faon dont lassistant de texte dtermine o finit chaque observation et o commence la suivante. Chaque variable est dfinie par son numro de ligne dans lobservation et par sa position de colonne. Vous devez spcifier le nombre de lignes de chaque observation pour que vos donnes soient lues correctement.

56 Chapitre 3

Combien dobservations souhaitez-vous importer ? Vous pouvez importer toutes les observations du fichier de donnes, les n premires observations (n tant un nombre que vous avez dfini) ou encore un chantillon alatoire dun pourcentage spcifi. Cette routine gnrant une dcision indpendante pseudo-alatoire pour chaque observation, le pourcentage dobservations slectionnes ne peut quapprocher le pourcentage spcifi. Plus il y a dobservations dans le fichier de donnes, plus le pourcentage des observations slectionnes sera proche de la valeur indique.

Assistant de texte : Etape 4 (Fichiers dlimits)


Figure 3-19 Assistant de texte : Etape 4 (pour les fichiers dlimits)

Cette tape prsente la meilleure mthode dtermine par lAssistant de texte sur la faon de lire le fichier de donnes et vous permet de modifier cette mthode.

57 Fichiers de donnes

Quels sparateurs saffichent entre les variables ? Indique les caractres ou les

symboles utiliss pour sparer les valeurs de donnes. Vous pouvez slectionner nimporte quelle combinaison despaces, de virgules, de points-virgules, de tabulations ou dautres caractres. Plusieurs sparateurs conscutifs non spars par des valeurs de donnes sont considrs comme des valeurs manquantes.
What is the text qualifier? Il sagit de caractres utiliss pour dlimiter les valeurs contenant des caractres sparateur. Par exemple, si la virgule est un sparateur, les valeurs contenant des virgules ne seront lues correctement que si un qualificateur de texte dlimite la valeur ; ainsi, les virgules de la valeur ne sont pas considres comme des sparateurs de valeurs. Les fichiers de donnes au format CSV exports partir dExcel utilisent le guillemet () comme qualificateur de texte. Le qualificateur de texte apparat au dbut et la fin de la valeur, et dlimite ainsi la valeur entire.

Assistant de texte : Etape 4 (Fichiers de largeur fixe)


Figure 3-20 Assistant de texte : Etape 4 (pour les fichiers de largeur fixe)

58 Chapitre 3

Cette tape prsente la meilleure mthode dtermine par lAssistant de texte sur la faon de lire le fichier de donnes et vous permet de modifier cette mthode. Les lignes verticales prsentes dans la fentre daperu indiquent les positions que lAssistant de texte estime correspondre au dbut de chaque variable dans le fichier. Insrez, dplacez et supprimez les lignes de dlimitation des variables votre convenance pour sparer les variables. Si chaque observation utilise plusieurs lignes, slectionnez chaque ligne dans la liste droulante et modifiez les lignes de dlimitation des variables en consquence. Remarques : Dans le cas de fichiers de donnes gnrs par ordinateur et prsentant un flux continu de valeurs de donnes non spares par des espaces ni par dautres caractristiques distinctives, il peut savrer difficile de dterminer lendroit o commence chaque variable. De tels fichiers de donnes sont gnralement associs un fichier de dfinitions de donnes ou toute autre description crite dfinissant la position de ligne et de colonne de chaque variable. LAssistant de texte est conu pour tre utilis avec une police monoespace ( espacement fixe) pour afficher les contenus des fichiers. Avec les polices non monoespaces (proportionnelles), le contenu des fichiers nest pas correctement align. Ce paramtre de police est contrl par le paramtre Police rsultats texte dans longlet Editeur de rsultats de la bote de dialogue Options (menu Edition).

59 Fichiers de donnes

Assistant de texte : Etape 5


Figure 3-21 Assistant de texte : Etape 5

Cette tape dfinit le nom de variable et le format de donnes utiliss par lAssistant de texte pour lire chaque variable et dtermine les variables qui seront incluses dans le fichier de donnes final.
Nom de la variable. Vous pouvez remplacer les noms de variables par dfaut par vos propres noms de variable. Si vous choisissez des noms de variable provenant du fichier de donnes, lassistant de texte modifiera automatiquement les noms de variable qui ne sont pas conformes aux rgles de dnomination de variable. Slectionnez une variable dans la fentre daperu, puis entrez un nom de variable. Format des donnes. Slectionnez une variable dans la fentre daperu, puis slectionnez un format dans la liste droulante. Pour slectionner plusieurs variables contigus, appuyez sur le bouton de la souris tout en maintenant la touche Maj enfonce ; pour slectionner plusieurs variables non contigus, appuyez sur le bouton de la souris tout en maintenant la touche Ctrl enfonce.

60 Chapitre 3

Assistant de texte : options de formatage


Les options de formatage pour la lecture des variables au moyen de lAssistant de texte sont les suivantes :
Ne pas importer. Cette option permet domettre la ou les variables slectionnes dans

le fichier de donnes import.


Numrique. Les valeurs valides incluent les nombres, un signe plus ou moins en

dbut, et un indicateur de dcimale.


Chane. Les valeurs valides incluent pratiquement tous les caractres du clavier avec des blancs imbriqus. Dans le cas des fichiers dlimits, vous pouvez spcifier le nombre de caractres de la valeur (le nombre maximal tant de 32 767). Par dfaut, lAssistant de texte dtermine que ce nombre de caractres correspond celui de la valeur de chane la plus longue pour la ou les variables slectionnes. Dans le cas des fichiers de largeur fixe, le nombre de caractres des valeurs de chane est dfini par le positionnement des lignes de dlimitation des variables effectu ltape 4. Date/Heure. Les valeurs valides correspondent aux dates exprimes dans les formats

traditionnels jj-mm-aaaa, mm/jj/aaaa, jj.mm.aaaa, aaaa/mm/jj, hh:mm:ss, et dans divers autres formats de date et dheure. Les mois peuvent tre reprsents par des chiffres, des chiffres romains, des abrviations trois lettres, ou bien ils peuvent tre noncs en entier. Slectionnez un format de date dans la liste.
Dollar. Les valeurs valides sont des nombres prcds, en option, par un signe dollar

et, galement en option, des virgules comme sparateurs de milliers.


Virgule. Les valeurs valides correspondent aux nombres utilisant un point comme

indicateur dcimal et des virgules comme sparateurs de milliers.


Point. Les valeurs valides correspondent aux nombres utilisant une virgule comme indicateur dcimal et des points comme sparateurs de milliers.

Remarque : les valeurs comportant des caractres incorrects pour le format slectionn seront traites comme des valeurs manquantes. Les valeurs contenant lun des sparateurs spcifis seront considres comme des valeurs multiples.

61 Fichiers de donnes

Assistant de texte : Etape 6


Figure 3-22 Assistant de texte : Etape 6

Il sagit de la dernire tape de lAssistant de texte. Vous pouvez enregistrer vos slections dans un fichier pour les appliquer lors de limportation de fichiers de donnes texte similaires. Il vous est galement possible de coller la syntaxe gnre par lAssistant de texte dans une fentre de syntaxe. Vous pouvez alors personnaliser et/ou enregistrer cette syntaxe afin de lutiliser dans dautres sessions ou dautres tches de production.
Mettre donnes en cache localement. Un cache de donnes est une copie complte du

fichier de donnes, enregistre dans un espace disque temporaire. La cration d'un cache du fichier de donnes peut amliorer les performances.

62 Chapitre 3

Lecture des donnes de dimension


Vous pouvez lire les donnes partir des produits de dimensions SPSS, y compris Quanvert, Quancept et mrInterview. Pour lire les sources de donnes de dimensions, vous devez avoir install les lments suivants sur lordinateur excutant SPSS : .NET framework Modle de donnes de dimension et accs OLE DB Les versions des composants compatibles avec cette version de SPSS peuvent tre installes partir du CD dinstallation SPSS et sont disponibles dans le menu AutoPlay. Vous pouvez uniquement lire les sources de donnes de dimension en mode danalyse locale. Cette fonction nest pas disponible dans le mode danalyse distribue utilisant le serveur SPSS. Pour lire les donnes partir dune source de donnes de dimension :
E A partir du menu de nimporte quelle fentre SPSS ouverte, slectionnez : Fichier Ouvrir les donnes de dimension E Dans longlet Connexions des Proprits du lien de donnes, spcifiez le fichier de

mtadonnes, le type de donnes dobservation et le fichier de donnes dobservation.


E Cliquez sur OK. E Dans la bote de dialogue Importation des donnes de dimension, slectionnez les

variables inclure et tout critre de slection des observations.


E Cliquez sur OK pour lire les donnes.

Onglet Connexions des proprits du lien de donnes


Pour lire les sources de donnes de dimension, vous devez spcifier :
Lemplacement des mtadonnes. Le fichier de document des mtadonnes (.mdd) qui

contient les informations de dfinition du questionnaire.

63 Fichiers de donnes

Le type des donnes dobservation. Le format du fichier de donnes dobservation. Les

formats disponibles sont les suivants : Fichier de donnes Quancept (DRS). Donnes dobservation dans un fichier Quancept .drs, .drz ou .dru. Base de donnes Quanvert. Donnes dobservation dans une base de donnes Quanvert. Base de donnes de dimensions (Serveur MS SQL). Les donnes dobservation dans une base de donnes relationnelle SPSS MR dans un serveur SQL. Cette option peut tre utilise pour lire des donnes collectes en utilisant mrInterview. Fichier de donnes de dimension XML. Donnes dobservation dans un fichier XML.
Emplacement des donnes dobservation. Le fichier contenant les donnes

dobservation. Le format de ce fichier doit tre cohrent avec le type de donnes dobservation slectionn.
Figure 3-23 Proprits du lien de donnes : Onglet Connexions

64 Chapitre 3

Remarque : Il est impossible de savoir si les autres paramtres de longlet Connexions ou les paramtres des autres onglets Proprits du lien de donnes affecteront ou non la lecture des donnes de dimension dans SPSS ; il est donc recommand de ne pas les modifier.

Slectionner longlet Variables


Vous pouvez slectionner un sous-ensemble de variables lire. Par dfaut, toutes les variables standard de la source de donnes sont affiches et slectionnes.
Afficher les variables systme. Affiche toutes les variables systme, y compris

les variables affichant un tat dentrevue (en cours, termin, date de fin, etc.). Vous pouvez alors slectionner toutes les variables systme inclure. Par dfaut, toutes les variables systme sont exclues.
Afficher les variables de code. Affiche toutes les variables qui reprsentent des

codes utiliss pour des rponses ouvertes Autre pour les variables qualitatives. Vous pouvez alors slectionner toutes les variables de code inclure. Par dfaut, toutes les variables de code sont exclues.
Afficher les variables SourceFile. Affiche toutes les variables contenant des noms

de fichiers dimages de rponses analyses. Vous pouvez alors slectionner toutes les variables SourceFile inclure. Par dfaut, toutes les variables SourceFile sont exclues.

65 Fichiers de donnes Figure 3-24 Importation des donnes de dimension : Slectionner longlet Variables

Onglet Slection des observations


Pour les sources de donnes de dimension qui contiennent des variables systme, vous pouvez slectionner des observations se basant sur un nombre de critres de variables systme. Vous navez pas besoin dinclure les variables systme correspondantes dans la liste des variables lire, mais les variables systme ncessaires doivent exister dans la source de donnes pour appliquer les critres de slection. Si les variables ncessaires nexistent pas dans les donnes source, les critres de slection correspondants seront ignors.
Etat de la collecte des donnes. Vous pouvez slectionner des donnes du rpondant,

des donnes de test ou les deux. Vous pouvez galement slectionner des observations se basant sur une combinaison des paramtres de ltat dentrevue suivants : Termin avec succs Actif/en cours

66 Chapitre 3

Expir Arrt par le script Arrt par le rpondant Arrt du systme dentrevue Signal (termin par un nonc de signal dans le script)
Date de fin de la collecte des donnes. Vous pouvez slectionner des observations en se basant sur la date de fin de la collecte des donnes. Date de dbut. Les observations pour lesquelles la collecte des donnes sest

termine la date spcifie ou aprs celle-ci sont incluses.


Date de fin. Les observations pour lesquelles la collecte des donnes sest termine

avant la date spcifie sont incluses. Cela ne comprend pas les observations pour lesquelles la collecte des donnes sest termine la date de fin. Si vous spcifiez la fois une date de dbut et une date de fin, cela dfinit une plage de dates de fin partir de la date de dbut jusqu la date de fin ( lexclusion de celle-ci).

67 Fichiers de donnes Figure 3-25 Importation des donnes de dimension : Onglet Slection des observations

Informations sur les fichiers


Un fichier de donnes SPSS contient bien plus que des donnes brutes. Il contient galement toutes les informations sur la dfinition des variables, dont : Le nom des variables Le format des variables Les tiquettes descriptives de variables et de valeurs. Ces informations sont enregistres dans la partie dictionnaire du fichier de donnes de SPSS. Lditeur de donnes permet de voir les informations de la dfinition des variables. Vous pouvez galement afficher des informations de dictionnaire compltes pour lensemble de donnes actif, ou tout autre fichier de donnes.

68 Chapitre 3

Pour obtenir des informations sur un fichier de donnes


E A partir des menus de la fentre de lditeur de donnes, slectionnez : Fichier Afficher des informations sur un fichier de donnes E Pour le fichier de donnes en cours dutilisation, choisissez Fichier de travail. E Pour dautres fichiers de donnes, slectionnez Fichier externe puis le fichier de

donnes. Les informations sur le fichier de donnes sont affiches dans le Viewer.

Enregistrement des fichiers de donnes


Toute modification effectue dans un fichier de donnes ne dure que le temps de la session en cours, moins que vous nenregistriez ces modifications de faon explicite.

Pour enregistrer des fichiers de donnes modifis


E Faites en sorte que lditeur de donnes devienne la fentre active (cliquez nimporte

o dans la fentre pour la rendre active).


E A partir des menus, slectionnez : Fichier Enregistrer

Le fichier de donnes modifi est enregistr, et crase les versions prcdentes du fichier.

Enregistrement de fichiers de donnes au format Excel


Vous pouvez enregistrer vos donnes dans un des trois formats Microsoft Excel. Le choix du format dpend de la version dExcel qui sera utilise pour ouvrir les donnes. Lapplication Excel ne peut pas ouvrir de fichier cr dans une version plus rcente. Par exemple, Excel 5.0 ne peut pas ouvrir un document Excel 2000. Cependant, Excel 2000 peut facilement lire un document Excel 5.0.

69 Fichiers de donnes

Le format de fichier Excel induit des contraintes qui nexistent pas dans SPSS. Ces contraintes sont les suivantes : Les informations sur les variables, telles que les valeurs manquantes et les tiquettes de variable, ne sont pas comprises dans les fichiers Excel exports. Concernant lexportation vers Excel 97 et les versions ultrieures, une option permet dinclure les tiquettes de valeurs au lieu des valeurs. Du fait que tous les fichiers Excel sont limits 256 colonnes de donnes, les 256 premires variables sont comprises dans le fichier export. Les fichiers Excel 4.0 et Excel 5.0/95 sont limits 16 384 enregistrements, ou lignes de donnes. Les fichiers Excel 972000 autorisent 65 536 enregistrements. Si vos donnes excdent ces limites, un message davertissement apparat et les donnes sont tronques la taille maximale autorise par Excel.
Types de variable

Le tableau suivant indique la concordance des types de variable entre les donnes SPSS dorigine et les donnes exportes dans Excel.
Type de variable SPSS Numrique Virgule Dollar Date Heure Chane Format de donnes Excel 0.00; #,##0.00; ... 0.00; #,##0.00; ... $#,##0_); ... j-mmm-aaaa hh:mm:ss Gnral

Enregistrement de fichiers de donnes au format SAS


Vos donnes reoivent divers traitements spciaux quand elles sont enregistres en tant que fichier SAS. Ces traitements sont les suivants : Certains caractres autoriss dans les noms de variable SPSS ne sont pas valides dans SAS, comme @, # et $. Lors de lexportation des donnes, ces caractres interdits sont remplacs par un trait de soulignement.

70 Chapitre 3

Les noms de variables SPSS qui contiennent des caractres plusieurs octets (pax exemple, caractres japonais ou chinois) sont convertis en noms de variables au format traditionnel Vnnn, nnn correspondant une valeur entire. Les tiquettes de variable SPSS contenant plus de 40 caractres sont tronques quand elles sont exportes vers un fichier SAS v6. Quand elles existent, les tiquettes de variable SPSS sont associes aux tiquettes de variable SAS. Sil nexiste aucune tiquette de variable dans les donnes SPSS, le nom de variable est associ ltiquette de variable SAS. SAS nautorise quune seule valeur manquante par dfaut, alors que SPSS en autorise un grand nombre. Par consquent, toutes les valeurs manquantes par dfaut de SPSS sont associes une seule de ces valeurs dans le fichier SAS.
Enregistrement des tiquettes de valeurs

Vous pouvez choisir denregistrer les valeurs et les tiquettes de valeurs associes votre fichier de donnes dans un fichier de syntaxe SAS. Par exemple, lorsque les tiquettes de valeurs du fichier de donnescars.sav sont exportes, le fichier de syntaxe gnr contient :
libname library 'd:\spss\' ; proc format library = library ; value ORIGIN /* Pays d'origine */ 1 = 'Amricaine' 2 = 'Europenne' 3 = 'Japonaise' ; value CYLINDER /* Nombre de cylindres */ 3 = '3 cylindres' 4 = '4 cylindres' 5 = '5 cylindres' 6 = '6 cylindres' 8 = '8 cylindres' ; value FILTER__ /* cylrec = 1 | cylrec = 2 (FILTER) */ 0 = 'Non slectionns'

71 Fichiers de donnes
1 = 'Slectionns' ; proc datasets library = library ; modify cars; format format format quit; ORIGIN ORIGIN.; CYLINDER CYLINDER.; FILTER__ FILTER__.;

Cette fonctionnalit nest pas prise en charge par le fichier de transfert SAS.
Types de variable

Le tableau suivant indique la concordance des types de variable entre les donnes SPSS dorigine et les donnes exportes dans SAS.
Type de variable SPSS Numrique Virgule Points Notation scientifique Date Date (Heure) Dollar Devise personnalise Chane Type de variable SAS Numrique Numrique Numrique Numrique Numrique Numrique Numrique Numrique Caractre Format de donnes SAS 12 12 12 12 (Date) par exemple, MMJJAA10, ... Time18 12 12 $8

Enregistrement de fichiers de donnes au format Stata


Les donnes peuvent tre crites au format Stata versions 5-8 et la fois aux formats Intercooled et SE (versions 7-8 uniquement). Les fichiers de donnes enregistrs au format Stata version 5 peuvent tre lues par un format Stata version 4.

72 Chapitre 3

Les premiers 80 octets dtiquettes de variable sont enregistrs comme tiquettes de variable Stata. Pour les variables numriques, les premiers 80 octets dtiquettes de valeurs sont enregistrs comme tiquettes de valeurs Stata. Pour les variables chane, les tiquettes de valeurs sont ignores. Pour les versions 7 et 8, les premiers 32 octets de noms de variables sensibles la casse sont enregistrs comme noms de variables Stata. Pour les versions antrieures, les premiers 8 octets de noms de variables sont enregistrs comme noms de variables Stata. Tout caractre autre que des lettres, des chiffres ou des traits de soulignement sont convertis en traits de soulignement. Les noms de variables SPSS qui contiennent des caractres plusieurs octets (pax exemple, caractres japonais ou chinois) sont convertis en noms de variables au format traditionnel Vnnn, o nnn correspond une valeur entire. Pour les versions 5-6 et les versions Intercooled 7-8, les premiers 80 octets de valeurs chanes sont enregistrs. Pour Stata SE versions 7-8, les premiers 244 octets de valeurs chane sont enregistrs. Pour les versions 5-6 et les versions Intercooled 7-8, seuls les premiers 2 047 octets de variables sont enregistrs. Pour Stata SE versions 7-8, seuls les premiers 32 767 octets de variables sont enregistrs.
Type de variable SPSS Numrique Virgule Points Notation scientifique Date, dateheure Heure, DHeure Joursem Moan Dollar Devise personnalise Chane Type de variable Stata Format de donnes Stata g Numrique Numrique Numrique Numrique Numrique Numrique Numrique Numrique Numrique Numrique Chane g g g J_m_A g (nombre de secondes) g (1-7) g (1-12) g g s

73 Fichiers de donnes

Pour enregistrer des fichiers de donnes sous des formats diffrents


E Faites en sorte que lditeur de donnes devienne la fentre active (cliquez nimporte

o dans la fentre pour la rendre active).


E A partir des menus, slectionnez : Fichier Enregistrer sous E Slectionnez un type de fichier de la liste propose. E Entrez un nom de fichier pour le nouveau fichier de donnes.

Pour crire des noms de variable sur la premire ligne dun fichier de donnes de format feuille de calcul ou dlimit par des tabulations :
E Cliquez sur Ecrire nom de var. dans tableur dans la bote de dialogue Enregistrer

Donnes sous.
Pour enregistrer les tiquettes de valeurs la place des valeurs de donnes au format Excel 97 :
E Dans la bote de dialogue Enregistrer les donnes sous, cliquez sur Enregistrer les tiquettes de valeurs lorsquelles sont dfinies la place des valeurs de donnes.

Pour enregistrer les tiquettes de valeurs dans un fichier de syntaxe SAS (cette option nest active que si un type de fichier SAS est slectionn) :
E Dans la bote de dialogue Enregistrer les donnes sous, cliquez sur Enregistrer les tiquettes de valeurs dans un fichier .sas.

Enregistrement de donnes : Types de fichier de donnes


Vous pouvez enregistrer des donnes sous les formats suivants :
SPSS (*:sav). Format SPSS.

Les fichiers de donnes enregistrs dans le format SPSS ne peuvent tre lus avec les versions du logiciel antrieures la version 7.5.

74 Chapitre 3

Lorsque vous utilisez des fichiers de donnes ayant des noms de plus de huit octets sous SPSS 10.x ou 11.x, des versions uniques de noms de variable huit octets sont utilises. Toutefois, les noms de variables originaux sont conservs pour la version 12.0 ou suprieure. Dans les versions SPSS antrieures la version 10,0, les noms longs originaux des variables sont perdus si vous enregistrez le fichier de donnes. Lorsque vous utilisez des fichiers de donnes avec des variables chane de plus de 255 octets dans les versions de SPSS antrieures 13.0, ces variables chane sont segmentes en plusieurs variables chane de 255 octets.
SPSS 7.0 (*:sav). Format SPSS 7.0 pour Windows. Les fichiers de donnes enregistrs

au format SPSS 7.0 peuvent tre lus par SPSS 7.0 et par les versions SPSS pour Windows antrieures, mais nincluent pas les vecteurs multirponses dfinis ni les donnes entres pour linformation de Windows.
SPSS/PC+ (*:sys). Format SPSS/PC+. Si le fichier de donnes contient plus de

500 variables, seules les 500 premires seront sauvegardes. En ce qui concerne les variables ayant plus dune valeur manquante par dfaut dfinie, les valeurs manquantes par dfaut supplmentaires seront ralignes sur la premire valeur manquante par dfaut.
SPSS portable (*:por). Fichier SPSS portable qui peut tre lu par dautres versions de

SPSS sur dautres systmes dexploitation (par exemple, Macintosh, UNIX). Les noms de variable sont limits huit octets et sont automatiquement convertis en noms huit octets uniques si ncessaire.
Tabul (*:dat). Fichiers texte ASCII avec valeurs spares par des tabulations. ASCII fixe (*:dat). Fichier ASCII texte en format fixe, qui utilise le format dcriture

par dfaut pour toutes les variables. Il ny a pas de tabulations ni despaces entre les champs de variables.
Excel 2.1 (*:xls). Fichier de type tableur Microsoft Excel 2.1. Le nombre maximum de

variables est de 256 et le nombre maximum de lignes est de 16 384.


Excel versions 97 et ultrieures (*.xls). Fichier de type feuille de calcul Microsoft Excel

97/2000/XP. Le nombre maximum de variables est de 256 et le nombre maximum de lignes est de 65 536.
1-2-3 Version 3.0 (*:wk3). Fichier tableur Lotus 1-2-3, version 3,0. Vous pouvez

enregistrer un nombre maximum de 256 variables.

75 Fichiers de donnes

1-2-3 Version 2.0 (*:wk1). Fichier tableur Lotus 1-2-3, version 2.0. Vous pouvez

enregistrer un nombre maximum de 256 variables.


1-2-3 Version 1.0 (*:wks). Fichier tableur Lotus 1-2-3, version 1A. Vous pouvez

enregistrer un nombre maximum de 256 variables.


SYLK (*:slk). Format de lien symbolique pour fichiers de type tableur Microsoft Excel

et Multiplan. Vous pouvez enregistrer un nombre maximum de 256 variables.


dBASE IV (*:dbf). Format dBASE IV. dBASE III (*:dbf). Format dBASE III. dBASE II (*:dbf). Format dBASE II. SAS v6 pour Windows (*.sd2). Format de fichier SAS v6 pour Windows/OS2. SAS v6 pour UNIX (*.ssd01). Format de fichier SAS v6 pour UNIX (Sun, HP, IBM). SAS v6 pour Alpha/OSF (*.ssd04). Format de fichier SAS v6 pour Alpha/OSF (DEC

UNIX).
SAS v7+ extension courte Windows (*.sd7). SAS version 78 pour Windows, format

de nom de fichier court.


SAS v7+ extension courte Windows (*.sas7bdat). SAS version 78 pour Windows,

format de nom de fichier long.


SAS v7+ pour UNIX (*.ssd01). SAS v8 pour UNIX. SAS transfert (*.xpt). Fichier de transfert SAS. Stata Version 45 (*.dta). Stata Version 6 (*.dta). Stata Intercooled Version 7 (*.dta). Stata Version 7 SE (*.dta). Stata Intercooled Version 8 (*.dta). Stata Version 8 SE (*.dta).

76 Chapitre 3

Enregistrement de sous-ensembles de variables


Figure 3-26 Bote de dialogue Enregistrer les donnes en tant que variables

La bote de dialogue Enregistrer les donnes en tant que variables vous permet de slectionner les variables que vous souhaitez enregistrer dans le nouveau fichier de donnes. Par dfaut, toutes les variables sont enregistres. Dslectionnez les variables ne pas enregistrer, ou cliquez sur Supprimer tout puis slectionnez les variables enregistrer.

Pour enregistrer un sous-groupe de variables


E Faites en sorte que lditeur de donnes devienne la fentre active (cliquez nimporte

o dans la fentre pour la rendre active).


E A partir des menus, slectionnez : Fichier Enregistrer sous E Slectionnez le type de fichier. E Cliquez sur Variables. E Slectionnez les variables enregistrer.

77 Fichiers de donnes

Enregistrement de fichier : Options


Vous pouvez crire des noms de variables dans la premire ligne des fichiers de type tableur et des fichiers tabuls.

Protection des donnes dorigine


Pour viter de modifier/supprimer vos donnes dorigine par accident, vous pouvez paramtrer les fichiers en lecture seule.
E A partir des menus de lditeur de donnes, slectionnez : Fichier Marquer le fichier comme tant en lecture seule

Si vous apportez dimportantes modifications aux donnes, puis que vous essayez denregistrer le fichier de donnes, vous pouvez uniquement lenregistrer sous un autre nom ; les donnes dorigine sont ainsi protges. Vous pouvez redonner au fichier lattribut de lecture/criture en slectionnant Marquer le fichier comme tant en lecture/criture dans le menu Fichier.

Fichier actif virtuel


Le fichier actif virtuel vous permet de travailler avec des fichiers de donnes volumineux sans ncessiter dimportants volumes despace disque temporaire. Dans le cas de la plupart des procdures danalyse et de cration de diagrammes, la source de donnes dorigine est lue chaque fois que vous excutez une procdure diffrente. Les procdures qui modifient les donnes ncessitent un certain volume despace disque temporaire afin de conserver une trace de ces modifications, et certaines oprations requirent toujours un espace disque suffisant pour pouvoir effectuer au moins une copie intgrale du fichier de donnes.

78 Chapitre 3 Figure 3-27 Espace disque temporaire requis

Les oprations ne ncessitant pas despace disque temporaire sont les suivantes :

lecture de fichiers de donnes SPSS ; fusion de deux fichiers de donnes SPSS ou plus ; lecture de tableaux de base de donnes avec lassistant de base de donnes ; fusion dun fichier de donnes SPSS avec un tableau de base de donnes ; excution de procdures lisant les donnes (par exemple, Frquences, Tableaux croiss, Explorer).
Les oprations crant une ou plusieurs colonnes de donnes dans un espace disque temporaire sont les suivantes :

calcul de nouvelles variables ; recodage de variables existantes ; excution de procdures crant ou modifiant des variables (par exemple, enregistrement de prvisions dans la Rgression linaire).

79 Fichiers de donnes

Les oprations crant une copie intgrale du fichier de donnes dans un espace disque temporaire sont les suivantes :

lecture de fichiers Excel ; excution de procdures triant les donnes (par exemple, Trier les observations, Scinder fichier) ; Lecture des donnes avec la commande GET TRANSLATE ou DATA LIST Utilisation de la fonctionnalit Donnes de mmoire cache ou de la commande
CACHE

Ouverture depuis SPSS dautres applications lisant le fichier de donnes (par exemple, AnswerTree, DecisionTime). Remarque : La commande GET DATA assure des fonctionnalits comparables celles de la commande DATA LIST mais sans crer de copie intgrale du fichier de donnes dans un espace disque temporaire. Dans sa syntaxe, la commande SPLIT FILE ne trie pas le fichier de donnes et nen cre donc pas de copie. Toutefois, pour pouvoir fonctionner correctement, cette commande ncessitent des donnes tries ; linterface de botes de dialogue de ces procdures triera donc automatiquement le fichier de donnes, aboutissant ainsi la cration dune copie complte de ce fichier. (La syntaxe de commande nest pas disponible dans la version Student.)
Oprations crant une copie intgrale du fichier de donnes par dfaut :

Lecture de bases de donnes avec lAssistant de base de donnes Lecture de fichiers texte avec lAssistant de texte LAssistant de texte offre un paramtre optionnel qui cre automatiquement un cache des donnes. Par dfaut, cette option est slectionne. Pour dsactiver cette option, dslectionnez la case Mettre donnes en cache localement. Pour lAssistant de base de donnes, vous pouvez coller la syntaxe de commande gnre et supprimer la commande CACHE.

Cration dun cache de donnes


Bien que le fichier actif virtuel contribue rduire considrablement le volume despace disque temporaire requis, labsence dune copie temporaire du fichier actif signifie que la source de donnes dorigine doit tre lue de nouveau pour chaque procdure. Dans le cas de fichiers de donnes volumineux provenant dune

80 Chapitre 3

source externe, la cration dune copie temporaire des donnes peut amliorer les performances de lecture. Dans le cas de tableaux de donnes lus dans une base de donnes, la requte SQL qui consulte les informations de la base doit tre rexcute pour toute commande ou procdure ncessitant la lecture des donnes. Du fait que quasiment toutes les procdures danalyse statistique et de cration de diagrammes doivent lire les donnes, la requte SQL est rexcute pour chaque nouvelle procdure que vous lancez, ce qui risque dentraner un allongement considrable des temps de traitement si vous devez excuter un grand nombre de procdures. Si lordinateur sur lequel vous effectuez lanalyse (quil sagisse de votre ordinateur local ou dun serveur distant) dispose dun volume despace disque suffisant, vous pouvez liminer de nombreuses requtes SQL et rduire ainsi les temps de traitement en crant un cache de donnes du fichier actif. Le cache de donnes est une copie temporaire de la totalit des donnes. Remarque : Par dfaut, lAssistant de base de donnes cre automatiquement un cache de donnes. Toutefois, si vous utilisez la commande GET DATA dans une syntaxe afin de lire une base de donnes, le cache de donnes nest pas cr automatiquement. (La syntaxe de commande nest pas disponible dans la version Student.)

Pour crer un cache de donnes


E A partir des menus, slectionnez : Fichier Donnes Cache... E Cliquez sur OK ou sur Cacher maintenant.

Loption OK crera un cache de donnes la prochaine lecture des donnes (par exemple, lorsque vous excuterez une procdure statistique). Cest loption que vous choisirez le plus souvent puisque cette opration ne ncessite pas de passage de donnes supplmentaire. Loption Cacher maintenant cre un cache de donnes

81 Fichiers de donnes

immdiatement, ce qui gnralement ne devrait pas savrer ncessaire. Loption Cacher maintenant est surtout utile pour deux raisons : Une source de donnes est verrouille et ne peut tre mise jour tant que vous navez pas ferm la session, ouvert une autre source de donnes ou cr un cache des donnes. Pour les sources de donnes volumineuses, la consultation du contenu de longlet Affichage des donnes dans Data Editor savrera bien plus rapide si vous placez les donnes dans un cache.

Pour mettre automatiquement des donnes en mmoire cache


Vous pouvez paramtrer la commande SET pour quelle cre automatiquement un cache de donnes ds que vous avez apport un certain nombre de modifications dans le fichier de donnes actif. Par dfaut, le fichier de donnes actif est automatiquement mis en mmoire cache aprs 20 modifications.
E A partir des menus, slectionnez : Fichier Nouveau Syntaxe E Dans la fentre de syntaxe, entrez SET CACHE n. La valeur n correspond au nombre

de modifications apportes au fichier de donnes actif avant sa mise en mmoire cache.


E Dans le menu de la fentre de syntaxe, slectionnez : Excuter Tous

Remarque : Vous devez dfinir le paramtre de cache pour chaque session. A chaque nouvelle session, la valeur est paramtre par dfaut sur 20.

Chapitre

Mode danalyse distribue

Le mode danalyse distribue vous permet dutiliser un autre ordinateur local que le vtre (ou de bureau) pour les tches sollicitant la mmoire de faon intensive. Les serveurs distants utiliss pour lanalyse distribue se rvlant gnralement plus puissants et plus rapides que votre ordinateur local, le mode danalyse distribue permet de rduire considrablement les temps de traitement. Lanalyse distribue effectue laide dun serveur distant peut savrer utile si votre travail met en uvre : des fichiers de donnes volumineux, contenant notamment des donnes provenant de bases de donnes ; des tches sollicitant la mmoire de faon intensive. Toute tche longue effectuer en mode danalyse locale serait ainsi mieux adapte une analyse distribue. Lanalyse distribue naffecte que les tches impliquant des donnes, telles que la lecture et la transformation de donnes ainsi que le calcul de nouvelles variables et de statistiques. Lanalyse distribue na aucun effet sur les tches associes la modification de rsultats, telles que la manipulation de tableaux pivotants ou la modification de diagrammes. Remarque : Lanalyse distribue nest disponible que si vous disposez la fois dune version locale du programme et dun accs une version serveur du mme logiciel install sur un serveur distant.

Analyse distribue et analyse locale


Voici quelques recommandations destines vous permettre de choisir entre le mode danalyse locale et celui danalyse distribue :
Accs aux bases de donnes. Il est possible que les tches effectuant des requtes dans

des bases de donnes sexcutent plus rapidement en mode distribu si le serveur dispose dun accs prioritaire ces bases de donnes ou quil sexcute sur le mme
83

84 Chapitre 4

poste que le moteur de base de donnes. Si le logiciel daccs la base de donnes requise nest disponible que sur le serveur ou que votre administrateur rseau ne vous permet pas de tlcharger des tableaux de donnes de grande taille, vous ne pourrez accder la base de donnes quen mode distribu.
Rapport entre calculs et rsultats. Les commandes qui offrirent des performances

optimales si elles sont excutes en mode distribue sont des commandes effectuant un grand nombre de calculs et produisant peu de rsultats (par exemple, des tableaux pivotants en petit nombre ou peu volumineux, de brefs rsultats en format texte, ou encore des diagrammes simples ou en nombre rduit). Le gain de performances obtenu dpend dans une large mesure de la puissance de calcul du serveur distant.
Tches rapides. Les tches sexcutant rapidement en mode local le feront presque

toujours plus lentement en mode distribu du fait des sollicitations systme inhrentes larchitecture client-serveur.
Diagrammes. Les diagrammes conus pour les observations, tels que les diagrammes de dispersion, les diagrammes de rsidus de rgression ou les diagrammes squentiels, ncessitent la prsence de donnes brutes sur votre ordinateur local. Dans le cas de fichiers de donnes ou de tableaux de base de donnes volumineux, cette ncessit risque dentraner un ralentissement des performances en mode distribu puisque les donnes doivent tre envoyes par le serveur distant votre ordinateur local. En revanche, les autres diagrammes mettant en uvre des donnes rcapitulatives ou agrges seront traits de faon adquate en mode distribu puisque lopration consistant agrger les donnes est effectue sur le serveur. Diagrammes interactifs. Si les donnes brutes sont enregistres avec des graphiques interactifs (un paramtre optionnel), de grandes quantits de donnes peuvent tre transfres depuis un serveur distant vers votre ordinateur local, rduisant de manire significative le temps ncessaire lenregistrement de vos rsultats. Tableaux pivotants. La cration de tableaux pivotants de grande taille peut savrer

plus longue en mode distribu. Ceci se vrifie plus particulirement dans le cas de la procdure Cubes OLAP et des tableaux contenant des donnes dobservations individuelles, tels que ceux disponibles dans la procdure Rcapituler.
Rsultats texte. Plus la quantit de texte gnre est importante, plus elle sera longue

seffectuer en mode distribu, car ce texte est cr sur le serveur distant, puis copi sur votre ordinateur local pour affichage. Toutefois, les rsultats en format texte ne sollicitent que faiblement le systme et sont transmis rapidement.

85 Mode danalyse distribue

Connexion au serveur SPSS


La bote de dialogue Connexion au serveur vous permet de slectionner lordinateur qui traite les commandes et excute les procdures. Vous pouvez slectionner votre ordinateur local ou un serveur distant.
Figure 4-1 Bote de dialogue Connexion au serveur

Vous pouvez ajouter et modifier des serveurs distants de la liste, ou en supprimer. Les serveurs distants ncessitent gnralement un ID utilisateur ainsi quun mot de passe, et parfois mme un nom de domaine. Pour plus dinformations sur la connexion, les serveurs disponibles, les ID utilisateur, les mots de passe et noms de domaine, contactez ladministrateur systme. Vous pouvez slectionner un serveur par dfaut et enregistrer lID utilisateur, le nom de domaine et le mot de passe associs un serveur. Lorsque vous dmarrez une session, vous tes automatiquement connect au serveur par dfaut.

Ajout et modification des paramtres de connexion au serveur


Utilisez la bote de dialogue Paramtres de connexion au serveur pour ajouter ou modifier des informations de connexion pour les serveurs distants utiliser en mode danalyse distribue.

86 Chapitre 4 Figure 4-2 Bote de dialogue Paramtres de connexion au serveur

Contactez ladministrateur systme pour obtenir la liste des serveurs disponibles et des numros de port associs aux serveurs, ainsi que des informations de connexion supplmentaires. Nutilisez le protocole SSL que si ladministrateur vous le demande.
Nom du serveur. Un nom de serveur peut tre un nom alphanumrique affect un ordinateur (par exemple, NetworkServer) ou une adresse IP unique attribue un ordinateur (par exemple, 202.123.456.78). Numro de port. Le numro du port est le port que le logiciel du serveur utilise pour les communications. Description. Vous pouvez entrer une description facultative devant apparatre dans la

liste des serveurs.


Connecter avec le protocole SSL. Le protocole SSL (Secure Sockets Layer) code les demandes danalyse distribue envoyes au serveur SPSS distant. Avant dutiliser le protocole SSL, consultez ladministrateur. Pour quil soit activ, le protocole SSL doit tre configur sur votre ordinateur et sur le serveur.

87 Mode danalyse distribue

Slection, changement ou ajout de serveurs


E A partir des menus, slectionnez : Fichier Changer serveur

Pour slectionner un serveur par dfaut :


E Dans la liste des serveurs, cochez la case situe en regard du serveur utiliser. E Entrez lID utilisateur, le nom de domaine et le mot de passe fournis par

ladministrateur. Remarque : Lorsque vous dmarrez une session, vous tes automatiquement connect au serveur par dfaut.
Pour utiliser un autre serveur :
E Slectionnez un serveur dans la liste. E Entrez votre ID utilisateur, nom de domaine et mot de passe (le cas chant).

Remarque : Lorsque vous changez de serveur au cours dune session, toutes les fentres ouvertes sont automatiquement fermes. Le systme vous demande denregistrer vos modifications avant la fermeture des fentres.
Pour ajouter un serveur :
E Demandez les informations de connexion du serveur ladministrateur. E Cliquez sur Ajouter pour ouvrir la bote de dialogue Paramtres de connexion au

serveur.
E Entrez les informations de connexion et les paramtres facultatifs, puis cliquez sur OK.

Pour modifier un serveur :


E Demandez les informations de connexion rvises ladministrateur. E Cliquez sur Edition pour ouvrir la bote de dialogue Paramtres de connexion au

serveur.
E Entrez les modifications et cliquez sur OK.

88 Chapitre 4

Ouverture de fichiers de donnes partir dun serveur distant


Figure 4-3 Bote de dialogue Ouvrir fichier distant

En mode danalyse distribue, la bote de dialogue Ouvrir fichier distant remplace la bote de dialogue Ouvrir fichier. Le contenu de la liste des fichiers, dossiers et lecteurs disponibles dpend des donnes accessibles sur le serveur distant. Le nom du serveur utilis est indiqu dans la zone suprieure de la bote de dialogue. En mode danalyse distribue, vous naurez accs aux fichiers de donnes de votre ordinateur local que si vous dfinissez le lecteur correspondant comme un lecteur partag et les dossiers contenant vos fichiers de donnes comme des dossiers partags. Si le systme dexploitation du serveur est diffrent du vtre (Windows et UNIX par exemple), vous naurez probablement pas accs aux fichiers de donnes locaux en mode danalyse distribue, mme sils se trouvent dans des dossiers partags.

Pour ouvrir des fichiers de donnes partir dun serveur distant


E Si vous ntes pas encore connect au serveur distant, faites-le maintenant.

89 Mode danalyse distribue E Selon le type de fichier de donnes ouvrir, slectionnez les options de menu

suivantes :
Fichier Open Donnes

ou
Fichier Ouvrir la base de donnes

ou
Fichier Lire les donnes du texte...

Enregistrement de fichiers de donnes partir dun serveur distant


Figure 4-4 Bote de dialogue Enregistrer fichier distant

En mode danalyse distribue, la bote de dialogue Enregistrer fichier distant remplace la bote de dialogue Enregistrer fichier standard. Le contenu de la liste des dossiers et lecteurs disponibles dpend des donnes accessibles sur le serveur distant. Le nom du serveur utilis est indiqu dans la zone suprieure de la bote de dialogue. Vous naurez accs aux dossiers de

90 Chapitre 4

votre ordinateur local que si vous dfinissez le lecteur correspondant comme un lecteur partag et spcifiez les dossiers comme des dossiers partags. Si le systme dexploitation du serveur est diffrent du vtre (Windows et UNIX par exemple), vous naurez probablement pas accs aux fichiers de donnes locaux en mode danalyse distribue, mme sils se trouvent dans des dossiers partags. Les droits daccs relatifs aux dossiers partags doivent inclure la possibilit dcrire dans les dossiers si vous souhaitez enregistrer les fichiers de donnes dans un dossier local.

Pour enregistrer des fichiers de donnes partir dun serveur distant


E Activez la fentre de lditeur de donnes. E A partir des menus, slectionnez : Fichier Enregistrer (ou Enregistrer sous...)

Accs aux fichiers de donnes en mode danalyse locale ou distribue Mode :


Laffichage des fichiers de donnes, dossiers (rpertoires) et lecteurs de votre ordinateur local et du rseau dpend de lordinateur que vous utilisez pour traiter les commandes et excuter les procdures (qui ne correspond pas obligatoirement lordinateur que vous avez en face de vous).
Mode danalyse locale. Lorsque vous utilisez votre ordinateur local comme votre

serveur , laffichage des fichiers de donnes, dossiers et lecteurs que vous obtenez dans la bote de dialogue daccs aux fichiers (permettant douvrir les fichiers de donnes) est le mme que celui fourni dans dautres applications ou dans lExplorateur Windows. Vous pouvez afficher tous les fichiers de donnes et dossiers de votre ordinateur, ainsi que tous les fichiers et dossiers stocks sur les lecteurs rseau.
Mode danalyse distribue. Lorsque vous utilisez un autre ordinateur comme serveur

distant pour excuter les commandes et procdures, laffichage des fichiers de donnes, dossiers et lecteurs correspond celui obtenu du serveur distant. Bien que vous puissiez obtenir des noms de dossiers familiers tels que Program Files et des lecteurs portant la lettre C, il ne sagit pas des dossiers et lecteurs de votre ordinateur, mais des dossiers et lecteurs du serveur distant.

91 Mode danalyse distribue Figure 4-5 Affichages local et distant

En mode danalyse distribue, vous naurez accs aux fichiers de donnes de votre ordinateur local que si vous dfinissez le lecteur correspondant comme un lecteur partag et spcifiez les dossiers contenant vos fichiers de donnes comme des dossiers partags. Si le systme dexploitation du serveur est diffrent du vtre (Windows et UNIX par exemple), vous naurez probablement pas accs aux fichiers de donnes locaux en mode danalyse distribue, mme sils se trouvent dans des dossiers partags. Lutilisation du mode danalyse distribue nquivaut pas accder aux fichiers de donnes stocks sur un autre ordinateur de votre rseau. Vous pouvez accder aux fichiers de donnes situs sur dautres disques rseau en mode danalyse locale ou en mode danalyse distribue. En mode local, vous accdez dautres disques

92 Chapitre 4

partir de votre ordinateur local. En mode distribu, vous accdez dautres disques rseau depuis le serveur distant. Pour savoir si vous utilisez le mode local ou le mode distribu, examinez la barre de titre de la bote de dialogue permettant daccder aux fichiers de donnes. Si le titre de la bote de dialogue contient le terme Distant (comme dans Ouvrir fichier distant) ou que le libell Serveur distant : [nom_de_serveur] apparat dans la zone suprieure de la bote de dialogue, vous utilisez le mode danalyse distribue. Remarque : Ceci ne concerne que les botes de dialogue permettant daccder aux fichiers de donnes (telles que Ouvrir les donnes, Enregistrer les donnes, Ouvrir la base de donnes et Appliquer le dictionnaire des donnes). Pour tous les autres types de fichier (tels que les fichiers Viewer, les fichiers de syntaxe et les fichiers scripts), laffichage local est toujours utilis.

Pour dfinir des droits daccs de partage pour un lecteur ou un dossier


E Dans Poste de travail, cliquez sur le dossier (rpertoire) ou le lecteur partager. E Depuis le menu Fichier, choisissez Proprits. E Cliquez sur longlet Partage, puis sur Nom de partage.

Pour plus dinformations sur le partage de lecteurs et de dossiers, consultez laide de votre systme dexploitation.

Disponibilit des procdures en Mode :


En mode danalyse distribue, uniquement les procdures installes la fois sur votre version locale et sur la version du serveur distant sont disponibles. Si vous avez des composants optionnels installs localement qui ne sont pas disponibles sur le serveur distant et si vous basculez de lordinateur local au serveur distant, les procdures affectes seront supprimes des menus et des erreurs se produiront dans la syntaxe de commande correspondante. Vous devrez rtablir le mode local pour restaurer toutes les procdures affectes.

93 Mode danalyse distribue

Utilisation des spcifications de chemins UNC


Avec la version serveur Windows NT de SPSS, les spcifications de chemins relatifs pour des fichiers de donnes sont relatives par rapport au serveur utilis en mode danalyse distribue, et non par rapport votre ordinateur local. Une spcification de chemin telle que c:\mydocs\mydata.sav ne dsigne pas un rpertoire et un fichier de votre disque C, mais un rpertoire et un fichier du disque dur du serveur distant. Si le rpertoire et/ou le fichier nexistent pas sur le serveur distant, une erreur se produit dans la syntaxe de commande comme dans lexemple suivant :
GET FILE='c:\Mes_documents\Mes_donnes.sav'.

Avec la version serveur Windows NT de SPSS, vous pouvez utiliser des noms de chemin UNC (Universal Naming Convention = convention de dnomination universelle) pour spcifier lemplacement des fichiers de donnes dans vos fichiers de commande. Une spcification de chemin UNC prend gnralement la forme suivante :
\\nom_serveur\nom_partage\chemin\nom_fichier

Llment nom_serveur est le nom de lordinateur contenant le fichier de donnes. Llment nom_partage dsigne le dossier (rpertoire) de lordinateur dfini comme dossier de partage. Llment chemin correspond aux sous-dossiers (sous-rpertoires) du dossier partag. Llment nom_fichier est le nom du fichier de donnes. Voir lexemple comme suit :
GET FILE='\\hqdev001\public\juillet\ventes.sav'.

Si aucun nom na t attribu lordinateur, vous pouvez utiliser son adresse IP, comme dans lexemple suivant :
GET FILE='\\204.125.125.53\public\juillet\ventes.sav'.

Mme si vous utilisez des spcifications de chemins UNC, vous ne pouvez accder quaux fichiers de donnes installs sur des lecteurs et des dossiers partags. Lorsque vous utilisez le mode danalyse distribue, les fichiers de donnes de votre ordinateur local sont inclus dans le traitement.

94 Chapitre 4

Serveurs UNIX. Sur les plateformes UNIX, il nexiste aucun quivalent la

dnomination UNC. Pour tous les rpertoires, vous devez indiquer un chemin daccs absolu, commenant la racine du serveur. Les chemins relatifs ne sont pas admis. Par exemple, si le fichier de donnes se trouve dans le rpertoire /bin/spss/data et que le rpertoire actif est galement /bin/spss/data, la commande GET FILE='ventes.sav' nest pas valide. Vous devez indiquer lintgralit du chemin daccs, savoir :
GET FILE='/bin/spss/data/sales.sav'.

Chapitre

Editeur de donnes

Lditeur de donnes fournit une mthode pratique, semblable celle dun tableur, permettant de crer et de modifier des fichiers de donnes SPSS. La fentre de lditeur de donnes souvre automatiquement lorsque vous lancez une session SPSS. Editeur de donnes permet dafficher les donnes de deux faons :
Affichage des donnes. Affiche les valeurs relles des donnes ou les tiquettes de

valeurs dfinies.
Affichage des variables. Affiche les informations de dfinition des variables,

savoir les tiquettes de valeurs et de variables dfinies, le type des donnes (par exemple, chane, date ou valeur numrique), le niveau de mesure (nominale, ordinale ou chelle) et les valeurs utilisateur manquantes. Dans les deux affichages, vous pouvez ajouter, modifier et supprimer les informations contenues dans le fichier de donnes.

95

96 Chapitre 5

Affichage des donnes


Figure 5-1 Affichage des donnes

Un grand nombre des fonctions de lAffichage des donnes sont similaires celles que proposent les tableurs. Il y a toutefois des diffrences importantes : Les lignes sont des observations. Chaque ligne reprsente une observation. Par exemple, chaque rpondant dun questionnaire est considr comme tant une observation. Les colonnes sont des variables. Chaque colonne reprsente une variable ou une caractristique tant mesure. Par exemple, chaque lment ou lment dun questionnaire est une variable. Les cellules contiennent des valeurs. Chaque cellule contient une seule valeur pour une variable et pour une observation. La cellule correspond au point dintersection de lobservation et de la variable. Les cellules ne contiennent que des valeurs de donnes. A la diffrence des tableurs, les cellules de lditeur de donnes ne peuvent pas contenir de formules. Le fichier de donnes est rectangulaire. La taille du fichier de donnes est dtermine par le nombre dobservations et de variables. Vous pouvez entrer des donnes dans nimporte quelle cellule. Si vous entrez des donnes dans une cellule en dehors des limites du fichier de donnes dfini, SPSS agrandit le rectangle des donnes pour inclure toutes les lignes et/ou colonnes ncessaires entre cette cellule et les limites du fichier. Il ny a pas de cellule vide

97 Editeur de donnes

lintrieur des limites du fichier de donnes. En ce qui concerne les variables numriques, les cellules blanc sont converties en valeurs manquantes par dfaut. En ce qui concerne les variables chane, un blanc est considr comme une valeur valide.

Affichage des variables


Figure 5-2 Affichage des variables

LAffichage des variables prsente les descriptions des attributs de chaque variable du fichier de donnes. Dans lAffichage des variables : Les lignes sont des variables. Les colonnes sont des attributs de variable. Vous pouvez ajouter ou supprimer des variables et modifier les attributs de ces dernires, y compris les attributs suivants : Le nom de la variable Le type de donnes

98 Chapitre 5

Le nombre de chiffres ou de caractres Le nombre de dcimales Les tiquettes descriptives de variables et de valeurs. Les valeurs manquantes dfinies par lutilisateur La largeur des colonnes Le niveau de mesure Tous ces attributs sont enregistrs lorsque vous sauvegardez le fichier de donnes. Vous pouvez dfinir les proprits des variables dans lAffichage des variables, mais vous disposez galement de deux autres mthodes pour ce faire : Lassistant Copier des proprits de donnes permet dutiliser un fichier de donnes SPSS externe ou un autre ensemble de donnes disponible dans la session en cours comme modle pour dfinir les proprits de fichier et de variable dans lensemble de donnes actif. Vous pouvez galement utiliser des variables de lensemble de donnes actif comme modle pour dautres variables de lensemble de donnes actif. Loption Copier des proprits de donnes est disponible dans le menu Donnes de la fentre de lditeur de donnes. Loption Dfinir les proprits de variable (galement disponible dans le menu Donnes de la fentre de lditeur de donnes) permet danalyser vos donnes et de rpertorier toutes les valeurs de donnes uniques pour les variables slectionnes et didentifier les valeurs non tiquetes, et fournit une fonction dtiquetage automatique. Cette mthode est particulirement utile pour les variables qualitatives qui utilisent des codes numriques pour reprsenter les modalits. Par exemple, 0 = Masculin, 1 = Fminin.

Pour afficher ou dfinir des attributs de variable


E Activez la fentre de lditeur de donnes. E Double-cliquez sur un nom de variable dans la zone suprieure de la colonne de laffichage de donnes ou cliquez sur longlet Affichage des variables. E Pour dfinir de nouvelles variables, entrez un nom de variable dans une ligne vierge. E Slectionnez les attributs dfinir ou modifier.

99 Editeur de donnes

Noms de variable
Les rgles suivantes sappliquent pour les noms des variables : Le nom doit commencer par une lettre. Les autres caractres peuvent tre nimporte quelle lettre, nimporte quel chiffre, un point, ou les symboles @, #, _ ou $. Les noms de variable ne peuvent pas se terminer par un point. Les noms de variable se terminant par un trait de soulignement sont viter (pour viter des conflits avec les variables cres automatiquement par certaines procdures). La longueur du nom ne doit pas excder 64 octets. 64 octets correspondent 64 caractres dans les langues sur un octet (anglais, franais, allemand, espagnol, italien, hbreu, russe, grec, arabe et tha par exemple) et 32 caractres dans les langues sur deux octets (japonais, chinois et coren par exemple). Les espaces et les caractres spciaux ne peuvent pas tre utiliss (par exemple, !, ?, , et *). Chaque nom de variable doit tre unique ; aucune duplication nest admise. Les mots-cls rservs ne peuvent pas tre utiliss pour les noms de variables : Les mots-cls rservs sont les suivants : ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO, WITH. Les noms de variables peuvent tre dfinis par nimporte quelle combinaison de majuscules et de minuscules. La casse est respecte pour des raisons daffichage. Lorsque des noms longs de variable occupent plusieurs lignes au niveau du rsultat, SPSS essaie dinsrer les sauts de ligne au niveau des traits de soulignement, des virgules et des passages de minuscule majuscule.

Niveau de mesure des variables


Vous pouvez spcifier un niveau de mesure dchelle (donnes numriques sur un intervalle ou une chelle de rapport), ordinal ou nominal Les donnes nominales et ordinales peuvent tre des chanes de caractres (alphanumriques) ou numriques.
Nominales. Une variable peut tre traite comme tant nominale si ses valeurs

reprsentent des modalits sans classement intrinsque (par exemple, le service de la socit dans lequel travaille un employ). La rgion, le code postal ou l'appartenance religieuse sont des exemples de variable nominale.

100 Chapitre 5

Ordinales. Une variable peut tre traite comme tant ordinale si ses valeurs

reprsentent des modalits associes un classement intrinsque (par exemple, des niveaux de satisfaction allant de Trs mcontent Trs satisfait). Exemples de variable ordinale : des scores d'attitude reprsentant le degr de satisfaction ou de confiance, et des scores de classement des prfrences.
Echelle.. Une variable peut tre traite comme tant une variable d'chelle si ses

valeurs reprsentent des modalits classes avec une mesure significative, de sorte que les comparaisons de distance entre les valeurs soient adquates. L'ge en annes et le revenu en milliers de dollars sont des exemples de variable d'chelle. Remarque : Pour les variables chane ordinales, lordre alphabtique des valeurs chane est suppos reflter lordre des modalits. Par exemple, pour une variable chane comportant des valeurs Faible, Moyen, Elev, lordre des modalits est interprt comme Elev, Faible ou Moyen, ce qui ne correspond pas lordre correct. En rgle gnrale, il est recommand dutiliser les codes numriques pour reprsenter les donnes ordinales. Pour les nouvelles variables cres lors dune session, les donnes lues partir de formats de fichier externes et les fichiers de donnes SPSS crs prcdemment la version 8, lattribution par dfaut de niveaux de mesure est base sur les rgles suivantes : Les variables numriques ayant moins de 24 valeurs uniques et les variables chane sont dfinies comme variables nominales. Les variables numriques ayant 24 valeurs uniques ou plus sont dfinies comme variables dchelle. Vous pouvez changer la valeur dinclusion dchelle/nominale pour des variables numriques dans la bote de dialogue Options. Pour plus d'informations, reportez-vous Options diagrammes interactifs dans Chapitre 44 p. 672. La bote de dialogue Dfinir les proprits de la variable, disponible partir du menu Donnes, peut vous aider attribuer le niveau de mesure adquat. Pour plus d'informations, reportez-vous Affectation du niveau de mesure dans Chapitre 7 p. 129.

101 Editeur de donnes

Type de variable
Loption Type de variable permet de dfinir le type de donnes pour chaque variable. Par dfaut, toute nouvelle variable est numrique. Vous pouvez utiliser loption Type de variable pour changer le type des donnes. Le contenu de la bote de dialogue Type de variable dpend du type de donnes slectionn. Pour certains types de donnes, il y a des zones de texte o sont indiqus la longueur et le nombre de dcimales. Pour dautres types de donnes, il vous suffit de slectionner un format dans une liste droulante contenant des exemples.
Figure 5-3 Bote de dialogue Type de variable

Les types de donnes disponibles sont les suivants :


Numrique. Variable dont les valeurs sont des nombres. Les valeurs sont affiches en

format numrique standard. Lditeur de donnes accepte les valeurs numriques au format standard ou sous forme de notation scientifique.
Virgule. Variable numrique dont les valeurs sont affiches avec des virgules toutes les trois positions, le point servant de sparateur dcimal. Loutil Editeur de donnes accepte les valeurs numriques pour les variables de virgule avec ou sans virgule ou sous forme de notation scientifique. Les valeurs ne peuvent pas contenir de virgule droite de lindicateur dcimal. Point. Variable numrique dont les valeurs sont affiches avec des points toutes les trois positions, la virgule servant de sparateur dcimal. Loutil Editeur de donnes accepte les valeurs numriques pour les variables de point avec ou sans point ou sous forme de notation scientifique. Les valeurs ne peuvent pas contenir de point droite de lindicateur dcimal.

102 Chapitre 5

Notation scientifique. Variable numrique dont les valeurs sont affiches avec un E intgr et un exposant de puissance dix avec signe. Lditeur de donnes accepte des valeurs numriques pour les variables de notation scientifique avec ou sans exposant. Lexposant peut tre prcd dun E ou dun D avec ou sans signe, ou seulement dun signe. Par exemple, 123, 1.23E2, 1.23D2, 1.23E+2 et mme 1.23+2. Date. Variable numrique dont les valeurs sont affiches dans lun des formats de date ou dheure possibles. Slectionnez un format dans la liste. Vous pouvez entrer des dates avec, comme sparateur, des barres obliques, des traits dunion, des points, des virgules ou des espaces. La valeur du sicle pour les annes 2 chiffres est dtermine par les paramtres Options (accessibles depuis le menu Edition, slectionnez Options, puis cliquez sur longlet Donnes). Dollar. Variable numrique affiche avec le signe dollar ($), avec des virgules toutes

les trois positions, le point servant de sparateur dcimal. Vous pouvez entrer des valeurs de donnes avec ou sans le signe dollar.
Symbole montaire. Variable numrique dont les valeurs sont affiches dans lun des

formats montaires personnaliss que vous avez dfinis dans longlet Devise de la bote de dialogue Options. Les caractres de symbole montaire dfinis ne sont pas utilisables lors de la saisie de donnes mais sont affichs dans lditeur de donnes.
Chane. Variable dont les valeurs ne sont pas numriques et ne sont donc pas utilises

pour les calculs. Ces valeurs peuvent contenir nimporte quel caractre, dans la limite de la longueur dfinie. Les majuscules et les minuscules sont diffrencies. Ce type de variable est aussi connu sous le nom de variable alphanumrique.

Pour dfinir le type de variable


E Cliquez sur le bouton de la cellule Type de la variable dfinir. E Slectionnez le type de donnes dans la bote de dialogue Type de variable. E Cliquez sur OK.

103 Editeur de donnes

Formats dentre/daffichage
Selon le format, les valeurs affiches dans lAffichage des donnes peuvent diffrer des valeurs relles entres et enregistres en interne. Voici quelques rgles gnrales : Pour les formats Numrique, Virgule et Point, vous pouvez entrer des valeurs avec nimporte quel nombre de positions dcimales (maximum 16), et la valeur entire est enregistre. LAffichage des donnes naffiche que le nombre de dcimales dfini et arrondit les valeurs comportant plus de dcimales. Toutefois, la valeur complte est utilise dans tous les calculs. Pour les variables chane, toutes les valeurs sont cadres droite au maximum de la longueur. Pour une variable chane dont la largeur maximum est de trois, une valeur Non est enregistre comme 'Non ' et nest pas quivalente ' Non'. Pour les formats de dates, vous pouvez utiliser des barres obliques, des tirets, des espaces, des virgules ou des points comme sparateurs entre les jours, les mois et les annes. Pour les mois, vous pouvez entrer des nombres, des abrviations trois lettres ou le nom des mois en clair. Les dates de format gnral sous la forme jj-mmm-aa sont affiches avec des tirets servant de sparateurs et des abrviations trois lettres pour le mois. Les dates de format gnral sous la forme jj/mm/aa et mm/jj/aa sont affiches avec des barres obliques comme sparateurs et des nombres pour le mois. De manire interne, les dates sont enregistres sous la forme dun nombre de secondes partir du 14 octobre 1582. La plage de sicles pour les dates avec des annes deux chiffres est dtermine partir des paramtres Options (dans le menu Edition, slectionnez Options, puis cliquez sur longlet Donnes). Pour les formats de temps, vous pouvez utiliser les deux points, des points ou des espaces comme sparateurs entre les heures, les minutes et les secondes. Les temps sont affichs avec des deux points comme sparateurs. De faon interne, les temps sont enregistrs comme tant le nombre de secondes depuis le 14 octobre 1582.

Etiquettes des variables


Vous pouvez attribuer des tiquettes de variables descriptives dont le nombre de caractres ne dpasse pas 256 (128 caractres pour les langages sur deux octets). Les tiquettes de variable peuvent contenir des espaces et des caractres rservs qui ne sont pas autoriss dans les noms de variable.

104 Chapitre 5

Pour spcifier des tiquettes de variable


E Activez la fentre de lditeur de donnes. E Double-cliquez sur un nom de variable dans la zone suprieure de la colonne de laffichage de donnes ou cliquez sur longlet Affichage des variables. E Entrez ltiquette de variable descriptive dans la cellule Etiquette de la variable.

Etiquettes de valeurs
Vous pouvez affecter des tiquettes descriptives de valeur pour chaque valeur dune variable. Ce processus se rvle particulirement utile si votre fichier de donnes utilise des codes numriques pour reprsenter des modalits non numriques (par exemple, les codes 1 et 2 pour homme et femme). Les tiquettes de valeurs peuvent slever jusqu 120 octets. Les tiquettes de valeurs ne sont pas disponibles pour les variables chane longues (variables chane de plus de 8 caractres).
Figure 5-4 Bote de dialogue Etiquettes de valeurs

Pour spcifier des tiquettes de valeur


E Cliquez sur le bouton de la cellule Valeurs de la variable dfinir.

105 Editeur de donnes E Pour chaque valeur, entrez la valeur et une tiquette. E Cliquez sur Ajouter pour entrer ltiquette de valeur. E Cliquez sur OK.

Insertion de sauts de ligne dans les tiquettes


Les tiquettes de variables ou de valeurs ont un retour la ligne automatique dans les tableaux pivotants et les diagrammes si la cellule ou la zone nest pas assez large pour afficher ltiquette sur une seule ligne ; vous pouvez galement modifier les rsultats pour insrer des sauts de ligne manuellement si vous voulez que le saut de ligne se fasse ailleurs. Vous pouvez aussi crer des tiquettes de variable ou de valeur qui effectueront toujours un retour la ligne en des points dfinis et qui comporteront plusieurs lignes.
E Pour les tiquettes de variable, slectionnez la cellule Etiquette de la variable dans

la zone Affichage des variables de Editeur de donnes.


E Pour les tiquettes de valeur, slectionnez la cellule Valeurs de la variable dans la zone

Affichage des variables de Editeur de donnes, cliquez sur le bouton qui apparat dans la cellule, puis slectionnez ltiquette que vous souhaitez modifier dans la bote de dialogue Etiquettes de valeurs.
E Dans ltiquette, saisissez \n lendroit o vous voulez insrer un retour la ligne.

Le \n ne saffiche pas dans les tableaux pivotants ou les diagrammes ; il est reconnu comme un caractre de saut de ligne.

Valeurs manquantes
Loption Valeurs manquantes permet de dfinir les valeurs de donnes spcifies comme valeurs manquantes spcifies par lutilisateur. Par exemple, vous pouvez faire la distinction entre les donnes manquantes parce quune personne interroge a refus de rpondre et les donnes manquantes parce que la question ne sappliquait pas au rpondant. Les valeurs des donnes dfinies comme valeurs utilisateur manquantes sont repres par un indicateur en vue dun traitement spcial et sont exclues de la plupart des calculs.

106 Chapitre 5 Figure 5-5 Bote de dialogue Valeurs manquantes

Vous pouvez entrer jusqu trois valeurs manquantes de votre choix, un intervalle de valeurs manquantes ou un intervalle plus une valeur de votre choix. Les intervalles ne peuvent tre spcifis que pour des valeurs numriques. Vous ne pouvez pas dfinir de valeur manquante pour des variables chane longues (variables chane de plus de 8 caractres).
Valeurs manquantes pour des variables de chane. Toutes les valeurs de chane, y

compris les valeurs nulles ou vides, sont considres comme des valeurs valides moins que vous ne les dfinissiez comme manquantes. Pour dfinir des valeurs nulles ou vides comme manquantes pour une variable chane, entrez un seul espace dans lun des champs sous la slection Valeurs manquantes discrtes.

Pour dfinir les valeurs manquantes


E Cliquez sur le bouton de la cellule Manquante de la variable dfinir. E Entrez les valeurs ou lintervalle de valeurs reprsentant les valeurs manquantes.

Toutes les valeurs de chane, y compris les valeurs nulles ou vides, sont considres comme des valeurs valides moins que vous ne les dfinissiez comme manquantes. Pour dfinir des valeurs nulles ou vides comme manquantes pour une variable chane, entrez un seul espace dans lun des champs sous la slection Valeurs manquantes discrtes.

107 Editeur de donnes

Largeur des colonnes


Vous pouvez spcifier le nombre de caractres dfinissant la largeur des colonnes. Vous pouvez galement modifier la largeur des colonnes dans laffichage Donnes en cliquant et en tirant les bords des colonnes. Les formats de colonnes affectent seulement laffichage des valeurs dans lditeur de donnes. Modifier la largeur de la colonne ne change pas la largeur dfinie dune variable. Si la largeur relle et la largeur dfinie dune valeur sont plus larges que la colonne, des astrisques (*) apparaissent dans laffichage Donnes.

Alignement de variable
Lalignement contrle laffichage des valeurs des donnes et/ou des tiquettes de valeur dans laffichage Donnes. Lalignement par dfaut est droite pour les variables numriques et gauche pour les variables chane. Ce paramtre naffecte que laffichage de laffichage Donnes.

Application dattributs de dfinition de variable plusieurs variables


Lorsque vous avez dfini les attributs de dfinition dune variable, vous pouvez copier des attributs et les appliquer une ou plusieurs variables. Lapplication dattributs de dfinition de variable seffectue au moyen des oprations Copier et Coller de base. Vous pouvez: Copier un seul attribut (par exemple, les tiquettes de valeurs) et le coller dans la ou les mmes cellules dattribut dune ou de plusieurs variables. Copier tous les attributs dune variable et les coller dans dautres variables. Crer plusieurs variables avec tous les attributs de la copie dune variable.

Application dattributs de dfinition de variable dautres variables


Pour appliquer certains attributs dune variable dfinie, procdez comme suit.
E Dans lAffichage des variables, slectionnez la cellule dattribut appliquer dautres

variables.

108 Chapitre 5 E A partir des menus, slectionnez : Edition Copier E Slectionnez la ou les cellules dattribut auxquelles vous souhaitez appliquer lattribut.

(Vous pouvez slectionner plusieurs variables cible.)


E A partir des menus, slectionnez : Edition Coller

Si vous collez lattribut dans des lignes vides, de nouvelles variables sont cres avec des valeurs dattributs par dfaut pour tous les attributs, lexception de celui que vous avez slectionn.
Pour appliquer tous les attributs dune variable dfinie, procdez comme suit.
E Dans lAffichage des variables, slectionnez le numro de ligne de la variable

prsentant les attributs utiliser. (La totalit de la ligne est mise en surbrillance.)
E A partir des menus, slectionnez : Edition Copier E Slectionnez le numro de ligne de la variable laquelle vous souhaitez appliquer les

attributs. (Vous pouvez slectionner plusieurs variables cible.)


E A partir des menus, slectionnez : Edition Coller

Cration de plusieurs nouvelles variables avec les mmes attributs


E Dans lAffichage des variables, cliquez sur le numro de ligne de la variable

prsentant les attributs utiliser pour la nouvelle variable. (La totalit de la ligne est mise en surbrillance.)
E A partir des menus, slectionnez : Edition Copier E Cliquez sur le numro de la ligne vide qui se trouve sous la dernire variable dfinie

dans le fichier de donnes.

109 Editeur de donnes E A partir des menus, slectionnez : Edition Coller les variables... E Dans la bote de dialogue Coller les variables, entrez le nombre de variables crer. E Entrez un prfixe et un numro de dpart pour les nouvelles variables. E Cliquez sur OK.

Les noms des nouvelles variables seront composs du prfixe spcifi et dun numro squentiel commenant par le numro spcifi.

Saisie de donnes
Dans laffichage des donnes, vous pouvez entrer les donnes directement dans Editeur de donnes. Vous pouvez entrer des donnes dans nimporte quel ordre. Vous pouvez entrer des donnes par observation ou par variable, pour des zones slectionnes ou des cellules individuelles. La cellule active est mise en surbrillance. Le nom de variable et le numro de ligne de la cellule active sont affichs dans le coin suprieur gauche de lditeur de donnes. Lorsque vous slectionnez une cellule et lorsque vous entrez une valeur de donnes, la valeur est affiche dans lditeur de cellules en haut de lditeur de donnes. Les valeurs de donnes ne sont pas enregistres tant que vous navez pas appuy sur Entre ou que vous navez pas slectionn une autre cellule. Pour entrer autre chose que des donnes numriques simples, vous devez dabord dfinir le type de variable. Si vous entrez une valeur dans une colonne vide, lditeur de donnes cre automatiquement une nouvelle variable et affecte un nom de variable.

110 Chapitre 5 Figure 5-6 Ensemble de donnes actif dans lAffichage de donnes

Pour entrer des donnes numriques


E Slectionnez une cellule dans laffichage Donnes. E Entrez la valeur des donnes. (La valeur est affiche dans lditeur de cellules dans la

partie suprieure de Editeur de donnes.)


E Appuyez sur Entre ou slectionnez une autre cellule pour enregistrer la valeur.

Pour entrer des donnes non numriques


E Double-cliquez sur un nom de variable dans la zone suprieure de la colonne de laffichage de donnes ou cliquez sur longlet Affichage des variables. E Cliquez sur le bouton de la cellule Type de la variable. E Slectionnez le type de donnes dans la bote de dialogue Type de variable. E Cliquez sur OK. E Double-cliquez sur le numro de ligne ou cliquez sur longlet Affichage des donnes. E Pour la variable que vous venez de dfinir, entrez les donnes dans la colonne.

111 Editeur de donnes

Pour utiliser des tiquettes de valeur pour lentre de donnes


E Si les tiquettes de valeurs napparaissent pas dans lAffichage des donnes,

choisissez dans les menus :


Affichage Etiquettes de valeurs E Cliquez sur la cellule dans laquelle vous souhaitez entrer la valeur. E Slectionnez une tiquette de valeur dans la liste droulante.

La valeur est saisie et ltiquette de valeur est affiche dans la cellule. Remarque : Ce processus ne fonctionne que si vous avez dfini des tiquettes de valeurs pour la variable.

Restrictions concernant la valeur de donnes dans lditeur de donnes


Le type et la largeur dfinis de la variable dterminent le type de valeur que vous pouvez entrer dans la cellule de laffichage Donnes. Si vous tapez un caractre qui nest pas autoris par le type dfini de la variable, loutil Editeur de donnes met un signal sonore et naccepte pas le caractre. Pour les variables chane, les caractres dpassant la largeur dfinie ne sont pas autoriss. Pour les variables numriques, des nombres entiers dpassant la valeur dfinie peuvent tre entrs mais lditeur de donnes affichera dans la cellule une notation scientifique ou des astrisques pour indiquer que la valeur dpasse la largeur dfinie. Pour afficher la valeur dans la cellule, changez la largeur dfinie de la variable. (Remarque : changer la largeur de la colonne naffecte pas la largeur de la variable).

Modification de donnes
Avec Editeur de donnes, vous pouvez modifier les valeurs des donnes dans lAffichage des donnes de plusieurs manires. Vous pouvez: Changer les valeurs des donnes. Couper, copier et coller des valeurs de donnes. Ajouter et supprimer des observations.

112 Chapitre 5

Ajouter et supprimer des variables. Changer lordre des variables.

Pour remplacer ou modifier les valeurs de donnes


Pour supprimer lancienne valeur et pour entrer une nouvelle valeur :
E Dans laffichage Donnes, double-cliquez sur la cellule. (La valeur de la cellule

est affiche dans lditeur de cellules.)


E Modifiez la valeur directement dans la cellule ou dans lditeur de cellules. E Appuyez sur Entre (ou dplacez-vous sur une autre cellule) pour enregistrer la

nouvelle valeur.

Couper, copier et coller des valeurs de donnes


Vous pouvez couper, copier et coller des valeurs individuelles de cellules ou des groupes de valeurs dans lditeur de donnes. Vous pouvez: Dplacer ou copier la valeur dune seule cellule dans une autre cellule. Dplacer ou copier la valeur dune seule cellule dans un groupe de cellules. Dplacer ou copier les valeurs dune seule observation (ligne) dans plusieurs observations. Dplacer ou copier les valeurs dune seule variable (colonne) dans plusieurs variables. Dplacer ou copier un groupe de valeurs de cellule dans un autre groupe de cellules.

Conversion de donnes de valeurs colles dans lditeur de donnes


Si les types dfinis de variables des cellules source et cible ne sont pas les mmes, SPSS essaye de convertir la valeur. Si aucune conversion nest possible, la valeur manquante par dfaut est insre dans la cellule cible.
Conversion des formats numrique ou date en chanes de caractres. Les formats numriques (par exemple, Numrique, Dollar, Point ou Virgule) et les formats de date sont convertis en caractres sils sont colls dans une cellule de variables chane. La

113 Editeur de donnes

valeur dune chane est la valeur numrique telle quelle est affiche dans la cellule. Par exemple, pour une variable dont le format est exprim en dollars, le signe Dollar qui est affich devient partie intgrante de la valeur de caractres. Les valeurs qui excdent la largeur dfinie de la variable chane sont tronques.
Conversion de chanes de caractres en formats numrique ou date. Les valeurs de

chanes qui contiennent des caractres acceptables pour le format numrique ou de date de la cellule cible sont converties dans la valeur quivalente numrique ou de date. Par exemple, une valeur de caractres de 25/12/91 est convertie en date valide si le type de format de la cellule cible est un des formats jour-mois-anne, mais elle est convertie en valeur manquante par dfaut si le type de format de la cellule cible est de type mois-jour-anne.
Conversion du format date en format numrique. Les valeurs de dates et de temps sont converties en un nombre de secondes si la cellule cible est dun format numrique (par exemple, Numrique, Dollar, Point ou Virgule). Etant donn que les dates sont enregistres en interne comme le nombre de secondes depuis le 14 octobre 1582, le fait de convertir des dates en valeurs numriques peut rsulter en des nombres trs importants. Par exemple, la date du 10/29/91 a une valeur de conversion numrique de 12.908.073.600. Conversion du format numrique en formats date ou heure. Les valeurs numriques sont converties en dates ou temps si la valeur reprsente un nombre de secondes pouvant produire une date ou un temps valides. En ce qui concerne les dates, les valeurs numriques infrieures 86 400 sont converties dans la valeur manquante par dfaut.

Insrer de nouvelles observations


Le fait dentrer des donnes dans une cellule sur une ligne blanche cre automatiquement une nouvelle observation. Editeur de donnes insre la valeur manquante par dfaut pour toutes les autres variables de cette observation. Sil y a quelques lignes blanches entre la nouvelle observation et les observations existantes, les lignes blanches deviennent galement des nouvelles observations avec des valeurs manquantes par dfaut pour toutes les variables. Vous pouvez galement insrer de nouvelles observations entre des observations existantes

114 Chapitre 5

Pour insrer de nouvelles observations entre des observations existantes


E Dans lAffichage des donnes, slectionnez nimporte quelle cellule pour

lobservation (ligne) situe sous la position o vous souhaitez insrer la nouvelle observation.
E A partir des menus, slectionnez : Edition Insrer les observations

Une nouvelle ligne est insre pour cette observation et toutes les variables reoivent la valeur manquante par dfaut.

Insrer de nouvelles variables


La saisie de donnes dans une colonne vide de lAffichage des donnes ou dans une ligne vide de lAffichage des variables cre automatiquement une nouvelle variable portant un nom par dfaut (prfixe var et numro squentiel) et un type de format de donnes par dfaut (numrique). Lditeur de donnes insre la valeur manquante par dfaut pour toutes les observations concernes par la nouvelle variable. Sil existe des colonnes vides dans lAffichage des donnes ou des lignes vides dans lAffichage des variables entre la nouvelle variable et les variables existantes, ces colonnes ou lignes deviennent galement de nouvelles variables avec une valeur manquante par dfaut pour toutes les observations. Vous pouvez galement insrer des nouvelles variables entre les variables existantes.

Pour insrer de nouvelles variables entre des variables existantes


E Slectionnez nimporte quelle cellule de la variable situe droite de (pour

lAffichage des donnes) ou au-dessous (pour lAffichage des variables) de lendroit o vous souhaitez insrer la nouvelle variable.
E A partir des menus, slectionnez : Edition Insrer une variable

Une nouvelle variable est insre avec la valeur manquante par dfaut pour toutes les observations.

115 Editeur de donnes

Pour dplacer des variables


E Pour slectionner la variable, cliquez sur son nom dans lAffichage des donnes ou

sur son numro de ligne dans lAffichage des variables.


E Faites glisser la variable jusqu son nouvel emplacement. E Pour positionner la variable entre deux variables existantes : Dans lAffichage des

donnes, dplacez la variable sur la colonne de la variable droite de laquelle vous souhaitez la positionner ou dplacez la variable sur la ligne de la variable sous laquelle vous souhaitez la positionner dans lAffichage des variables.

Pour modifier le type de donnes


Vous pouvez changer le type de donnes dune variable tout moment en utilisant la bote de dialogue Type de variable dans lAffichage des variables. Loutil Editeur de donnes essaiera de convertir les valeurs existantes dans le nouveau type. Si aucune conversion nest possible, la valeur manquante par dfaut est affecte. Les rgles de conversion sont les mmes que celles pour coller des valeurs de donnes une variable de type de format diffrent. Si le changement du format des donnes peut avoir pour consquence la perte des spcifications de la valeur manquante par dfaut ou dtiquettes de valeurs, loutil Editeur de donnes affiche une bote dalerte et vous demande si vous voulez poursuivre le changement ou si vous dsirez lannuler.

Aller lobservation
La bote de dialogue Aller lobservation vous permet daller au numro dobservation (ligne) spcifi dans Editeur de donnes.
Figure 5-7 Bote de dialogue Aller lobservation

116 Chapitre 5

Pour rechercher une observation dans lditeur de donnes


E Activez la fentre de lditeur de donnes. E A partir des menus, slectionnez : Donnes Aller lobservation E Dans la bote de dialogue Aller lobservation, entrez le numro de ligne de

lobservation de Editeur de donnes.

Etat de la slection de lobservation dans lditeur de donnes


Si vous avez slectionn un sous-ensemble dobservations mais navez pas cart les observations non slectionnes, celles-ci sont identifies dans Editeur de donnes par une barre oblique dans le numro de ligne.
Figure 5-8 Observations filtres dans lditeur de donnes

117 Editeur de donnes

Options daffichage de lditeur de donnes


Le menu Affichage propose plusieurs options daffichage pour lditeur de donnes :
Polices. Contrle les caractristiques de la police pour laffichage des donnes. Quadrillage. Permet de basculer laffichage du quadrillage. Etiquette de valeur. Permet de basculer entre laffichage des valeurs de donnes actuelles et laffichage des tiquettes de valeurs descriptives dfinies par lutilisateur. Cette option nest disponible que dans lAffichage des donnes. Utilisation des affichages multiples

Dans lAffichage des donnes, vous pouvez crer plusieurs affichages (panneaux) en utilisant les sparations situes au-dessus de la barre de dfilement horizontale et droite de la barre de dfilement verticale.
Figure 5-9 Sparations du panneau Affichage des donnes

Vous pouvez galement utiliser le menu de la fentre pour insrer et supprimer des sparations de panneaux. Pour insrer des sparations :
E Dans lAffichage de donnes, partir des menus, slectionnez : Fentre Spare

Les sparations sont insres au-dessus et gauche de la cellule slectionne.

118 Chapitre 5

Si la cellule suprieure gauche est slectionne, les sparations sont insres pour diviser laffichage actuel en deux parties, verticalement et horizontalement. Si une cellule autre que la cellule suprieure de la premire colonne est slectionne, une sparation horizontale du panneau est insre au-dessus de la cellule slectionne. Si une cellule autre que la premire cellule de la ligne suprieure est slectionne, une sparation verticale du panneau est insre gauche de la cellule slectionne.

Impression de lditeur de donnes


Un fichier de donnes simprime tel quil apparat lcran. Les informations de laffichage en cours sont imprimes. Dans lAffichage des donnes, les donnes sont imprimes. Dans lAffichage des variables, ce sont les informations de dfinition des donnes qui sont imprimes. Le quadrillage nest imprim que sil apparat dans laffichage slectionn. Les tiquettes de valeurs sont imprimes si elles apparaissent dans lAffichage des donnes. Dans le cas contraire, ce sont les valeurs de donnes relles qui sont imprimes. Utilisez le menu Affichage dans la fentre de lditeur de donnes pour afficher ou masquer le quadrillage et pour activer/dsactiver laffichage des valeurs de donnes et des tiquettes de valeurs.

Pour imprimer le contenu de Editeur de donnes


E Activez la fentre de lditeur de donnes. E Cliquez sur longlet correspondant laffichage que vous souhaitez imprimer. E A partir des menus, slectionnez : Fichier Imprimer

Chapitre

Utilisation des sources de donnes multiples

Avec SPSS 14.0, SPSS peut avoir plusieurs sources de donnes ouvertes en mme temps, ce qui permet de facilement : Basculer entre les sources de donnes. Comparer les contenus des diffrentes sources de donnes. Copier et coller les donnes entre les sources de donnes. Crer de multiples sous-ensembles dobservations et/ou de variables pour analyse. Fusionner plusieurs sources de donnes partir de diffrents formats de donnes (par exemple des feuilles de calcul, des bases de donnes ou des donnes texte) sans avoir enregistrer pralablement chaque source de donnes au format SPSS.

119

120 Chapitre 6

Manipulation de base de plusieurs sources de donnes


Figure 6-1 Deux sources de donnes souvrent en mme temps

Chaque source de donnes que vous ouvrez est affiche dans une nouvelle fentre de Data Editor. Toute source de donnes ouverte au pralable le reste pour utilisation ultrieure. Lorsque vous ouvrez dabord une source de donnes, elle devient automatiquement lensemble de donnes actif. Vous pouvez modifier lensemble de donnes actif en cliquant simplement nimporte o dans la fentre Data Editor de la source de donnes que vous souhaitez utiliser ou en slectionnant la fentre Data Editor pour cette source de donnes partir du menu Fentre.

121 Utilisation des sources de donnes multiples

Seules les variables de lensemble de donnes actif sont disponibles pour analyse.
Figure 6-2 Liste de variables contenant les variables dans lensemble de donnes actif

Vous ne pouvez pas modifier lensemble de donnes actif lorsque une bote de dialogue ayant accs aux donnes est ouverte (y compris toutes les botes de dialogue qui affichent des listes de variables). Au moins une fentre Data Editor doit tre ouverte lors dune session. Lorsque vous fermez la dernire fentre Data Editor, SPSS se ferme automatiquement, vous invitant au pralable enregistrer vos modifications. Remarque : Si vous utilisez la syntaxe de commande pour ouvrir les sources de donnes (par exemple GET FILE ou GET DATA), vous devez explicitement nommer chaque ensemble de donnes afin davoir plus dune source de donnes ouverte simultanment.

122 Chapitre 6

Copie et collage dinformations entre les ensembles de donnes


Vous pouvez copier la fois des donnes et des attributs de dfinition de variable dun ensemble de donnes un autre de la mme faon que vous copiez et collez des informations au sein dun fichier de donnes unique. Le fait de copier et coller des cellules de donnes slectionnes dans Affichage des donnes ne colle que les valeurs des donnes, sans les attributs de dfinition de variable. Le fait de copier et coller une variable entire dans Affichage des donnes en slectionnant le nom de la variable en haut de la colonne colle toutes les donnes et tous les attributs de dfinition de variable pour cette variable. Le fait de copier et coller des attributs de dfinition de variable ou des variables entires dans Affichage des variables colle les attributs slectionns (ou la dfinition de la variable entire) mais ne colle pas les valeurs des donnes.

Attribution dun nouveau nom aux ensembles de donnes


Lorsque vous ouvrez une source de donnes via les menus et les botes de dialogue, un nom densemble de donnes DataSetn est automatiquement attribuer chaque source de donnes ; n est une valeur entire squentielle . Lorsque vous ouvrez une source de donnes via la syntaxe de commande, aucun nom densemble de donnes nest attribu moins que vous en spcifiez un avec DATASET NAME. Pour fournir des noms densembles de donnes plus descriptifs :
E Depuis les menus de la fentre Data Editor pour lensemble de donnes dont vous

souhaitez modifier le nom, choisissez :


Fichier Renommer lensemble de donnes E Entrez un nouveau nom conforme aux rgles dappelation des variables SPSS pour

lensemble de donnes. Pour plus d'informations, reportez-vous Noms de variable dans Chapitre 5 p. 99.

Chapitre

Prparation des donnes

Une fois que vous avez ouvert le fichier de donnes ou saisi les donnes dans lditeur de donnes, vous pouvez crer des tableaux, des diagrammes et des analyses sans effectuer aucune autre tche prliminaire. Cependant, il existe des fonctions de prparation des donnes supplmentaires qui peuvent vous tre utiles, y compris la possibilit de : Affecter des proprits de variable qui dcrivent les donnes et dterminent le traitement devant tre appliqu certaines valeurs. Identifier les observations pouvant contenir des informations redondantes, et les exclure des analyses ou les supprimer du fichier de donnes. Crer des variables avec diffrentes modalits qui reprsentent des intervalles de valeurs provenant de variables comportant un grand nombre de valeurs possibles.

Proprits de variable
Les donnes saisies dans Data Editor dans laffichage des donnes ou lues dans SPSS partir dun format de fichier externe (une feuille de calcul Excel ou un fichier texte par exemple) ne sont pas dotes de certaines proprits de variable que vous pourriez trouver trs utiles, notamment : Dfinition dtiquettes de valeurs descriptives pour les codes numriques (par exemple, 0 = homme et 1 = femme). Identification des codes de valeurs manquantes (par exemple, 99 = Sans objet). Attribution de niveaux de mesure (nominal, ordinal ou chelle).

123

124 Chapitre 7

Toutes ces proprits de variable (ainsi que dautres) peuvent tre affectes dans la vue Variable de lditeur de donnes. Plusieurs utilitaires peuvent galement vous aider dans ce processus : Loption Dfinir les proprits de variable peut vous aider dfinir les tiquettes de valeurs descriptives et les valeurs manquantes. Ceci est particulirement utile pour les donnes qualitatives dotes de codes numriques utiliss pour les valeurs de modalits. Loption Copier les proprits de donnes permet dutiliser un fichier de donnes au format SPSS existant comme modle pour les proprits de fichier et de variable dans le fichier de donnes en cours. Ceci est particulirement utile si vous utilisez frquemment des fichiers de donnes au format externe ayant un contenu similaire (comme des rapports mensuels au format Excel).

Dfinition des proprits de variable


Loption Dfinir les proprits de variable vous aide dans le processus de cration dtiquettes de valeurs descriptives pour les variables qualitatives (nominales ou ordinales). Dfinir les proprits de variable : Analyse les valeurs relles des donnes et rpertorie toutes les valeurs de donnes uniques pour chaque variable slectionne. Identifie les valeurs non tiquetes et possde une fonction d tiquetage automatique . Permet de copier des tiquettes de valeurs dfinies dune autre variable vers la variable slectionne ou de la variable slectionne vers plusieurs autres variables. Remarque : Pour utiliser loption Dfinir les proprits de variable sans analyse pralable des observations, saisissez 0 dans le nombre dobservations analyser.

Pour dfinir les proprits de variable


E A partir des menus, slectionnez : Donnes Dfinir les proprits de variables

125 Prparation des donnes Figure 7-1 Bote de dialogue initiale permettant de slectionner les variables dfinir

E Slectionnez les variables numriques ou les variables chane courtes pour lesquelles

vous voulez crer des tiquettes de valeurs, ou dfinir ou modifier dautres proprits de variables, telles que les valeurs manquantes ou les tiquettes de variable descriptives. Remarque : Les variables chane longues (variables chane dune largeur dfinie de plus de huit caractres) ne sont pas affiches dans la liste de variables. Les variables chane longues ne peuvent pas avoir dtiquettes de valeurs dfinies ou de modalits de valeurs manquantes.
E Spcifier le nombre dobservations analyser afin de gnrer la liste de valeurs

uniques. Ceci est particulirement utile pour les fichiers de donnes comportant un grand nombre dobservations, pour lesquelles une analyse complte du fichier de donnes prendrait beaucoup de temps.
E Spcifier une limite suprieure pour le nombre de valeurs uniques afficher. Cette

opration est particulirement utile pour viter de rpertorier des centaines, des

126 Chapitre 7

milliers, voire des millions de valeurs pour les variables dchelle (intervalle continu, rapport).
E Cliquez sur Poursuivre pour ouvrir la bote de dialogue principale de la fonction

Dfinir les proprits de variable.


E Slectionnez une variable pour laquelle vous voulez crer des tiquettes de valeurs,

ou dfinir ou modifier dautres proprits de variable.


E Saisissez le texte de ltiquette pour toutes les valeurs non tiquetes affiches dans la

grille Etiquette de valeur.


E Si vous souhaitez crer des tiquettes de valeurs pour des valeurs qui ne sont pas

affiches, vous pouvez saisir les valeurs dans la colonne Valeur, sous la dernire valeur analyse.
E Rptez lopration pour chaque variable rpertorie pour laquelle vous voulez crer

des tiquettes de valeurs.


E Cliquez sur OK pour appliquer les tiquettes de valeurs et les autres proprits de

variable.

127 Prparation des donnes

Dfinition des tiquettes de valeurs et des autres proprits de variable


Figure 7-2 Dfinir les proprits de variable, bote de dialogue principale

La bote de dialogue principale de la fonction Dfinir les proprits de variable donne linformation suivante concernant les variables analyses :
Liste des variables analyses. Pour chaque variable analyse, une coche dans la colonne Sans tiquette indique que la variable contient des valeurs qui ne possdent pas dtiquette de valeur.

Pour trier la liste de variables dans le but dafficher en tte de liste toutes les variables non tiquetes :
E Cliquez sur le titre de colonne Sans tiquette sous la liste des variables analyses.

Vous pouvez galement faire un tri par nom de variable ou par niveau de mesure en cliquant sur le titre de colonne correspondant dans la liste des variables analyses.
Grille dtiquettes de valeurs Etiquette. Affiche toute tiquette de valeur dfinie. Dans cette colonne, vous

pouvez ajouter ou modifier des tiquettes.

128 Chapitre 7

Valeur. Valeurs uniques pour chaque variable slectionne. Cette liste de valeurs

uniques se fonde sur le nombre dobservations analyses. Par exemple, si vous analysez seulement les 100 premires observations du fichier de donnes, la liste refltera uniquement les valeurs uniques prsentes dans ces observations. Si le fichier de donnes a dj t tri par la variable laquelle vous voulez affecter des tiquettes de valeurs, la liste pourrait afficher beaucoup moins de valeurs uniques quil nen existe dans les donnes.
Effectif. Nombre doccurrences de chaque valeur dans les observations analyses. Manquant. Valeurs reprsentant les donnes manquantes. Vous pouvez modifier la

dsignation des valeurs manquantes de la modalit en cochant la case. Si la case est coche, la modalit est dfinie en tant que modalit manquante spcifie par lutilisateur. Si une variable possde dj une plage de valeurs dfinies comme manquantes par lutilisateur (par exemple, 90-99), vous ne pouvez ni ajouter ni supprimer des modalits de valeurs manquantes pour cette variable avec la fonction Dfinir les proprits de variable. Dans lditeur de donnes, vous pouvez utiliser loption daffichage des variables pour modifier les modalits de valeurs manquantes de la variable possdant des plages de valeurs manquantes. Pour plus d'informations, reportez-vous Valeurs manquantes dans Chapitre 5 p. 105.
Modifi. Indique que vous avez ajout ou modifi une tiquette de valeur.

Remarque : Dans la bote de dialogue initiale, si vous indiquez 0 comme nombre dobservations analyser, la grille Etiquette de valeur est dabord vide, sauf pour les tiquettes de valeurs et/ou les modalits de valeurs manquantes dfinies pour la variable slectionne. En outre, le bouton Suggrer du niveau de mesure est dsactiv.
Niveau de mesure. Comme les tiquettes de valeurs sont particulirement utiles pour

les variables qualitatives (nominales et ordinales), et comme certaines procdures traitent les variables qualitatives et dchelle diffremment, il peut tre important dattribuer le niveau de mesure correct. Toutefois, par dfaut, le niveau de mesure dchelle est affect toutes les nouvelles variables numriques. Par consquent, de nombreuses variables normalement qualitatives peuvent tre initialement affiches en tant que variables dchelle. En cas de doute sur le niveau de mesure affecter une variable, cliquez sur Suggrer.
Copier les proprits. Vous pouvez copier les tiquettes de variable ou les autres

proprits de variable partir dune autre variable vers la variable slectionne, ou partir de la variable slectionne vers une ou plusieurs autres variables.

129 Prparation des donnes

Valeurs non tiquetes. Pour crer automatiquement des tiquettes pour les valeurs non tiquetes, cliquez sur Etiquettes automatiques. Etiquette de variable et Format daffichage

Vous pouvez modifier ltiquette de variable descriptive et le format daffichage. Vous ne pouvez pas modifier le type fondamental de la variable (chane ou numrique). Pour les variables chane, vous ne pouvez modifier que ltiquette de variable, mais pas le format daffichage. Concernant les variables numriques, vous pouvez changer le type numrique (nombres, dates, dollars ou autre devise), la largeur (nombre maximal de chiffres, dont les dcimales et/ou les indicateurs de regroupement) et le nombre de dcimales. Pour ce qui est du format numrique de date, vous pouvez slectionner un format de date spcifique (tel que jj-mm-aaaa, mm/jj/aa, aaaajjj, etc.) Pour un format numrique personnalis, vous pouvez slectionner un des cinq formats de devise personnaliss (de CCA CCE). Pour plus d'informations, reportez-vous Options montaires (devises) dans Chapitre 44 p. 677. Un astrisque est affich dans la colonne Valeur si la largeur indique est infrieure soit celle des valeurs analyses, soit celle des valeurs affiches, dans le cas des tiquettes de valeurs dfinies dj existantes ou des modalits de valeurs manquantes. Un point (.) est affich si les valeurs analyses ou les valeurs affiches (pour les tiquettes de valeurs dfinies dj existantes ou pour les modalits de valeurs manquantes) ne sont pas valides pour le type de format daffichage slectionn. Par exemple, une valeur numrique interne de moins de 86 400 nest pas valide pour une variable format de date.

Affectation du niveau de mesure


Quand vous cliquez sur Suggrer pour le niveau de mesure dans la bote de dialogue principale Dfinir les proprits de variable, la variable en cours est value en fonction des observations analyses et des tiquettes de valeurs dfinies, et un niveau de mesure est suggr dans la bote de dialogue de suggestion dun niveau de mesure

130 Chapitre 7

qui apparat. La zone Explication propose une brve description des critres utiliss pour dterminer le niveau de mesure suggr.
Figure 7-3 Bote de dialogue Suggestion dun niveau de mesure

Remarque : Les valeurs dfinies comme tant manquantes ne sont pas comprises dans lvaluation pour le niveau de mesure. Par exemple, lexplication du niveau de mesure suggr peut indiquer que la suggestion est due, en partie, au fait que la variable ne contient pas de valeurs ngatives, alors quen ralit, elle peut en contenir, mais elles sont dj dfinies comme manquantes.
E Cliquez sur Poursuivre pour accepter le niveau de mesure suggr ou sur Annuler

pour ne pas modifier le niveau de mesure.

Copie de proprits de variable


La bote de dialogue Appliquer des tiquettes et un niveau apparaissent lorsque vous cliquez sur A partir dune autre variable ou sur Vers dautres variables dans la bote de dialogue principale Dfinir les proprits de variable. Toutes les variables analyses correspondant au type de la variable courante (numrique ou chane) sont

131 Prparation des donnes

alors affiches. Dans le cas des variables chane, la largeur dfinie doit galement correspondre.
Figure 7-4 Bote de dialogue Appliquer les tiquettes et le niveau

E Slectionnez une seule variable dont vous allez copier les tiquettes de valeurs et les

autres proprits de variable (sauf ltiquette de variable). ou


E Slectionnez une ou plusieurs variables qui doivent recevoir les tiquettes de valeurs

et les autres proprits de variable.


E Cliquez sur Copier pour copier les tiquettes de valeurs et le niveau de mesure.

Les tiquettes de valeurs existantes et les modalits de valeurs manquantes des variables cible ne sont pas remplaces. Les tiquettes de valeurs et les modalits de valeurs manquantes des valeurs qui ne sont pas encore dfinies pour les variables cible sont ajoutes au groupe dtiquettes de valeurs et de modalits de valeurs manquantes des variables cible.

132 Chapitre 7

Le niveau de mesure des variables destination est toujours remplac. Si la variable source ou cible possde un intervalle dfini de valeurs manquantes, les dfinitions de valeurs manquantes ne sont pas copies.

Vecteurs de rponses multiples


Les options Tableaux personnaliss et Gnrateur de diagrammes prennent galement en charge un type spcifique de variable nomm vecteur de rponses multiples. Les vecteurs multirponses ne sont pas rellement des variables au sens habituel du terme. En effet, vous ne pouvez pas les voir dans lditeur de donnes et les autres procdures ne les reconnaissent pas. Les vecteurs multirponses utilisent plusieurs variables pour enregistrer les rponses des questions auxquelles le rpondant peut donner plusieurs rponses. Les vecteurs multirponses sont traits comme des variables qualitatives, et la plupart des actions appliques ces dernires peuvent galement ltre aux vecteurs multirponses. Les vecteurs multirponses sont construits partir de plusieurs variables dans le fichier de donnes. Un vecteur multirponses est une structure spciale dans un fichier de donnes au format SPSS. Vous pouvez dfinir et enregistrer les vecteurs multirponses dans un fichier de donnes au format SPSS, mais vous ne pouvez ni importer ni exporter des vecteurs multirponses partir/vers dautres formats de fichiers. (Vous pouvez copier les vecteurs multirponses dautres fichiers de donnes SPSS via loption Copier des proprits de donnes accessibles partir du menu Donnes dans la fentre de Data Editor.Pour plus d'informations, reportez-vous Copier les proprits de donnes p. 136.)

Dfinir des vecteurs multirponses


Pour dfinir des vecteurs multirponses :
E A partir du menu, slectionnez : Donnes Dfinir des vecteurs multirponses...

133 Prparation des donnes Figure 7-5 Bote de dialogue Dfinir des vecteurs multirponses

E Slectionnez deux ou plusieurs variables. Si vos variables sont codes comme

dichotomies, indiquez la valeur que vous souhaitez calculer.


E Entrez un nom unique pour chaque vecteur multirponses. Le nom peut comporter

jusqu 63 octets de long. Un signe dollar est automatiquement ajout devant le nom du vecteur.
E Indiquez une tiquette dcrivant le vecteur. (Cette opration est facultative.) E Cliquez sur Ajouter pour ajouter les vecteurs multirponses la liste des vecteurs

dfinis.
Dichotomies

Un vecteur de dichotomies multiples est compos de plusieurs variables dichotomiques : il sagit de variables qui nont que deux valeurs possibles du type oui/non, prsent/absent ou slectionn/non slectionn. Bien que les variables peuvent

134 Chapitre 7

ne pas tre strictement dichotomiques, toutes les variables du vecteur sont codes de la mme manire et la valeur compte reprsente la condition oui/prsent/slectionn. Par exemple, une enqute pose la question Parmi les sources suivantes, quelles sont les plus fiables dans le domaine de linformation ? et propose cinq rponses possibles. Le rpondant peut indiquer plusieurs choix en cochant la case situe en regard de chaque proposition. Les cinq rponses deviennent cinq variables dans le fichier de donnes, codes par 0 pour Non (non slectionn) et 1 pour Oui (slectionn). Dans le vecteur de dichotomies multiples, la valeur compte est 1. Le fichier de donnes dchantillon survey_sample.sav (dans le rpertoire tutorial/sample_files du rpertoire dinstallation) comporte dj trois vecteurs multirponses dfinis. $mltnews est un vecteur de dichotomies multiples.
E Dans la liste Vecteurs de rponses multiples, slectionnez $mltnews en cliquant dessus.

Les variables et paramtres utiliss pour dfinir ce vecteur multirponses apparaissent. La liste Variables inclure comporte les cinq variables utilises pour construire le vecteur multirponses. Le groupe Variables codes en tant que indique que les variables sont dichotomiques. La valeur compte est 1.
E Slectionnez une des variables de la liste Variables inclure en cliquant dessus. E Cliquez avec le bouton droit de la souris sur la variable et slectionnez Informations sur les variables dans le menu contextuel. E Dans la fentre Informations sur les variables, cliquez sur la flche de la liste

droulante Etiquettes de valeur pour afficher la liste complte des tiquettes de valeurs dfinies.
Figure 7-6 Informations sur la variable source dichotomies multiples

135 Prparation des donnes

Ltiquette de valeur indique que la variable est une dichotomie avec les valeurs 0 et 1, reprsentant respectivement Non et Oui. Les cinq variables de la liste sont codes de la mme faon et la valeur 1 (code correspondant Oui) est la valeur compte pour le vecteur de dichotomies multiples.
Modalits

Un vecteur de modalits multiples comporte plusieurs variables, toutes codes de la mme faon, souvent avec un grand nombre de modalits de rponses possibles. Par exemple, une enqute comporte la question Nommez jusqu trois nationalits dcrivant le mieux votre hritage ethnique . Des centaines de rponses sont possibles, mais pour des questions de codage, la liste est limite aux 40 nationalits les plus courantes, le reste tant relgu dans une modalit Autre . Dans le fichier de donnes, les trois choix deviennent trois variables, chacune comportant 41 modalits (40 nationalits codes et une modalit Autre ). Dans le fichier de donnes exemple, $ethmult et $mltcars sont des vecteurs de modalits multiples.
Source de ltiquette de modalit

Pour les dichotomies multiples, vous pouvez contrler la manire dont les ensembles sont tiquets.
Etiquettes de variable. Utilise les tiquettes de variables dfinies (ou les noms de

variables pour les variables sans tiquette de variable dfinie) en tant qutiquettes de modalit densemble. Par exemple, si toutes les variables de lensemble ont la mme tiquette de valeur (ou pas dtiquette de valeur dfinie) pour la valeur compte (par exemple, Oui), alors vous devez utiliser les tiquettes de variables comme tiquettes de modalit densemble.
Etiquettes des valeurs comptes. Utilise les tiquettes de valeur dfinies des

valeurs comptes comme tiquettes de modalit densemble. Slectionnez cette option uniquement si toutes les variables ont une tiquette de valeur dfinie pour la valeur compte et si ltiquette de la valeur compte est diffrente pour chaque variable.
Utilisez ltiquette de variable comme tiquette densemble. Si vous slectionnez
Etiquette des valeurs comptes, vous pouvez galement utiliser ltiquette de

variable pour la premire variable de lensemble avec une tiquette de variable dfine comme tiquette densemble. Si aucune des variables de lensemble ne

136 Chapitre 7

comporte dtiquettes de variables dfinies, le nom de la premire variable est utilis comme tiquette densemble.

Copier les proprits de donnes


Lassistant Copier des proprits de donnes permet dutiliser un fichier de donnes SPSS externe comme modle pour dfinir les proprits de fichier et de variable dans lensemble de donnes actif. Vous pouvez galement utiliser des variables de lensemble de donnes actif comme modle pour dautres variables de lensemble de donnes actif. Vous pouvez: Copier des proprits de fichier slectionnes partir dun fichier de donnes externe ou ouvrir un ensemble de donnes vers lensemble de donnes actif. Les proprits de fichier comprennent les documents, les tiquettes de fichier, les vecteurs multirponses, les groupes de variables et la pondration. Copier des proprits de variable slectionnes partir dun fichier de donnes externe ou ouvrir un ensemble de donnes vers des variables correspondantes de lensemble de donnes actif. Les proprits de variable comprennent les tiquettes de valeurs, les valeurs manquantes, le niveau de mesure, les tiquettes de variable, le format dimpression et dcriture, lalignement et la largeur des colonnes (dans lditeur de donnes). Copier des proprits de variable slectionnes partir dune variable dun fichier de donnes externe, ouvrir un ensemble de donnes ou lensemble de donnes actif vers plusieurs variables de lensemble de donnes actif. Crer de nouvelles variables dans lensemble de donnes actif partir de variables slectionnes dans un fichier de donnes externe ou ouvrir un ensemble de donnes. Lors de la copie de proprits de donnes, les rgles gnrales suivantes sont appliques : Si vous utilisez un fichier de donnes externe en tant que fichier source, celui-ci doit tre au format SPSS. Si vous utilisez lensemble de donnes actif comme fichier de donnes source, celui-ci doit contenir au moins une variable. Vous ne pouvez pas utiliser un ensemble de donnes actif entirement vide comme le fichier de donnes source.

137 Prparation des donnes

Les proprits non dfinies (vides) de lensemble de donnes source ne remplacent pas les proprits dfinies dans lensemble de donnes actif. Les proprits de variable ne sont copies partir de la variable source que sur des variables dun type correspondant : chane (alphanumrique) ou numrique (nombres, dates et devises). Remarque : Loption Copier des proprits de donnes remplace loption dapplication du dictionnaire de donnes, auparavant disponible dans le menu Fichier.

Pour copier des proprits de donnes


E A partir des menus de la fentre de lditeur de donnes, slectionnez : Donnes Copie des proprits de donnes...

138 Chapitre 7 Figure 7-7 Assistant Copier des proprits de donnes : Etape 1

E Slectionnez le fichier de donnes possdant les proprits de fichier et/ou de variable

copier. Il peut sagir dun ensemble de donnes en cours dutilisation, dun fichier de donnes externe au format SPSS ou de lensemble de donnes actif.
E Suivez les instructions de lassistant Copier des proprits de donnes tape par tape.

Slection des variables source et cible


Dans cette tape, vous pouvez spcifier les variables source contenant les proprits de variable copier et les variables cible qui doivent recevoir ces proprits.

139 Prparation des donnes Figure 7-8 Assistant Copier des proprits de donnes : Etape 2

Application des proprits provenant de variables de lensemble de donnes source aux variables concordantes de lensemble de donnes actif. Les proprits de variable sont

copies partir dune ou de plusieurs variables source slectionnes vers les variables concordantes dans lensemble de donnes actif. Les variables sont concordantes si le type (chane ou numrique) et le nom de la variable sont les mmes. En ce qui concerne les variables chane, la longueur dfinie doit galement tre la mme. Par dfaut, seules les variables concordantes sont affiches dans les deux listes de variables.
Cration des variables concordantes dans lensemble de donnes actif si elles nexistent pas dj. Permet de mettre jour la liste source afin dafficher toutes

les variables dans le fichier de donnes source. Si vous slectionnez des variables

140 Chapitre 7

source qui nexistent pas dans lensemble de donnes actif (daprs le nom de variable), les nouvelles variables sont cres dans lensemble de donnes actif avec les noms et proprits de variable du fichier de donnes source. Si lensemble de donnes actif ne contient pas de variables (dans le cas dun nouvel ensemble de donnes vide), toutes les variables du fichier de donnes source sont affiches et les nouvelles variables fondes sur les variables source concernes sont cres automatiquement dans lensemble de donnes actif.
Application des proprits dune variable source unique sur des variables slectionnes de mme type dun ensemble de donnes actif. Les proprits dune variable unique

slectionne dans la liste source peuvent tre appliques une ou plusieurs variables slectionnes de la liste de lensemble de donnes actif. Seules des variables du mme type (numrique ou chane) que la variable choisie dans la liste source sont affiches dans la liste de lensemble de donnes actif. Dans le cas des variables de chane, seules les chanes de mme longueur que la variable source sont affiches. Cette option nest disponible que si lensemble de donnes actif ne contient aucune variable. Remarque : Cette option ne vous permet pas de crer de nouvelles variables dans lensemble de donnes actif.
Application des proprits dun ensemble de donnes uniquement, sans slection de variable. Seules les proprits du fichier (par exemple, les documents, les tiquettes

de fichier et la pondration) sont appliques lensemble de donnes actif. Aucune proprit de variable nest applique. Cette option nest pas disponible si lensemble de donnes actif est galement le fichier de donnes source.

Choix des proprits de variable copier


Vous pouvez copier des proprits de variable partir des variables source vers les variables cible. Les proprits non dfinies (vides) des variables source ne remplacent pas les proprits dfinies des variables cible.

141 Prparation des donnes Figure 7-9 Assistant Copier des proprits de donnes : Etape 3

Etiquette de valeur. Les tiquettes de valeurs sont des tiquettes descriptives associes

des valeurs de donnes. Les tiquettes de valeurs sont souvent utilises quand des valeurs de donnes numriques reprsentent des modalits non numriques (par exemple, les codes 1 et 2 pour Homme et Femme). Vous pouvez remplacer ou fusionner les tiquettes de valeurs dans les variables cible. Loption Remplacer supprime les tiquettes de valeurs dfinies dans la variable cible et les remplace par les tiquettes de valeurs dfinies de la variable source. Loption Fusionner fusionne les tiquettes de valeurs dfinies de la variable source avec toute tiquette de valeur dfinie existante de la variable cible. Si la mme valeur possde une tiquette dfinie dans les deux variables source et cible, ltiquette de valeur de la variable cible reste inchange.

142 Chapitre 7

Attributs Personnaliss. Les attributs de variables personnaliss, crs en gnral par la commande VARIABLE ATTRIBUTE dans la syntaxe de commande.

Loption Remplacer supprime les attributs personnaliss dans la variable cible et les remplace par les attributs dfinis de la variable source. Loption Fusionner fusionne les attributs dfinis de la variable source avec tout attribut personnalis dfini existant de la variable cible.
Valeurs manquantes. Les valeurs manquantes reprsentent des donnes manquantes

(par exemple, 98 pour Ne se prononce pas et 99 pour Sans objet). Ces valeurs possdent galement des tiquettes de valeurs dfinies qui dcrivent ce que reprsentent les codes de la valeur manquante. Les valeurs manquantes dfinies existant dans la variable cible sont supprimes et remplaces par les valeurs manquantes dfinies dans la variable source.
Etiquette de variable. Les tiquettes de variable descriptive peuvent contenir des espaces et des caractres rservs qui ne sont pas autoriss dans les noms de variable. Avant de copier des proprits dune seule variable source sur plusieurs variables cible, plusieurs lments sont prendre en compte. Niveau de mesure. Le niveau de mesure peut tre nominal, ordinal ou dchelle. Pour

les procdures qui font une distinction entre diffrents niveaux de mesure, les niveaux nominal et ordinal sont tous deux considrs comme qualitatifs.
Formats. Concernant les variables numriques, cette option contrle le type numrique

(nombres, dates ou devises), la largeur (nombre total de caractres affichs, dont les caractres de dbut et de fin, et lindicateur dcimal) et le nombre de dcimales affiches. Cette option est ignore pour les variables chane.
Alignement. Cette option naffecte que lalignement (gauche, droite, centr) de

laffichage des donnes de lditeur de donnes.


Largeur des colonnes dans lditeur de donnes. Cette option naffecte que la largeur des colonnes de laffichage des donnes dans lditeur de donnes.

Copie des proprits densembles de donnes (proprits de fichier)


Vous pouvez appliquer des proprits choisies dun ensemble de donnes global partir du fichier de donnes source vers lensemble de donnes actif. (Cette option nest pas disponible si lensemble de donnes actif est le fichier de donnes source.)

143 Prparation des donnes Figure 7-10 Assistant Copier des proprits de donnes : Etape 4

Vecteurs multirponses. Applique les dfinitions de vecteurs multirponses du fichier

de donnes source vers lensemble de donnes actif. (Remarque : Les vecteurs de rponses multiples ne sont actuellement utiliss que par le Gnrateur de diagrammes et loption complmentaire Tableaux.) Les vecteurs multirponses du fichier de donnes source contenant des variables qui nexistent pas dans lensemble de donnes actif sont ignors, moins que ces variables ne soient cres selon les spcifications de ltape 2 (slection des variables source et cible) avec lassistant Copier des proprits de donnes.

144 Chapitre 7

Loption Remplacer supprime tous les vecteurs multirponses de lensemble de donnes actif et les remplace par les vecteurs multirponses du fichier de donnes source. Loption Fusionner ajoute les vecteurs multirponses du fichier de donnes source lensemble de vecteurs multirponses de lensemble de donnes actif. Sil existe dans les deux fichiers un vecteur portant le mme nom, le vecteur existant dans lensemble de donnes actif reste inchang.
Groupes de variables. Les groupes de variables permettent de contrler la liste des variables affiches dans les botes de dialogue. Les groupes de variables sont dfinis laide de loption Dfinir les vecteurs du menu Utilitaires.

Les groupes du fichier de donnes source contenant des variables qui nexistent pas dans lensemble de donnes actif sont ignors moins que ces variables ne soient cres selon les spcifications de ltape 2 (slection des variables source et cible) avec lassistant Copier des proprits de donnes. Loption Remplacer supprime tous les groupes de variables existants dans lensemble de donnes actif et les remplace par les groupes de variables du fichier de donnes source. Loption Fusionner ajoute les groupes de variables du fichier de donnes source lensemble des groupes de variables de lensemble de donnes actif. Sil existe dans les deux fichiers un vecteur portant le mme nom, le vecteur existant dans lensemble de donnes actif reste inchang.
Documents. Remarques ajoutes au fichier de donnes via la commande DOCUMENT.

Loption Remplacer supprime tous les documents existants dans lensemble de donnes actif et les remplace par les documents du fichier de donnes source. Loption Fusionner combine les documents de lensemble de donnes actif et source. Les documents uniques dans le fichier source et qui nexistent pas dans lensemble de donnes actif sont ajouts lensemble de donnes actif. Tous les documents sont ensuite tris par date.
Attributs Personnaliss. Les attributs de fichier de donnes personnaliss, crs en gnral par la commande DATAFILE ATTRIBUTE dans la syntaxe de commande.

145 Prparation des donnes

Loption Remplacer supprime tous les attributs du fichier de donnes personnaliss existants dans lensemble de donnes actif et les remplace par les attributs du fichier de donnes partir du fichier de donnes source. Loption Fusionner combine les attributs du fichier de donnes de lensemble de donnes actif et source. Les noms dattributs uniques dans le fichier source et qui nexistent pas dans lensemble de donnes actif sont ajouts lensemble de donnes actif. Si un nom dattribut identique existe dans les deux fichiers de donnes, lattribut nomm dans lensemble de donnes actif reste inchang.
Spcification de pondration. Pondre les observations laide de la variable de pondration actuelle du fichier de donnes source sil existe une variable concordante dans lensemble de donnes actif. Cette opration remplace toute pondration en cours dans lensemble de donnes actif. Etiquette de fichier. Etiquette descriptive applique un fichier de donnes via la commande FILE LABEL.

146 Chapitre 7

Rsultats
Figure 7-11 Assistant Copier des proprits de donnes : Etape 5

La dernire tape de lassistant Copier des proprits de donnes fournit des informations sur le nombre de variables dont les proprits seront copies partir du fichier de donnes source, le nombre de nouvelles variables qui seront cres et le nombre de proprits densembles de donnes (proprits de fichier) qui seront copies. Vous pouvez galement choisir de coller la syntaxe de commande gnre dans une fentre de syntaxe et de lenregistrer pour un usage ultrieur.

147 Prparation des donnes

Identification des observations dupliques


Vos donnes peuvent comprendre des observations dupliques pour les raisons suivantes : La mme observation est saisie plusieurs fois par erreur. Plusieurs observations partagent la mme valeur dID principal, mais ont des valeurs dID secondaire diffrentes (par exemple, les membres dune famille qui vivent tous dans la mme maison). Plusieurs observations reprsentent la mme observation, mais les valeurs des variables autres que celles qui identifient lobservation sont diffrentes (par exemple, plusieurs achats effectus par la mme personne ou la mme socit pour des produits diffrents ou des heures diffrentes). Lidentification des observations dupliques vous permet de dfinir la variable duplicate suivant vos besoins et de contrler la dtermination automatique des observations principales par rapport aux observations dupliques.
Pour identifier et reprer les observations dupliques
E A partir des menus, slectionnez : Donnes Identifier les observations dupliques... E Slectionnez les variables qui identifient les observations concordantes. E Slectionnez des options dans la zone Variables crer.

Sinon, vous pouvez :


E Slectionner des variables pour trier les observations dans des groupes dfinis par les

variables des observations concordantes slectionnes. Lordre de tri dfini par ces variables dtermine la premire et la dernire observation de chaque groupe. Sinon, lordre utilis est celui dorigine du fichier.
E Filtrer automatiquement les observations dupliques afin quelles ne soient pas

incluses dans les rapports, les graphiques ou le calcul des statistiques.

148 Chapitre 7 Figure 7-12 Bote de dialogue Identifier les observations dupliques

Dfinir les observations concordantes par. Les observations sont considres

comme tant dupliques lorsque leurs valeurs concordent avec toutes les variables slectionnes. Pour identifier uniquement les observations dont la concordance est gale 100 %, slectionnez toutes les variables.
Trier les groupes concordants par. Les observations sont automatiquement tries par

les variables qui dfinissent les observations concordantes. Vous pouvez slectionner dautres variables de tri qui dtermineront lordre des observations dans chaque groupe concordant. Pour chaque variable de tri, vous pouvez effectuer le tri dans lordre croissant ou dcroissant.

149 Prparation des donnes

Si vous slectionnez plusieurs variables de tri, les observations sont tries pour chaque variable au sein des modalits de la variable prcdente dans la liste. Par exemple, si la premire variable de tri slectionne est date et que la deuxime est quantit, les observations sont tries en fonction de la quantit correspondant chaque date. Pour modifier lordre de tri des variables, utilisez les boutons flchs Haut et Bas situs droite de la liste. Lordre de tri dtermine la premire et la dernire observation de chaque groupe concordant, qui dtermine la valeur de la variable indicatrice principale facultative. Par exemple, pour filtrer toutes les observations, lexception de la plus rcente, dans chaque groupe concordant, vous pouvez trier les observations du groupe dans lordre croissant partir dune variable de date. De cette faon, la date la plus rcente devient la dernire date du groupe.
Indicateur dobservations principales. Cre une variable dont la valeur est 1 pour toutes

les observations uniques et pour lobservation identifie comme tant lobservation principale de chaque groupe dobservations concordantes, et 0 pour les observations dupliques non principales de chaque groupe. En fonction de lordre de tri dtermin dans le groupe concordant, lobservation principale peut tre la dernire ou la premire observation de ce groupe. Si vous nindiquez aucune variable de tri, lordre dorigine du fichier dtermine celui des observations dans chaque groupe. Vous pouvez utiliser la variable indicatrice en tant que variable de filtre pour exclure les observations dupliques non principales des rapports et des analyses sans les supprimer du fichier de donnes.
Effectif squentiel des observations concordantes de chaque groupe. Cre une variable dont la valeur squentielle est comprise entre 1 et n pour les observations de chaque groupe concordant. La squence est base sur lordre en cours des observations dans chaque groupe, cest--dire lordre dorigine du fichier ou celui dtermin par les variables de tri indiques. Dplacer les observations concordantes vers le haut. Trie le fichier de donnes afin

que tous les groupes dobservations concordantes se trouvent au dbut de ce fichier. Le contrle visuel des observations concordantes est ainsi facilit dans lditeur de donnes.

150 Chapitre 7

Afficher les frquences pour les variables cres. Tableaux de frquences indiquant le nombre dobservations pour chaque valeur des variables cres. Par exemple, pour la variable indicatrice principale, le tableau indique le nombre dobservations dont la valeur est 0 pour cette variable (ce qui indique le nombre dobservations dupliques) et le nombre dobservations dont la valeur est 1 pour cette variable (cest--dire le nombre dobservations uniques et principales). Valeurs manquantes. Pour les variables numriques, la valeur manquante par dfaut est traite comme toute autre valeur. Les observations disposant de la valeur manquante par dfaut pour une variable didentificateur sont traites comme si elles disposaient de valeurs concordantes pour cette variable. Pour les variables chane, les observations ne disposant daucune valeur pour une variable didentificateur sont traites comme si elles disposaient de valeurs concordantes pour cette variable.

Outil visuel de regroupement en bandes


Loutil visuel de regroupement en bandes est conu pour vous aider lors de la cration de variables bases sur le regroupement des valeurs contigus de variables dans un nombre distinct de modalits. Loutil visuel de regroupement en bandes vous permet deffectuer les oprations suivantes : Crer des variables qualitatives partir de variables dchelle continues. Par exemple, vous pouvez utiliser la variable dchelle Revenu pour crer une variable qualitative contenant les tranches de revenus. Fusionner un grand nombre de modalits ordinales en un jeu de modalits plus petit. Par exemple, vous pouvez fusionner une chelle dvaluation allant jusqu neuf pour obtenir trois modalits qui reprsenteraient les niveaux faible, moyen et lev. Dans la premire tape de loutil visuel de regroupement en bandes, vous pouvez effectuer les oprations suivantes :
E Slectionner lchelle numrique et/ou les variables ordinales pour lesquelles crer

des variables qualitatives (en bandes).

151 Prparation des donnes Figure 7-13 Premire bote de dialogue permettant de slectionner les variables regrouper en bandes

Vous pouvez galement limiter le nombre dobservations analyser. Pour les fichiers de donnes contenant un grand nombre dobservations, mme si la limitation du nombre dobservations analyses peut permettre de gagner du temps, vitez si possible de procder cette opration car elle risque davoir une incidence sur la distribution des valeurs utilises dans les calculs effectus ultrieurement dans loutil visuel de regroupement en bandes. Remarque : Les variables chane et les variables numriques nominales ne sont pas affiches dans la liste des variables source. Loutil visuel de regroupement en bandes requiert lutilisation de variables numriques qui sont mesures sur une chelle ou au niveau ordinal. En effet, loutil considre que les valeurs de donnes reprsentent un ordre logique qui peut servir regrouper les valeurs de manire significative. Vous pouvez modifier le niveau de mesure dfini dune variable dans la vue Variable de Data Editor. Pour plus d'informations, reportez-vous Niveau de mesure des variables dans Chapitre 5 p. 99.

152 Chapitre 7

Pour regrouper les variables en bandes


E A partir des menus de la fentre de lditeur de donnes, slectionnez : Transformer Outil visuel de regroupement en bandes : E Slectionner lchelle numrique et/ou les variables ordinales pour lesquelles crer

des variables qualitatives (en bandes).


E Slectionnez une variable dans la zone Liste des variables analyses. E Entrez le nom de la nouvelle variable regroupe en bandes. Les noms de variable

doivent tre uniques et conformes aux rgles de dnomination de variables SPSS. Pour plus d'informations, reportez-vous Noms de variable dans Chapitre 5 p. 99.
E Dfinissez les critres de regroupement en bandes de la nouvelle variable. Pour plus

d'informations, reportez-vous Regroupement de variables en bandes p. 153.


E Cliquez sur OK.

153 Prparation des donnes

Regroupement de variables en bandes


Figure 7-14 Bote de dialogue principale de loutil visuel de regroupement en bandes

La bote de dialogue principale de loutil visuel de regroupement en bandes fournit les informations suivantes concernant les variables analyses :
Liste des variables analyses. Affiche les variables slectionnes dans la premire

bote de dialogue. Vous pouvez trier la liste par niveau de mesure (chelle ou ordinal), par tiquette de variable ou par nom. Pour ce faire, cliquez sur les titres de colonne.
Observations analyses. Indique le nombre dobservations analyses. Toutes les

observations analyses dont la variable slectionne ne prsente aucune valeur manquante par dfaut ou utilisateur sont utilises pour gnrer la distribution des valeurs servant aux calculs effectus dans loutil visuel de regroupement en bandes, y compris lhistogramme affich dans la bote de dialogue principale et les divisions bases sur les centiles ou les carts-types.

154 Chapitre 7

Valeurs manquantes. Indique le nombre dobservations analyses contenant des valeurs manquantes par dfaut et spcifies par lutilisateur. Les valeurs manquantes ne sont incluses dans aucune modalit regroupe en bandes. Pour plus d'informations, reportez-vous Valeurs manquantes utilisateur dans loutil visuel de regroupement en bandes p. 161. Variable actuelle. Nom et tiquette (si disponible) de la variable slectionne, qui

seront utiliss comme base pour les nouvelles variables regroupes en bandes.
Variable regroupe en bandes. Nom et tiquette facultative de la nouvelle variable

regroupe en bandes.
Nom. Vous devez entrer le nom de la nouvelle variable. Les noms de variable

doivent tre uniques et conformes aux rgles de dnomination de variables SPSS. Pour plus d'informations, reportez-vous Noms de variable dans Chapitre 5 p. 99.
Etiquette. Vous pouvez entrer une tiquette de variable descriptive contenant

jusqu 255 caractres. Ltiquette de variable par dfaut est ltiquette (si disponible) ou le nom de la variable source, suivi de la mention (Regroup en bandes).
Minimum et Maximum. Valeurs minimales et maximales de la variable slectionne,

bases sur les observations analyses et nincluant pas de valeurs dfinies en tant que valeurs manquantes spcifies par lutilisateur.
Valeurs non manquantes. Lhistogramme affiche la distribution des valeurs non manquantes pour la variable slectionne, base sur les observations analyses.

Une fois que vous avez dfini les bandes de la nouvelle variable, les lignes verticales de lhistogramme apparaissent afin dindiquer les divisions dfinissant ces bandes. Vous pouvez cliquer sur les lignes de division, puis les dplacer vers diffrents emplacements de lhistogramme, sans changer les intervalles de bandes. Vous pouvez supprimer les bandes en faisant glisser les lignes de division hors de lhistogramme. Remarque : Lhistogramme (affichant les valeurs non manquantes), et les valeurs minimales et maximales sont bass sur les valeurs analyses. Si vous nincluez pas toutes les observations dans lanalyse, vous risquez de ne pas obtenir une distribution prcise et reprsentative, surtout si le fichier de donnes a t tri par la variable

155 Prparation des donnes

slectionne. Si vous nanalysez pas dobservations, aucune information sur la distribution des valeurs nest disponible.
Grille. Affiche les valeurs qui dfinissent les extrema suprieurs de chaque bande et

les tiquettes de valeur facultatives de chaque bande.


Valeur. Valeurs qui dfinissent les extrema suprieurs de chaque bande. Vous

pouvez entrer des valeurs ou utiliser loption Crer des divisions pour crer automatiquement des bandes en fonction des critres slectionns. Par dfaut, une division dont la valeur est ELEVE est automatiquement incluse. Cette bande contient alors toutes les valeurs non manquantes situes au-dessus des autres divisions. La bande dfinie par la division la moins leve inclut toutes les valeurs non manquantes infrieures ou gales cette valeur (ou simplement infrieures cette valeur, en fonction de la dfinition des extrema suprieurs).
Etiquette. Etiquettes descriptives facultatives pour les valeurs de la nouvelle

variable regroupe en bandes. Etant donn que les valeurs de la nouvelle variable sont des valeurs entires squentielles comprises entre 1 et n, les tiquettes dcrivant les valeurs peuvent se rvler trs utiles. Vous pouvez entrer les tiquettes de valeur ou utiliser loption Crer des tiquettes pour les crer automatiquement.
Pour supprimer une bande de la grille
E Cliquez avec le bouton droit de la souris sur la cellule Valeur ou Etiquette de la bande. E Dans le menu contextuel, slectionnez Supprimer la ligne.

Remarque : Si vous supprimez la bande ELEVE, la valeur par dfaut manquante de la nouvelle variable est attribue toutes les observations dont les valeurs sont suprieures celle de la dernire division spcifie.
Pour supprimer toutes les tiquettes ou toutes les bandes dfinies
E Cliquez avec le bouton droit nimporte o dans la grille. E Dans le menu contextuel, slectionnez Supprimer toutes les tiquettes ou Supprimer toutes les divisions.

Extrema suprieurs. Contrle le traitement des valeurs des extrema suprieurs saisies

dans la colonne Valeur de la grille.

156 Chapitre 7

Inclus (<=). Les observations contenant la valeur spcifie dans la cellule Valeur

sont incluses dans la modalit regroupe en bandes. Par exemple, si vous spcifiez les valeurs 25, 50 et 75, les observations dont la valeur est 25 seront places dans la premire bande. En effet, cette bande inclut les observations dont les valeurs sont infrieures ou gales 25.
Exclu (<). Les observations contenant la valeur spcifie dans la cellule Valeur

ne sont pas incluses dans la modalit regroupe en bandes. Elles sont incluses dans la bande suivante. Par exemple, si vous spcifiez les valeurs 25, 50 et 75, les observations dont la valeur est 25 seront places dans la seconde bande. En effet, la premire bande inclut uniquement les observations dont les valeurs sont infrieures 25.
Crer des divisions. Gnre automatiquement des modalits regroupes en bandes

pour les intervalles de longueur identique, les intervalles avec le mme nombre dobservations ou les intervalles bass sur les carts-types. Cette option nest disponible que si vous analysez au moins une observation. Pour plus d'informations, reportez-vous Gnration automatique de modalits regroupes en bandes p. 156.
Crer des tiquettes. Gnre des tiquettes descriptives pour les valeurs entires

squentielles de la nouvelle variable regroupe en bandes, bases sur les valeurs se trouvant dans la grille et le traitement des extrema suprieurs (inclus ou exclus).
Inverser lchelle. Par dfaut, les valeurs de la nouvelle variable regroupe en bandes sont des valeurs entires squentielles croissantes comprise entre 1 et n. Inversez lchelle pour que ces valeurs deviennent des entiers squentiels dcroissants compris entre n et 1. Copier les bandes. Vous pouvez copier les spcifications de regroupement partir dune variable vers la variable slectionne ou partir de la variable slectionne vers dautres variables. Pour plus d'informations, reportez-vous Copie de modalits regroupes en bandes p. 159.

Gnration automatique de modalits regroupes en bandes


La bote de dialogue Crer des divisions vous permet de gnrer automatiquement les modalits regroupes en bandes en fonction des critres slectionns.

157 Prparation des donnes

Pour utiliser la bote de dialogue Crer des divisions


E Dans la zone Liste des variables analyses, slectionnez une variable en cliquant

dessus.
E Cliquez sur Crer des divisions. E Slectionnez les critres de gnration des divisions, qui dfinira les modalits

regroupes en bandes.
E Cliquez sur Appliquer. Figure 7-15 Bote de dialogue Crer des divisions

Remarque : La bote de dialogue Crer des divisions nest disponible que si vous avez analys des observations.

158 Chapitre 7

Intervalles de longueur identique. Gnre des modalits regroupes en bandes de longueur identique (par exemple, 110, 1120, 2130, etc.) en fonction de deux des trois critres suivants : Emplacement de la premire division. Valeur qui dfinit la limite suprieure de la

modalit regroupe en bandes la moins leve (par exemple, la valeur 10 indique un intervalle comprenant toutes les valeurs jusqu 10).
Nombre de divisions. Le nombre de modalits regroupes en bandes correspond

au nombre de divisions, plus 1. Par exemple, 9 divisions gnrent 10 modalits regroupes en bandes.
Largeur. Longueur de chaque intervalle. Par exemple, la valeur 10 regroupe les

donnes dge en annes par intervalles de 10 ans.


Centiles gaux fonds sur les observations analyses. Gnre des modalits regroupes en bandes avec un nombre dobservations identique dans chaque bande ( laide de lalgorithme empirique pour les centiles), en fonction de lun des critres suivants : Nombre de divisions. Le nombre de modalits regroupes en bandes correspond au

nombre de divisions, plus 1. Par exemple, trois divisions gnrent quatre bandes de centiles (quartiles), chacune contenant 25 % des observations.
Largeur (%). Longueur de chaque intervalle, exprime en pourcentage du

nombre total des observations. Par exemple, la valeur 33,3 gnrerait trois modalits regroupes en bandes (deux divisions), chacune contenant 33,3 % des observations. Si la variable source comporte peu de valeurs distinctes ou de nombreuses observations ayant la mme valeur, vous risquez dobtenir un nombre de bandes infrieur celui requis. Si une division dispose de plusieurs valeurs identiques, ces dernires seront toutes places dans le mme intervalle ; les pourcentages rels risquent donc de ne pas tre strictement gaux.
Divisions au niveau de la moyenne et des carts-types slectionns, fondes sur les observations analyses. Gnre des modalits regroupes en bandes bases sur les

valeurs de la moyenne et de lcart-type de la distribution de la variable.

159 Prparation des donnes

Si vous ne slectionnez pas les intervalles dcarts-types, deux modalits regroupes en bandes sont cres, la moyenne tant utilise comme division entre les bandes. Vous pouvez slectionner nimporte quelle combinaison dintervalles dcarts-types en utilisant un, deux et/ou trois carts-types. Par exemple, si vous slectionnez les trois, huit modalits regroupes en bandes sont cres : six bandes dans un intervalle dcarts-types, et deux bandes pour les observations suprieures ou infrieures la moyenne de plus de trois carts-types. Dans une distribution normale, 68 % des observations sont comprises dans un cart-type de la moyenne, 95 %, dans deux carts-types et 99 % dans trois carts-types. Si la cration de modalits regroupes en bandes est base sur les carts-types, certaines bandes dfinies risquent de se retrouver hors de lintervalle de donnes rel, voire hors de lintervalle des valeurs possibles (par exemple, un intervalle de salaires ngatif). Remarque : Les calculs de centiles et dcarts-types reposent sur les observations analyses. Si vous limitez le nombre dobservations analyses, les bandes obtenues risquent de ne pas contenir la proportion dobservations souhaite, en particulier si le fichier de donnes est tri par variable source. Par exemple, si vous limitez lanalyse aux 100 premires observations dun fichier de donnes contenant 1 000 observations et que ce fichier de donnes est tri dans lordre croissant de lge des rpondants, vous nobtiendrez pas quatre bandes dge en centiles contenant 25 % des observations, mais plutt trois bandes contenant chacune 3,3 % des observations et une quatrime en contenant 90 %.

Copie de modalits regroupes en bandes


Si vous souhaitez crer des modalits regroupes en bandes pour plusieurs variables, vous pouvez copier les spcifications du regroupement partir dune variable vers la variable slectionne ou partir de la variable slectionne vers plusieurs variables.

160 Chapitre 7 Figure 7-16 Copie de bandes partir de ou vers la variable actuelle

Pour copier les spcifications de regroupement en bandes


E Dfinissez des modalits regroupes en bandes pour une variable au moins (ne cliquez pas sur OK ni sur Coller). E Dans la zone Liste des variables analyses, cliquez sur une variable pour laquelle

vous avez dfini des modalits regroupes en bandes.


E Cliquez sur Vers dautres variables. E Slectionnez les variables pour lesquelles crer des variables ayant les mmes

modalits regroupes en bandes.


E Cliquez sur Copier.

ou
E Dans la zone Liste des variables analyses, cliquez sur la variable vers laquelle copier

les modalits regroupes en bandes concernes.


E Cliquez sur A partir dune autre variable. E Slectionnez la variable avec les modalits regroupes en bandes dfinies copier.

161 Prparation des donnes E Cliquez sur Copier.

Si vous avez spcifi des tiquettes de valeur pour la variable partir de laquelle vous copiez les spcifications de regroupement, ces tiquettes sont galement copies. Remarque : Une fois que vous avez cliqu sur OK dans la bote de dialogue principale de loutil visuel de regroupement en bandes pour crer les variables regroupes en bandes (ou que vous avez ferm cette bote de dialogue dune autre manire), vous ne pouvez pas utiliser cet outil pour copier les modalits regroupes en bandes vers dautres variables.

Valeurs manquantes utilisateur dans loutil visuel de regroupement en bandes


Les valeurs dfinies comme valeurs manquantes spcifies par lutilisateur (valeurs identifies comme codes pour les donnes manquantes) pour la variable source ne sont pas incluses dans les modalits regroupes en bandes de la nouvelle variable. Les valeurs manquantes utilisateur des variables source sont copies en tant que telles pour la nouvelle variable. Toutes les tiquettes de valeur dfinies pour les codes de valeur manquante sont galement copies. Si un code de valeur manquante est en conflit avec lune des valeurs de modalit regroupe en bandes pour la nouvelle variable, le code de la valeur manquante de cette nouvelle variable est modifi : 100 est ajout la valeur la plus leve de la modalit regroupe en bandes. Par exemple, si la valeur 1 est dfinie comme valeur manquante utilisateur de la variable source et que la nouvelle variable comporte six modalits regroupes en bandes, la valeur 106 de la nouvelle variable vient remplacer la valeur 1 de la variable source pour toutes les observations. Cette valeur devient alors la nouvelle valeur manquante spcifie par lutilisateur. Si la valeur manquante utilisateur de la variable source comporte une tiquette de valeur dfinie, cette dernire est utilise comme tiquette pour la valeur recode de la nouvelle variable. Remarque : Si la variable source comporte un intervalle dfini de valeurs manquantes utilisateur sous la forme LO-n (n tant un nombre positif), les valeurs manquantes utilisateur correspondantes de la nouvelle variable sont des nombres ngatifs.

Chapitre

Transformations de donnes

Dans une situation idale, vos donnes brutes conviennent parfaitement pour le type danalyse que vous dsirez effectuer, et toute relation entre les variables est soit linaire soit orthogonale. Malheureusement, cest rarement le cas. Lanalyse prliminaire peut rvler des schmas de codage peu pratiques ou des erreurs de codage, ou des transformations de donnes peuvent savrer ncessaires pour dterminer la vritable relation entre les variables. SPSS vous permet deffectuer des transformations de donnes simples, comme la fusion de modalits pour une analyse, ou des tches plus volues, comme la cration de nouvelles variables bases sur des quations complexes et des instructions conditionnelles.

Calcul de variables
Utilisez la bote de dialogue Calculer pour calculer les valeurs dune variable en fonction des transformations numriques dautres variables. Vous pouvez calculer les valeurs de variables numriques ou sous forme de chane de caractres (alphanumrique). Vous pouvez crer de nouvelles variables ou remplacer les valeurs de variables existantes. Dans le cas de nouvelles variables, vous pouvez aussi spcifier le type et ltiquette. Vous pouvez calculer les valeurs de manire slective pour des sous-ensembles de donnes en fonction de conditions logiques. Vous pouvez utiliser plus de 70 fonctions intgres, dont des fonctions arithmtiques, statistiques, de distribution, et de chane.

163

164 Chapitre 8 Figure 8-1 Bote de dialogue Calculer la variable

Pour calculer des variables


E A partir des menus, slectionnez : Transformer Calculer E Entrez le nom dune seule variable cible. Il peut sagir dune variable existante ou

dune nouvelle variable ajouter lensemble de donnes actif.


E Pour construire une expression, vous pouvez soit coller les composants dans le champ

Expression, soit les saisir directement depuis le clavier. Pour coller des fonctions ou des variables systme couramment utilises, slectionnez un groupe dans la liste Groupe de fonctions, puis, dans la liste Fonctions et variables spciales, double-cliquez sur la fonction ou la variable voulue (ou slectionnez-la, puis cliquez sur la flche adjacente la liste Groupe de fonctions). Dfinissez tous les paramtres indiqus par un point dinterrogation

165 Transformations de donnes

(cette opration ne concerne que les fonctions). Le groupe de fonctions tiquet Tous rpertorie toutes les fonctions et variables systme disponibles. Une brve description de la variable ou de la fonction slectionne apparat dans une zone particulire de la bote de dialogue. Les constantes alphanumriques doivent tre prsentes entre guillemets ou apostrophes. Si des valeurs contiennent des chiffres dcimaux, utilisez la virgule comme indicateur dcimal. Pour les nouvelles variables chane, vous devez aussi slectionner Type & tiquette pour spcifier le type de donnes.

Calculer la variable : Expressions conditionnelles


La bote de dialogue Si... (Expressions conditionnelles) vous permet dappliquer les transformations de donnes des sous-ensembles dobservations slectionnes, au moyen dexpressions conditionnelles. Une expression conditionnelle renvoie la valeur True (vrai), False (faux) ou manquant pour chaque observation.
Figure 8-2 Bote de dialogue Expression conditionnelle Calculer la variable

166 Chapitre 8

Si le rsultat dune expression conditionnelle est Vrai, lobservation est incluse dans le sous-ensemble slectionn. Si le rsultat dune expression conditionnelle est Faux ou manquant, lobservation nest pas incluse dans le sous-ensemble slectionn. La plupart des expressions conditionnelles utilisent un ou plus des six oprateurs relationnels (<, >, <=, >=, = et ~=) du pav numrique. Les expressions conditionnelles peuvent comprendre des noms de variable, des constantes, des oprateurs arithmtiques, des fonctions (numriques ou non), des variables logiques et des oprateurs relationnels.

Calculer la variable : Type et tiquette


Par dfaut, les nouvelles variables calcules sont numriques. Pour calculer une nouvelle variable chane, vous devez spcifier le type de donnes et sa longueur.
Etiquette. Etiquette de variable facultative et descriptive jusqu 120 caractres. Vous pouvez entrer une tiquette ou utiliser les 110 premiers caractres de lexpression de calcul comme tiquette. Type. Les variables calcules peuvent tre numriques ou alphanumriques. Les variables chane ne peuvent tre utilises dans des calculs.
Figure 8-3 Bote de dialogue Calculer la variable : Type et tiquette

Fonctions
Plusieurs types de fonctions sont prises en charge, y compris : Fonctions arithmtiques Fonctions statistiques

167 Transformations de donnes

Fonctions sur chanes les fonctions date et heure Fonctions de distribution les fonctions de variable alatoire les fonctions de valeur manquante Fonctions danalyse (serveur SPSS uniquement) Recherchez les fonctions dans lindex de laide en ligne pour obtenir la liste complte des fonctions.

Valeurs manquantes dans les fonctions


Les fonctions et les expressions arithmtiques simples traitent les valeurs manquantes de manire diffrente. Dans lexpression :
(var1+var2+var3)/3

le rsultat est manquant sil manque une valeur dans lune des trois variables dune observation. Dans lexpression :
MEAN(var1, var2, var3)

le rsultat ne manque que si les valeurs des trois variables manquent dans lobservation. Pour les fonctions statistiques, vous pouvez spcifier le nombre minimal darguments ne comportant pas de valeurs manquantes. Pour ce faire, tapez un point et le nombre minimal aprs le nom de la fonction, comme suit :
MEAN.2(var1, var2, var3)

Gnrateurs de nombres alatoires


La bote de dialogue Gnrateurs de nombres alatoires vous permet de slectionner le gnrateur de nombres alatoires et de dfinir la valeur de la squence initiale afin que vous puissiez reproduire une squence de nombres alatoires.

168 Chapitre 8

Gnrateur actif. Deux types de gnrateur de nombres alatoires sont disponibles : Compatible avec SPSS 12. Gnrateur de nombres alatoires utilis dans SPSS 12

et les versions prcdentes. Si vous avez besoin de reproduire des rsultats alatoires gnrs dans des versions prcdentes sur la base d'une valeur de gnrateur spcifie, utilisez ce gnrateur de nombres alatoires.
Mersenne Twister. Gnrateur de nombres alatoires plus rcent et plus fiable

pour les simulations. Si la reproduction de rsultats alatoires partir de SPSS 12 ou d'une version antrieure n'est pas un problme, utilisez ce gnrateur de nombres alatoires.
Initialisation du gnrateur actif. Le nombre alatoire change chaque fois que SPSS gnre un nombre alatoire utiliser dans des transformations (telles que les fonctions de distribution alatoire), un chantillonnage alatoire ou une pondration dobservation. Pour rpliquer une squence de nombres alatoires, dfinissez la valeur du point de dpart de linitialisation avant chaque analyse utilisant les nombres alatoires. Il doit sagir dun nombre entier positif.
Figure 8-4 Bote de dialogue Gnrateurs de nombres alatoires

169 Transformations de donnes

Pour slectionner le gnrateur de nombres alatoires et/ou dfinir la valeur dinitialisation :


E A partir des menus, slectionnez : Transformer Gnrateurs de nombres alatoires

Compter occurrences des valeurs par observation


Cette bote de dialogue cre une variable qui compte les occurrences des mmes valeurs dans une liste de variables pour chaque observation. Par exemple, une enqute peut comporter une liste de magazines avec des cases cocher oui/non pour indiquer les magazines lus par chaque rpondant. Vous pourriez compter le nombre de rponses oui pour chaque rpondant et crer une nouvelle variable contenant le nombre total de magazines lus.
Figure 8-5 Bote de dialogue Compter occurrences des valeurs par observation

Pour compter les occurrences de valeurs par observations


E A partir des menus, slectionnez : Transformer Compter E Entrez le nom dune variable cible.

170 Chapitre 8 E Slectionnez deux ou plusieurs variables du mme type (numrique ou

alphanumrique).
E Cliquez sur Dfinir les valeurs et spcifiez les valeurs compter.

En option, vous pouvez dfinir un sous-ensemble dobservations dont il faut compter les occurrences de valeurs.

Compter les occurrences des valeurs par observations : Valeurs compter


La valeur de la variable cible (dans la bote de dialogue principale) est incrmente dune unit chaque fois que lune des variables slectionnes correspond une spcification dans la liste Valeurs compter. Si une observation correspond plusieurs spcifications pour une variable quelconque, la variable cible est incrmente plusieurs fois pour cette variable. Les spcifications de valeurs peuvent inclure des valeurs individuelles, des valeurs manquantes ou manquantes par dfaut, et des intervalles. Les limites comprennent leurs extrmes et toute valeur manquante spcifie figurant dans lintervalle.
Figure 8-6 Bote de dialogue Compter occurrences des valeurs par observation : Valeurs compter

171 Transformations de donnes

Compter occurrences : Expressions conditionnelles


La bote de dialogue Si... (Expressions conditionnelles) vous permet de compter les occurrences des valeurs pour un sous-ensemble donn dobservations, au moyen dexpressions conditionnelles. Une expression conditionnelle renvoie la valeur True (vrai), False (faux) ou manquant pour chaque observation.
Figure 8-7 Bote de dialogue Expression conditionnelle Compter occurrences

Pour obtenir des informations dordre gnral sur lutilisation de la bote de dialogue Si les observations, reportez-vous Calculer la variable : Expressions conditionnelles p. 165.

Recodage de valeurs
Vous pouvez modifier les valeurs de donnes en les recodant. Ceci est particulirement utile pour fusionner des modalits ou les combiner. Vous pouvez recoder les valeurs lintrieur de variables existantes ou crer des variables sur la base des valeurs recodes de variables existantes.

172 Chapitre 8

Recodage de variables
La bote de dialogue Recodage de variables vous permet de raffecter les valeurs de variables existantes ou de fusionner des intervalles de valeurs existantes dans de nouvelles valeurs. Par exemple, vous pourriez fusionner des salaires dans des modalits dintervalles de salaires. Vous pouvez recoder des variables numriques et chane. Si vous slectionnez plusieurs variables, elles doivent toutes tre du mme type. Vous ne pouvez pas recoder ensemble des variables numriques et chane.
Figure 8-8 Bote de dialogue Recodage de variables

Pour recoder les valeurs dune variable


E A partir des menus, slectionnez : Transformer Recode Recodage de variables E Slectionnez les variables que vous dsirez recoder. Si vous slectionnez plusieurs

variables, elles doivent tre du mme type (numrique ou alphanumrique).


E Cliquez sur Anciennes et nouvelles valeurs et spcifiez comment recoder les valeurs.

En option, vous pouvez dfinir un sous-ensemble dobservations recoder. La bote de dialogue Si les observations permettant deffectuer cette opration est identique celle dcrite pour le comptage doccurrences.

173 Transformations de donnes

Recodage de variables : Anciennes et nouvelles valeurs


Vous pouvez dfinir les valeurs recoder dans cette bote de dialogue. Toutes les spcifications de valeurs doivent tre du mme type de donnes (numrique ou alphanumrique) que les variables slectionnes dans la bote de dialogue principale.
Ancienne valeur. Valeurs recoder. Vous pouvez recoder des valeurs uniques, des

intervalles de valeurs, et des valeurs manquantes. Les valeurs manquantes par dfaut et les intervalles ne peuvent tre slectionns pour des variables chane, car aucun de ces concepts ne sapplique ce type de variable. Les limites comprennent leurs extrmes et toute valeur manquante spcifie figurant dans lintervalle.
Valeur. Les anciennes valeurs individuelles doivent tre recodes par de nouvelles

valeurs. La valeur doit tre du mme type de donnes (numrique ou chane) que la variable que vous recodez.
Manquant par dfaut. Valeurs affectes par le programme lorsque certaines valeurs

de vos donnes sont non dfinies d'aprs le type de format spcifi, lorsqu'un champ numrique est vide ou lorsqu'une valeur rsultant d'une commande de transformation n'est pas dfinie. Les valeurs manquantes par dfaut numriques sont affiches sous forme de points. Les variables chane ne peuvent pas comporter de valeurs manquantes par dfaut, puisqu'elles acceptent tous les caractres.
Manquante par dfaut ou spcifie. Observations comportant des valeurs dfinies

comme valeurs utilisateur manquantes, ou comportant des valeurs inconnues et auxquelles ont t attribues des valeurs par dfaut, comme l'indique le point (.).
Plage. Intervalle de valeurs inclusif. Non disponible pour les variables de chane.

Les valeurs manquantes spcifies comprises dans l'intervalle sont prises en compte.
Toutes les autres valeurs. Toute autre valeur non incluse dans l'une des

spcifications de la liste Ancienne-Nouvelle. Apparat sous l'intitul ELSE dans la liste Ancienne-Nouvelle.
Nouvelle valeur. Valeur unique en laquelle chaque ancienne valeur ou intervalle de valeurs est recod. Vous pouvez entrer une valeur ou la valeur manquante par dfaut.

174 Chapitre 8

Valeur. Valeur dans laquelle une ou plusieurs valeurs anciennes devront tre

recodes. La valeur doit tre du mme type de donnes (numrique ou chane) que l'ancienne variable.
Manquant par dfaut. Recode les anciennes valeurs spcifies en valeurs

manquantes par dfaut. Les valeurs manquantes par dfaut ne sont pas utilises dans les calculs, et les observations avec des valeurs manquantes par dfaut sont exclues de nombreuses procdures. Non disponible pour les variables de chane.
Ancienne>Nouvelle. liste les spcifications qui seront utilises pour recoder la ou les

variables. Vous pouvez ajouter, modifier et supprimer des spcifications dans la liste. La liste est trie automatiquement, en fonction de la spcification de lancienne valeur, selon lordre suivant : valeurs uniques, valeurs manquantes, intervalles, puis toutes les autres valeurs. Si vous changez une spcification de recodage dans la liste, SPSS trie de nouveau la liste automatiquement, si ncessaire, pour conserver cet ordre.
Figure 8-9 Bote de dialogue Anciennes et nouvelles valeurs

Cration de variables
La bote de dialogue Cration de variables vous permet de raffecter les valeurs de variables existantes ou de fusionner des intervalles de valeurs existantes dans de nouvelles valeurs pour une nouvelle variable. Par exemple, vous pourriez fusionner les salaires en une nouvelle variable contenant des modalits dintervalles de salaires.

175 Transformations de donnes

Vous pouvez recoder des variables numriques et chane. Vous pouvez recoder des variables numriques en variables chane et inversement. Si vous slectionnez plusieurs variables, elles doivent toutes tre du mme type. Vous ne pouvez pas recoder ensemble des variables numriques et chane.
Figure 8-10 Bote de dialogue Recoder et crer de nouvelles variables

Pour recoder les valeurs dune variable dans une nouvelle variable
E A partir des menus, slectionnez : Transformer Recode Cration de variables E Slectionnez les variables que vous dsirez recoder. Si vous slectionnez plusieurs

variables, elles doivent tre du mme type (numrique ou alphanumrique).


E Entrez un nom de variable de rsultat (nouveau) pour chaque nouvelle variable, puis cliquez sur Remplacer. E Cliquez sur Anciennes et nouvelles valeurs et spcifiez comment recoder les valeurs.

En option, vous pouvez dfinir un sous-ensemble dobservations recoder. La bote de dialogue Si les observations permettant deffectuer cette opration est identique celle dcrite pour le comptage doccurrences.

176 Chapitre 8

Recoder et crer de nouvelles variables : Anciennes et nouvelles valeurs


Vous pouvez dfinir les valeurs recoder dans cette bote de dialogue.
Ancienne valeur. Valeurs recoder. Vous pouvez recoder des valeurs uniques, des

intervalles de valeurs, et des valeurs manquantes. Les valeurs manquantes par dfaut et les intervalles ne peuvent tre slectionns pour des variables chane, car aucun de ces concepts ne sapplique ce type de variable. Les anciennes valeurs doivent tre du mme type de donnes (numrique ou alphanumrique) que la variable dorigine. Les limites comprennent leurs extrmes et toute valeur manquante spcifie figurant dans lintervalle.
Valeur. Les anciennes valeurs individuelles doivent tre recodes par de nouvelles

valeurs. La valeur doit tre du mme type de donnes (numrique ou chane) que la variable que vous recodez.
Manquant par dfaut. Valeurs affectes par le programme lorsque certaines valeurs

de vos donnes sont non dfinies d'aprs le type de format spcifi, lorsqu'un champ numrique est vide ou lorsqu'une valeur rsultant d'une commande de transformation n'est pas dfinie. Les valeurs manquantes par dfaut numriques sont affiches sous forme de points. Les variables chane ne peuvent pas comporter de valeurs manquantes par dfaut, puisqu'elles acceptent tous les caractres.
Manquante par dfaut ou spcifie. Observations comportant des valeurs dfinies

comme valeurs utilisateur manquantes, ou comportant des valeurs inconnues et auxquelles ont t attribues des valeurs par dfaut, comme l'indique le point (.).
Plage. Intervalle de valeurs inclusif. Non disponible pour les variables de chane.

Les valeurs manquantes spcifies comprises dans l'intervalle sont prises en compte.
Toutes les autres valeurs. Toute autre valeur non incluse dans l'une des

spcifications de la liste Ancienne-Nouvelle. Apparat sous l'intitul ELSE dans la liste Ancienne-Nouvelle.
Nouvelle valeur. Valeur unique en laquelle chaque ancienne valeur ou intervalle de valeurs est recod. Les nouvelles valeurs peuvent tre numriques ou alphanumriques. Valeur. Valeur dans laquelle une ou plusieurs valeurs anciennes devront tre

recodes. La valeur doit tre du mme type de donnes (numrique ou chane) que l'ancienne variable.

177 Transformations de donnes

Manquant par dfaut. Recode les anciennes valeurs spcifies en valeurs

manquantes par dfaut. Les valeurs manquantes par dfaut ne sont pas utilises dans les calculs, et les observations avec des valeurs manquantes par dfaut sont exclues de nombreuses procdures. Non disponible pour les variables de chane.
Copier les anciennes valeurs. Conserve les anciennes valeurs. Si certaines

valeurs n'ont pas besoin d'tre recodes, utilisez cette option pour inclure les anciennes valeurs. Toute ancienne valeur non spcifie n'est pas incluse dans la nouvelle variable, et les observations avec ces valeurs se verront affecter la valeur manquante par dfaut de la nouvelle variable.
Variables destination sont des chanes. Dfinit la nouvelle variable recode comme une

variable chane (alphanumrique). L'ancienne variable peut tre numrique ou chane.


Convertir les chanes numriques en nombres. Convertit les variables de chane

contenant des chiffres en valeurs numriques. Les chanes de caractres contenant autre chose que des nombres et des signes (+ ou -) sont considres comme des valeurs manquantes par dfaut.
Ancienne>Nouvelle. liste les spcifications qui seront utilises pour recoder la ou les

variables. Vous pouvez ajouter, modifier et supprimer des spcifications dans la liste. La liste est trie automatiquement, en fonction de la spcification de lancienne valeur, selon lordre suivant : valeurs uniques, valeurs manquantes, intervalles, puis toutes les autres valeurs. Si vous changez une spcification de recodage dans la liste, SPSS trie de nouveau la liste automatiquement, si ncessaire, pour conserver cet ordre.
Figure 8-11 Bote de dialogue Anciennes et nouvelles valeurs

178 Chapitre 8

Ordonner les observations


La bote de dialogue Ordonner les observations vous permet de crer de nouvelles variables contenant des rangs, des scores normaux et de Savage, ainsi que des valeurs de centiles pour les variables numriques. De nouveaux noms de variables et des tiquettes de variable descriptives sont automatiquement gnres par SPSS, en fonction du nom dorigine de la variable et des mesures slectionnes. Un tableau rcapitulatif liste les variables dorigine, les nouvelles variables et les tiquettes de variable. Sinon, vous pouvez : Ordonner les observations en ordre croissant ou dcroissant. Sparez les rangs en sous-groupes en slectionnant des variables de regroupement pour la liste Par. Les rangs sont calculs lintrieur de chaque groupe. Les groupes sont dfinis par combinaison des valeurs des variables de regroupement. Par exemple, si vous slectionnez sexe et minorit comme variables de regroupement, les rangs seront calculs pour chaque combinaison de sexe et minorit.
Figure 8-12 Bote de dialogue Ordonner les observations...

179 Transformations de donnes

Pour ordonner les observations


E A partir des menus, slectionnez : Transformer Ordonner les observations E Slectionnez des variables ordonner. Vous ne pouvez ordonner que des variables

numriques. En option, vous pouvez ordonner les observations en ordre croissant ou dcroissant et sparer les rangs en sous-groupes.

Ordonner les observations : Types (de rangs)


Vous pouvez slectionner plusieurs mthodes dordonnancement. Une variable dordonnancement distincte est cre pour chaque mthode. Les mthodes dordonnancement comprennent les rangs simples, les scores de Savage, les rangs fractionnaires et les centiles. Vous pouvez aussi crer des ordonnancements bass sur des estimations de la proportion et des scores normaux.
Rang. Rang simple. La valeur de la nouvelle variable est gale son rang. Score de Savage. La nouvelle variable contient des scores de Savage reposant sur

une distribution exponentielle.


Rang fractionnaire. La valeur de la nouvelle variable est gale au rang divis par la

somme des pondrations des observations non manquantes.


Rang en pourcentage. Chaque rang est divis par le nombre d'observations ayant des valeurs valides et multipli par 100. Somme des poids. La valeur de la nouvelle variable est gale la somme des pondrations d'observation. La nouvelle variable est une constante pour toutes les observations du mme groupe. Fractiles. Les rangs sont bass sur des groupes de centiles, chaque groupe contenant peu prs le mme nombre d'observations. Par exemple, une spcification de 4 fractiles affectera une valeur de 1 aux observations infrieures au 25e centile, de 2 celles situes entre les 25e et 50e centiles, de 3 celles situes entre les 50e et 75e centiles, et de 4 celles suprieures au 75e centile. Estimations de la proportion. Estimations de la proportion cumule de la distribution

correspondant un rang particulier.

180 Chapitre 8

Scores normaux. Ecarts z correspondant la proportion cumule estime. Formule destimation dune proportion. Pour les estimations de la proportion et les

scores normaux, vous pouvez slectionner la formule destimation dune proportion : Blom, Tukey, Rankit ou Van der Waerden.
Blom. Cre une variable d'ordonnancement sur la base des estimations de la

proportion, qui utilise la formule (r-3/8) / (w+1/4), o r est le rang et w la somme des pondrations d'observation.
Tukey. Utilise la formule (r-1/3) / (w+1/3), dans laquelle r est le rang et w la

somme des pondrations d'observation.


Rankit. Utilise la formule (r-1/2) / w, w reprsentant le nombre d'observations

et r le rang, de 1 w.
Van der Waerden. Transformation de Van der Waerden, dfinie par la formule

r/(w+1), dans laquelle w est la somme des pondrations d'observation et r le rang, compris entre 1 et w.
Figure 8-13 Bote de dialogue Ordonner les observations : Types

Ordonner les observations : Ex aequo


Cette bote de dialogue dtermine la mthode daffectation pour ordonner les observations ayant la mme valeur que la variable dorigine.

181 Transformations de donnes Figure 8-14 Bote de dialogue Ordonner les observations : Ex aequo

Le tableau suivant montre comment les diffrentes mthodes affectent des rangs des valeurs ex aequo.
Valeur 10 15 15 15 16 20 Moyenne 1 3 3 3 5 6 Faible 1 2 2 2 5 6 Eleve 1 4 4 4 5 6 Squentielle 1 2 2 2 3 4

Recoder automatiquement
La bote de dialogue Recodage automatique vous permet de convertir les valeurs numriques et alphanumriques en entiers conscutifs. Lorsque les codes de modalit ne sont pas squentiels, les cellules vides qui en rsultent rduisent les performances et augmentent les besoins en mmoire de nombreuses procdures SPSS. De plus, certaines procdures ne peuvent utiliser des variables chane, et certaines ont besoin de valeurs entires conscutives pour les niveaux de facteurs.

182 Chapitre 8 Figure 8-15 Bote de dialogue Recoder automatiquement

Les nouvelles variables cres par le Recodage automatique conservent toute variable dfinie et les tiquettes de valeurs de lancienne variable. Pour toute valeur sans tiquette de dfinition de valeur, la valeur dorigine est utilise comme tiquette pour la valeur recode. Un tableau affiche les anciennes et les nouvelles valeurs et les tiquettes de valeurs. Les valeurs de chane sont recodes dans lordre alphabtique, les majuscules prcdant leurs quivalents minuscules. Les valeurs manquantes sont recodes en valeurs manquantes suprieures toutes valeurs non manquantes, en conservant leur ordre. Par exemple, si la variable dorigine comporte 10 valeurs non manquantes, la valeur manquante la plus faible serait recode en 11 et la valeur 11 serait une valeur manquante pour la nouvelle variable.
Utilisez le mme systme de recodage pour toutes les variables. Cette option vous

permet dappliquer un seul systme de recodage automatique toutes les variables slectionnes et de gnrer un systme de codage appropri pour toutes les nouvelles variables.

183 Transformations de donnes

Si vous slectionnez cette option, les rgles et limites suivantes sappliquent : Toutes les variables doivent tre du mme type (numrique ou alphanumrique). La totalit des valeurs observes pour toutes les variables slectionnes est utilise pour trier les valeurs afin de les recoder en entiers squentiels. Les valeurs utilisateur manquantes des nouvelles variables dpendent de la premire variable de la liste contenant les valeurs utilisateur manquantes dfinies. Toutes les autres valeurs des autres variables dorigine, lexception des valeurs manquantes par dfaut, sont traites comme des valeurs valides.
Traiter les valeurs de chane vide comme valeurs manquantes spcifies par lutilisateur.

Pour les variables chane, les valeurs nulles ou vides ne sont pas traites comme des valeursmanquantes par dfaut. Cette option permet de recoder automatiquement une chane vide en unevaleur utilisateur manquante suprieure la valeur non manquante la plus leve.
Modles

Vous pouvez enregistrer le systme de recodage automatique dans un fichier de modle, puis lappliquer dautres variables et fichiers de donnes. Exemple : vous disposez dun grand nombre de codes de produit alphanumriques que vous recodez automatiquement en nombres entiers tous les mois. Toutefois, certains mois, de nouveaux codes de produit sont ajouts et le systme de recodage automatique dorigine est modifi. Si vous enregistrez le systme dorigine dans un modle et que vous lappliquez aux nouvelles donnes qui contiennent le nouvel ensemble de codes, tous les nouveaux codes prsents dans les donnes sont recods automatiquement en valeurs suprieures la dernire valeur du modle. Le systme de recodage automatique dorigine des codes de produit dorigine est ainsi conserv.
Enregistrer le modle sous. Enregistre le systme de recodage automatique des variables slectionnes dans un fichier de modle externe.

Le modle contient des informations qui tablissent une correspondance entre les valeurs non manquantes dorigine et les valeurs recodes. Seules les informations relatives aux valeurs non manquantes sont enregistres dans le modle. Les informations relatives aux valeurs utilisateur manquantes ne sont pas enregistres.

184 Chapitre 8

Si vous avez slectionn plusieurs variables recoder, mais que vous nutilisez pas le mme systme de recodage automatique pour toutes les variables, ou que vous nappliquez pas un modle existant lors du recodage automatique, le modle dpend de la premire variable de la liste. Si vous avez slectionn plusieurs variables recoder et Utiliser la mme mthode denregistrement pour toutes les variables, et/ou que vous avez choisi Appliquer le modle, le modle contient le systme de recodage automatique combin de toutes les variables.
Appliquer le modle partir de. Applique un modle de recodage automatique dj

enregistr aux variables slectionnes pour le recodage, en ajoutant des valeurs supplmentaires de variables la fin du systme, et en conservant les relations entre les valeurs dorigine et les valeurs recodes automatiquement qui sont stockes dans le systme enregistr. Toutes les variables slectionnes pour le recodage doivent tre du mme type (numrique ou alphanumrique) et ce type doit correspondre celui dfini dans le modle. Les modles ne contiennent aucune information sur les valeurs utilisateur manquantes. Les valeurs utilisateur manquantes des variables cible dpendent de la premire variable de la liste des variables dorigine contenant les valeurs utilisateur manquantes dfinies. Toutes les autres valeurs des autres variables dorigine, lexception des valeurs manquantes par dfaut, sont traites comme des valeurs valides. Les correspondances de valeurs du modle sont appliques en premier. Toutes les valeurs restantes sont recodes en valeurs suprieures la dernire valeur du modle, et les valeurs utilisateur manquantes (qui dpendent de la premire variable de la liste contenant les valeurs utilisateur manquantes dfinies) sont recodes en valeurs suprieures la dernire valeur valide. Si vous avez slectionn plusieurs variables pour le recodage automatique, le modle est dabord appliqu, suivi du recodage automatique combin standard de toutes les valeurs supplmentaires dtectes dans les variables slectionnes. Un seul systme de recodage automatique standard est ainsi gnr pour toutes les variables slectionnes.

185 Transformations de donnes

Pour recoder des variables numriques ou alphanumriques en nombres entiers conscutifs


E A partir des menus, slectionnez : Transformer Recoder automatiquement E Slectionnez des variables recoder. E Pour chaque variable slectionne, entrez un nom pour la nouvelle variable, puis cliquez sur Nouveau nom.

Assistant Date et heure


LAssistant Date et heure simplifie un grand nombre de tches courantes en relation avec les variables date et heure.
Pour utiliser lAssistant Date et heure
E A partir des menus, slectionnez : Transformer Date/Heure... E Slectionnez la tche que vous souhaitez accomplir et suivez les tapes pour la dfinir.

186 Chapitre 8 Figure 8-16 Ecran de prsentation de lAssistant Date et heure

Dcouvrir comment les dates et heures sont reprsentes dans SPSS. Cette

opration fait apparatre un cran contenant une brve prsentation des variables date/heure dans SPSS. Le bouton Aide fait galement apparatre un lien vers des informations plus dtailles.
Crer une variable date/heure partir dune variable chane contenant une date ou une heure. Utilisez cette option pour crer une variable date/heure partir

dune variable chane. Par exemple, vous avez une variable chane reprsentant des dates au format jj/mm/aaaa et vous souhaitez crer une variable date/heure partir de la variable chane.
Crer une variable date/heure partir de parties existantes de variables contenant une date ou une heure. Cette opration vous permet de construire une variable

date/heure partir dun ensemble de variables existantes. Par exemple, vous avez une variable reprsentant le mois (sous la forme dun nombre entier), une deuxime reprsentant le jour du mois et une troisime lanne. Vous pouvez combiner ces trois variables pour crer une seule variable date/heure.

187 Transformations de donnes

Calculer les dates et les heures. Utilisez cette option pour ajouter ou supprimer des

valeurs dans les variables date/heure. Par exemple, vous pouvez calculer la dure dun processus en soustrayant une variable reprsentant le dbut du processus dune autre variable reprsentant sa fin.
Extraire une partie dune variable date ou heure. Cette option vous permet dextraire

une partie dune variable date/heure, telle que le jour du mois dune variable date/heure de format jj/mm/aaaa.
Attribuer une priodicit un ensemble de donnes. Cette opration fait apparatre

la bote de dialogue Dfinir des dates, utilise pour crer des variables date/heure composes dun ensemble de dates squentielles. Cette fonctionnalit est typiquement utilise pour lassociation de dates des donnes de sries chronologiques. Remarque : Les tches sont dsactives lorsque lensemble de donnes ne dispose pas des types de variables requis pour accomplir la tche. Si lensemble de donnes contient des variables sans chane par exemple, la tche permettant de crer une variable date/heure partir dune variable chane ne sapplique donc pas et se trouve alors dsactive.

Dates et heures dans SPSS


Les variables reprsentant les dates et heures dans SPSS possdent une variable de type numrique avec des formats daffichages correspondant aux formats date/heure spcifiques. Ces variables sont gnralement appeles variables date/heure. SPSS fait une distinction entre les variables date/heure reprsentant des dates et celles reprsentant des dures (par exp. 20 heures, 10 minutes et 15 secondes) qui ne dpendent de la date. Ces dernires sont appeles variables de dure et les premires sont appeles variables date ou variables date/heure. Pour une liste dtaille des formats daffichage, reportez vous au paragraphe intitul Date and Time de la section Universals du manuel SPSS Command Syntax Reference.
Variables date et date/heure. Les variables date disposent dun format de date tel que jj/mm/aaaa. Les variables date/heure disposent dun format date et heure tel que jj-mmm-aaaa hh:mm:ss. Les variables date et date/heure sont enregistres en interne en nombre de secondes depuis le 14 octobre 1582. Elles sont galement appeles variables de format date.

188 Chapitre 8

Les spcifications des annes deux ou quatres chiffres sont reconnues. Par dfaut, des annes deux chiffres reprsentent une plage commenant 69 annes avant la date courante et finissant 30 annes aprs. Vos paramtres Options permettent de dterminer la plage et de la configurer (slectionnez Options partir du menu Modifier, puis cliquez sur longlet Donnes. Les tirets, points, virgules, barres obliques ou espaces peuvent tre utiliss comme sparateurs dans les formats jour-mois-anne. Les mois peuvent tre reprsents par des chiffres, des chiffres romains, des abrviations trois lettres, ou bien ils peuvent tre noncs en entier. Les abbrviations trois lettres et les noms de mois noncs en entier doivent tre en anglais. Les noms de mois dautres langues ne seront pas reconnus.
Variables de dure. Les variables de dure disposent dun format reprsentant une

dure temporelle, telle que hh:mm. Elles sont enregistres en interne en nombres de secondes sans rfrence une date en particulier. Dans les spcifications temporelles (sapplique aux variables date/heure et dure), les deux points peuvent tre utiliss pour sparer les heures, les minutes et les secondes. Les heures et les minutes sont requises, les secondes restent optionnelles. A period is required to separate seconds from fractional seconds. Les heures peuvent tre avoir des valeurs illimites, cependant la valeur maximum est de 59 pour les minutes et de 59,999... pour les secondes.
Date et heure actuelles. La variable par dfaut $TIME contient la date et lheure actuelles. Elle reprsente le nombre de secondes coules depuis le 14 octobre 1582, jusqu la date et lheure auxquelles la commande de transformation utilise pour cette variable est excute.

Cration dune variable date/heure partir dune variable chane


Pour crer une variable date/heure partir dune variable chane :
E Slectionnez Crer une variable date/heure partir dune variable chane contenant une date ou une heure sur lcran de prsentation de lAssistant Date et heure.

189 Transformations de donnes

Slection dune variable chane convertir en une variable date/heure


Figure 8-17 Etape 1 : Cration dune variable date/heure partir dune variable chane

E Slectionnez la variable chane convertir dans la liste Variables. Notez que cette

liste affiche uniquement des variables chane.


E Dans la liste Motifs, slectionnez le motif correspondant la manire dont les dates

sont reprsentes par la variable chane. La liste Valeurs de lchantillon affiche les valeurs actuelles des variables slectionnes dans le fichier de donnes. Les valeurs de la variable chane qui ne correspondent pas au motif slectionn engendrent une valeur manquante par dfaut pour la nouvelle variable.

190 Chapitre 8

Spcification du rsultat de conversion dune variable chane en une variable date/heure


Figure 8-18 Etape 2 : Cration dune variable date/heure partir dune variable chane

E Entrez un nom pour la variable de rsultat. Le nom ne peut pas tre identique une

variable existante. Sinon, vous pouvez : slectionner un format date/heure pour la nouvelle variable dans la liste Formats des rsultats. attribuer une tiquette de variable descriptive la nouvelle variable.

Cration dune variable date/heure partir dun ensemble de variables


Pour fusionner un ensemble de variables existantes en une variable date/heure unique :
E Slectionnez Crer une variable date/heure partir de parties existantes de variables contenant une date ou une heure sur lcran de prsentation de lAssistant Date

et heure.

191 Transformations de donnes

Slection de variables fusionner en une variable date/heure unique


Figure 8-19 Etape 1 : Cration dune variable date/heure partir dun ensemble de variables

E Slectionnez les variables reprsentant les diffrentes parties de la date et de lheure.

Certaines combinaisons de slections ne sont pas autorises. Par exemple, la cration dune variable date/heure partir de Anne et Jour du mois nest pas valide car une fois Anne slectionn, une date complte est requise. Vous ne pouvez pas utiliser une variable date/heure existante comme lune des parties de la variable date/heure finale que vous crez. Les variables formant les parties de la nouvelle variable date/heure doivent correspondre des nombres entiers. Il est toutefois possible dutiliser une variable date/heure existante pour la partie Secondes de la nouvelle variable. Etant donn que les fractions de secondes sont autorises, la variable utilise pour Secondes ne doit pas ncessairement tre un nombre entier. Les valeurs, pour nimporte quelle partie de la nouvelle variable, non comprises dans lintervalle autoris engendrent une valeur manquante par dfaut pour la nouvelle variable. Par exemple, si, par inadvertance, vous utilisez une variable reprsentant le jour du mois pour le mois. Puisque la plage de valeurs valides de SPSS concernant les mois est comprise entre 1 et 113, une valeur manquante par

192 Chapitre 8

dfaut pour la nouvelle variable sera attribue toute observation dont la valeur Jour du mois (jour du mois) sera comprise dans la plage 14 et 31.

Spcification dune variable date/heure cre par la fusion de variables


Figure 8-20 Etape 2 : Cration dune variable date/heure partir dun ensemble de variables

E Entrez un nom pour la variable de rsultat. Le nom ne peut pas tre identique une

variable existante.
E Slectionnez un format de date/heure dans la liste Formats des rsultats.

Sinon, vous pouvez : attribuer une tiquette de variable descriptive la nouvelle variable.

193 Transformations de donnes

Ajout de valeurs aux variables date/heure ou suppression de valeurs des variables date/heure
Pour ajouter des valeurs aux variables date/heure ou en supprimer :
E Slectionnez loption Calculer les dates et les heures dans lcran de prsentation de

lAssistant Date et heure.

Slection du type de calcul effectuer avec les variables date/heure.


Figure 8-21 Etapes 1 : Ajout de valeurs aux variables date/heure ou suppression de valeurs des variables date/heure

Ajout dune dure une date ou Suppression dune dure dune date. Utilisez cette

option pour ajouter des valeurs la variable de format date ou supprimer des valeurs dune variable de format date. Vous pouvez ajouter ou supprimer des dures avec des valeurs fixes comme 10 jours ou les valeurs dune variable numrique, comme une variable reprsentant les annes.

194 Chapitre 8

Calculer le temps coul entre deux dates. Utilisez cette option pour obtenir la

diffrence entre les deux dates comme mesure dans une unit choisie. Par exemple, vous pouvez obtenir le nombre dannes ou le nombre de jours sparant les deux dates.
Supprimer deux dures. Utilisez cette option pour obtenir la diffrence entre deux

variables ayant des formats de dure tels que hh:mm ou hh:mm:ss. Remarque : Les tches sont dsactives lorsque lensemble de donnes ne dispose pas des types de variables requis pour accomplir la tche. Par exemple, si lensemble de donnes ne dispose pas de deux variables avec des formats de dure, la tche permettant alors de supprimer deux dures ne sapplique plus et se trouve alors dsactive.

Ajout dune dure une date ou suppression dune dure dune date
Pour ajouter une dure variable de format date ou supprimer une dure dune variable de format date :
E Slectionnez Ajout dune dure une date ou Suppression dune dure dune date sur

lcran intitul Effectuer des calculs sur les dates de lAssistant Date et heure.

195 Transformations de donnes

Slection dune variable date/heure et dune dure ajouter ou supprimer


Figure 8-22 Etape 2 : Ajout ou suppression dune dure

E Slectionnez une variable date (ou heure). E Slectionnez une variable dure ou entrez une valeur dune dure constante. Les

variables utilises pour les dures ne peuvent pas tre des variables date ou des variables date/heure. Il peut sagir de variables de dure ou de simples variables numriques.
E Slectionnez lunit reprsente par la dure dans la liste droulante. Slectionnez Dure si vous utilisez une variable et que celle-ci est exprime sous la forme dune

dure, telle que hh:mm ou hh:mm:ss.

196 Chapitre 8

Spcification du rsultat de lajout ou de la suppression dune dure dans une variable date/heure
Figure 8-23 Etape 3 : Ajout ou suppression dune dure

E Entrez un nom pour la variable de rsultat. Le nom ne peut pas tre identique une

variable existante. Sinon, vous pouvez : attribuer une tiquette de variable descriptive la nouvelle variable.

Suppression de variables de format date


Pour supprimer deux variables de format date :
E Slectionnez Calculer le temps coul entre deux dates sur lcran de lAssistant Date

et heure intitul Effectuer les calculs sur les dates.

197 Transformations de donnes

Slection des variables de format date supprimer


Figure 8-24 Etape 2 : Suppression de dates

E Slectionnez les variables supprimer. E Slectionnez lunit du rsulat dans la liste droulante.

198 Chapitre 8

Spcification du rsultat de suppression de deux variables de format date


Figure 8-25 Etape 3 : Suppression de dates

E Entrez un nom pour la variable de rsultat. Le nom ne peut pas tre identique une

variable existante. Sinon, vous pouvez : attribuer une tiquette de variable descriptive la nouvelle variable.

Suppression de variables de dure


Pour supprimer deux variables de dure :
E Slectionnez Supprimer deux dures sur lcran intitul Effectuer des calculs sur

les dates de lAssistant date et heure .

199 Transformations de donnes

Slection de variables de dure supprimer


Figure 8-26 Etape 2 : Suppression de dures

E Slectionnez les variables supprimer.

200 Chapitre 8

Spcification du rsultat de suppression de deux variables de dure


Figure 8-27 Etape 3 : Suppression de dures

E Entrez un nom pour la variable de rsultat. Le nom ne peut pas tre identique une

variable existante.
E Slectionnez un format de dure dans la liste Formats des rsultats.

Sinon, vous pouvez : attribuer une tiquette de variable descriptive la nouvelle variable.

Extraction dune partie dune variable date/heure


Pour extraire un composant (lanne par exemple) dune variable date/heure :
E Slectionnez Extraire une partie dune variable date ou heure sur lcran de prsentation

de lAssistant Date et heure.

201 Transformations de donnes

Slection du composant extraire dune variable date/heure


Figure 8-28 Etape 1 : Obtention dune partie dune variable date/heure

E Slectionnez la variable contenant la partie date ou heure extraire. E Slectionnez la partie de la variable extraire dans la liste droulante. Vous pouvez

extraire les informations des dates qui ne sont pas explicitement affiches dans la date, telles que le jour de la semaine.

202 Chapitre 8

Spcification du rsultat obtenu par lextraction dun composant dune variable date/heure
Figure 8-29 Etape 2 : Obtention dune partie dune variable date/heure

E Entrez un nom pour la variable de rsultat. Le nom ne peut pas tre identique une

variable existante.
E Si vous extrayez la partie date ou heure dune variable date/heure, vous devez alors

slectionner un format dans la liste Formats des rsultats. Les observations pour lesquelles le format du rsultat nest pas requis, la liste Format du rsultat sera dsactive. Sinon, vous pouvez : attribuer une tiquette de variable descriptive la nouvelle variable.

203 Transformations de donnes

Transformation de donnes pour srie chronologique


Plusieurs transformations de donnes utiles pour les analyses de sries chronologiques sont fournies : Gnration de variables de date pour tablir une priodicit et faire la distinction entre les priodes historiques, de validation et de prvision. Cration de nouvelles variables de sries chronologiques sous forme de fonctions de variables de sries chronologiques existantes. Remplacement des valeurs manquantes spcifies et des valeurs manquantes par dfaut par des estimations bases sur une mthode parmi plusieurs. Une srie chronologique est obtenue par mesure rgulire dune variable (ou dun groupe de variables) sur une certaine priode. Les transformations de donnes de sries chronologiques exigent une structure de fichier de donnes dans laquelle chaque ligne reprsente un groupe dobservations une heure diffrente, et lintervalle de temps entre les observations est uniforme.

Dfinir des dates


La bote de dialogue Dfinir des dates vous permet de gnrer des variables de date pouvant tre utilises pour tablir la priodicit de Sries chronologiques et pour tiqueter le rsultat danalyses de sries chronologiques.
Figure 8-30 Bote de dialogue Dfinir des dates

Les observations sont. Dfinit lintervalle de temps utilis pour gnrer des dates.

204 Chapitre 8 Non dat supprime toutes les variables de date prcdemment dfinies. Toutes les

variables portant les noms suivants sont supprimes : anne_, trimestre_, mois_, semaine_, jour_, heure_, minute_, seconde_ et date_.
Autres indique la prsence de variables de date personnalises cres avec la

syntaxe de commande (par exemple, une semaine de travail de quatre jours). Cet lment reflte simplement ltat actuel de lensemble de donnes actif. Sa slection dans la liste est sans effet.
La premire observation est. Dfinit la valeur de la date de dpart, qui est affecte la

premire observation. Des valeurs squentielles, bases sur lintervalle de temps, sont affectes aux observations ultrieures.
Priodicit au niveau suprieur. Indique une variation cyclique rptitive, telle que le

nombre de mois dans une anne ou le nombre de jours de la semaine. La valeur affiche indique la valeur maximale que vous pouvez entrer. Une nouvelle variable numrique est cre pour chaque composant utilis pour dfinir la date. Les noms des nouvelles variables se terminent par un trait de soulignement. Une variable descriptive chane, date_, est galement cre partir des composants. Par exemple, si vous avez slectionn semaines, jours, heures, quatre nouvelles variables sont cres : semaine_, jour_, heure_ et date_. Si des variables de date ont t dj dfinies, elles sont remplaces lorsque vous dfinissez de nouvelles variables de date portant le mme nom que les variables de date existantes.
Pour dfinir des dates pour des donnes de sries chronologiques
E A partir des menus, slectionnez : Donnes Dfinir des dates E Slectionnez un intervalle de temps dans la liste Les observations sont. E Entrez les valeurs dfinissant la date de dpart, qui dtermine la date affecte

la premire observation.

205 Transformations de donnes

Variables de date versus variables de format date


Les variables de date cres avec Dfinir les dates ne doivent pas tre confondues avec les variables de format date, dfinies dans laffichage des variables de lditeur de donnes. Les variables de date sont utilises pour crer une priodicit pour les donnes de sries chronologiques. Les variables de format date reprsentent des dates et/ou des heures affiches selon divers formats de date/heure. Les variables de date sont de simples entiers reprsentant le nombre de jours, de semaines, dheures, etc., partir dun point de dpart spcifi par lutilisateur. En interne, la plupart des variables de format date sont stockes sous la forme du nombre de secondes coules depuis le 14 octobre 1582.

Crer la srie chronologique


La bote de dialogue Crer la srie chronologique vous permet de crer de nouvelles variables bases sur des fonctions de variables numriques de Sries chronologiques existantes. Ces valeurs transformes sont utiles dans de nombreuses procdures danalyses de sries chronologiques. Par dfaut, les noms de nouvelles variables reprennent les six premiers caractres de la variable existante utilise pour les crer, suivis dun trait de soulignement et dun numro squentiel. Par exemple, pour la variable prix, le nom de la nouvelle variable serait prix_1. Les nouvelles variables conservent toute tiquette de valeur dfinie des variables dorigine. Les fonctions disponibles, permettant de crer des variables de sries chronologiques, incluent les fonctions de diffrences, de moyennes mobiles, de mdianes mobiles, de dcalages et de dcalage ngatif.

206 Chapitre 8 Figure 8-31 Bote de dialogue Crer la srie chronologique

Pour crer des variables chronologiques


E A partir des menus, slectionnez : Transformer Crer la srie chronologique E Slectionnez la fonction de sries chronologiques que vous dsirez utiliser pour

transformer les variables dorigine.


E Slectionnez les variables partir desquelles vous dsirez crer de nouvelles variables

de sries chronologiques. Seules des variables numriques peuvent tre utilises. Sinon, vous pouvez : Entrer des noms de variables pour remplacer les noms des nouvelles variables par dfaut. Remplacer la fonction par une variable slectionne.

207 Transformations de donnes

Fonctions de transformation de sries chronologiques


Diffrence. Diffrence non saisonnire entre les valeurs successives dans les sries. Lordre est le nombre des valeurs prcdentes utilis pour calculer la diffrence. Comme une observation est perdue pour chaque ordre de diffrence, les valeurs manquantes par dfaut apparaissent au dbut des sries. Par exemple, si lordre de diffrence est 2, les deux premires observations contiendront la valeur manquante par dfaut pour la nouvelle variable. Diffrence saisonnire. Diffrence entre des valeurs de sries spares par un intervalle constant. Lintervalle est bas sur la priodicit actuellement dfinie. Pour calculer des diffrences saisonnires, vous devez disposer de variables de date dfinies (Menu Donnes, Dfinir les dates) qui incluent une composante priodique (telle que les mois de lanne). Lordre est le nombre de priodes saisonnires utilis pour calculer la diffrence. Le nombre dobservations avec la valeur manquante par dfaut au dbut des sries est gal la priodicit multiplie par lordre. Par exemple, si la priodicit courante est 12 et lordre 2, les 24 premires observations auront la valeur manquante par dfaut pour nouvelle variable. Moyenne mobile centre. Moyenne dun intervalle de valeurs de sries entourant et

incluant la valeur courante. Lintervalle est le nombre de valeurs de sries utilis pour calculer la moyenne. Si lintervalle est pair, la moyenne mobile est calcule en faisant la moyenne de chaque paire de moyennes non centres. Le nombre dobservations avec la valeur manquante par dfaut au dbut et la fin des sries pour un intervalle de n est gal n/2 pour des valeurs dintervalles paires et impaires. Par exemple, si lintervalle est 5, le nombre dobservations avec la valeur manquante par dfaut au dbut et la fin des sries est 2.
Moyenne mobile prcdente. Moyenne de lintervalle de valeurs des sries prcdant

la valeur courante. Lintervalle est le nombre de valeurs de sries prcdentes utilis pour calculer la moyenne. Le nombre dobservations avec la valeur manquante par dfaut au dbut des sries est gal la valeur de lintervalle.
Mdianes mobiles. Mdiane dun intervalle de valeurs de sries entourant et incluant

la valeur courante. Lintervalle est le nombre de valeurs de sries utilis pour calculer la mdiane. Si lintervalle est pair, la mdiane est calcule en faisant la moyenne de chaque paire de mdianes non centres. Le nombre dobservations avec la valeur manquante par dfaut au dbut et la fin des sries pour un intervalle de n est gal n/2 pour des valeurs dintervalles paires et impaires. Par exemple, si lintervalle

208 Chapitre 8

est 5, le nombre dobservations avec la valeur manquante par dfaut au dbut et la fin des sries est 2.
Somme cumule. Somme cumule des valeurs des sries concurrence de la valeur courante, y compris celle-ci. Dcalage positif. Valeur dune observation prcdente, base sur lordre de dcalage spcifi. Lordre est le nombre dobservations antrieures lobservation courante partir de laquelle la valeur est obtenue. Le nombre dobservations avec la valeur manquante par dfaut au dbut des sries est gal la valeur de lordre. Dcalage ngatif. Valeur dune observation ultrieure, base sur lordre de dcalage

ngatif spcifi. Lordre est le nombre dobservations aprs lobservation courante partir de laquelle la valeur est obtenue. Le nombre dobservations avec la valeur manquante par dfaut la fin des sries est gal la valeur de lordre.
Lissage. Nouvelles valeurs des sries bases sur un lisseur de donnes composes.

Le lisseur commence avec une mdiane mobile de 4, centre par une mdiane mobile de 2. Il relisse ensuite ces valeurs en appliquant une mdiane mobile de 5, puis une de 3, et du hanning (excution de moyennes pondres). Les rsidus sont calculs par soustraction des sries lisses des sries dorigine. Tout ce processus est ensuite rpt sur les rsidus calculs. Pour finir, les rsidus lisss sont calculs par soustraction des valeurs lisses obtenues la premire fois par le processus. On parle parfois de lissage T4253H.

Remplacer les valeurs manquantes


Les observations manquantes peuvent constituer un problme dans le cadre danalyses, et il arrive que des mesures de sries ne puissent tre calcules si des valeurs manquent dans les sries. Il arrive que la valeur dune observation donne ne soit tout simplement pas connue. De plus, une donne manquante peut provenir de lune des actions suivantes : Chaque degr de diffrentiation rduit la longueur dune srie de 1. Chaque degr de diffrentiation saisonnire rduit la longueur dune srie dune saison.

209 Transformations de donnes

Si vous crez de nouvelles sries contenant des prvisions relatives la fin de la srie existante (en cliquant sur un bouton Enregistrer et en effectuant les choix appropris), les sries dorigine et les sries de rsidus gnres auront des valeurs manquantes pour les nouvelles observations. Certaines transformations (la transformation log par exemple) gnrent des donnes manquantes pour certaines valeurs des sries dorigine. Les donnes manquantes situes au dbut ou la fin dune srie ne posent aucun problme : elles rduisent simplement la longueur utile de la srie. Les trous situs au milieu dune srie (donnes manquantes intgres) peuvent reprsenter un problme beaucoup plus srieux. Ltendue du problme dpend de la procdure danalyse utilise. La bote de dialogue Remplacer les valeurs manquantes vous permet de crer de nouvelles variables Sries chronologiques partir de variables existantes, en remplaant les valeurs manquantes par des estimations calcules selon une mthode. Par dfaut, les noms de nouvelles variables reprennent les six premiers caractres de la variable existante utilise pour les crer, suivis dun trait de soulignement et dun numro squentiel. Par exemple, pour la variable prix, le nom de la nouvelle variable serait prix_1. Les nouvelles variables conservent toute tiquette de valeur dfinie des variables dorigine.
Figure 8-32 Bote de dialogue Remplacer les valeurs manquantes...

210 Chapitre 8

Pour remplacer les valeurs manquantes par des variables de sries chronologiques
E A partir des menus, slectionnez : Transformer Remplacer les valeurs manquantes E Slectionnez la mthode destimation que vous dsirez utiliser pour remplacer les

valeurs manquantes.
E Slectionnez les variables dont vous voulez remplacer les valeurs manquantes.

Sinon, vous pouvez : Entrer des noms de variables pour remplacer les noms des nouvelles variables par dfaut. Changer la mthode destimation pour une variable slectionne.

Mthodes destimation pour le remplacement de valeurs manquantes


Moyenne de la srie. Remplace les valeurs manquantes par la moyenne de toute la

srie.
Moyenne des points voisins. Remplace les valeurs manquantes par la moyenne des

valeurs valides qui les entourent. Lintervalle des points voisins est le nombre de valeurs valides au-dessus et au-dessous de la valeur manquante utilise pour calculer la moyenne.
Mdiane des points voisins. Remplace les valeurs manquantes par la mdiane des valeurs valides qui les entourent. Lintervalle des points voisins est le nombre de valeurs valides au-dessus et au-dessous de la valeur manquante utilise pour calculer la mdiane. Interpolation linaire. Remplace les valeurs manquantes au moyen dune interpolation

linaire. La dernire valeur valide avant la valeur manquante et la premire valeur valide aprs la valeur manquante sont utilises pour linterpolation. Si la premire ou la dernire observation de la srie comporte une valeur manquante, celle-ci nest pas remplace.
Tendance linaire au point. Remplace les valeurs manquantes par la tendance linaire de ce point. Une rgression est effectue sur la srie existante selon une variable dindex dune chelle de 1 n. Les valeurs manquantes sont remplaces par les prvisions correspondantes.

211 Transformations de donnes

Notation de donnes avec des modles de prvision


Le processus consistant appliquer un modle de prvision un ensemble de donnes est appel notation des donnes. SPSS, Clementine et AnswerTree ont des procdures pour construire des modles de prvision comme les modles de rgression, de classification, de segmentation et de rseau neuronal. Une fois le modle construit, les spcifications de ce dernier sont enregistres dans un fichier XML contenant toutes les informations ncessaires pour reconstruire le modle. Le serveur SPSS fournit alors les moyens pour lire un fichier de modle XML et appliquer le modle un ensemble de donnes.
Exemple. Une demande de crdit est note comme tant risque en se basant sur

diffrents aspects du demandeur et du prt en question. Le rsultat de crdit obtenu partir du modle de risque est utilis pour accepter ou refuser la demande de prt. La notation est traite comme une transformation des donnes. Le modle sexprime en interne comme un ensemble de transformations numriques appliques un ensemble donn de variables, les variables indpendantes spcifies dans le modle, afin dobtenir une prvision. En ce sens, le processus de notation de donnes avec un modle donn est actuellement similaire lapplication dune fonction, telle la fonction de racine carre, un ensemble de donnes. La notation est uniquement disponible avec le serveur SPSS et peut tre effectue de faon interactive par les utilisateurs en travaillant en Mode danalyse distribue.. Pour la notation de larges fichiers de donnes, vous pouvez utiliser SPSS Batch Facility, une version excutable spare de SPSS fournie avec le serveur SPSS. Pour obtenir plus dinformations concernant lutilisation de SPSS Batch Facility, consultez SPSS Batch Facility Users Guide, fourni en tant que fichier PDF sur le CD du serveur SPSS. Le processus de notation comporte les tapes suivantes :
E Le chargement dun modle depuis un fichier au format XML (PMML). E Le calcul de vos rsultats sous forme dune nouvelle variable, en utilisant la fonction

ApplyModel ou StrApplyModel disponible dans la bote de dialogueCalculer la variable . Pour obtenir des dtails au sujet des fonctions ApplyModel ou StrApplyModel, consultez Expressions de notation dans la section Expressions de transformation de SPSS Command Syntax Reference.

212 Chapitre 8

Chargement dun modle enregistr


La bote de dialogue Charger un modle vous permet de charger des modles de prvision au format XML (PMML) et est seulement disponible lorsque vous travaillez en Mode danalyse distribue.. Le chargement des modles est une premire tape indispensable pour pouvoir les utiliser afin de noter les donnes.
Figure 8-33 Charger le rsultat du modle

Pour charger un modle


E A partir des menus, slectionnez : Transformer Prparer le modle Chargement du modle...

213 Transformations de donnes Figure 8-34 Bote de dialogue Prparer le modle Charger le modle

E Entrez un nom associer avec ce modle. Chaque modle charg doit avoir un

nom unique.
E Cliquez sur Fichier et slectionnez un fichier de modle. La bote de dialogue Ouvrir

le fichier en rsultant affiche les fichiers disponibles en mode danalyse distribue. Cela comprend les fichiers de lordinateur sur lequel le serveur SPSS est install et les fichiers de votre ordinateur local se trouvant dans des dossiers ou des lecteurs partags. Remarque : Lorsque vous notez des donnes, le modle sera appliqu aux variables dans lensemble de donnes actif portant les mmes noms que les variables du fichier de modle. Vous pouvez lier des variables du modle dorigine diffrentes variables de lensemble de donnes actif en utilisant la syntaxe de commande (voir la commande MODEL HANDLE).
Nom. Un nom utilis pour identifier ce modle. Les rgles pour la dnomination

correcte des modles est la mme que pour les noms de variableSPSS (reportez-vous Noms de variable dans Chapitre 5 p. 99), avec lajout du signe $ en tant que premier caractre. Vous utiliserez ce nom pour spcifier le modle lors de la notation de donnes avec les fonctions ApplyModel ou StrApplyModel.
Fichier. Le fichier XML (PMML) contenant les spcifications du modle.

214 Chapitre 8

Valeurs manquantes

Ce groupe doptions contrle le traitement des valeurs manquantes rencontres lors du processus de notation pour les variables indpendantes dfinies dans le modle. Une valeur manquante dans le contexte de la notation rfre lune des options suivantes : Une variable explicative ne contient pas de valeur. Pour les variables numriques, cela correspond la variable manquante par dfaut. Pour les variables de chane, cela correspond une chane nulle. La valeur a t dfinie comme manquante utilisateur dans le modle, pour lexplication donne. Les valeurs dfinies comme manquantes utilisateur dans lensemble de donnes actif mais pas dans le modle ne seront pas traites comme des valeurs manquantes lors du processus danalyse. La variable explicative est qualitative et la valeur nest pas lune des modalits dfinies dans le modle.
Utiliser la valeur de substitution. Tentative pour utiliser une valeur de substitution lors de la notation dobservations avec des valeurs manquantes. La mthode pour dterminer une valeur se substituant une valeur manquante dpend du modle de prvision. Modles SPSS. Pour des variables indpendantes dans une rgression linaire et

des modles discriminants, si la valeur moyenne de substitution pour les valeurs manquantes a t spcifie lors de la construction et lenregistrement du modle, alors cette valeur moyenne est utilise la place de la valeur manquante lors du calcul des notes et lors du processus de notation. Si cette valeur moyenne nest pas disponible, alors la valeur manquante par dfaut est retourne.
Modles AnswerTree et modles de commande SPSS TREE. Pour les modles

CHAID et Exhaustive CHAID, le plus gros nud enfant est slectionn pour une variable de scission manquante. Le plus gros nud enfant est celui possdant la plus large population parmi les nuds enfant utilisant des observations dchantillon dapprentissage. Pour les modles C&RT et QUEST, les variables de scission de substitution (le cas chant) sont utilises en premier. (Les variables de scission de substitution sont des variables de scission qui tentent de correspondre au mieux la variable de scission originale en utilisant des variables indpendantes alternatives.) Si aucune variable de scission de substitution nest spcifie ou si toutes les variables de scission de substitution sont manquantes, le plus gros nud enfant est utilis.

215 Transformations de donnes

Modles Clementine. Les modles de rgression linaire sont traits comme

indiqu pour les modles SPSS. Les modles de rgression logistique sont traits comme indiqu pour les modles de rgression logistique. Les modles C&RT Tree sont traits comme indiqu pour les modles C&RT sous les modles AnswerTree.
Modles de rgression logistique. Pour les covariables des modles de rgression

logistique, si une valeur moyenne de la variable indpendante a t inclue dans le modle enregistr, alors cette valeur moyenne est utilise la place de la valeur manquante dans le calcul des notes et les processus de notation. Si la variable indpendante est qualitative (par exemple un facteur dun modle de rgression logistique) ou si la valeur moyenne nest pas disponible, alors la valeur manquante par dfaut est retourne.
Utiliser la valeur manquante par dfaut Retourne la valeur manquante par dfaut lors de la notation dune observation comportant une valeur manquante.

Affichage dune liste de modles chargs


Vous pouvez obtenir une liste des modles actuellement chargs. A partir des menus (uniquement disponibles en mode danalyse distribue), choisissez :
Transformer Prparer le modle Lister le(s) modle(s)

Cela gnre un tableau Descriptions des modles. Ce tableau contient une liste des modles actuellement chargs et inclut le nom (appel description du modle) assign au modle, son type, le chemin daccs au fichier du modle et la mthode utilise pour traiter les valeurs manquantes.
Figure 8-35 Liste des modles chargs

216 Chapitre 8

Fonctions supplmentaires avec la syntaxe de commande


A partir de la bote de dialogue Charger le modle, vous pouvez coller vos slections dans une fentre de syntaxe et modifier la syntaxe de commande MODEL HANDLE en rsultant. Cela vous permet de : Lier les variables du modle original diffrentes variables de lensemble de donnes actif (avec la sous-commande MAP). Par dfaut, le modle sera appliqu aux variables dans lensemble de donnes actif portant les mmes noms que les variables du fichier de modle. Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Chapitre

Gestion et transformations de fichiers

Lorganisation des fichiers de donnes ne rpond pas toujours idalement vos besoins. Vous pouvez, par exemple, combiner des fichiers, trier des donnes dans un ordre diffrent, slectionner des sous-ensembles dobservations ou modifier lunit danalyse en regroupant les observations. De nombreuses possibilits de transformation de fichier sont disponibles, y compris la possibilit de :
Trier les donnes. Vous pouvez trier les observations en fonction de la valeur de

certaines variables.
Transposer des observations et des variables. Le format des fichiers de donnes SPSS lit les lignes comme des observations et les colonnes comme des variables. Vous pouvez inverser les lignes et les colonnes et lire les donnes selon le bon format pour les fichiers qui prsentent les informations dans lautre sens. Fusionner des fichiers. Vous pouvez fusionner des fichiers de donnes (au moins

deux). Vous pouvez associer des fichiers disposant des mmes variables mais prsentant des observations diffrentes, ou linverse.
Slectionner des sous-ensembles dobservations. Vous pouvez limiter votre analyse

un sous-ensemble dobservations ou effectuer des analyses simultanes sur diffrents sous-ensembles.


Agrger les donnes. Vous pouvez modifier lunit danalyse en agrgeant des observations en fonction de la valeur dune ou plusieurs variables de regroupement. Pondrer les donnes. La pondration des donnes concerne les analyses fondes

sur la valeur dune variable pondre.


Restructurer les donnes. Vous pouvez restructurer des donnes pour crer une observation (un enregistrement) partir de plusieurs observations ou crer plusieurs observations partir dune seule.
217

218 Chapitre 9

Trier les observations


Cette bote de dialogue permet de trier les observations (lignes) du fichier en fonction des valeurs dune ou plusieurs variables de tri. Vous pouvez trier les observations par ordre croissant ou dcroissant. Si vous slectionnez plusieurs variables de tri, les observations sont tries pour chaque variable au sein des modalits de la variable prcdente dans la liste Tri. Par exemple, si vous slectionnez Sexe comme premire variable de tri et Culture comme seconde variable de tri, les observations seront tries en fonction de la culture de chaque individu au sein de chaque modalit de la variable sexe. Pour les variables alphanumriques, les lettres en majuscules prcdent les minuscules dans lordre de tri. Par exemple, la valeur Oui prcde oui dans lordre de tri.
Figure 9-1 Bote de dialogue Trier les observations

Pour trier les observations


E A partir des menus, slectionnez : Donnes Trier les observations... E Slectionnez au moins une variable de tri.

219 Gestion et transformations de fichiers

Transposer
La transposition permet de crer un nouveau fichier dans lequel les lignes et les colonnes du fichier initial sont inverses pour que les observations (lignes) deviennent des variables (colonnes), et vice versa. SPSS gnre automatiquement de nouveaux noms pour les variables et affiche une liste de ces nouveaux noms. Une nouvelle variable de type chane contenant le nom de variable dorigine, case_lbl, est automatiquement cre. Si lensemble de donnes actif contient un ID (identifiant) ou une variable de nom dont les valeurs sont uniques, vous pouvez lutiliser comme variable de nom et employer ses valeurs comme noms de variable dans le fichier transpos. Sil sagit dune variable numrique, les noms de variables commencent par la lettre V, suivie de la valeur numrique. Les valeurs manquantes lutilisateur sont converties en valeurs manquantes par dfaut dans le fichier transpos. Pour conserver certaines de ces valeurs, modifiez la dfinition des valeurs manquantes dans laffichage des variables de lditeur de donnes.
Pour transposer des variables et des observations
E A partir des menus, slectionnez : Donnes Transposer E Slectionnez au moins une variable transposer en observation.

Fusionner des fichiers de donnes


SPSS vous permet de fusionner des donnes partir de deux fichiers et de deux faons diffrentes. Vous pouvez: Fusionner lensemble de donnes actif avec un autre fichier de donnes ouvert ou avec un fichier de donnes au format SPSS contenant les mmes variables mais des observations diffrentes. Fusionner lensemble de donnes actif avec un autre fichier de donnes ouvert ou avec un fichier de donnes au formant SPSS contenant les mmes variables mais des observations diffrentes.

220 Chapitre 9

Pour fusionner des fichiers


E A partir des menus, slectionnez : Donnes Fusionner des fichiers E Slectionnez Ajouter des observations ou Ajouter des variables. Figure 9-2

Ajouter des observations


Ajouter des observations fusionne lensemble de donnes actif avec un second ensemble de donnes ou avec un fichier de donnes au format SPSS contenant les mmes variables (colonnes) mais des observations (lignes) diffrentes. Par exemple, vous pouvez enregistrer la mme information sur des clients de deux secteurs de vente et grer ces donnes dans des fichiers spars pour chaque rgion. Le second ensemble de donnes peut tre un fichier de donnes externe au format SPSS ou un ensemble de donnes disponible dans la section actuelle.

221 Gestion et transformations de fichiers Figure 9-3 Bote de dialogue Ajouter des observations

Variables non communes : Variables exclure du nouveau fichier fusionn. Les

variables de lensemble de donnes actif sont identifies par un astrisque (*). Les variables dun autre ensemble de donnes sont identifies par un signe (+). Par dfaut, la liste contient : Des variables sans correspondance dans lautre fichier. Vous pouvez crer des paires avec les variables non communes et les inclure dans le nouveau fichier fusionn. Des variables contenant des donnes numriques dans lun des fichiers et des donnes alphanumriques dans lautre. Il est impossible de fusionner des variables numriques avec des variables alphanumriques. Des variables alphanumriques de longueur diffrente. La longueur dfinie pour une variable alphanumrique doit tre la mme dans les deux fichiers.
Variables dans un nouvel ensemble de donnes actif. Variables inclure dans le nouveau fichier actif. Par dfaut, toutes les variables dont le nom et le type correspond sont ajoutes la liste.

Vous pouvez supprimer des variables de la liste si vous ne les souhaitez pas dans le fichier fusionn. Les variables non communes incluses dans le fichier fusionn contiendront des donnes manquantes pour les observations du fichier qui ne les contient pas.

222 Chapitre 9

Indiquer le fichier source dans la variable. Indique le fichier de donnes source pour chaque observation. Cette variable a une valeur de 0 pour les observations de l'ensemble de donnes actif et une valeur de 1 pour les observations du fichier de donnes externe. Pour fusionner des fichiers de donnes avec les mmes variables mais des observations diffrentes
E Ouvrez au moins un des fichiers de donnes que vous souhaitez fusionner. Sil existe

plusieurs ensembles de donnes ouverts, vous devez slectionner celui que vous souhaitez fusionner pour en faire lensemble de donnes actif. Les observations de ce fichier apparaissent en premier dans le nouveau fichier fusionn.
E A partir des menus, slectionnez : Donnes Fusionner des fichiers Ajouter des observations E Slectionnez lensemble de donnes ou le fichier de donnes au format SPSS

fusionner avec lensemble de donnes actif.


E Supprimez toutes les variables indsirables de la liste Variables du nouvel ensemble

de donnes actif.
E Ajouter des paires de variables de la liste des variables non communes qui reprsentent

les mmes informations mais enregistres sous des noms diffrents dans les deux fichiers. Par exemple, la date de naissance peut tre enregistre sous datenais dans un fichier et n_le dans lautre.
Slectionner une paire de variables non communes
E Cliquez sur lune des variables dans la liste Variables non communes. E Tout en maintenant la touche Ctrl enfonce, cliquez sur lautre variable dans la

liste. (Appuyez sur la touche Ctrl et cliquez en mme temps sur le bouton gauche de la souris.)
E Cliquez sur Apparier pour dplacer la paire de variables dans la liste Variables du

nouvel ensemble de donnes actif. (Le nom de variable de lensemble de donnes est utilis comme nom de variable dans le fichier fusionn.)

223 Gestion et transformations de fichiers Figure 9-4 Slectionner des paires de variables laide du Ctrl/click

Ajout dobservations : Renommer


Vous pouvez renommer les variables de lensemble de donnes actif ou de lautre ensemble de donnes avant de les dplacer de la liste des variables non communes dans la liste des variables ajouter au fichier fusionn. Renommer des variables vous permet de : Utiliser le nom de la variable de lautre ensemble de donnes plutt que celui de lensemble de donnes actif pour les paires de variables. Inclure deux variables portant le mme nom mais de type diffrent ou de longueur diffrente. Par exemple, pour inclure la fois la variable numrique sexe de lensemble de donnes actif et la variable alphanumrique sexe de lautre ensemble de donnes, vous devez dabord les renommer.

224 Chapitre 9

Ajout dobservations : Informations du dictionnaire


Tous les informations du dictionnaire existantes (tiquettes de variable et de valeurs, valeurs manquantes utilisateur, formats daffichage) dans lensemble de donnes actif sont appliques au fichier de donnes fusionn. Si certaines informations du dictionnaire relatives une variable ne sont pas dfinies dans lensemble de donnes actif, les informations du dictionnaire de lautre ensemble de donnes sappliquent. Si lensemble de donnes actif contient des tiquettes de valeurs non dfinies ou des valeurs manquantes de type utilisateur, toutes les autres tiquettes de valeurs ou les valeurs manquantes de type utilisateur pour cette variable dans lautre ensemble de donnes sont ignores.

Fusion de plus de deux sources de donnes


A laide de la syntaxe de commande, vous pouvez fusionner jusqu 50 ensembles de donnes et/ou de fichiers de donnes. Pour plus dinformations, reportez-vous la commande ADD FILES dans SPSS Command Syntax Reference (disponible depuis le menu Aide).

Ajouter des variables


Ajouter des variables fusionne lensemble de donnes actif avec un autre fichier de donnes ouvert ou avec un fichier de donnes SPSS contenant les mmes observations (lignes) mais des variables (colonnes) diffrentes. Par exemple, vous souhaitez fusionner un fichier de donnes contenant les rsultats dun test pralable avec un autre fichier contenant les rsultats dun test final. Les observations doivent tre prsentes dans le mme ordre dans les deux ensembles de donnes. Si une ou plusieurs cls dappariement sont utilises pour apparier les observations, les deux ensembles de donnes doivent prsenter ces cls dappariement par ordre croissant. Les noms de variable du second fichier, redondants avec les noms de lensemble de donnes actif, sont exclus par dfaut. En effet, SPSS part du principe que ces variables contiennent des informations redondantes.

225 Gestion et transformations de fichiers

Indiquer le fichier source dans la variable. Indique le fichier de donnes source pour chaque observation. Cette variable a une valeur de 0 pour les observations de l'ensemble de donnes actif et une valeur de 1 pour les observations du fichier de donnes externe.
Figure 9-5 Bote de dialogue Ajouter des variables

Variables exclues : Variables exclure du nouveau fichier fusionn. Par dfaut, cette liste contient tous les noms de variable de lautre ensemble de donnes qui sont redondants avec ceux de lensemble de donnes actif. Les variables de lensemble de donnes actif sont identifies par un astrisque (*). Les variables dun autre ensemble de donnes sont identifies par un signe (+). Si vous souhaitez inclure une variable exclue avec un nom redondant dans le fichier fusionn, vous pouvez le renommer puis lajouter la liste des variables inclure. Nouvel ensemble de donnes actif. Variables inclure dans le nouvel ensemble de donnes actif fusionn. Par dfaut, tous les noms de variables uniques dans les deux ensembles de donnes sont inclus dans la liste. Cls dappariement : Si certaines observations dans un ensemble de donnes nont

pas de concordance dans lautre ensemble de donnes (cest--dire que certaines observations manquent dans un ensemble de donnes), utilisez les cls dappariement pour identifier et correctement apparier les observations des deux ensembles de

226 Chapitre 9

donnes. Vous pouvez galement utiliser ces cls avec des fichiers de consultation de table. Les cls dappariement doivent avoir le mme nom dans les deux ensembles de donnes. Les deux ensembles de donnes doivent prsenter les variables par ordre croissant ou dcroissant et lordre des variables de la liste cls dappariement doit tre le mme que lordre de tri. Les observations qui nont pas de correspondance dans les cls dappariement sont inclus dans le fichier fusionn mais elles sont fusionnes avec les observations de lautre fichier. Les observations sans correspondance contiennent des valeurs uniquement pour les variables du fichier duquel elles sont issues. Les variables de lautre fichier contiennent la valeur manquante par dfaut.
Lensemble de donnes actif ou non actif est une table code. Une table code ou un fichier de consultation de table, est un fichier dans lequel les donnes de chaque observation peuvent sappliquer plusieurs observations de lautre fichier. Par exemple, si un des fichiers contient des informations sur les diffrents membres dune famille (sexe, ge, niveau scolaire) et lautre des informations gnrales sur la famille (revenu global, taille, habitat), vous pouvez utiliser le fichier sur la famille comme fichier de consultation et appliquer les informations gnrales chaque membre de la famille dans le fichier fusionn. Pour fusionner des fichiers avec les mmes variables mais des observations diffrentes
E Ouvrez au moins un des fichiers de donnes que vous souhaitez fusionner. Si il y a

plusieurs ensembles de donnes ouverts, faites de lun de celui dont vous souhaitez fusionner lensemble de donnes actif.
E A partir des menus, slectionnez : Donnes Fusionner des fichiers Ajouter des variables E Slectionnez lensemble de donnes ou le fichier de donnes au format SPSS

fusionner avec lensemble de donnes actif.


Slectionnez des cls dappariement.
E Slectionnez les variables du fichier externe (+) dans la liste des Variables exclues.

227 Gestion et transformations de fichiers E Slectionnez Apparier les observations sur les cls des fichiers tris. E Ajoutez des variables la liste des cls dappariement.

Les cls dappariement doivent exister la fois dans lensemble de donnes actif et dans lautre. Les deux ensembles de donnes doivent prsenter les variables par ordre croissant ou dcroissant et lordre des variables de la liste cls dappariement doit tre le mme que lordre de tri.

Ajouter des variables: Renommer


Vous pouvez renommer les variables de lensemble de donnes actif ou de lautre ensemble de donnes avant de les dplacer dans la liste des variables ajouter au fichier fusionn. Ceci est particulirement important si vous souhaitez inclure deux variables portant le mme nom mais contenant des informations diffrentes.

Fusion de plus de deux sources de donnes


A laide de la syntaxe de commande, vous pouvez fusionner jusqu 50 ensembles de donnes et/ou de fichiers de donnes. Pour plus dinformations, reportez-vous la commande MATCH FILES dans SPSS Command Syntax Reference (disponible depuis le menu Aide).

Agrger les donnes


Loption Agrger les donnes permet dagrger des groupes dobservations de lensemble de donnes actif dans des observations uniques. Elle permet galement de crer un nouveau fichier agrg ou de nouvelles variables (dans lensemble de donnes actif) qui contiennent des donnes agrges. Les observations sont agrges en fonction de la valeur dun ou de plusieurs critres dagrgation (regroupement). Si vous crez un fichier de donnes agrges, il contient une observation pour chaque groupe dfini par les critres dagrgation. Par exemple, sil existe un critre dagrgation comprenant deux valeurs, le nouveau fichier de donnes contiendra uniquement deux observations. Si vous ajoutez des variables dagrgation lensemble de donnes actif, le fichier de donnes nest pas agrg. Chaque observation disposant des mmes valeurs des critres dagrgation reoit les mmes valeurs pour les nouvelles

228 Chapitre 9

variables dagrgation. Par exemple, si le seul critre dagrgation est sexe, tous les hommes reoivent la mme valeur pour une nouvelle variable dagrgation qui reprsente lge moyen.
Figure 9-6 Bote de dialogue Agrger les donnes

Critre(s) dagrgation. Les observations sont regroupes selon les valeurs des critres dagrgation. Chaque combinaison unique de valeurs de critres dagrgation dfinit un groupe. Lorsque vous crez un fichier de donnes agrges, tous les critres dagrgation sont enregistrs dans le nouveau fichier avec leurs noms et les informations du dictionnaire. Le critre dagrgation peut tre de type numrique ou chane. Variable(s) agrge(s). Les variables source sont utilises avec des fonctions dagrgation pour crer de nouvelles variables dagrgation. Le nom de la variable dagrgation est suivi ventuellement dune tiquette de variable entre guillemets, le

229 Gestion et transformations de fichiers

nom de la fonction dagrgation et du nom de la variable source entre parenthses. Les variables source pour les fonctions dagrgation doivent tre numriques. Vous pouvez galement passer outre les noms de variables dagrgation par dfaut, ajouter des tiquettes de variable descriptive et modifier les fonctions utilises pour calculer la valeur des donnes agrges. Vous pouvez galement crer une variable qui contienne le nombre dobservations dans chaque agrgat.
Pour agrger un fichier de donnes
E A partir des menus, slectionnez : Donnes Agrger E Slectionnez un ou plusieurs critres dagrgation qui dfinissent la faon dont les

observations sont groupes pour crer des donnes agrges.


E Slectionnez une ou plusieurs variables dagrgation. E Slectionnez une fonction dagrgation pour chaque variable dagrgation.

Enregistrement des rsultats agrgs

Vous pouvez ajouter des variables dagrgation lensemble de donnes actif ou crer un nouveau fichier de donnes agrges.
Ajouter des variables agrges un ensemble de donnes actif. De nouvelles

variables bases sur les fonctions d'agrgation sont ajoutes l'ensemble de donnes actif. Le fichier de donnes lui-mme n'est pas agrg. Chaque observation disposant des mmes valeurs des critres d'agrgation reoit les mmes valeurs pour les nouvelles variables d'agrgation.
Crer un nouvel ensemble de donnes ne contenant que les variables agrges.

Enregistre les donnes agrges dans un nouvel ensemble de donnes de la session en cours. L'ensemble de donnes comprend les critres d'agrgation qui dfinissent les observations agrges et toutes les variables d'agrgation dfinies par les fonctions d'agrgation. L'ensemble de donnes actif n'est pas affect.
Crer un nouveau fichier de donnes ne contenant que les variables agrges.

Enregistre les donnes agrges dans un fichier de donnes externe. Le fichier comprend les critres d'agrgation qui dfinissent les observations agrges

230 Chapitre 9

et toutes les variables d'agrgation dfinies par les fonctions d'agrgation. L'ensemble de donnes actif n'est pas affect.
Options de tri des fichiers de donnes volumineux

Pour les fichiers de donnes volumineux, il peut tre plus judicieux dagrger des donnes pralablement tries.
Fichier dj tri sur les critres d'agrgation. Si les donnes ont dja t tries en fonction des valeurs des critres d'agrgation, cette option permet une excution plus rapide de la procdure et une conomie de mmoire. Utilisez cette option avec prcaution.

Les donnes doivent tre tries en fonction des valeurs des critres dagrgation, dans le mme ordre que les critres dagrgation indiqus pour la procdure Agrger les donnes. Si vous ajoutez des variables lensemble de donnes actif, slectionnez cette option uniquement si les donnes sont tries dans lordre croissant en fonction des critres dagrgation.
Trier le fichier avant l'agrgation. Dans de trs rares instances avec des fichiers de

donnes volumineux, il peut s'avrer ncessaire de trier le fichier de donnes en fonction des valeurs des critres d'agrgation avant de procder l'agrgation. Cette option est dconseille, sauf si vous rencontrez des problmes de mmoire/performances.

Agrgation de donnes : fonction dagrgation


Cette bote de dialogue indique la fonction utiliser pour calculer la valeur des donnes agrges pour les variables slectionnes dans la liste des variables agrges de la Bote de dialogue Agrger des donnes. Les fonctions dagrgation comprennent : Des fonctions rcapitulatives, notamment la moyenne, la mdiane, lcart type et la somme. Le nombre dobservations (pondres et non pondres, manquantes et non manquantes).

231 Gestion et transformations de fichiers

Le pourcentage ou la proportion des valeurs infrieures ou suprieures une valeur donne. Le pourcentage ou la proportion des valeurs appartenant ou nappartenant pas un intervalle donn.
Figure 9-7 Bote de dialogue Fonction dagrgation

Agrgation de donnes : nom et tiquette de variable


SPSS attribue par dfaut des noms aux variables agrges dans le nouveau fichier de donnes. Cette bote de dialogue vous permet de changer le nom des variables slectionnes dans la liste des variables dagrgation et vous propose une tiquette descriptive des variables. Pour plus d'informations, reportez-vous Noms de variable dans Chapitre 5 p. 99.

232 Chapitre 9 Figure 9-8 Bote de dialogue Nom et tiquette de variable

Scinder un fichier
Scinder un fichier vous permet de scinder un fichier de donnes en plusieurs classes, en fonction des valeurs dune ou plusieurs variables de regroupement. Si vous slectionnez plusieurs variables de regroupement, les observations sont regroupes pour chaque variable au sein des modalits de la variable prcdente dans la liste des variables de regroupement. Par exemple, si vous slectionnez sexe comme premire variable de regroupement et culture comme seconde, les observations seront classes en fonction de lorigine culturelle au sein de chaque modalit de la variable sexe. Vous pouvez spcifier jusqu 8 variables de regroupement. Chaque bloc de huit caractres dans une variable alphanumrique longue (plus de 8 caractres) est considr comme une variable par rapport la limite de 8 variables de regroupement. Les observations doivent tre tries en fonction des valeurs des variables de regroupement, suivant lordre dans lequel les variables sont prsentes dans la liste des variables de regroupement. Si le fichier de donnes nest pas tri, slectionnez Tri suivant les variables de regroupement.

233 Gestion et transformations de fichiers Figure 9-9 Bote de dialogue Scinder un fichier

Comparer les classes. Les classes du fichier scind sont prsentes ensemble pour

permettre la comparaison. En ce qui concerne les tableaux pivotants, un seul dentre eux est cr et chaque variable du fichier scind peut tre dplace entre les dimensions du tableau. Quant aux diagrammes, un diagramme distinct est cr pour chaque groupe du fichier scind et ces diagrammes sont affichs ensemble dans le Viewer.
Sparer rsultats par groupes. Tous les rsultats de chaque procdure sont affichs sparment pour chaque classe du fichier scind. Pour scinder un fichier de donnes pour analyse
E A partir des menus, slectionnez : Donnes Scinder un fichier E Slectionnez Comparer les groupes ou Sparer rsultats par groupes. E Slectionnez une ou plusieurs variables de regroupement.

234 Chapitre 9

Slectionner des observations


Slectionner les observations propose une srie de mthodes pour slectionner un sous-groupe dobservations en fonction de certains critres qui incluent variables et expressions complexes. Vous pouvez galement slectionner un chantillon alatoire dobservations. Les critres utiliss pour dfinir un sous-groupe comprennent : Plages et valeurs de variables Plages de dates et dheures Nombres dobservations (lignes) Expressions arithmtiques Expressions logiques Fonctions
Figure 9-10 Bote de dialogue Slectionner des observations

Toutes les observations. Dsactive le filtrage et utilise toutes les observations.

235 Gestion et transformations de fichiers

Selon une condition logique. Utilisez une expression conditionnelle pour slectionner

des observations. Si le rsultat de l'expression conditionnelle est vrai, l'observation est slectionne. Si le rsultat est faux ou manquant, l'observation n'est pas slectionne.
Par chantillonnage alatoire. Slectionne un chantillon alatoire bas sur un

pourcentage approximatif ou un nombre exact d'observations.


Dans un intervalle de temps ou d'observations. Permet de slectionner des observations partir d'un intervalle d'observations ou d'un intervalle de date/temps. Selon une variable filtre. Utilise comme filtre la variable numrique slectionne dans le fichier de donnes. Les observations dont la valeur de la variable filtre est autre que manquante ou nulle sont slectionnes.

Rsultats

Cette section contrle le traitement des observations exclues. Vous pouvez choisir lune des options suivantes pour traiter les observations exclues :
Filtrez les observations exclues. Les observations exclues ne sont pas incluses

dans lanalyse, mais restent dans lensemble de donnes. Vous pouvez utiliser les observations exclues ultrieurement dans la session si vous dsactivez le filtrage. Si vous slectionnez un chantillon alatoire ou si vous slectionnez des observations sur la base dune expression conditionnelle, une variable nomme filter_$ est gnre ; elle comporte la valeur 1 pour les observations slectionnes et la valeur 0 pour les observations exclues.
Copiez les observations slectionnes dans lensemble de donnes. Les

observations slectionnes sont copies dans un nouvel ensemble de donnes ; lensemble de donnes dorigine reste inchang. Les observations exclues ne sont pas incluses dans le nouvel ensemble de donnes et sont conserves dans leur tat dorigine dans lensemble de donnes dorigine.
Supprimez les observations exclues. Les observations exclues sont supprimes de

lensemble de donnes. Vous pouvez rcuprer les observations supprimes uniquement en fermant le fichier sans enregistrer les modifications et en louvrant nouveau. La suppression des observations est dfinitive si vous enregistrez les modifications apportes au fichier de donnes. Remarque : Si vous supprimez des observations exclues et enregistrez le fichier, vous ne pouvez pas rcuprer ces observations.

236 Chapitre 9

Slection dun sous-groupe dobservations


E A partir des menus, slectionnez : Donnes Slectionner des observations E Slectionnez une des mthodes de slection dobservations. E Spcifiez les critres de slection des observations.

Slectionner observations : Si
La bote de dialogue vous permet de slectionner des sous-ensembles dobservations laide dexpressions conditionnelles. Une expression conditionnelle renvoie la valeur True (vrai), False (faux) ou manquant pour chaque observation.
Figure 9-11 Bote de dialogue Slectionner des observations : Si

Si le rsultat dune expression conditionnelle est Vrai, lobservation est incluse dans le sous-ensemble slectionn. Si le rsultat dune expression conditionnelle est Faux ou manquant, lobservation nest pas incluse dans le sous-ensemble slectionn.

237 Gestion et transformations de fichiers

La plupart des expressions conditionnelles utilisent un ou plus des six oprateurs relationnels (<, >, <=, >=, = et ~=) du pav numrique. Les expressions conditionnelles peuvent comprendre des noms de variable, des constantes, des oprateurs arithmtiques, des fonctions (numriques ou non), des variables logiques et des oprateurs relationnels.

Slectionner observations : Echantillon alatoire


Cette bote de dialogue vous permet de slectionner un chantillon alatoire partir dun pourcentage approximatif ou un nombre prcis dobservations. Lchantillonnage est ralis sans remplacement ; vous ne pouvez donc slectionner une mme observation quune seule fois.
Figure 9-12 Bote de dialogue Slectionner observations : Echantillon alatoire

Environ. SPSS gnre un chantillon alatoire dobservations dont le nombre correspond approximativement au pourcentage indiqu. Comme cette routine gnre une dcision indpendante pseudo-alatoire pour chaque observation, le pourcentage dobservations slectionnes peut seulement approcher le pourcentage spcifi. Plus il y a dobservations dans le fichier de donnes, plus le pourcentage des observations slectionnes sera proche de la valeur indique. Exactement. Nombre dobservations spcifi par lutilisateur. Vous devez galement indiquer le nombre dobservations partir duquel lchantillon sera gnr. Ce deuxime nombre doit tre infrieur ou gal au nombre total dobservations dans le fichier de donnes. Si ce nombre dpasse le nombre total dobservations dans le fichier de donnes, lchantillon contiendra proportionnellement moins dobservations que le nombre demand.

238 Chapitre 9

Slectionner observations : Plage


Cette bote de dialogue vous permet de slectionner des observations partir dun intervalle de numros dobservation ou dun intervalle de date ou de temps. Les intervalles dobservations sont fonds sur un numro de ligne, affich dans lditeur de donnes. Les intervalles de dates et de temps sont valables uniquement pour lesDonnes de sries chronologiques disposant de variables de date (menu Donnes, Dfinir dates).
Figure 9-13 Slectionnez la bote de dialogue Intervalle dobservations pour un intervalle dobservations (aucune variable de date dfinie).

Figure 9-14 Slectionnez la bote de dialogue Intervalle dobservations pour les sries chronologiques (variable de date dfinie).

239 Gestion et transformations de fichiers

Pondrer les observations


Pondrer les observations permet de pondrer diffremment les observations (par rplication simule) dans le cadre de lanalyse statistique. Les valeurs de la variable de pondration doivent indiquer le nombre dobservations reprsentes par des observations uniques de donnes. Les observations avec zro, une valeur ngative ainsi que les variables manquantes pour la variable de pondration sont exclues de lanalyse. Vous pouvez utiliser des fractions. Elles sont utilises leur juste valeur lorsque cela est significatif, et le plus souvent lorsque les observations sont tabules (tableaux croiss).
Figure 9-15 Bote de dialogue Pondrer les observations

Une fois que vous avez appliqu une variable de pondration, celle-ci est effective jusqu ce que vous slectionniez une autre variable de pondration ou que vous dsactiviez cette pondration. Si vous enregistrez un fichier de donnes pondres, les informations de pondration sont galement enregistres. Vous pouvez dsactiver la pondration nimporte quel moment, mme aprs lenregistrement du fichier avec sa pondration.
Pondration dans des tableaux croiss. Plusieurs options de la procdure Tableaux

croiss permettent de grer la pondration des observations. Pour plus d'informations, reportez-vous Affichage de cellules (cases) de tableaux croiss dans Chapitre 17 p. 387.
Pondration des diagrammes de dispersion et histogrammes. Les diagrammes de dispersion et les histogrammes disposent dune option dactivation/dsactivation de la pondration des observations, mais cela naffecte pas les observations avec des

240 Chapitre 9

valeurs ngatives, des zros, ou une valeur manquante pour la variable de pondration. Ces observations sont toujours exclues du diagramme mme lorsque la pondration est dsactive depuis ce diagramme.
Pour pondrer des observations
E A partir des menus, slectionnez : Donnes Pondrer les observations E Slectionnez Pondrer les observations par. E Slectionnez une variable de frquence.

Les valeurs de la variable de frquence servent la pondration des observations. Par exemple, une observation ayant la valeur 3 dans la table de frquence reprsente 3 observations dans le fichier des donnes pondres.

Restructuration des donnes


Utilisez lAssistant de restructuration des donnes pour restructurer les donnes qui sont ncessaires la procdure SPSS choisie. LAssistant remplace le fichier actuel par un nouveau fichier, restructur. LAssistant vous permet de : Restructurer les variables slectionnes en observations Restructurer les observations slectionnes en variables Transposer toutes les donnes

Restructuration des donnes


E A partir des menus, slectionnez : Donnes Restructurer... E Slectionnez le type de restructuration effectuer. E Slectionnez les donnes restructurer.

241 Gestion et transformations de fichiers

Sinon, vous pouvez : Crer des variables didentification qui vous permettent de faire correspondre une valeur du nouveau fichier avec la valeur du fichier dorigine Trier les donnes avant leur restructuration Dfinir les options du nouveau fichier Coller la syntaxe de la commande dans une fentre de syntaxe

Assistant de restructuration des donnes : Slectionner un type


Servez-vous de lAssistant de restructuration des donnes pour restructurer vos donnes. Dans la premire bote de dialogue, slectionnez le type de restructuration effectuer.
Figure 9-16 Assistant de restructuration des donnes

242 Chapitre 9

Restructurer les variables slectionnes en observations. Slectionnez cette option

lorsque vos donnes comportent des groupes de colonnes apparentes que vous souhaitez faire apparatre dans des groupes de lignes du nouveau fichier de donnes. Si vous choisissez cette option, lassistant affiche les tapes relatives lopration de restructuration des variables en observations.
Restructurer les observations slectionnes en variables. Slectionnez cette option

lorsque vos donnes comportent des groupes de lignes apparentes que vous souhaitez faire apparatre dans des groupes de colonnes du nouveau fichier de donnes. Si vous choisissez cette option, lAssistant affiche les tapes relatives lopration de restructuration des observations en variables.
Transposer toutes les donnesChoisissez cette option pour transposer vos donnes.

Dans les nouvelles donnes, toutes les lignes vont tre transformes en colonnes et les colonnes en lignes. La slection de cette option entrane la fermeture de lAssistant de restructuration des donnes et louverture de la bote de dialogue Transposer les donnes.
Choix du mode de restructuration des donnes

Une variable contient les informations analyser, comme une mesure ou un rsultat. Une observation correspond, par exemple, un individu. Dans une structure de donnes simple, chaque variable correspond une colonne de vos donnes et chaque observation une ligne. Supposez que vous mesuriez les rsultats obtenus un test par tous les tudiants dune classe. Dans ce cas, tous les rsultats apparaissent dans une mme colonne et une ligne est associe chaque tudiant. Lors de lanalyse des donnes, vous tes souvent amen analyser la manire dont une variable volue en fonction de certaines conditions. Ces conditions peuvent correspondre un traitement exprimental prcis, une population, un moment en particulier, etc. Dans lanalyse des donnes, les conditions qui vous intressent sont souvent appeles facteurs. Lorsque vous analysez des facteurs, vous obtenez une structure de donnes complexe. Vous pouvez disposer dinformations sur une variable dans plusieurs colonnes de vos donnes (par exemple, une colonne pour chaque niveau dun facteur) ou dinformations sur une observation dans plusieurs lignes (par exemple, une ligne pour chaque niveau dun facteur). LAssistant de restructuration des donnes vous aide restructurer les fichiers dont la structure de donnes est complexe. Les options que vous slectionnez dans lAssistant dpendent de la structure du fichier actuel et de celle du nouveau fichier.

243 Gestion et transformations de fichiers

Organisation des donnes dans le fichier actuel Vous pouvez organiser les donnes actuelles de telle sorte que les facteurs soient enregistrs dans une variable distincte (dans des groupes dobservations) ou avec la variable (dans des groupes de variables). Groupes dobservations. Dans le fichier actuel, les variables et les conditions

sont-elles enregistres dans des colonnes distinctes ? Par exemple :


var 8 9 3 1 factor 1 1 2 2

Dans cet exemple, les deux premires lignes constituent un groupe dobservations car elles sont apparentes. Elles contiennent des donnes relatives au mme niveau de facteur. Dans les analyses de donnes SPSS, le facteur est souvent appel variable de regroupement lorsque les donnes sont structures de cette manire.
Groupes de colonnes. Dans le fichier actuel, les variables et les conditions

sont-elles enregistres dans la mme colonne ? Par exemple :


var_1 8 9 var_2 3 1

Dans cet exemple, les deux colonnes constituent un groupe de variables car elles sont apparentes. Elles contiennent des donnes concernant la mme variable (var_1 pour le niveau de facteur 1 et var_2 pour le niveau de facteur 2). Dans les analyses de donnes SPSS, le facteur est souvent appel mesure rpte lorsque les donnes sont structures de cette manire.
Organisation des donnes dans le nouveau fichier La procdure danalyse des donnes dtermine gnralement lorganisation des donnes. Procdures ncessitant des groupes dobservations. Vous devez structurer vos

donnes en groupes dobservations pour procder des analyses qui requirent une variable de regroupement. A titre dexemple, il est possible de citer le modle linaire gnral pour les composantes univaries, multivaries et de variance, les modles linaires gnraux, les modles mixtes, les cubes OLAP, ainsi que

244 Chapitre 9

le test T ou les tests non paramtriques pour les chantillons indpendants. Si vos donnes actuelles sont structures en groupes de variables, slectionnez Restructurer les variables slectionnes en observations pour procder ces analyses.
Procdures ncessitant des groupes de variables. Vous devez structurer vos

donnes en groupes de variables pour procder des analyses de mesures rptes. A titre dexemple, il est possible de citer le modle linaire gnral pour les mesures rptes, lanalyse par la rgression de Cox prdicteurs chronologiques, le test T pour les chantillons apparis ou les tests non paramtriques pour les chantillons apparents. Si vos donnes actuelles sont structures en groupes dobservations, slectionnez Restructurer les observations slectionnes en variables pour procder ces analyses.

Exemple de restructuration de variables en observations


Dans cet exemple, les rsultats dun test sont enregistrs dans des colonnes distinctes pour chacun des facteurs A et B.
Figure 9-17 Donnes actuelles utilises pour la restructuration de variables en observations

Vous voulez raliser un test t pour des chantillons indpendants. Vous disposez dun groupe de colonnes comprenant score_a et score_b, mais pas de la variable de regroupement requise par la procdure. Slectionnez Restructurer les variables slectionnes en observations dans lAssistant de restructuration des donnes, restructurez un groupe de variables dans une nouvelle variable intitule rsultat, puis crez un index appel groupe. Le nouveau fichier de donnes est illustr dans la figure suivante.

245 Gestion et transformations de fichiers Figure 9-18 Nouvelles donnes restructures utilises pour la restructuration de variables en observations

Lorsque vous excutez le test t pour des chantillons indpendants, vous pouvez dsormais utiliser lindex groupe en tant que variable de regroupement.

Exemple de restructuration dobservations en variables


Dans cet exemple, les rsultats du test sont enregistrs deux fois pour chaque sujetavant et aprs le traitement.
Figure 9-19 Donnes actuelles utilises pour la restructuration dobservations en variables

Vous voulez raliser un test t pour des chantillons apparis. Vos donnes sont structures en groupes dobservations, mais vous ne disposez pas des mesures rptes des variables apparies requises par la procdure. Slectionnez Restructurer les observations slectionnes en variables dans lAssistant de restructuration des donnes, utilisez id pour identifier les groupes de lignes dans les donnes actuelles, et temps pour crer le groupe de variables dans le nouveau fichier.
Figure 9-20 Nouvelles donnes restructures utilises pour la restructuration dobservations en variables

246 Chapitre 9

Pour lexcution du test t pour chantillons apparis, vous pouvez dsormais utiliser ava et apr comme paire de variables.

Assistant de restructuration des donnes (Restructurer les variables en observations) : Nombre de groupes de variables
Remarque : LAssistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes. Lors de cette tape, vous dterminez le nombre de groupes de variables du fichier actuel restructurer dans le nouveau fichier.
Nombre de groupes de variables prsents dans le fichier actuel. Dterminez le nombre de groupes de variables prsents dans les donnes actuelles. Un groupe de colonnes apparentes, appel groupe de variables, permet denregistrer les mesures rptes dune mme variable dans des colonnes distinctes. Supposez que parmi les donnes dont vous disposez, trois colonnes, l1, l2 et l3, enregistrent la largeur. Dans ce cas, vous avez un groupe de variables. Si trois autres colonnes, h1, h2 et h3, enregistrent la hauteur, vous disposez de deux groupes de variables. Nombre de groupes de variables crer dans le nouveau fichier Dterminez le nombre de groupes de variables reprsenter dans le nouveau fichier. Il nest pas ncessaire de restructurer tous les groupes de variables dans le nouveau fichier.

247 Gestion et transformations de fichiers Figure 9-21 Assistant de restructuration des donnes : Nombre de groupes de variable, tape 2

Une. LAssistant cre une variable restructure dans le nouveau fichier partir

dun groupe de variables du fichier actuel.


Plusieurs. LAssistant cre plusieurs variables restructures dans le nouveau

fichier. Le nombre spcifi est utilis ltape suivante, au cours de laquelle lAssistant cre automatiquement le nombre de variables indiqu.

Assistant de restructuration des donnes (Restructurer les variables en observations) : Slectionnez Variables
Remarque : LAssistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes.

248 Chapitre 9

A cette tape, dcrivez le mode dutilisation des variables du fichier actuel dans le nouveau fichier. Vous pouvez galement crer une variable qui identifie les lignes du nouveau fichier.
Figure 9-22 Assistant de restructuration des donnes : Slectionner les variables, tape 3

Identification des nouvelles lignes. Vous pouvez crer une variable dans le nouveau

fichier de donnes afin didentifier la ligne du fichier actuel qui a servi crer un groupe de nouvelles lignes. Lidentificateur peut tre un numro dobservation squentiel ; il peut galement sagir des valeurs de la variable. Utilisez les contrles de loption Identification du groupe dobservations pour dfinir la variable didentification dans le nouveau fichier. Cliquez sur une cellule pour modifier le nom de la variable par dfaut et attribuer une tiquette descriptive la variable didentification.

249 Gestion et transformations de fichiers

Elments restructurer dans le nouveau fichier. A ltape prcdente, vous avez indiqu lAssistant le nombre de groupes de variables restructurer. LAssistant a cr une variable pour chaque groupe. Les valeurs du groupe de variables apparatront dans cette variable, dans le nouveau fichier. Utilisez les contrles de loption Variables transposer pour dfinir la variable restructure dans le nouveau fichier. Pour spcifier une variable structure
E Placez dans la liste Variables transposer les variables comprenant le groupe de

variables transformer. Toutes les variables du groupe doivent tre du mme type (numrique ou alphanumrique). Vous pouvez inclure une mme variable plusieurs fois dans le groupe de variables (au lieu dtre dplaces, les variables sont copies partir de la liste des variables source) ; ses valeurs sont rptes dans le nouveau fichier.
Pour spcifier plusieurs variables structures
E Dans la liste droulante, slectionnez la premire variable cible dfinir. E Placez dans la liste Variables transposer les variables comprenant le groupe de

variables transformer. Toutes les variables du groupe doivent tre du mme type (numrique ou alphanumrique). Vous pouvez inclure la mme variable plusieurs fois dans le groupe de variables. (Une variable est copie au lieu dtre dplace partir de la liste des variables source et ses valeurs sont rptes dans le nouveau fichier.)
E Slectionnez la variable cible suivante dfinir et recommencez le processus de

slection de la variable pour toutes les variables cible disponibles. Bien que vous puissiez inclure plusieurs fois une mme variable dans un groupe de variables cible, vous ne pouvez pas linclure dans plusieurs groupes de variables cible. Chaque liste de groupes de variables cible doit contenir le mme nombre de variables. (Les variables rpertories plusieurs fois sont comptes.)

250 Chapitre 9

Le nombre de groupes de variables cible est dtermin par le nombre de groupes de variables que vous avez indiqu ltape prcdente. Vous pouvez modifier le nom par dfaut des variables ici, mais pour modifier le nombre de groupes de variables restructurer, vous devez retourner ltape prcdente. Vous devez dfinir les groupes de variables (slectionnez les variables dans la liste source) pour chaque variable cible disponible avant de passer ltape suivante.
Elments copier dans le nouveau fichier. Les variables non restructures peuvent tre copies dans le nouveau fichier. Leurs valeurs seront rpercutes dans les nouvelles lignes. Dplacez vers la liste Variable(s) fixe(s) les variables copier dans le nouveau fichier.

Assistant de restructuration des donnes (Restructurer les variables en observations) : Crer des variables Variables
Remarque : LAssistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes. A cette tape, indiquez si vous voulez crer des variables dindex. Un index est une nouvelle variable qui identifie de manire squentielle un groupe de lignes daprs la variable dorigine partir de laquelle la nouvelle ligne a t cre.

251 Gestion et transformations de fichiers Figure 9-23 Assistant de restructuration des donnes : Crer des variables dindex, tape 4

Nombre de variables dindex crer dans le nouveau fichier Vous pouvez utiliser les

variables dindex en tant que variables de regroupement dans les procdures SPSS. Dans la plupart des cas, une variable dindex suffit. Toutefois, si les groupes de variables de votre fichier actuel font apparatre plusieurs niveaux de facteur, il est recommand de crer plusieurs index.
Une. LAssistant cre une seule variable dindex. Plusieurs. LAssistant cre plusieurs index. Entrez le nombre dindex crer. Le

nombre spcifi est utilis ltape suivante, au cours de laquelle lAssistant cre automatiquement le nombre dindex indiqu.
Aucune. Slectionnez cette option pour ne crer aucune variable dindex dans le

nouveau fichier.

252 Chapitre 9

Exemple dindex unique lors de la restructuration de variables en observations


Parmi les donnes actuelles figurent un groupe de variables, largeur, et un facteur, temps. La largeur a t mesure trois fois et enregistre dans l1, l2 et l3.
Figure 9-24 Donnes actuelles utilises pour un index

Vous allez restructurer le groupe de variables en une seule variable, largeur, et crer un index numrique. Les nouvelles donnes sont illustres dans le tableau suivant.
Figure 9-25 Nouvelles donnes restructures avec un index

La valeur Index dbute 1 et sincrmente pour chacune des variables du groupe. Elle se rinitialise sur 1 ds quune nouvelle ligne est dtecte dans le fichier dorigine. Vous pouvez dsormais utiliser la valeur index dans les procdures SPSS qui requirent une variable de regroupement.

Exemple de deux index lors de la restructuration de variables en observations


Lorsquun groupe de variables enregistre plusieurs facteurs, vous pouvez crer plusieurs index. Toutefois, vous devez organiser les donnes utilises de faon ce que les niveaux du premier facteur correspondent un index principal qui inclut les niveaux des facteurs suivants. Les donnes actuelles comprennent un groupe de variables, largeur et deux facteurs, A et B. Les donnes sont organises de telle sorte que les niveaux du facteur B sont inclus dans les niveaux du facteur A.

253 Gestion et transformations de fichiers Figure 9-26 Donnes actuelles utilises pour deux index

Vous allez restructurer le groupe de variables en une seule variable, largeur, et crer deux index. Les nouvelles donnes sont illustres dans le tableau suivant.
Figure 9-27 Nouvelles donnes restructures avec deux index

Assistant de restructuration des donnes (Restructurer les variables en observations) : Crer une variable dindex
Remarque : LAssistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes et pour la cration dune variable dindex. A cette tape, indiquez les valeurs affecter la variable dindex. Vous pouvez utiliser des nombres squentiels ou le nom des variables dun groupe de variables dorigine. Vous pouvez galement attribuer un nom et une tiquette la nouvelle variable dindex.

254 Chapitre 9 Figure 9-28 Assistant de restructuration des donnes : Crer une variable dindex, tape 5

Pour plus d'informations, reportez-vous Exemple dindex unique lors de la restructuration de variables en observations p. 252.
Nombres squentiels. LAssistant affecte automatiquement des numros

squentiels en tant que valeurs dindex.


Noms des variables. LAssistant utilise les noms du groupe de variables

slectionn en tant que valeurs dindex. Choisissez un groupe de variables dans la liste propose.
Noms et tiquettes. Cliquez sur une cellule pour modifier le nom de la variable par

dfaut et attribuer une tiquette descriptive la variable dindex.

255 Gestion et transformations de fichiers

Assistant de restructuration des donnes (Restructurer les variables en observations) : Crer plusieurs variables dindex
Remarque : LAssistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes et pour la cration de plusieurs variables dindex. A cette tape, indiquez le nombre de niveaux de chaque variable dindex. Vous pouvez galement attribuer un nom et une tiquette la nouvelle variable dindex.
Figure 9-29 Assistant de restructuration des donnes : Crer plusieurs variables dindex, tape 5

Pour plus d'informations, reportez-vous Exemple de deux index lors de la restructuration de variables en observations p. 252.

256 Chapitre 9

Nombre de niveaux enregistrs dans le fichier actuel Dterminez le nombre de niveaux de facteur enregistrs dans les donnes actuelles. Un niveau dfinit un groupe dobservations ayant t soumis des conditions identiques. En cas de facteurs multiples, vous devez organiser les donnes actuelles de faon ce que les niveaux du premier facteur correspondent un index principal qui inclut les niveaux des facteurs suivants. Nombre de niveaux crer dans le nouveau fichier Entrez le nombre de niveaux pour chaque index. Les valeurs des variables dindex multiples sont toujours des nombres squentiels. Les valeurs dbutent 1 et sincrmentent chaque niveau. Lincrmentation du premier index est la plus lente ; celle du dernier index est la plus rapide. Niveaux combins (total). Vous ne pouvez pas crer plus de niveaux que dans les donnes actuelles. Etant donn que les donnes restructures vont contenir une ligne pour chaque combinaison de traitements, lAssistant vrifie le nombre de niveaux que vous crez. Il va comparer le produit des niveaux crs au nombre de variables figurant dans vos groupes de variables. Ils doivent tre identiques. Noms et tiquettes. Cliquez sur une cellule pour modifier le nom de la variable par

dfaut et attribuer une tiquette descriptive aux variables dindex.

Assistant de restructuration des donnes (Restructurer les variables en observations) : Options


Remarque : LAssistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes. A cette tape, prcisez les options du nouveau fichier restructur.

257 Gestion et transformations de fichiers Figure 9-30 Assistant de restructuration des donnes : Options, tape 6

Suppression des variables non slectionnes Lors de la phase de slection des variables (tape 3), vous avez indiqu les groupes de variables restructurer, les variables copier et une variable didentification parmi les donnes actuelles. Les donnes des variables slectionnes vont figurer dans le nouveau fichier. Si dautres variables figurent dans les donnes actuelles, vous pouvez les supprimer ou les conserver. Conservation des donnes manquantes LAssistant recherche des valeurs nulles dans

chacune des nouvelles lignes potentielles. Une valeur nulle est une valeur manquante par dfaut ou vide. Vous pouvez conserver ou supprimer les lignes qui contiennent uniquement des valeurs nulles.
Cration dune variable de dcompte LAssistant peut crer une variable de dcompte dans le nouveau fichier. Elle contient le nombre de nouvelles lignes gnres par une ligne des donnes actuelles. Une variable de dcompte peut savrer utile lorsque

258 Chapitre 9

vous choisissez de supprimer les valeurs nulles du nouveau fichier. Il est en effet alors possible de crer un nombre de lignes diffrent pour une ligne prcise des donnes actuelles. Cliquez sur une cellule pour modifier le nom de la variable par dfaut et attribuer une tiquette descriptive la variable de dcompte.

Assistant de restructuration des donnes (Restructurer les observations en variables) : Slectionnez Variables
Remarque : LAssistant vous propose cette tape lorsque vous optez pour la restructuration des groupes dobservations en colonnes. A cette tape, dcrivez le mode dutilisation des variables du fichier actuel dans le nouveau fichier.
Figure 9-31 Assistant de restructuration des donnes : Slectionner les variables, tape 2

259 Gestion et transformations de fichiers

Elments didentification des groupes dobservations dans les donnes actuelles Un groupe dobservations est un groupe de lignes apparentes. En effet, ces dernires mesurent la mme unit dobservation, comme un individu ou une institution. LAssistant doit pouvoir reprer les variables du fichier actuel qui identifient les groupes dobservations afin dintgrer chacun dentre eux dans une ligne du nouveau fichier. Dplacez vers la liste Variable(s) de lidentificateur les variables qui identifient les groupes dobservations dans le nouveau fichier. Les variables qui servent diviser le fichier de donnes actuel sont automatiquement affectes lidentification des groupes. Chaque fois que lAssistant dtecte une nouvelle combinaison de valeurs didentification, il cre une ligne. Vous devez par consquent trier les observations du fichier actuel sur la base des valeurs des variables didentification, dans le mme ordre que les variables qui figurent dans la liste Variable(s) de lidentificateur. Vous pouvez trier le fichier actuel ltape suivante. Mode de cration des groupes de variables dans le nouveau fichier Dans les donnes dorigine, une variable apparat dans une seule colonne. Dans le nouveau fichier de donnes, cette variable apparat dans plusieurs colonnes. Les variables dindex correspondent aux variables incluses dans les donnes actuelles dont lAssistant se sert pour crer des colonnes. Les donnes restructures contiendront une nouvelle variable pour chacune des valeurs uniques figurant dans ces colonnes. Dplacez vers la liste Variable(s) dindex les variables qui doivent servir la cration des groupes de variables. Parmi les possibilits offertes par lAssistant, vous pouvez galement opter pour le tri des nouvelles colonnes par index. Devenir des autres colonnes LAssistant dtermine automatiquement ce que vont

devenir les variables qui demeurent dans la liste Fichier actuel. Il vrifie pour chaque variable si les valeurs des donnes varient au sein dun groupe dobservations. Si tel est le cas, lAssistant restructure, dans le nouveau fichier, les valeurs dans un groupe de variables. Dans le cas contraire, lAssistant copie les valeurs dans le nouveau fichier.

Assistant de restructuration des donnes (Restructurer les observations en variables) : Trier Donnes
Remarque : LAssistant vous propose cette tape lorsque vous optez pour la restructuration des groupes dobservations en colonnes.

260 Chapitre 9

A cette tape, indiquez si vous voulez trier le fichier actuel avant de le restructurer. Chaque fois que lAssistant dtecte une nouvelle combinaison de valeurs didentification, il cre une ligne. Vous devez par consquent trier les donnes daprs les variables identifiant les groupes dobservations.
Figure 9-32 Assistant de restructuration des donnes : Trier les donnes, tape 3

Organisation des lignes dans le fichier actuel Dterminez le mode de tri des donnes

actuelles et les variables qui servent identifier les groupes de variables (dfinis ltape prcdente).
Oui. LAssistant trie automatiquement les donnes actuelles par variable

didentification, dans le mme ordre que les variables qui figurent dans la liste Variable(s) de lidentificateur prsente ltape prcdente. Slectionnez cette option lorsque les donnes ne sont pas tries par variable didentification ou lorsque vous avez des doutes ce propos. Cette option implique un passage

261 Gestion et transformations de fichiers

distinct des donnes, mais elle assure un tri adquat des lignes dans loptique de la restructuration.
Non. LAssistant ne trie pas les donnes actuelles. Slectionnez cette option

lorsque vous tes certain que les donnes actuelles sont tries sur la base des variables qui identifient les groupes dobservations.

Assistant de restructuration des donnes (Restructurer les observations en variables) : Options


Remarque : LAssistant vous propose cette tape lorsque vous optez pour la restructuration des groupes dobservations en colonnes. A cette tape, prcisez les options du nouveau fichier restructur.
Figure 9-33 Assistant de restructuration des donnes : Options, tape 4

262 Chapitre 9

Mode de tri des groupes de variables dans le nouveau fichier Par variable. LAssistant regroupe les variables cres partir dune variable

dorigine.
Par index. LAssistant regroupe les variables en fonction des valeurs des variables

dindex.
Exemple. Les variables restructurer sont l et h, et lindex est mois :
l h mois

Le rsultat du regroupement par variable est le suivant :


l.jan l.fv h.jan

Le rsultat du regroupement par index est le suivant :


l.jan h.jan l.fv

Cration dune variable de dcompte LAssistant peut crer une variable de dcompte

dans le nouveau fichier. Elle contient le nombre de lignes des donnes actuelles qui a permis de crer une ligne dans le nouveau fichier de donnes.
Crer des variables indicatrices Lassistant peut utiliser les variables dindex pour

crer des variables indicatrices dans le nouveau fichier de donnes. Il cre une variable pour chaque valeur unique de la variable dindex. Les variables indicatrices signalent la prsence ou labsence dune valeur pour une observation. Une variable indicatrice a la valeur 1 si lobservation a une valeur ; sinon, elle a la valeur 0.
Exemple. La variable dindex est produit. Elle enregistre les produits achets par un client. Les donnes dorigine sont les suivantes :
client 1 1 2 3 produit poussin oeufs oeufs poussin

263 Gestion et transformations de fichiers

La cration dune variable indicatrice entrane la cration dune variable pour chaque valeur unique de produit. Les donnes restructures sont les suivantes :
client 1 2 3 poussin indicateur 1 0 1 oeufs indicateurs 1 1 0

Dans cet exemple, les donnes restructures pourraient tre utilises pour obtenir des effectifs des produits achets par le client.

Assistant de restructuration des donnes : Terminer


Il sagit de la dernire tape de lAssistant de restructuration de donnes. Dfinissez lobjet de vos spcifications.

264 Chapitre 9 Figure 9-34 Assistant de restructuration des donnes : Terminer

Restructurer. Lassistant cre le fichier restructur. Choisissez cette option pour

remplacer immdiatement le fichier actuel. Remarque : Si les donnes dorigine sont pondres, les nouvelles donnes sont galement pondres moins que la variable qui sert de pondration ne soit restructure ou supprime du nouveau fichier.
Coller la syntaxe. Lassistant colle la syntaxe gnre dans une fentre de syntaxe.

Slectionnez cette option si vous ntes pas prt remplacer le fichier actuel, lorsque vous voulez modifier sa syntaxe ou lorsque vous souhaitez lenregistrer en vue dune utilisation ultrieure.

Utilisation du rsultat

10

Chapitre

Lorsque vous lancez une procdure, les rsultats sont affichs dans une fentre appele le Rsultats. Dans cette fentre, vous pouvez facilement naviguer vers le rsultat que vous voulez voir. Vous pouvez galement manipuler le rsultat et crer un document contenant prcisment le rsultat voulu.

Rsultats
Les rsultats sont affichs dans le Rsultats. Vous pouvez utiliser le Rsultats pour : parcourir les rsultats ; afficher ou masquer les tableaux et diagrammes slectionns ; modifier lordre daffichage des rsultats en dplaant les lments slectionns ; dplacer des lments entre le Rsultats et dautres applications.

265

266 Chapitre 10 Figure 10-1 Rsultats

Le Rsultats est divis en deux panneaux : Le panneau de gauche du Rsultats contient une lgende du contenu du rsultat. Le panneau droit contient les tableaux statistiques, les diagrammes et les textes. Vous pouvez utiliser les barres de dfilement pour parcourir les rsultats ou cliquer sur un lment de la ligne de lgende pour aller directement au tableau ou diagramme correspondant. Vous pouvez cliquer et faire glisser le bord droit de la fentre de lgende pour modifier la largeur de la fentre.

Utilisation du Rsultats en mode brouillon


Si vous prfrez les sorties en texte simple plutt que les tableaux pivotants interactifs, vous pouvez utiliser le Rsultats en mode brouillon.

267 Utilisation du rsultat

Pour utiliser le Rsultats en mode brouillon :


E A partir du menu de nimporte quelle fentre, slectionnez : Edition Options E Dans longlet Gnral, cliquez sur Editeur de rsultats en mode brouillon comme type

de rsultat.
E Pour modifier les options de format de sortie du Rsultats en mode brouillon, cliquez sur longlet Rsultats en mode Brouillon.

Pour plus d'informations, reportez-vous Viewer en mode brouillon dans Chapitre 11 p. 301. Vous pouvez galement rechercher des informations dans lutilitaire daide pour en apprendre plus :
E A partir du menu de nimporte quelle fentre, slectionnez : Aide Rubriques E Cliquez sur longlet Index dans la fentre Rubriques daide. E Tapez Editeur de rsultats en mode brouillon et double-cliquez sur lentre dindex.

Affichage et masquage des rsultats


Dans le Rsultats, vous pouvez slectionner individuellement des tableaux ou les rsultats dune procdure pour les afficher ou les masquer. Ce processus est utile si vous voulez limiter la proportion de rsultats visibles dans le panneau de contenu.

Pour masquer un tableau ou un diagramme


E Double-cliquez sur licne Livre de llment dans le panneau de lgende de lEditeur

de rsultats. ou
E Cliquez sur llment pour le slectionner.

268 Chapitre 10 E A partir des menus, slectionnez : Affichage Masquer

ou
E Cliquez sur licne Livre ferm (Masquer) dans la barre doutils Lgende.

Licne Livre ouvert (Montrer) devient licne active, indiquant que llment est dsormais masqu.

Pour masquer les rsultats de la procdure


E Cliquez sur la bote gauche du nom de la procdure dans le panneau de lgende.

Cela masque tous les rsultats de la procdure et rduit laffichage de la lgende.

Dplacement, suppression et copie de rsultats


Vous pouvez rarranger les rsultats en copiant, en dplaant ou en effaant un lment ou un groupe dlments.

Pour dplacer des rsultats dans lEditeur de rsultats


E Cliquez sur un item affich dans le panneau de lgende ou de contenu. (Maj-Clic

pour slectionner plusieurs lments, ou Ctrl-clic pour slectionner des lments non contigus)
E Cliquez et faites glisser les items slectionns (maitenir le bouton de la souris enfonc

lors du dplacement).
E Relchez le bouton de la souris lorsque le curseur se trouve sur llment situ juste

au-dessus de lemplacement o vous voulez placer les lments slectionns. Vous pouvez galement dplacer les lments laide des commandes Couper et Coller aprs du menu Edition.

269 Utilisation du rsultat

Pour supprimer des rsultats dans lEditeur de rsultats


E Cliquez sur un item affich dans le panneau de lgende ou de contenu. (Maj-Clic

pour slectionner plusieurs lments, ou Ctrl-clic pour slectionner des lments non contigus)
E Appuyez sur la touche Supprimer.

ou
E A partir des menus, slectionnez : Edition Suppr

Pour copier des rsultats dans lEditeur de rsultats


E Cliquez sur un item affich dans le panneau de lgende ou de contenu. (Maj-Clic

pour slectionner plusieurs lments, ou Ctrl-clic pour slectionner des lments non contigus)
E Maintenez la touche Ctrl enfonce pour cliquer et faire glisser les lments

slectionns (maintenez le bouton de la souris enfonc pendant que vous faites glisser les lments slectionns).
E Relchez le bouton de la souris pour dposer les lments lendroit dsir.

Vous pouvez galement copier des items laide des commandes Copier et Coller aprs du menu Edition.

Changemernt de lalignement initial


Par dfaut, tous les rsultats sont initialement aligns gauche. Vous pouvez modifier lalignement initial (dans le menu Edition, choisissez Options, puis longlet Editeur de rsultats) tout moment.

Changement de lalignement des items de rsultat


E Dans le panneau de lgende ou de contenu, cliquez sur les items aligner (cliquez

dessus tout en appuyant sur la touche Maj ou Ctrl).

270 Chapitre 10 E A partir des menus, slectionnez : Format Aligner gauche

Les autres options dalignement incluent Centrer et Aligner droite. Remarque : Tous les rsultats sont affichs dans le Rsultats avec alignement gauche. Seul lalignement des rsultats imprims est affect par les paramtres dalignement. Les lments centrs et aligns droite sont identifis par un symbole situ au-dessus et gauche des lments en question.

Lgende du Rsultats
Le panneau de lgende fournit une table des matires du document Rsultats. Vous pouvez utiliser le panneau de lgende pour naviguer dans votre rsultat et contrler laffichage du rsultat. La plupart des actions dans le panneau de lgende ont un effet correspondant sur le panneau de contenu. Le fait de slectionner un lment dans le panneau de lgende affiche llment correspondant dans le panneau de contenu. Dplacer un lment dans le panneau de lgende dplace llment correspondant dans le panneau de contenu. Rduire la ligne de lgende masque le rsultat de tous les lments des niveaux rduits.

271 Utilisation du rsultat Figure 10-2 Panneau de lgende rduit et rsultats masqus

Contrler lAffichage du Rsultat. Pour contrler laffichage du rsultat, vous pouvez :

Maximiser et Rduire laffichage de la ligne de lgende. Modifier le niveau de ligne de lgende pour les lments slectionns. Modifier la taille des lments dans laffichage de la ligne de lgende. Modifier la police utilise dans laffichage de la ligne de lgende.

Pour rduire et agrandir laffichage de lgende


E Cliquez sur la bote gauche de llment de ligne de lgende rduire ou tendre.

ou
E Cliquez sur llment dans la ligne de lgende. E A partir des menus, slectionnez : Affichage Plier

272 Chapitre 10

ou
Affichage Dvelopper

Pour modifier le niveau de lgende dun lment


E Cliquez sur llment dans le panneau de lgende. E Cliquez sur la flche gauche de la barre doutil de la Ligne de lgende pour

promouvoir llment (le dplacer vers la gauche).


E Cliquez sur la flche droit de la barre doutil de la Ligne de lgende pour rtrograder

llment (dplacer llment vers la droite). ou A partir des menus, slectionnez :


Edition Bordure Promouvoir

ou
Edition Bordure Rtrograder

Modifier le niveau de lgende est particulirement utile aprs avoir dplac des lments dans un niveau de lgende. Dplacer des lments peut modifier le niveau de lgende des lments et vous pouvez utiliser les boutons de flche gauche et de flche droite dans la barre doutils de la Ligne de lgende pour restaurer le niveau dorigine.

Pour modifier la taille des lments dans la lgende


E A partir des menus, slectionnez : Affichage Taille de la ligne de lgende Petit

Dautres options incluent Moyen et Grand. Les icnes et les textes associs changent de taille.

273 Utilisation du rsultat

Pour modifier la police dans la lgende


E A partir des menus, slectionnez : Affichage Police de la ligne de lgende E Slectionnez une police.

Ajout dlments au Rsultats


Dans le Rsultats, vous pouvez ajouter des lments tels que des titres, du nouveau texte, des diagrammes ou des donnes provenant dautres applications.

Pour ajouter un nouveau titre ou texte


Des lments textes qui ne sont pas lis un tableau ou un diagramme peuvent tre ajouts au Rsultats.
E Cliquez sur le tableau, diagramme ou autre objet qui prcdera le titre ou texte. E A partir des menus, slectionnez : Insrer Nouveau titre

ou
Insrer Nouveau texte E Double-cliquez sur le nouvel objet. E Entrez le texte souhait cet emplacement.

Pour ajouter un fichier texte


E Dans le panneau de lgende ou de contenu de lEditeur de rsultats, cliquez sur le

tableau, diagramme ou autre objet qui prcdera le texte.


E A partir des menus, slectionnez : Insrer Fichier texte E Slectionnez un fichier texte.

274 Chapitre 10

Pour modifier le texte, double-cliquez dessus.

Utilisation de rsultats dans dautres applications


Les tableaux pivotants et diagrammes peuvent tre copis et colls dans dautres applications Windows telles que les traitements de texte ou les tableurs. Vous pouvez coller les tableaux pivotants ou les diagrammes dans lun des divers formats suivants :
Objet imbriqu. Pour des applications supportant les objets ActiveX, vous pouvez

imbriquer des tableaux pivotants et des diagrammes interactifs. Aprs avoir coll le tableau, vous pouvez lactiver sur place en double-cliquant dessus puis le modifier comme dans lEditeur de rsultats.
Image (mtafichier). Vous pouvez coller des tableaux pivotants, des rsultats texte et des diagrammes en tant quimages (mtafichiers). Le format image peut tre redimensionn dans lautre application, et quelquefois dit dans une mesure limite laide des outils de lautre application. Les tableaux pivotants colls comme images conservent toutes leurs caractristiques de bordures et de polices. RTF (texte enrichi). Les tableaux pivotants peuvent tre colls dans dautres

applications au format RTF. Dans la plupart des applications, cette procdure colle le tableau pivotant en tant que tableau pouvant tre modifi dans une autre application.
Bitmap. Les diagrammes peuvent tre colls dans dautres applications en tant que bitmaps. BIFF. Le contenu dun tableau peut tre coll dans une feuille de calcul et conserver

sa prcision numrique.
Texte. Le contenu dun tableau peut tre copi et coll comme texte. Cette option peut

tre utile pour les applications telles que le courrier lectronique, o lapplication ne peut accepter ou transmettre que du texte.

Pour copier un tableau ou un diagramme


E Slectionnez le tableau ou diagramme copier. E A partir des menus, slectionnez : Edition Copier

275 Utilisation du rsultat

Pour copier - coller des rsultats dans une autre application


E Copiez les rsultats dans le Rsultats. E Dans les menus de lapplication cible, choisissez : Edition Coller

ou
Edition Collage spcial

Coller. Les sorties sont copies vers le Presse-papiers dans un certain nombre

de formats. Chaque application dtermine le meilleur format utiliser pour Coller. Dans beaucoup dapplications, Coller collera les rsultats en tant quimage (mtafichier). Pour les applications de traitement de texte, Coller collera les tableaux pivotants au format RTF, ce qui collera le tableau pivotant comme un tableau. Pour les tableurs, Coller colle les tableaux pivotants au format BIFF. Les diagrammes sont colls en tant que mtafichiers.
Collage spcial. Les rsultats sont copis dans le Presse-papiers dans de multiples formats. Collage spcial vous permet de slectionner le format voulu dans la liste des formats disponibles pour lapplication cible.

Incorporation dun tableau dans une autre application


Vous pouvez imbriquer des tableaux pivotants et des diagrammes interactifs dans dautres applications au format ActiveX. Un objet imbriqu peut tre activ sur place en double cliquant dessus puis en le modifiant et le faisant pivoter comme dans lEditeur de rsultats. Si vous avez des applications prenant en charge les objets Active-X :
E Double-cliquez sur le fichier objs-on.bat situ dans le rpertoire dinstallation de

SPSS. Ceci active lincorporation ActiveX pour les tableaux pivotants. Le fichier objs-off.bat dsactive lincorporation des objets ActiveX.

276 Chapitre 10

Pour incorporer un tableau pivotant ou un diagramme interactif dans une autre application :
E Dans le Rsultats, copiez le tableau. E Dans les menus de lapplication cible, choisissez : Edition Collage spcial E Dans la liste, slectionnez Objet tableau pivotant SPSSouSPSS Graphics Control Object.

Lapplication cible doit prendre en charge les objets ActiveX. Voir la documentation de lapplication pour plus dinformations sur la prise en charge de ActiveX. Certaines applications qui ne prennent pas en charge ActiveX pourront initialement accepter des tableaux pivotants ActiveX mais faire preuve ensuite dinstabilit. Ne vous fiez pas aux objets imbriqus jusqu ce que vous ayez test la stabilit de votre application avec les objets Active-X imbriqus.

Collage dun tableau pivotant ou dun diagramme en tant quimage (mtafichier)


E Dans le Rsultats, copiez le tableau ou le diagramme. E Dans les menus de lapplication cible, choisissez : Edition Collage spcial E Dans la liste, slectionnez Image.

Llment est coll comme mtafichier. Seule la strate et les colonnes visibles lorsque llment a t copi sont disponibles dans le mtafichier. Les autres strates et colonnes masques ne sont pas disponibles.

Collage dun tableau pivotant en tant que tableau (RTF)


E Dans le Rsultats, copiez le tableau pivotant. E Dans les menus de lapplication cible, choisissez : Edition Collage spcial E Dans la liste, slectionnez Texte format (RTF) ou Texte enrichi.

277 Utilisation du rsultat

Le tableau pivotant est coll en tant que tableau. Seule la strate et les colonnes visibles lorsque llment a t copi sont colles dans le tableau. Les autres strates et colonnes masques ne sont pas disponibles. Vous pouvez copier et coller un seul tableau pivotant la fois ce format.

Collage dun tableau pivotant en tant que texte


E Dans le Rsultats, copiez le tableau. E Dans les menus de lapplication cible, choisissez : Edition Collage spcial E Dans la liste, choisissez Texte non format.

Le texte du tableau pivotant non format contient des tabulations entre les colonnes. Vous pouvez aligner des colonnes en ajustant les marques de tabulation dans lautre application.

Pour copier et coller plusieurs lments dans une autre application


E Slectionnez les tableaux et/ou graphiques copier. (Maj-clic ou Ctrl-clic pour

slectionner plusieurs lments)


E A partir des menus, slectionnez : Edition Copier les objets E Dans lapplication cible, partir du menu, slectionnez : Edition Coller

Remarque : Utiliser Copier les objets pour copier plusieurs lments du Rsultats vers une autre application seulement. Pour copier et coller dans SPSS (par exemple, entre deux fentres du Rsultats), utilisez Copier dans le menu Edition.

278 Chapitre 10

Collage dobjets dans le Rsultats


Des objets provenant dautres applications peuvent tre colls dans le Rsultats. Vous pouvez utiliser soit Coller aprs, soit Collage spcial. Les deux types de collage placent le nouvel objet la suite de lobjet actuellement slectionn dans le Rsultats. Utilisez Collage spcial lorsque vous voulez choisir le format de lobjet coller.

Collage spcial
Collage spcial vous permet de slectionner le format de lobjet copi coller dans le Rsultats. Les types possibles de fichier pour lobjet sont lists dans la bote de dialogue Collage spcial. Lobjet sera insr dans le Rsultats la suite de lobjet actuellement slectionn.
Figure 10-3 Bote de dialogue Collage spcial

Collage dobjets dune autre application dans le Rsultats


E Dans lautre application, copiez lobjet. E Dans le panneau de lgende ou de contenu de lEditeur de rsultats, cliquez sur le

tableau, diagramme ou autre objet qui prcdera lobjet.

279 Utilisation du rsultat E A partir des menus, slectionnez : Edition Collage spcial E Dans la liste, slectionnez le format de lobjet.

Exporter rsultats
Loption Exporter rsultats enregistre les tableaux pivotants et les sorties texte aux formats HTML, texte, Word/RTF, Excel et PowerPoint (requiert PowerPoint 97 ou version ultrieure) et enregistre les diagrammes sous divers formats communment utiliss par dautres applications. (Remarque : Exporter vers PowerPoint nest pas disponible dans la version Student.)
Document rsultat. Exporte toute combinaison de tableaux pivotants, rsultat texte et

diagrammes. Pour les formats HTML et texte, les diagrammes sont exports dans le format dexportation du diagramme slectionn. Pour le format document HTML, les tableaux sont intgrs par rfrence, et vous devez exporter les tableaux sous un format adapt pour permettre leur intgration dans des documents HTML. Pour le format document texte, une ligne est insre dans le fichier texte pour chaque diagramme, indiquant le nom de fichier du diagramme export. Pour le format Word/RTF, les diagrammes sont exports au format mtafichier Windows et incorpors dans le document Word. Les diagrammes ne sont pas inclus dans les documents Excel. Pour le format PowerPoint, les diagrammes sont exports au format TIFF, puis incorpors dans le fichier PowerPoint.
Document Rsultat (sans Graphiques). Exporte les tableaux pivotants et les rsultats texte. Les diagrammes du Rsultats sont ignors. Graphiques uniquement. Les formats dexportation disponibles sont les suivants :

mtafichier Windows (WMF), mtafichier amlior (EMF), bitmap Windows (BMP), PostScript encapsul (EPS), JPEG, TIFF, PNG ou PICT Macintosh.
Exporter quoi. Vous pouvez exporter tous les objets du Rsultats, tous les objets

visibles ou seulement les objets slectionns.

280 Chapitre 10

Format dexportation. Pour les documents de rsultat, les options disponibles sont HTML, texte, Word/RTF, Excel et PowerPoint ; pour les formats HTML et texte, les diagrammes sont exports au format du diagramme slectionn dans la bote de dialogue Options. Pour Graphiques Seulement, slectionnez un format dexportation de graphiques dans la liste droulante. Pour les documents de rsultat, les tableaux pivotants et le texte sont exports de la faon suivante : Fichier HTML (*.htm). Les tableaux pivotants sont exports comme des tableaux

HTML. Les rsultats texte sont publis au format HTML pr-format.


Fichier texte (*.txt). Les tableaux pivotants peuvent tre exports en format tabul

ou avec espaces. Tous les rsultats texte sont exports en format avec espaces.
Fichier Excel (*.xls). Les lignes, colonnes et cellules des tableaux pivotants sont

exportes comme des lignes, colonnes et cellules Excel, avec tous les attributs de formatage (bordures de cellule, styles de police, couleurs darrire-plan, etc.). Le rsultat texte est export avec tous les attributs de police. Chaque ligne du rsultat texte est une ligne dans le fichier Excel, avec le contenu de toute la ligne dans une seule cellule.
Fichier Word/RTF (*.doc). Les tableaux pivotants sont exports en tant que tableaux

Word, avec tous les attributs de formatage (bordures de cellule, styles de police, couleurs darrire-plan, etc.). La sortie texte est exporte au format RTF. Le rsultat texte dans SPSS apparat toujours dans une police espacement fixe (monoespac) et est export avec les mmes attributs de police. Une police espacement fixe (monoespac) est ncessaire pour le bon alignement des rsultats texte spars par des espaces.
Fichier PowerPoint (*.ppt). Les tableaux pivotants sont exports en tant que

tableaux Word, puis incorpors au fichier PowerPoint dans des diapositives distinctes, raison dune diapositive par tableau pivotant. Tous les attributs de formatage (bordures de cellule, styles de police, couleurs darrire-plan, etc.) sont conservs. La sortie texte est exporte au format RTF. Le rsultat texte dans SPSS apparat toujours dans une police espacement fixe (monoespac) et est export avec les mmes attributs de police. Une police espacement fixe (monoespac) est ncessaire pour le bon alignement des rsultats texte spars par des espaces. (Remarque : Exporter vers PowerPoint nest pas disponible dans la version Student.)
Systme de gestion des rsultats. Vous pouvez galement exporter automatiquement tous les rsultats ou tous les types de rsultats dfinis par lutilisateur, tels que les fichiers texte et les fichiers de donnes au format HTML, XML et SPSS. Pour plus

281 Utilisation du rsultat

d'informations, reportez-vous Systme de gestion des rsultats dans Chapitre 48 p. 743.

Pour exporter le rsultat


E Activez la fentre du Rsultats (cliquez nimporte o dans la fentre). E A partir des menus, slectionnez : Fichier Exporter... E Entrez un nom de fichier (ou un prfixe pour les graphiques) et slectionnez un

format dexportation.
Figure 10-4 Bote de dialogue Exporter rsultats

282 Chapitre 10 Figure 10-5 Rsultats exports au format Word/RTF

Options HTML, Word/RTF et Excel


Lorsque vous cliquez sur Options dans la bote de dialogue Exporter rsultats, une bote de dialogue saffiche ; elle contrle linclusion de notes de bas de page et de lgendes pour les documents exports aux formats HTML, Word/RTF et Excel, les options dexportation des diagrammes pour les documents HTML et la manipulation de tableaux pivotants multistrates.
Format Image. Contrle le format dexportation des diagrammes et les paramtres facultatifs, comme la taille pour les documents HTML. Pour le format Word/RTF, tous les diagrammes sont exports au format mtafichier (WMF) Windows. Pour Excel, les diagrammes sont exclus.

283 Utilisation du rsultat

Exporter les notes de bas de page et la lgende Cochez cette case pour inclure des notes de bas de page et des lgendes au cours de lexportation des tableaux pivotants. Exporter toutes les strates. Cochez cette case pour exporter toutes les strates dun tableau pivotant multistrates. Si cette option est dslectionne, seule la strate suprieure est exporte.

Dfinition des options dexportation HTML, Word/RTF et Excel


E Activez la fentre du Rsultats (cliquez nimporte o dans la fentre). E A partir des menus, slectionnez : Fichier Exporter... E Slectionnez Fichier HTML, Fichier Word/RTF ou Fichier Excel comme format

dexportation.
E Cliquez sur Options.

Options PowerPoint
Avec les options PowerPoint, vous pouvez inclure des titres aux diapositives, des notes de bas de page et des lgendes dans les tableaux pivotants, grer des tableaux pivotants plusieurs strates et utiliser les options dexportation de diagramme au format PowerPoint. (Remarque : Exporter vers PowerPoint nest pas disponible dans la version Student.)
Figure 10-6 Bote de dialogue Options PowerPoint

284 Chapitre 10

Inclure le titre sur la diapositive. Cochez cette case pour inclure un titre sur chaque

diapositive cre par lexportation. Chaque diapositive contient un lment unique export depuis lEditeur de rsultats. Le titre est form partir de lentre correspondant llment dans le panneau de lgende du Rsultats.
Exporter les notes de bas de page et la lgende Cochez cette case pour inclure des

notes de bas de page et des lgendes au cours de lexportation des tableaux pivotants.
Exporter toutes les strates Cochez cette case pour exporter toutes les strates dun

tableau pivotant plusieurs strates ; chaque strate est place sur une diapositive distincte et toutes ont le mme titre. Si cette option est dslectionne, seule la strate suprieure est exporte.

Options texte
Options texte contrle les options de format des tableaux pivotants, des lments textes et des diagrammes ainsi que linsertion de notes de bas de page et de lgendes pour les documents exports en format texte.

285 Utilisation du rsultat Figure 10-7 Bote de dialogue Options texte

Les tableaux pivotants peuvent tre exports en format tabul ou avec espaces. Pour le format tabul, si une cellule nest pas vide, son contenu et un caractre de tabulation sont imprims. Si une cellule est vide, un caractre de tabulation seul est imprim. Tous les rsultats texte sont exports en format avec espaces. Tous les rsultats avec espaces ncessitent une police point fixe (espacement unique) pour un alignement correct.
Formatage de cellule. Pour les tableaux pivotants avec espaces, par dfaut, tous les sauts de lignes sont supprims et chaque colonne est fixe la largeur de la plus longue tiquette ou valeur de la colonne. Pour limiter la largeur des colonnes et insrer des sauts de ligne dans les longues tiquettes, spcifiez un nombre de caractres pour la largeur de la colonne. Ce rglage naffecte que les tableaux pivotants. Sparateurs de cellules. Pour les tableaux pivotants avec espaces, vous pouvez

spcifier les caractres utiliss pour crer les bordures de cellules.


Format Image. Contrle le format dexportation des graphiques et les paramtres

facultatifs, comme la taille.

286 Chapitre 10

Insrer un saut de page entre les tableaux. Insre un changement/saut de page entre chaque tableau. Pour les tableaux pivotants multistrates, cette option insre un saut de page entre chaque strate.

Options Taille graphique


Loption Taille du diagramme contrle la taille des diagrammes exports. Les spcifications de pourcentage personnalises vous permettent de diminuer ou daugmenter la taille du diagramme export jusqu 200 pour cent.
Figure 10-8 Bote de dialogue Taille dexport des graphiques

Pour dfinir la taille des graphiques exports


E Activez la fentre du Rsultats (cliquez nimporte o dans la fentre). E A partir des menus, slectionnez : Fichier Exporter... E Pour les documents de rsultat, cliquez sur Options, slectionnez le format dexportation, puis cliquez sur Taille graphique. E Pour Graphiques uniquement, slectionnez le format dexportation, puis cliquez sur Taille graphique.

Options dexportation de diagrammes au format JPEG


Profondeur des couleurs. Vous pouvez exporter les graphiques JPEG en mode Couleurs vraies 24 bits ou 256 niveaux de gris.

287 Utilisation du rsultat

Espace de couleurs. Cette option fait rfrence au codage des couleurs dans limage.

Le modle de couleurs YUV est lun des modes de codage des couleurs. Il est couramment utilis pour la transmission de donnes au format vido numrique ou MPEG. Les lettres de ce sigle identifient les signaux Y, U et V. Le composant Y dtermine le niveau de gris ou luminance. Les composants U et V dfinissent la chrominance (informations de couleur). Les ratios correspondent au taux dchantillonnage de chaque composant. Si vous rduisez les taux dchantillonnage U et V, vous rduisez la taille du fichier (mais galement sa qualit). Loption Espace de couleurs dtermine le degr de perte des couleurs dans limage exporte. Si le paramtrage YUV 4:4:4 nentrane aucune perte, les configurations YUV 4:2:2 et YUV 4:1:1 constituent un compromis entre la rduction de la taille du fichier (espace disque) et la baisse de la qualit des couleurs affiches.
Encodage progressif. Permet le chargement progressif de limage. Limage apparat

tout dabord dans une faible rsolution, puis sa qualit augmente au fur et mesure de son chargement.
Paramtre de qualit de compression. Contrle le taux de compression en fonction de

la qualit de limage. Plus la qualit de limage est leve, plus le fichier export est volumineux.
Oprations de couleurs. Les oprations suivantes sont disponibles : Inverser. Chaque pixel est enregistr dans la couleur inverse de sa couleur

dorigine.
Correction Gamma. Ajuste lintensit des couleurs dans le diagramme export

en modifiant la constante gamma utilise pour faire correspondre les valeurs dintensit. Cette option permet principalement dclaircir ou dassombrir limage bitmap. Sa valeur peut tre comprise entre 0,10 (le plus fonc) et 6,5 (le plus clair).

Options dexportation de diagrammes aux formats BMP et PICT


Profondeur des couleurs. Dtermine le nombre de couleurs du diagramme export. Quelle que soit la profondeur de couleur utilise lors de lenregistrement dun diagramme, le nombre de couleurs du diagramme est compris entre le nombre de couleurs rellement utilises et le nombre maximal de couleurs autoris par la

288 Chapitre 10

profondeur. Par exemple, si vous enregistrez un diagramme contenant trois couleurs (rouge, blanc et noir) en mode 16 couleurs, ce diagramme conserve ses 3 couleurs. Lorsque le nombre de couleurs du diagramme est suprieur au nombre prvu pour cette profondeur, les couleurs sont converties de manire reproduire celles du diagramme. Loption Profondeur dcran actuelle correspond au nombre de couleurs affiches sur votre cran.
Oprations de couleurs. Les oprations suivantes sont disponibles : Inverser. Chaque pixel est enregistr dans la couleur inverse de sa couleur

dorigine.
Correction Gamma. Ajuste lintensit des couleurs dans le diagramme export

en modifiant la constante gamma utilise pour faire correspondre les valeurs dintensit. Cette option permet principalement dclaircir ou dassombrir limage bitmap. Sa valeur peut tre comprise entre 0,10 (le plus fonc) et 6,5 (le plus clair).
Utiliser la compression RLE. (BMP uniquement). Il sagit dune technique de

compression sans perte qui est prise en charge par les formats de fichiers Windows standard. Lexpression compression sans perte signifie que la rduction de la taille des fichiers nest pas effectue aux dpens de la qualit de limage.

Options dexportation de diagrammes aux formats PNG et TIFF


Profondeur des couleurs. Dtermine le nombre de couleurs du diagramme export. Quelle que soit la profondeur de couleur utilise lors de lenregistrement dun diagramme, le nombre de couleurs du diagramme est compris entre le nombre de couleurs rellement utilises et le nombre maximal de couleurs autoris par la profondeur. Par exemple, si vous enregistrez un diagramme contenant trois couleurs (rouge, blanc et noir) en mode 16 couleurs, ce diagramme conserve ses 3 couleurs.

Lorsque le nombre de couleurs du diagramme est suprieur au nombre prvu pour cette profondeur, les couleurs sont converties de manire reproduire celles du diagramme. Loption Profondeur dcran actuelle correspond au nombre de couleurs affiches sur votre cran.

289 Utilisation du rsultat

Oprations de couleurs. Les oprations suivantes sont disponibles : Inverser. Chaque pixel est enregistr dans la couleur inverse de sa couleur

dorigine.
Correction Gamma. Ajuste lintensit des couleurs dans le diagramme export

en modifiant la constante gamma utilise pour faire correspondre les valeurs dintensit. Cette option permet principalement dclaircir ou dassombrir limage bitmap. Sa valeur peut tre comprise entre 0,10 (le plus fonc) et 6,5 (le plus clair).
Transparence. Permet de slectionner la couleur qui sera transparente dans le

diagramme export. Cette option est disponible uniquement pour les exportations en mode Couleurs vraies 32 bits. Entrez une valeur entire comprise entre 0 et 255 pour chacune des couleurs. La valeur par dfaut de chaque couleur est 255. De ce fait, la couleur de transparence par dfaut est le blanc.
Format. (TIFF uniquement) Permet de dfinir lespace de couleurs et de compresser

le diagramme export. Vous disposez de toutes les profondeurs de couleur en mode RVB. Seuls les modes Couleurs vraies 24 et 32 bits sont disponibles avec les couleurs CMJN. Avec loption YCbCr, seul le mode Couleurs vraies 24 bits est disponible.

Options dexportation de diagrammes au format EPS


Cartes, arbres et diagrammes interactifs

Pour les arbres (option Arbres de segmentation), les cartes (option Cartes) et les diagrammes interactifs (menu Graphes, sous-menu Interactif), les options EPS suivantes sont disponibles :
Aperu de limage. Permet denregistrer laperu dune image dans limage EPS.

Un aperu sert principalement en cas dinsertion dun fichier EPS dans un autre document. Si de nombreuses applications ne peuvent pas afficher une image EPS, elles peuvent en revanche afficher laperu enregistr avec limage. Laperu de limage peut tre au format WMF (plus petit et plus facilement redimensionnable) ou TIFF (plus souple et pris en charge par un plus grand nombre de plateformes). Vrifiez dans lapplication de destination du graphique EPS les formats daperu pris en charge par lapplication.
Polices. Contrle le traitement des polices TrueType dans les images EPS.

290 Chapitre 10

Incorporer en tant que TrueType natif. Incorpore la plupart des donnes de police

dans limage EPS. La police PostScript rsultante est appele police Type 42. Remarque : Toutes les imprimantes PostScript ne disposent pas dun pilote de niveau 3 pouvant lire les polices Type 42).
Convertir en polices PostScript. Convertit les polices TrueType en polices

PostScript (Type 1) en fonction de la famille de polices. Par exemple, la police Times New Roman est convertie en Times et Arial est convertie en Helvetica. Remarque : Ce format est dconseill pour les graphiques interactifs qui utilisent la police SPSS Marker (comme les diagrammes de dispersion) car il nexiste aucun quivalent PostScript significatif aux marques SPSS TrueType.
Remplacer les polices avec courbes. Transforme les polices TrueType en donnes

de courbe PostScript. Vous ne pouvez plus modifier le texte en tant que tel dans les applications de retouche des graphiques EPS. La qualit est galement amoindrie. Cette option savre toutefois utile lorsque votre imprimante PostScript ne prend pas en charge les polices Type 42, mais quil vous faut conserver des symboles spciaux TrueType, comme des marques dans des diagrammes de dispersion interactifs.
Autres diagrammes

Pour tous les autres diagrammes, les options EPS suivantes sont disponibles :
Inclure un aperu TIFF. Enregistre un aperu avec limage EPS au format TIFF pour un

affichage dans les applications qui ne peuvent pas afficher les images EPS lcran.
Polices. Contrle le traitement des polices dans les images EPS. Remplacer les polices avec courbes. Transforme les polices en donnes de courbe

PostScript. Vous ne pouvez plus modifier le texte en tant que tel dans les applications de retouche des graphiques EPS. Cette option est utile si les polices utilises dans le diagramme ne sont pas disponibles sur le priphrique de sortie.
Utiliser des polices de rfrence. Si les polices utilises dans le diagramme

sont disponibles sur le priphrique de sortie, elles sont utilises. Sinon, le priphrique de sortie utilise des polices alternatives.

291 Utilisation du rsultat

Options dexportation de diagrammes au format WMF


Aldus placeable. Fournit un degr dindpendance par rapport au priphrique (taille

physique identique en cas douverture 96 ou 120 ppp) ; ce format nest pas pris en charge par certaines applications.
Windows standard. Option prise en charge par la plupart des applications pouvant

afficher des mtafichiers Windows.

Pour dfinir les options dexportation des graphiques


E Activez la fentre du Rsultats (cliquez nimporte o dans la fentre). E A partir des menus, slectionnez : Fichier Exporter... E Pour les documents de rsultat, cliquez sur Options, slectionnez le format dexportation, puis cliquez sur Options de diagramme. E Pour Graphiques uniquement, slectionnez le format dexportation, puis cliquez sur Options.

Impression de documents du Rsultats


Il y a deux options pour limpression du contenu de la fentre Editeur de rsultats :
Tous les rsultats affichs. Seuls simpriment les lments affichs dans le panneau de

contenu. Les lments masqus (lments accompagns dune icne reprsentant un livre ferm dans le panneau de ligne de lgende ou masqus dans les strates rduites des lignes de lgende) ne simpriment pas.
Slection. Seuls simpriment les lments slectionns dans les panneaux de ligne de

lgende et/ou de contenu.

292 Chapitre 10 Figure 10-9 Bote de dialogue dimpression du Rsultats

Pour imprimer des rsultats et des diagrammes


E Activez la fentre du Rsultats (cliquez nimporte o dans la fentre). E A partir des menus, slectionnez : Fichier Imprimer E Choisissez les paramtres dimpression voulus. E Cliquez sur OK pour imprimer.

Aperu avant impression


LAperu avant impression vous montre ce qui va simprimer sur chaque page des documents du Rsultats. Il est conseill dutiliser lAperu avant impression avant dimprimer rellement un document de lEditeur de rsultats car cela permet de

293 Utilisation du rsultat

dtecter les lments qui ne seront pas visibles, tout simplement en regardant le panneau de contenu de lEditeur de rsultats, notamment : Les sauts de page Les strates masques des tableaux pivotants Les ruptures dans les tableaux de grande largeur Les rsultats complets des grands tableaux Les en-ttes et pieds de page imprims sur chaque page
Figure 10-10 Aperu avant impression

Si des rsultats sont slectionns dans le Rsultats, laperu naffiche que les rsultats slectionns. Pour avoir un aperu de tous les rsultats, vrifiez que rien nest slectionn dans le Rsultats.

Pour afficher un aperu avant impression


E Activez la fentre du Rsultats (cliquez nimporte o dans la fentre).

294 Chapitre 10 E A partir des menus, slectionnez : Fichier Aperu avant impression

Mise en page
La Mise en page vous permet de contrler: La taille et lorientation du papier Les marges Les en-ttes et pieds de page La numrotation des pages La taille imprime pour les graphiques

295 Utilisation du rsultat Figure 10-11 Bote de dialogue Mise en page

Les paramtres de mise en page sont enregistrs dans le document du Rsultats. La Mise en page affecte uniquement les paramtres des documents du Rsultats. Ces paramtres nont aucun effet sur limpression des donnes de lditeur de donnes ou de la syntaxe dune fentre de syntaxe.

Pour modifier la mise en page


E Activez la fentre du Rsultats (cliquez nimporte o dans la fentre). E A partir des menus, slectionnez : Fichier Mise en page E Modifiez les paramtres et cliquez sur OK.

296 Chapitre 10

Mise en page : En-ttes et pieds de page


Les en-ttes et pieds de page sont les informations qui simpriment en haut et en bas de chaque page. Vous pouvez saisir le texte afficher dans les en-ttes et les pieds de page. Vous pouvez galement utiliser la barre doutils qui se trouve au milieu de la bote de dialogue pour insrer : La date et lheure Des numros de page Le nom du fichier du Rsultats Les tiquettes des en-ttes de lignes de lgende Les titres et les sous-titres ;
Figure 10-12 Bote de dialogue Options Mise en page, onglet En-tte/pied de page

297 Utilisation du rsultat

Les tiquettes den-tte des lignes de lgende indiquent len-tte de ligne de lgende de premier, deuxime, troisime et/ou quatrime niveau pour le premier lment de chaque page. Les titres et sous-titres de page impriment les titres et sous-titres de la page courante. Les titres et sous-titres sont crs avec les options Nouveau titre de page du menu Insrer de lEditeur de rsultats ou avec les commandes TITLE et SUBTITLE de la syntaxe de commande. Si vous navez indiqu aucun titre ou sous-titre de page, ce paramtre est ignor. Remarque : Les caractristiques de police des nouveaux titres de page et des sous-titres sont vrifies dans longlet Editeur de rsultats de la bote de dialogue Options (accessible en choisissant Options dans le menu Edition). Les caractristiques de police des titres de page et des sous-titres existants peuvent tre modifies en changeant les titres laide du Rsultats. Pour voir comment vos en-ttes et pieds de page vont apparatre sur la page imprime, choisissez Aperu avant impression dans le menu Fichier.

Mise en page : Options


Cette bote de dialogue contrle la taille du diagramme imprim, lespace entre les lments de rsultat imprims, ainsi que la numrotation des pages.
Taille imprime diagramme. Contrle la taille du diagramme imprim par rapport la

taille dfinie pour la page. Le rapport hauteur/largeur du diagramme nest pas affect par la taille du diagramme imprim. La taille globale dun diagramme imprim est limite par sa hauteur et par sa largeur. Lorsque les bordures extrieures dun tableau atteignent les bordures de gauche et de droite de la page, la taille du diagramme ne peut plus augmenter pour occuper plus de hauteur.
Espace entre items. Contrle lespace entre des lments imprims. Chaque tableau

pivotant, diagramme et objet de texte constitue un lment distinct. Ce paramtre naffecte pas laffichage des lments dans le Rsultats.
Commencer page. Numros de page conscutifs commenant partir dun numro

spcifi.

298 Chapitre 10 Figure 10-13 Bote de dialogue Options Mise en page, onglet Options

Enregistrement des rsultats


Le contenu du Rsultats peut tre enregistr comme un document du Rsultats. Le document enregistr contient les deux panneaux du Rsultats (lgende et contenu).

Pour enregistrer un document du Rsultats


E A partir du menu du Rsultats, slectionnez : Fichier Enregistrer

299 Utilisation du rsultat E Entrez le nom du document et cliquez sur Enregistrer.

Pour enregistrer le rsultat dans un format externe (par exemple HTML ou texte), utilisez Exporter dans le menu Fichier. (Non disponible dans la version autonome du SmartViewer).

Option Publier
Loption Enregistrer avec mot de passe vous permet de protger par mot de passe vos fichiers Rsultats.
Mot de passe. Le mot de passe est sensible la casse et peut contenir jusqu

16 caractres. Si vous assignez un mot de passe, le fichier ne peut pas tre affich sans la saisie de ce mot de passe.
Code OEM. Laissez ce champ vide moins que vous nayez un accord contractuel

avec SPSS Inc. pour distribuer le Smart Rsultats. Le code de licence OEM est fourni avec le contrat.

Pour enregistrer les fichiers du Rsultats avec un mot de passe


E A partir du menu du Rsultats, slectionnez : Fichier Enregistrer avec mot de passe... E Saisissez le mot de passe. E Entrez de nouveau le mot de passe pour le confirmer et cliquez sur OK. E Entrez un nom de fichier dans la bote de dialogue Enregistrer sous. E Cliquez sur Enregistrer.

Remarque : Laissez le champ Code OEM vide moins que vous nayez un accord contractuel avec SPSS Inc. pour distribuer le Smart Rsultats.

Viewer en mode brouillon

11

Chapitre

Le Viewer en mode brouillon fournit des rsultats sous forme de brouillons , avec : un rsultat texte simple (au lieu de tableaux pivotants) ; des diagrammes comme images mtafichiers (au lieu dobjets diagramme). Vous pouvez modifier les rsultats texte du Viewer en mode brouillon, redimensionner les diagrammes, et coller les rsultats texte et les diagrammes dans dautres applications. Cependant, vous ne pouvez pas modifier les diagrammes, et les fonctionnalits interactives des tableaux pivotants et des diagrammes ne sont pas disponibles.

301

302 Chapitre 11 Figure 11-1 Fentre du Viewer en mode brouillon

Pour crer un rsultat en mode brouillon


E A partir des menus, slectionnez : Fichier Nouveau Rsultat mode brouillon E Pour faire du rsultat en mode brouillon le type de rsultat par dfaut partir du

menu, slectionnez :
Affichage Options E Cliquez sur longlet Gnral. E Slectionnez Brouillon sous Type de navigateur au dmarrage.

303 Viewer en mode brouillon

Remarque : Le nouveau rsultat est toujours affich dans la fentre de Viewer dsign. Si vous avez ouvert une fentre de lEditeur de rsultats ou de lEditeur de rsultats en mode brouillon, la fentre dsigne est celle qui a t la dernire ouverte ou celle dsigne laide du bouton Dsigner la fentre (le point dexclamation) dans la barre doutils.

Contrle du format du rsultat en mode brouillon


La sortie qui serait affiche sous forme de tableaux pivotants dans le Viewer est convertie en sortie texte pour le Viewer en mode brouillon. Les paramtres par dfaut pour une sortie de tableaux pivotants convertie sont dfinis comme suit : Chaque colonne est ajuste en fonction de la largeur de ltiquette de colonne et les tiquettes ne stalent pas sur plusieurs lignes. Lalignement est contrl par des espaces ( la place des tabulations). Les caractres de la zone de la police SPSS Marker Set sont utiliss comme des sparateurs de lignes et de colonnes. Si les caractres de la bote sont dsactivs, les caractres verticaux (|) sont utiliss comme des sparateurs de colonnes et les tirets () comme des sparateurs de lignes. Vous pouvez contrler le format du nouveau rsultat en mode brouillon en utilisant les options du Viewer en mode brouillon (menu Edition, Options, onglet Viewer en mode brouillon).

304 Chapitre 11 Figure 11-2 Options du Viewer en mode brouillon

Largeur de colonne. Pour rduire la largeur des tableaux contenant des tiquettes longues, slectionnez Maximum caractres sous Largeur de colonne. Les tiquettes plus longues que la largeur spcifie sont adaptes pour sajuster la largeur maximale.

305 Viewer en mode brouillon Figure 11-3 Rsultat en mode brouillon avant et aprs le paramtrage de la largeur de colonne maximale

Sparateurs de lignes et de colonnes. Comme autre choix de caractres de la bote

pour les bordures de lignes et de colonnes, vous pouvez utiliser les paramtres des sparateurs de cellules pour vrifier que les sparateurs de lignes et de colonnes saffichent dans le nouveau rsultat en mode brouillon. Vous pouvez spcifier diffrents sparateurs de cellules ou entrer des espaces vides si vous ne voulez utiliser aucun caractre pour reprer les lignes et colonnes. Vous devez dslectionner la case Afficher les caractres pour indiquer les sparateurs de cellules.

306 Chapitre 11 Figure 11-4 Rsultat en mode brouillon avant et aprs le paramtrage des sparateurs de cellules

Sparer colonnes avec Espaces / Tabulations. Le Viewer en mode brouillon est conu pour afficher une sortie dans laquelle les sparations sont des espaces dans une police espacement fixe (non proportionnelle). Si vous souhaitez coller un rsultat en mode brouillon dans une autre application, vous devez utiliser une police espacement fixe pour aligner correctement les colonnes avec un espace de sparation. Si vous slectionnez les tabulations comme sparateurs de colonnes, vous pouvez utiliser la police de votre choix dans lautre application et dfinir les tabulations pour aligner le rsultat correctement. Cependant, la sortie avec des tabulations de sparation ne salignera pas correctement dans le Viewer en mode brouillon.

307 Viewer en mode brouillon Figure 11-5 Rsultat avec des tabulations de sparation dans le Viewer en mode brouillon puis formate dans un traitement de texte

Dfinition des options du Viewer en mode brouillon


E A partir des menus, slectionnez : Affichage Options E Cliquez sur longlet Viewer en mode brouillon. E Slectionnez les paramtres souhaits. E Cliquez sur OK ou sur Appliquer.

308 Chapitre 11

Les options daffichage des rsultats dans le Viewer affectent seulement le nouveau rsultat produit aprs modification des paramtres Un rsultat dj affich dans le Viewer nest pas affect par les changements de ces paramtres.

Attributs de polices
Vous pouvez modifier les attributs de polices (police, taille, style) du rsultat texte dans lEditeur de rsultats en mode brouillon. Cependant, si vous utilisez les caractres de la bote pour les bordures de lignes et de colonnes, lalignement appropri de la colonne pour du texte spar par des espaces ncessite lutilisation dune police espacement fixe (monoespace), telle que Courier. De plus, dautres modifications de police, comme la taille et le style (par exemple gras et italique), appliques une partie seulement dun tableau peuvent affecter lalignement de colonne.
Bordures de lignes et de colonnes. Les bordures de lignes et de colonnes pleines par dfaut utilisent la police SPSS Marker Set. Les caractres de traage de lignes utiliss pour tracer les bordures ne sont pas pris en charge par dautres polices.

Pour modifier les polices dans le Viewer en mode brouillon


E Slectionnez le texte auquel vous voulez appliquer la modification de police. E A partir des menus du Viewer en mode brouillon, slectionnez : Format Polices E Slectionnez les attributs de police appliquer au texte slectionn.

Pour imprimer un rsultat en mode brouillon


E A partir des menus du Viewer en mode brouillon, slectionnez : Fichier Imprimer

Pour imprimer uniquement la partie slectionne du rsultat en mode brouillon


E Slectionnez le rsultat imprimer.

309 Viewer en mode brouillon E A partir des menus, slectionnez : Fichier Imprimer E Choisissez Slection.

Aperu avant impression


LAperu avant impression vous montre ce qui va simprimer sur chaque page pour les documents brouillons. Nous vous conseillons dutiliser lAperu avant impression avant dimprimer rellement un document du Viewer car cela vous permet de visualiser les lments qui peuvent ne pas avoir t ajusts pour tenir sur une page, comme : les tableaux longs les tableaux larges produits par la conversion dune sortie dun tableau pivotant sans contrle de largeur de colonne les rsultats texte cres avec loption de largeur de page Large (options du Viewer en mode brouillon) sur une imprimante dfinie en mode Portrait. Une sortie trop large pour la page est alors tronque et ne simprimera pas sur une autre page. Il existe plusieurs mthodes permettant dviter quun rsultat trop volumineux soit tronqu : Utilisez une taille de police plus petite (menu Format, Polices). Slectionnez Paysage pour lorientation de page (menu Fichier, Mise en page). Pour une nouvelle sortie, spcifiez une largeur de colonne maximum troite (menu Edition, Options, onglet Viewer en mode brouillon). Pour les tableaux longs, utilisez les sauts de page (menu Insertion, Saut de Page) pour contrler les endroits o le tableau passe sur une autre page.

Pour visualiser un aperu avant impression du Viewer en mode brouillon


E A partir des menus du Viewer en mode brouillon, slectionnez : Fichier Aperu avant impression

310 Chapitre 11

Pour enregistrer une sortie du Viewer en mode brouillon


E A partir des menus du Viewer en mode brouillon, slectionnez : Fichier Enregistrer

La sortie du Viewer en mode brouillon est enregistre au format RTF (texte enrichi).

Pour enregistrer le rsultat en mode brouillon en tant que texte


E A partir des menus du Viewer en mode brouillon, slectionnez : Fichier Exporter...

Vous pouvez exporter tout le texte ou juste le texte slectionn Seul le rsultat texte (sortie de tableau pivotant convertie et sortie texte) est enregistre dans les fichiers exports. Les diagrammes ne sont pas inclus.

Tableaux pivotants

12

Chapitre

Beaucoup de rsultats sont prsents dans le Viewer sous forme de tableaux pouvant tre pivots de manire interactive. Cela signifie que vous pouvez rarranger les lignes, colonnes et strates.

Manipulation dun tableau pivotant


Les options de manipulation des tableaux pivotants comprennent les lments suivants : Transposer des lignes et des colonnes. Dplacer des lignes et des colonnes. Crer des strates multidimensionnelles. Grouper et sparer des lignes et des colonnes. Montrer et masquer des cellules. Faire pivoter des tiquettes de lignes et de colonnes. Trouver des dfinitions de termes.

Pour modifier un tableau pivotant


E Double-cliquez sur le tableau.

Cela active lditeur de tableaux pivotants.

Edition de deux tableaux pivotants ou plus en une fois


E Cliquez avec le bouton droit de la souris sur le tableau pivotant. 311

312 Chapitre 12 E A partir du menu contextuel, slectionnez : Objet tableau pivotant SPSS Ouvrir E Rptez lopration pour chaque tableau pivotant que vous voulez modifier.

Chaque tableau pivotant est prt tre dit dans sa propre fentre.

Pour faire pivoter un tableau laide dicnes


E Activez le tableau pivotant. E A partir des menus du tableau pivotant, choisissez : Tableau pivotant Structure pivotante E Placez le pointeur sur chaque icne pour apercevoir une note daide qui vous

indiquera la dimension de tableau reprsente par licne.


E Faites glisser une icne dune dimension lautre. Figure 12-1 Structure pivotante

Cette action modifie la disposition du tableau. Par exemple, supposons que licne reprsente une variable avec les modalits Oui et Non. Si vous faites glisser licne depuis la dimension de ligne vers la dimension de colonne, Oui et Non deviennent les tiquettes des colonnes. Avant le dplacement, Oui et Non taient les tiquettes des lignes.

313 Tableaux pivotants

Pour identifier des dimensions dans un tableau pivotant


E Activez le tableau pivotant. E Si la structure pivotante nest pas dj active, partir des menus du tableau pivotant,

choisissez :
Tableau pivotant Structure pivotante E Cliquez sur une icne et maintenez le bouton enfonc.

Cette action met en surbrillance les tiquettes de dimension dans le tableau pivotant.

Transposition des lignes et des colonnes


E A partir des menus du tableau pivotant, choisissez : Tableau pivotant Transposer lignes et colonnes

Cette action a le mme effet que le glissement de toutes les icnes de lignes dans la dimension de colonne et les icnes de colonnes dans la dimension de ligne.

Pour modifier lordre daffichage


Lordre des icnes de rotation dans un plateau de dimension reflte lordre daffichage des lments dans le tableau pivotant. Pour modifier lordre daffichage des lments dans une dimension :
E Activez le tableau pivotant. E Si la structure pivotante nest pas dj active, partir des menus du tableau pivotant,

choisissez :
Tableau pivotant Structure pivotante E Faites glisser les icnes de chaque plateau pour les placer dans lordre dsir (de

gauche droite ou de haut en bas).

Pour dplacer des lignes et des colonnes dans un tableau pivotant


E Activez le tableau pivotant.

314 Chapitre 12 E Cliquez sur ltiquette de la ligne ou colonne que vous voulez dplacer. E Faites glisser ltiquette vers sa nouvelle position. E Dans le menu contextuel, choisissez Insrer Avant ou Permuter.

Remarque : Assurez-vous que loption Faire glisser pour Copier du menu Edition nest pas active (coche). Si loption Faire glisser pour Copier est active, dsactivez-la.

Pour grouper des lignes ou des colonnes et insrer des tiquettes de groupe
E Activez le tableau pivotant. E Slectionnez les tiquettes des lignes ou des colonnes que vous voulez regrouper

(cliquez et faites glisser ou cliquez dessus tout en maintenant la touche Maj enfonce pour slectionner plusieurs tiquettes).
E A partir des menus, slectionnez : Edition Groupe

Une tiquette de groupe est insre automatiquement. Double-cliquez sur ltiquette de groupe pour modifier le texte de ltiquette.
Figure 12-2 Groupes et tiquettes de lignes et de colonnes
Etiquette de groupe de colonnes Female Etiquette de Groupe de Lignes Clerical Custodial Manager 206 10 Male 157 27 74 Total 363 27 84

Remarque : Pour ajouter des lignes ou des colonnes un groupe existant, vous devez dabord dissocier les lments du groupe, puis crer un nouveau groupe incluant les lments supplmentaires.

Pour dissocier des lignes ou des colonnes et supprimer des tiquettes de groupe
E Activez le tableau pivotant.

315 Tableaux pivotants E Cliquez nimporte o dans ltiquette de groupe pour les lignes et les colonnes que

vous souhaitez dgrouper.


E A partir des menus, slectionnez : Edition Dissocier

Dissocier supprime automatiquement ltiquette de groupe.

Pour faire pivoter des tiquettes de tableaux pivotants


E Activez le tableau pivotant. E A partir des menus, slectionnez : Format Pivoter Etiquettes de colonnes internes

ou
Pivoter Etiquettes de lignes externes Figure 12-3 Etiquettes de colonnes pivotes

Seules les tiquettes des colonnes les plus internes et les tiquettes des lignes les plus externes peuvent tre pivotes.

316 Chapitre 12

Rtablissement des pivots aux valeurs par dfaut


Aprs avoir excut une ou plusieurs oprations de pivot, vous pouvez rtablir la disposition dorigine du tableau pivotant.
E A partir du menu Tableau pivotant, choisissez Remettre pivots leur valeur par dfaut.

Cette action ne rtablit que les changements rsultant dune rotation des lments de lignes, de colonnes ou de strates entre les dimensions. Elle naffecte pas les changements tels que le regroupement, la dissociation ou le dplacement des lignes et des colonnes.

Pour rechercher la dfinition dune tiquette dans un tableau pivotant


Vous pouvez obtenir de lAide contextuelle sur les tiquettes de cellules dans les tableaux pivotants. Par exemple, si Moyenne apparat comme une tiquette, vous pouvez obtenir une dfinition de la moyenne.
E Cliquez avec le bouton droit sur une cellule dtiquette. E A partir du menu contextuel, slectionnez A propos de...

Vous devez cliquer avec le bouton droit de la souris sur la cellule dtiquette elle-mme plutt que sur les cellules de donnes de la ligne ou de la colonne. Laide contextuelle nest pas disponible pour les tiquettes dfinies par lutilisateur telles que les noms de variable ou les tiquettes de valeurs.

Utilisation des strates


Vous pouvez afficher un tableau bidimensionnel spar pour chaque modalit ou combinaison de modalits. Le tableau peut tre imagin comme un empilement de strates, dont seule la strate suprieure est visible.

Pour crer et afficher des strates


E Activez le tableau pivotant. E >> A partir du menu Tableau pivotant, choisissez Structures pivotantes (si cela nest

pas dj fait).

317 Tableaux pivotants E Faites glisser une icne du plateau Ligne ou du plateau Colonne vers le plateau Strate. Figure 12-4 Dplacer des modalits dans des strates

Chaque icne de strate possde des flches gauche et droite. Le tableau visible est celui de la strate suprieure.
Figure 12-5 Modalits en strates spares
Minority classification: Yes Minority classification: No

318 Chapitre 12

Pour modifier des strates


E Cliquez sur lune des flches de licne de strate.

ou
E Choisissez une modalit partir de la liste droulante de strates. Figure 12-6 Slectionnez des strates partir des listes droulantes.

Atteindre la modalit de la strate


Aller Modalit de Strate vous permet de modifier les strates dun tableau pivotant. Cette bote de dialogue est particulirement utile lorsquil existe un grand nombre de strates ou lorsquune strate possde de nombreuses modalits.

Pour aller une strate dun tableau


E A partir des menus du tableau pivotant, choisissez : Tableau pivotant Aller la strate...

319 Tableaux pivotants Figure 12-7 Bote de dialogue Atteindre la modalit de la strate

E Dans la liste Modalit visible, slectionnez une dimension de strate. La liste Modalits

de Strates affiche toutes les modalits de la dimension slectionne.


E Dans la liste Modalits, slectionnez la modalit que vous dsirez puis cliquez sur OK.

Cette action change la strate et ferme la bote de dialogue. Pour afficher une autre strate sans fermer la bote de dialogue :
E Slectionnez la modalit et cliquez sur Appliquer.

Pour dplacer des strates vers des lignes ou des colonnes


Si le tableau que vous affichez est empil en strates et que seule la strate suprieure est visible, vous pouvez afficher toutes les strates en mme temps, soit de haut en bas (lignes), soit de gauche droite (colonnes). Il doit y avoir au moins une icne dans le plateau Strate.

320 Chapitre 12 E Dans le menu Tableau pivotant, choisissez Dplacer Strates vers Lignes.

ou
E Dans le menu Tableau pivotant, choisissez Dplacer Strates vers Colonnes.

Vous pouvez galement dplacer les strates vers les lignes ou les colonnes en faisant glisser leurs icnes dans la structure pivotante Strate, Ligne et Colonne.

Signets
Les signets vous permettent denregistrer diffrents affichages dun tableau pivotant. Les signets incluent : le positionnement des lments dans les dimensions de ligne, colonne et strate lordre daffichage des lments dans chaque dimension ; la strate affiche pour chaque lment de strate.

Pour dfinir un signet pour un affichage de tableau pivotant


E Activez le tableau pivotant. E Faites pivoter le tableau vers laffichage pour lequel vous voulez dfinir un signet. E A partir des menus, slectionnez : Tableau pivotant Signets E Entrez un nom pour le signet. (Les noms de signets ne distinguent les majuscules des

minuscules.)
E Cliquez sur Ajouter.

Chaque tableau pivotant a son propre jeu de signets. A lintrieur dun tableau pivotant, chaque nom de signet doit tre unique, mais vous pouvez utiliser des noms de signets en double dans des tableaux pivotants diffrents.

321 Tableaux pivotants

Pour obtenir un affichage de tableau pivotant pour lequel un signet a t dfini auparavant
E Activez le tableau pivotant. E A partir des menus, slectionnez : Tableau pivotant Signets E Cliquez sur le nom du signet dans la liste. E Cliquez sur Atteindre.

Pour renommer un signet de tableau pivotant


E Activez le tableau pivotant. E A partir des menus, slectionnez : Tableau pivotant Signets E Cliquez sur le nom du signet dans la liste. E Cliquez sur Renommer. E Entrez le nouveau nom de signet. E Cliquez sur OK.

Montrer ou masquer des cellules


Il est possible de masquer de nombreux types de cellules, y compris : Etiquettes de dimension. Modalits, y compris la cellule dtiquette et les cellules de donnes dune ligne ou dune colonne. Etiquettes de modalit (sans masquer les cellules de donnes). Notes de bas de page, titres et lgendes.

322 Chapitre 12

Pour masquer des lignes et des colonnes dans un tableau


E Ctrl-Alt-Clic sur ltiquette de modalit de la ligne ou de la colonne masquer. E A partir des menus du tableau pivotant, choisissez : Affichage Masquer

ou
E Cliquez avec le bouton droit de la souris sur la ligne ou la colonne. E Dans le menu contextuel, choisissez Masquer modalit.

Pour afficher des colonnes et des lignes masques dans un tableau


E Slectionnez une autre tiquette dans la mme dimension que la ligne ou la colonne

masque. Par exemple, si la modalit Femme de la dimension Sexe est masque, cliquez sur la modalit Homme.
E A partir des menus du tableau pivotant, choisissez : Affichage Montrer toutes les modalits dans le nom de la dimension

Par exemple, choisissez Montrer Toutes les Modalits dans Sexe. ou


E A partir des menus du tableau pivotant, choisissez : Affichage Montrer Tout

Cette action affiche toutes les cellules masques du tableau. (Si loption Masquer les Lignes et Colonnes vides est slectionne dans les proprits de ce tableau, une ligne ou une colonne totalement vide reste masque)

Pour masquer ou afficher une tiquette de dimension


E Activez le tableau pivotant.

323 Tableaux pivotants E Slectionnez ltiquette de dimension ou toute tiquette de modalit dans la

dimension.
E A partir des menus, slectionnez : Affichage Masquer (ou montrer) Etiquette de dimension.

Pour masquer ou afficher une note de bas de page dans un tableau


E Slectionnez une note de bas de page. E A partir des menus, slectionnez : Affichage Masquer (ou montrer)

Pour afficher ou masquer une lgende ou un titre dans un tableau


E Slectionnez une lgende ou un titre. E A partir des menus, slectionnez : Affichage Masquer (ou montrer)

Modification des rsultats


Laspect et le contenu de chaque lment texte ou tableau du rsultat peuvent tre dits. Vous pouvez: Appliquer un modle de tableau. Modifier les proprits du tableau actuel. Modifier les proprits des cellules dans le tableau. Modifier du texte. Ajouter des notes de bas de page et des lgendes aux tableaux. Ajouter des lments au Viewer. Copier et Coller le rsultat dans dautres applications. Modifier la largeur des cellules de donnes.

324 Chapitre 12

Modification de laspect des tableaux


Vous pouvez modifier laspect dun tableau soit en ditant les proprits du tableau, soit en appliquant un modle de tableau. Chaque modle de tableau comprend un regroupement de proprits de tableau, y compris sur laspect gnral, les proprits des notes de bas de page, les proprits des cellules et les bordures. Vous pouvez slectionner lun des Aspects de tableau prdfinis ou crer et enregistrer un modle de tableau personnalis.

Modles de tableaux
Un modle de tableau est un ensemble de proprits dfinissant laspect dun tableau. Vous pouvez slectionner un modle de tableau prdfini ou crer votre propre modle de tableau. Avant ou aprs avoir appliqu un modle de tableau, vous pouvez modifier les formats de cellules pour des cellules individuelles ou des groupes de cellules laide des proprits de cellule. Les formats de cellule dits demeurent intactes, mme lorsque vous appliquez un nouveau modle de tableau. Par exemple, vous pouvez commencer par appliquer le modle de tableau 9POINT, puis slectionner une colonne de donnes et utiliser la bote de dialogue Formats des cellules pour appliquer une police en caractres gras cette colonne. Vous modifiez ensuite le modle de tableau et appliquez loption BOXED. La colonne prcdemment slectionne reste en caractres gras tandis que le reste des caractristiques du modle BOXED est appliqu. En option, vous pouvez restaurer pour toutes les cellules les formats dfinis par le modle de tableau actuel. Cette action restaure toutes les cellules qui ont t dites. Si loption Comme Affich est slectionne dans la liste de fichiers de modle de tableau, toutes les cellules modifies reprennent les proprits actuelles du tableau.

Pour appliquer ou enregistrer un modle de tableau


E Activez un tableau pivotant. E A partir des menus, slectionnez : Format Modles de tableaux

325 Tableaux pivotants Figure 12-8 Bote de dialogue Aspects de tableau

E Slectionnez un modle de tableau dans la liste de fichiers. Pour slectionner un fichier dans un autre rpertoire, cliquez sur Parcourir. E Cliquez sur OK pour appliquer le modle de tableau au tableau pivotant slectionn.

Pour modifier ou crer un Modle de tableau


E Dans la bote de dialogue Modles de tableaux, slectionnez un modle de tableau

parmi la liste de fichiers.


E Cliquez sur Modifier modle. E Modifiez les proprits de tableau pour obtenir les attributs souhaits et cliquez sur OK. E Cliquez sur Enregistrer modle pour enregistrer le modle de tableau modifi ou sur Enregistrer sous pour lenregistrer comme nouveau modle.

Modifier un modle de tableau naffecte que le tableau pivotant slectionn. Un modle de tableau modifi nest pas appliqu dautres tableaux utilisant cet Aspect, sauf si vous slectionnez ces tableaux et appliquez nouveau le modle de tableau.

326 Chapitre 12

Proprits du tableau
La bote de dialogue Proprits de tableau vous permet de fixer les proprits gnrales dun tableau et les styles de cellules pour diverses parties dun tableau ainsi que denregistrer un ensemble de proprit en tant que modle de tableau. A laide des onglets de cette bote de dialogue, vous pouvez : Contrler les proprits gnrales, telles que masquer les lignes ou les colonnes vides et ajuster les proprits dimpression. Contrler le format et la position des marques de notes de bas de page. Dterminer des formats spcifiques pour les cellules de donnes, pour les tiquettes de ligne et de colonne et pour les autres zones du tableau. Contrler la largeur et la couleur des lignes formant les bordures de chaque zone du tableau.

Pour modifier les proprits dun tableau pivotant


E Double-cliquez nimporte o sur le tabelau pivotant pour lactiver. E A partir des menus du tableau pivotant, choisissez : Format Proprits du tableau E Slectionnez un onglet (Gnral, Notes de bas de page, Formats de cellule, Bordures ou Impression). E Slectionnez les options souhaites. E Cliquez sur OK ou sur Appliquer.

Les nouvelles proprits sont appliques au tableau pivotant slectionn. Pour appliquer de nouvelles proprits de tableau un modle de tableau au lieu du tableau slectionn seulement, modifiez le modle de tableau (menu Format, Modle de tableau).

327 Tableaux pivotants

Proprits de tableau : Gnral


Plusieurs proprits sappliquent au tableau dans son ensemble. Vous pouvez: Afficher ou masquer des lignes et des colonnes. (Une ligne ou colonne vide ne possde rien dans aucune des cellules de donnes) Contrler le placement des tiquettes de lignes qui peuvent tre dans le coin gauche suprieur ou emboites. Contrler la largeur maximum et minimum de colonne (exprime en points).
Figure 12-9 Bote de dialogue Proprits du tableau, onglet Gnral

Modification des proprits gnrales dun tableau


E Cliquez sur longlet Gnral. E Slectionnez les options souhaites. E Cliquez sur OK ou sur Appliquer.

328 Chapitre 12

Proprits de tableau : Notes de bas de page


Les proprits des marques de notes de bas de page comprennent le style et la position par rapport au texte. Le style des marques de notes de bas de page est soit numrique (1, 2, 3...), soit alphabtique (a, b, c...). Les marques des notes de bas de page peuvent tre attaches au texte en indices ou en exposants.
Figure 12-10 Bote de dialogue Proprits du tableau, onglet Notes de bas de page

Modification des proprits des marques des notes de bas de page


E Cliquez sur longlet Notes de bas de page. E Slectionnez un format pour la numrotation des notes de bas de page. E Slectionnez une position pour les marques.

329 Tableaux pivotants E Cliquez sur OK ou sur Appliquer.

Proprits de tableau : Formats de cellule


Pour le formatage, un tableau est divis en zones : Titre, Strates, Etiquettes de coins, Etiquettes de lignes, Etiquettes de colonnes, Donnes, Lgende et Notes de bas de page. Pour chaque zone dun tableau, vous pouvez modifier les formats des cellules associes. Les formats de cellule comprennent les lments suivants : caractristiques de texte (police, taille, couleur, style), alignement horizontal et vertical, ombrage des cellules, couleurs de premier plan et darrire-plan, et marges intrieures des cellules.
Figure 12-11 Zones dun tableau

Les formats des cellules sont appliqus aux zones (modalits dinformations). Ce ne sont pas des caractristiques des cellules individuelles. Cette distinction est importante lorsquon fait pivoter un tableau. Par exemple : Si vous spcifiez une police en caractres gras pour un format de cellules dans les tiquettes de colonnes, celles-ci apparatront en caractres gras quelles que soient les informations affiches dans la dimension de la colonneet si vous dplacez

330 Chapitre 12

un lment de la dimension de colonne vers une autre dimension, il ne conserve pas les caractres gras des tiquettes de colonnes. Si vous appliquez les caractres gras sur les tiquettes de colonne simplement en mettant en surbrillance les cellules dans un tableau pivotant actif et en cliquant sur le bouton Gras de la barre doutils, le contenu de ces cellules demeurera en caractres gras quelle que soit la dimension dans laquelle vous les dplacez, et les tiquettes de colonne ne resteront pas en caractres gras pour dautres lments dplacs dans la dimension de colonne.
Figure 12-12 Bote de dialogue Proprits du tableau, onglet Formats des cellules

Modification des formats des cellules


E Slectionnez longlet Formats de cellule. E Slectionnez une zone dans la liste droulante ou cliquez sur une zone de lchantillon. E Slectionnez des caractristiques pour la zone. Vos slections se refltent dans

lchantillon.

331 Tableaux pivotants E Cliquez sur OK ou sur Appliquer.

Proprits de tableau : Bordures


Pour chaque emplacement de bordure dans un tableau, vous pouvez slectionner un style et une couleur de ligne. Si vous slectionnez Aucun comme style, il ny aura aucune ligne lemplacement slectionn.
Figure 12-13 Bote de dialogue Proprits du tableau, onglet Bordures

Pour modifier les bordures dun tableau


E Cliquez sur longlet Bordures. E Slectionnez un emplacement de bordure, soit en cliquant sur son nom dans la liste,

soit en cliquant sur une ligne dans la zone dchantillon. (Maj-clic pour slectionner plusieurs noms, Ctrl-Clic pour slectionner plusieurs noms non contigus)
E Slectionnez un style de ligne ou Aucun.

332 Chapitre 12 E Slectionnez une couleur. E Cliquez sur OK ou sur Appliquer.

Pour afficher des bordures masques dans un tableau pivotant


Pour les tableaux possdant peu de bordures visibles, vous pouvez afficher les bordures masques. Cela peut faciliter des tches telles que la modification de la largeur des colonnes. Les bordures masques (quadrillage) sont affiches dans le Viewer mais ne sont pas imprimes.
E Double-cliquez nimporte o sur le tabelau pivotant pour lactiver. E A partir des menus, slectionnez : Affichage Quadrillage

Proprits de tableau : Impression


Pour les tableaux pivotants imprims, vous pouvez contrler les proprits suivantes : Imprimer toutes les strates ou seulement la strate suprieure du tableau, et imprimer chaque strate sur une page spare. (Ceci naffecte que limpression, pas laffichage des strates dans lEditeur de rsultats.) Rtrcir un tableau horizontalement ou verticalement pour quil tienne dans la page lors de limpression. Contrler les lignes veuves et orphelines en contrlant le nombre minimal de lignes et de colonnes qui seront contenues dans une section imprime dun tableau si le tableau est trop large et/ou trop long pour la taille dfinie de la page. (Remarque : Si un tableau est trop long pour tenir sur le restant de la page actuelle car il y a un dautres rsultats au-dessus dans la page, mais quil tient dans la longueur de page dfinie, il est automatiquement imprim sur une nouvelle page, quel que soit le paramtrage des lignes veuves/orphelines) Inclure du texte de suite pour des tableaux qui ne peuvent sajuster une seule page. Vous pouvez afficher du texte de suite au bas de chaque page et en haut de chaque page. Si aucune option est slectionne, le texte de suite de sera pas affich.

333 Tableaux pivotants

Pour contrler limpression dun tableau pivotant


E Cliquez sur longlet Impression. E Slectionnez les options dimpression souhaites. E Cliquez sur OK ou sur Appliquer.

Polices
Un modle de tableau vous permet de spcifier des caractristiques de police pour diffrentes zones du tableau. Vous pouvez galement changer la police de toute cellule individuellement. Les options de police dans une cellule comprennent le type de police, le style, la taille et la couleur. Vous pouvez galement masquer le texte ou le souligner. Si vous spcifiez des proprits de police dans une cellule, ces proprits sappliquent dans toutes les strates du tableau possdant la mme cellule.
Figure 12-14 Bote de dialogue Police

334 Chapitre 12

Modification de la police dune cellule


E Activez le tableau pivotant et slectionnez le texte que vous voulez modifier. E A partir des menus du tableau pivotant, choisissez : Format Polices

En option, vous pouvez slectionner une police, un style de police et une taille, spcifier si vous voulez masquer ou souligner le texte ou slectionner une couleur et un style dcriture.

Largeur des cellules de donnes


Fixer la largeur des cellules de donnes est utilis pour fixer une mme largeur toutes les cellules de donnes.
Figure 12-15 Bote de dialogue Fixer la Largeur des Cellules de Donnes

Modification de la largeur des cellules de donnes


E Activez le tableau pivotant. E A partir des menus, slectionnez : Format Largeur des cellules E Entrez une valeur pour la largeur des cellules.

Modification de la largeur dune colonne de tableau pivotant


E Double-cliquez nimporte o sur le tabelau pour lactiver.

335 Tableaux pivotants E Dplacez le pointeur de la souris dans les tiquettes de modalits jusqu ce quil soit

sur la bordure droite de la colonne que vous voulez modifier. (Le pointeur se change en flche deux pointes.)
E Maintenez le bouton de la souris enfonc pendant que vous faites glisser la bordure

vers sa nouvelle position.


Figure 12-16 Modifier la largeur dune colonne

Vous pouvez modifier les bordures verticales de modalit et de dimension dans la zone des tiquettes de ligne, quelles soient masques ou non.
E Dplacez le pointeur de la souris travers les tiquettes de ligne jusqu voir

apparatre la flche deux pointes.


E Faites glisser la bordure jusqu la nouvelle largeur.

Proprits de la cellule
Les proprits de cellules sappliquent une cellule slectionne. Vous pouvez changer le format des valeurs, lalignement, les marges et de lombrage. Les Proprits des cellules supplantent les proprits de tableau ; donc, si vous changez les proprits de tableau, vous ne modifierez pas les proprits de cellules appliques individuellement.

Modification des proprits de la cellule


E Activez un tableau et slectionnez une cellule du tableau. E A partir des menus, slectionnez : Format Proprits de la cellule

336 Chapitre 12

Proprits des cellules : Valeur


Cet onglet de bote de dialogue contrle le format des valeurs dune cellule. Vous pouvez slectionner des formats pour les nombres, les dates, les heures ou les monnaies et ajuster le nombre de dcimales affiches.
Figure 12-17 Bote de dialogue Proprits de la cellule, onglet Valeur

Modification des formats des valeurs dans une cellule


E Cliquez sur longlet Valeur. E Slectionnez une modalit et un format. E Slectionnez le nombre de dcimales.

Pour modifier le format des valeurs dans une colonne


E Ctrl-Alt-clic sur ltiquette de colonne.

337 Tableaux pivotants E Cliquez avec le bouton droit de la souris sur la colonne en surbrillance. E A partir du menu contextuel, slectionnez Proprits de la cellule. E Cliquez sur longlet Valeur. E Slectionnez le format que vous voulez appliquer la colonne.

Vous pouvez utiliser cette mthode pour supprimer ou ajouter des symboles pourcentage ou dollar, modifier le nombre de dcimales affiches et passer de la notation numrique normale la notation scientifique.

Proprits des cellules : Alignement


Cet onglet de bote de dialogue fixe lalignement vertical et horizontal et la direction du texte pour une cellule. Si vous slectionnez Mixte, le contenu de la cellule est align selon son type (nombre, date ou texte).
Figure 12-18 Bote de dialogue Proprits de le cellule, onglet Alignement

338 Chapitre 12

Modification de lalignement dans les cellules


E Slectionnez une cellule dans le tableau. E A partir des menus du tableau pivotant, choisissez : Format Proprits de la cellule E Cliquez sur longlet Alignement.

Lorsque vous slectionnez les proprits dalignement de la cellule, elles sillustrent dans la zone dchantillon.

Proprits des cellules : Marges


Cet onglet de bote de dialogue spcifie la marge chaque bord dune cellule.
Figure 12-19 Bote de dialogue Proprits de la cellule, onglet Marges

339 Tableaux pivotants

Modification des marges dans les cellules


E Cliquez sur longlet Marges. E Slectionnez la valeur de chacune des quatre marges.

Proprits des cellules : Ombrage


Cet onglet de bote de dialogue spcifie le pourcentage dombrage ainsi que les couleurs de premier plan et darrire-plan pour une zone de cellules spcifie. Cela naffecte pas la couleur du texte.
Figure 12-20 Bote de dialogue Proprits de la cellule, onglet Ombrage

Modification de lombrage des cellules


E Cliquez sur longlet Ombrage. E Slectionnez les surbrillances et les couleurs de la cellule.

340 Chapitre 12

Marque de bas de page


Marque de note de bas de page modifie le ou les caractres utiliss pour marquer une note de bas de page.
Figure 12-21 Bote de dialogue Marque de Note de bas de page

Modification des caractres des marques des notes de bas de page


E Slectionnez une note de bas de page. E A partir des menus du tableau pivotant, choisissez : Format Marque de note de bas de page E Entrez un ou deux caractres.

Renumrotation des notes de bas de page


Lorsque vous avez fait pivoter un tableau en changeant des lignes, des colonnes et des strates, les notes de bas de page peuvent tre dsactives. Pour renumroter les notes de bas de page :
E Activez le tableau pivotant. E A partir des menus, slectionnez : Format Renumroter notes de bas de page

341 Tableaux pivotants

Slection des lignes et des colonnes dans les tableaux pivotants


Dans les tableaux pivotants, certaines contraintes existent quant la manire de slectionner les lignes et les colonnes, et la surbrillance qui indique la ligne ou la colonne slectionne peut stendre sur des zones non contigus du tableau.

Pour slectionner une ligne ou une colonne dans un tableau pivotant


E Double-cliquez nimporte o sur le tabelau pivotant pour lactiver. E Cliquez sur une tiquette de ligne ou de colonne. E A partir des menus, slectionnez : Edition Slectionnez Cellules de donnes et dtiquettes

ou
E Ctrl-Alt-clic sur ltiquette de ligne ou de colonne.

Si le tableau contient plusieurs dimensions dans la zone des lignes ou des colonnes, la slection en surbrillance peut stendre sur plusieurs cellules non contigus.

Modification des rsultats dun tableau pivotant


Le texte qui saffiche dans le Viewer peut apparatre dans beaucoup dlments. Vous pouvez modifier le texte ou ajouter de nouveaux textes. Les tableaux pivotants peuvent tre dits en : Editant du texte dans les cellules du tableau pivotant. Ajoutant des lgendes et des notes de bas de page.

Pour modifier le texte dune cellule


E Activez le tableau pivotant. E Double-cliquez sur la cellule.

342 Chapitre 12 E Editez le texte. E Appuyez sur la touche Entre pour enregistrer vos changements ou appuyez sur la

touche Echap pour restaurer le contenu prcdent de la cellule.

Ajout de lgendes un tableau


E A partir des menus du tableau pivotant, choisissez : Insrer Lgende

Les mots Lgende du tableau saffichent au bas du tableau.


E Double-cliquez sur les mots Lgende du tableau et remplacez-les par le texte de

lgende de votre choix.

Ajout dune note de bas de page un tableau


Une note de bas de page peut tre attache tout lment dun tableau.
E Cliquez sur un titre, une cellule ou une lgende dans le tableau pivotant activ. E A partir des menus du tableau pivotant, choisissez : Insrer Note de bas de page E Double-cliquez sur le mot Note de bas de page et remplacez-le par le texte de note

de bas de page de votre choix.

Impression des tableaux pivotants


Divers facteurs peuvent affecter laspect des tableaux pivotants imprims et ces facteurs peuvent tre contrls en modifiant les attributs du tableau pivotant. Pour des tableaux pivotants multidimensionnels (tableaux avec strates), vous pouvez soit imprimer toutes les strates, soit simplement imprimer la strate suprieure (visible). Pour des tableaux pivotants longs ou larges, vous pouvez automatiquement redimensionner le tableau pour ajuster la page ou contrler la position des sauts de tableaux ou des sauts de page.

343 Tableaux pivotants

Utilisez lAperu avant impression du menu Fichier pour voir quoi ressembleront les tableaux pivotants imprims.

Pour imprimer les strates masques dun tableau pivotant


E Double-cliquez nimporte o sur le tabelau pour lactiver. E A partir des menus, slectionnez : Format Proprits du tableau E Dans longlet Impression, slectionnez Imprimer toutes les strates.

Vous pouvez aussi imprimer chaque strate dun tableau pivotant sur une page distincte.

Contrle des sauts de tableau pour les tableaux longs et larges


Les tableaux pivotants qui sont soit trop larges soit trop longs pour tre imprims dans la taille de page dfinie sont automatiquement diviss et sont imprims en plusieurs sections. (Pour les tableaux larges, les diffrentes sections simpriment sur la mme page sil y a de la place). Vous pouvez: Contrler la position laquelle les lignes et les colonnes sont diviss les grands tableaux Indiquer les lignes et colonnes qui doivent tre conservs ensemble lors de la division de tableaux Redimensionner les grands tableaux pour les ajuster la taille dfinie pour la page

Pour spcifier des sauts de ligne et de colonne dans les tableaux pivotants imprims
E Activez le tableau pivotant. E Cliquez sur ltiquette de colonne gauche de lendroit o vous souhaitez insrer le

saut ou sur ltiquette de ligne au-dessus de lendroit o vous souhaitez insrer le saut.
E A partir des menus, slectionnez : Format Sparer ici

344 Chapitre 12

Spcification des lignes ou colonnes conserver ensemble


E Activez le tableau pivotant. E Slectionnez les tiquettes des lignes ou colonnes que vous souhaitez conserver

ensemble. (Cliquez-glissez ou Maj+cliquez pour slectionner plusieurs tiquettes de ligne ou de colonne.)


E A partir des menus, slectionnez : Format Conserver ensemble

Pour redimensionner un tableau pivotant afin de lajuster la page


E Activez le tableau pivotant. E A partir des menus, slectionnez : Format Proprits du tableau E Cliquez sur longlet Impression. E Slectionnez Redimensionner largeur de tableau.

et/ou
E Slectionnez Redimensionner longueur de tableau.

Utilisation de la syntaxe de commande

13

Chapitre

SPSS fournit un puissant langage de commande qui vous permet denregistrer et dautomatiser de nombreuses tches. Il fournit galement des fonctionnalits qui ne se trouvent ni dans les menus ni dans les botes de dialogue. La plupart des commandes sont accessibles depuis les menus et botes de dialogue. Cependant, certaines options et commandes ne sont disponibles quen utilisant le langage de commande. Celui-ci vous permet denregistrer vos travaux dans un fichier de syntaxe afin de vous permettre de relancer votre analyse une date ultrieure ou de lexcuter dans une opration automatise laide du systme de production. Un fichier de syntaxe de commande est un fichier texte simple contenant des commandes. Il est possible douvrir une fentre de syntaxe et de taper des commandes, mais il est plus simple de laisser SPSS construire le fichier de syntaxe selon lune des mthodes suivantes : Copie de la syntaxe de commande partir des botes de dialogue, Copie de la syntaxe partir du fichier de rsultat, Copie de la syntaxe partir du fichier-journal. Un guide de rfrence dtaill sur la syntaxe des commandes est disponible sous deux formes diffrentes : guide intgr dans le systme daide global et comme fichier PDF distinct appel SPSS Command Syntax Reference, aussi disponible partir du menu Aide. Laide contextuelle pour la commande en cours est disponible dans une fentre de syntaxe en pressant la touche F1.

345

346 Chapitre 13

Rgles de syntaxe de commande


Lorsque vous excutez des commandes partir dune fentre de syntaxe de commande lors dune session SPSS, vous excutez des commandes en mode interactif. Les rgles suivantes sappliquent aux spcifications de commandes en mode interactif : Chaque commande doit tre affiche avec un point servant de caractre de fin de commande. Cependant, il est prfrable dignorer le caractre de fin sur BEGIN DATA , de faon ce que les donnes linaires soient traites comme une seule spcification continue. Le caractre de fin de commande doit correspondre au dernier caractre non vide dune commande. En labsence dun point servant de caractre de fin de commande, toute ligne vide est interprte comme un caractre de fin de commande. Les commandes peuvent commencer dans nimporte quelle colonne dune ligne de commande et continuer sur autant de lignes que ncessaire. Cependant, une exception existe pour la commande END DATA. La commande END DATA doit commencer dans la premire colonne de la premire ligne la fin des donnes. Remarque : Pour que les autres modes dexcution de commande soient compatibles entre eux (notamment les fichiers de commandes excuts avec les commandes INSERT ou INCLUDE dans une session interactive), chaque ligne de syntaxe de commande ne doit pas dpasser 256 octets. La plupart des sous-commandes sont spares par des barres obliques (/). La barre oblique figurant avant la premire sous-commande de la commande est souvent facultative. Le nom des variables doit tre crit en en toute lettre. Le texte inclus dans les apostrophes ou les guillemets doit tenir sur une seule ligne. Un point (.) doit tre utilis pour indiquer les dcimales, indpendamment des paramtres rgionaux ou locaux. Le nom des variables finissant par un point peut engendrer des erreurs dans les commandes cres par les botes de dialogue. Vous ne pouvez pas crer de tels noms de variable dans les botes de dialogue ; vous devez donc viter dindiquer ces noms.

347 Utilisation de la syntaxe de commande

La syntaxe de commande respectant la casse, une abrviation de trois ou quatre lettres peut tre utilise pour spcifier ces commandes. Vous pouvez utiliser autant de lignes voulues pour spcifier une commande unique. Il vous est possible dajouter des espaces ou des sauts de ligne presque tous les points dinsertion dun espace vide, tels que des barres obliques, des parenthses, des oprateurs arithmtique, ou les ajouter entre le nom des variables. Par exemple,
FREQUENCIES VARIABLES=JOBCAT GENDER /PERCENTILES=25 50 75 /BARCHART.

et
freq var=jobcat gender /percent=25 50 75 /bar.

sont deux choix possibles qui gnrent les mmes rsultats.


Fichiers INCLUDE

Pour les fichiers de commande excuts via la commande INCLUDE, les rgles de syntaxe du mode de commande sappliquent. Les rgles suivantes sappliquent des spcifications de commandes en mode de commande ou en mode de production : Toutes les commandes du fichier de commande doivent commencer dans la colonne 1. Vous pouvez utiliser les signes plus (+) ou moins (-) dans la premire colonne si vous souhaitez indenter la spcification de commande afin de faciliter la lecture du fichier. Si plusieurs lignes sont utilises pour une commande, la colonne 1 de chaque ligne suivante doit tre vide. Les caractres de fin de commande sont optionnels. Une ligne ne peut pas excder 256 octets. Tout caractre supplmentaire est tronqu. A moins de disposer de fichiers de commande existants qui utilisent dj la commande
INCLUDE, il est prfrable dutiliser la place la commande INSERT, car elle

convient aux fichiers de commande conformes lun des deux ensembles de rgles. Si vous gnrez une syntaxe de commande en collant les slections dune bote de dialogue dans une fentre de syntaxe, le format des commandes convient tout mode de production. Pour plus dinformations, reportez-vous au manuel SPSS Command Syntax Reference (disponible au format PDF depuis le menu Aide).

348 Chapitre 13

Cration dune syntaxe depuis les botes de dialogue


La mthode la plus simple pour construire un fichier de syntaxe de commande consiste effectuer des slections dans les botes de dialogue et coller la syntaxe dans la fentre correspondante. En collant la syntaxe chaque tape dune longue analyse, vous pouvez construire un fichier de travail vous permettant de relancer lanalyse ultrieurement ou dexcuter une opration automatise laide du systme de production. Dans la fentre de syntaxe, vous pouvez excuter la syntaxe qui a t colle, la modifier et lenregistrer dans un fichier de syntaxe.

Collage dune syntaxe depuis les botes de dialogue


E Ouvrez la bote de dialogue et faites vos slections. E Cliquez sur Coller.

La syntaxe de commande est alors colle dans la fentre correspondante. Si vous navez pas ouvert de fentre, une nouvelle fentre souvre automatiquement pour pouvoir y coller la syntaxe.

349 Utilisation de la syntaxe de commande Figure 13-1 Syntaxe de commande colle depuis une bote de dialogue

Remarque : Si vous ouvrez une bote de dialogue partir des menus dune fentre de script, le code permettant dexcuter la syntaxe depuis un script est alors coll dans la fentre correspondante.

Utilisation de la syntaxe depuis le fichier de rsultat


Vous pouvez construire un fichier de syntaxe en copiant la syntaxe depuis le fichier apparaissant dans le Viewer. Pour ce faire, slectionnez Afficher commandes dans les paramtres de lEditeur de rsultats (menu Edition, Options, onglet Editeur de rsultats) avant de lancer lanalyse. Chaque commande apparat donc dans le Viewer accompagn du rsultat de lanalyse. Dans la fentre de syntaxe, vous pouvez excuter la syntaxe qui a t colle, la modifier et lenregistrer dans un fichier de syntaxe.

350 Chapitre 13 Figure 13-2 Syntaxe de commande dans le fichier

Copier la syntaxe depuis le fichier de rsultats


E Avant de lancer lanalyse, partir du menu, slectionnez : Edition Options E Dans longlet Viewer, slectionnez Afficher commandes.

Au cours de lanalyse, les commandes des slections faites dans votre bote de dialogue sont enregistres dans le fichier.
E Ouvrez un fichier de syntaxe prcdemment enregistr ou crez-en un nouveau. Pour

ce faire, partir du menu, slectionnez :


Fichier Nouveau Syntaxe E Dans lEditeur de rsultats, double-cliquez sur un lment du fichier pour le mettre en

surbrillance.

351 Utilisation de la syntaxe de commande E Cliquez et faites glisser la souris pour slectionner la syntaxe copier. E A partir du menu de lEditeur de rsultats, slectionnez : Edition Copier E Dans la fentre de syntaxe, partir du menu, slectionnez : Edition Coller

Utilisation de la syntaxe dans un fichier-journal


Par dfaut, toutes les commandes excutes au cours dune session sont enregistres dans un fichier-journal nomm spss.jnl (configur dans le menu Edition, commande Options). Vous pouvez modifier le fichier-journal et lenregistrer en tant que fichier de syntaxe que vous pouvez utiliser pour relancer une analyse, ou lexcuter dans une opration automatise laide du systme de production. Le fichier-journal est un fichier texte pouvant tre modifi comme tout autre fichier. Des messages derreur et des avertissements tant galement enregistrs dans le fichier-journal avec la syntaxe de commande, vous devez modifier les messages derreur et les avertissements gnrs avant denregistrer le fichier de syntaxe. Notez toutefois que les erreurs doivent tre rsolues pour que lanalyse puisse seffectuer correctement. Enregistrez le fichier-journal modifi sous un autre nom. Le fichier-journal tant automatiquement ajout ou cras chaque session, la tentative dutilisation du mme nom de fichier pour les fichiers de syntaxe et journaux peut gnrer des rsultats inattendus.

352 Chapitre 13 Figure 13-3 Edition du fichier-journal

Modification de la syntaxe dans un fichier-journal


E Pour ouvrir le fichier-journal, slectionnez partir du menu : Fichier Open Autre E Ouvrez le fichier-journal (par dfaut, spss.jnl se trouve dans le rpertoire temp).

Slectionnez Tous les fichiers (*.*) dans la liste des types de fichiers ou entrez *.jnl dans la zone de texte Nom de fichier pour afficher les fichiers-journaux dans la liste. Si vous ne parvenez pas trouver le fichier, utilisez Options du menu Edition pour connatre lemplacement du journal sur votre systme.
E Modifiez le fichier afin de supprimer tout message derreur ou avertissement indiqu

par un signe >.

353 Utilisation de la syntaxe de commande E Enregistrez le fichier-journal modifi sous un autre nom. (Nous vous conseillons

dutiliser un nom avec une extension .sps. Cest lextension par dfaut des fichiers de syntaxe.)

Excuter une syntaxe de commande


E Mettez en surbrillance les commandes excuter dans la fentre de syntaxe. E Cliquez sur le bouton Excuter (en forme de triangle) dans la barre doutils de la

fentre de lditeur de syntaxe. ou


E Slectionnez lune des options du menu Excuter.

Tout : Excute toutes les commandes dans la fentre de syntaxe. Slection : Excute les commandes slectionnes, y compris les commandes

partiellement slectionnes.
Courant : Excute la commande lendroit o le curseur est situ. Jusqu la fin : Excute toutes les commandes partir de lemplacement du curseur

jusqu la fin du fichier de syntaxe de commande. Le bouton Excuter dans la barre doutils de lditeur de syntaxe excute les commandes slectionnes ou la commande slectionne lendroit o le curseur est situ si aucun lment nest slectionn.
Figure 13-4 Barre doutils Editeur de syntaxe

Commandes Execute multiples


La syntaxe colle depuis des botes de dialogue ou copie depuis le journal peut contenir des commandes EXECUTE. Lorsque vous excutez plusieurs commandes partir dune fentre de syntaxe, il est inutile de faire appel plusieurs commandes EXECUTE. Vous risquez mme de ralentir les performances car cette commande lit lintgralit du fichier de donnes.

354 Chapitre 13

Si la dernire commande du fichier de syntaxe lit le fichier de donnes (comme une procdure statistique ou graphique), aucune commande EXECUTE nest ncessaire ; vous pouvez donc supprimer ces commandes. Si vous ntes pas sr que la dernire commande lise le fichier de donnes, vous pouvez gnralement supprimer toutes les commandes EXECUTE du fichier de syntaxe, lexception de la dernire.
Fonctions Dcalage positif

Cette exception concerne les commandes de transformation qui contiennent des fonctions Dcalage positif. Dans une srie de commandes de transformation ne contenant aucune commande EXECUTE ni aucune autre commande lisant les donnes, les fonctions Dcalage positif sont calcules une fois toutes les autres transformations effectues, sans tenir compte de lordre des commandes. Par exemple :
COMPUTE lagvar=LAG(var1) COMPUTE var1=var1*2

et
COMPUTE lagvar=LAG(var1) EXECUTE COMPUTE var1=var1*2

gnre diffrents rsultats pour la valeur lagvar car la premire valeur utilise la valeur transforme var1 alors que la deuxime utilise la valeur dorigine.

Effectifs

14

Chapitre

La procdure Effectifs permet dobtenir des affichages statistiques et graphiques qui servent dcrire de nombreux types de variables. La procdure Effectifs peut jouer un rle lorsque vous prenez connaissance de vos donnes. Pour obtenir un rapport des Effectifs et un diagramme en btons, vous pouvez trier les diffrentes valeurs par ordre croissant ou dcroissant, ou bien classer les modalits en fonction de leurs effectifs. Le rapport de effectifs peut tre supprim lorsquune variable a plusieurs valeurs distinctes. Vous pouvez tiqueter les diagrammes avec des effectifs (par dfaut) ou des pourcentages.
Exemple. Quelle est la rpartition de la clientle dune socit selon le type dindustrie

dont elle fait partie ? Le rsultat pourrait vous apprendre que votre clientle est compose 37,5 % dorganismes dtat, 24,9 % de socits commerciales, 28,1 % dtablissements universitaires et 9,4 % du secteur de la sant. Pour des donnes continues et quantitatives, comme par exemple les revenus des ventes, vous pourriez constater que la moyenne de vente par produit est de 3 576 avec un cart-type de 1 078 .
Diagrammes et statistiques. Effectifs de frquence, pourcentages, pourcentages

cumuls, moyenne, mdiane, mode, somme, cart-type, variance, intervalle, valeurs minimale et maximale, erreur standard de la moyenne, asymtrie et aplatissement (avec leurs erreurs standard), quartiles, centiles choisis par lutilisateur, diagrammes en btons, diagrammes en secteurs et histogrammes.
Donnes. Utilisez des codes numriques ou alphanumriques courts pour coder les

variables qualitatives (mesures de niveau nominal ou ordinal).


Hypothses. Les tabulations et les pourcentages fournissent une description utile sur

les donnes de nimporte quelle distribution, particulirement pour les variables disposant de modalits tries ou non. Certaines des statistiques rcapitulatives facultatives, telles que la moyenne et lcart-type, sont fondes sur la thorie de normalit et sont appropries pour des variables quantitatives avec une distribution
355

356 Chapitre 14

symtrique. Les statistiques de base, telles que la mdiane, les quartiles et les centiles, sont appropries pour les variables quantitatives, quelles rpondent ou non au critre de normalit.
Figure 14-1 Rsultat de effectifs

Pour obtenir des tableaux de effectifs


E A partir des menus, slectionnez : Analyse Statistiques descriptives Effectifs

357 Effectifs Figure 14-2 Bote de dialogue Effectifs

E Slectionnez une ou plusieurs variables qualitatives ou quantitatives.

Sinon, vous pouvez : Cliquer sur Statistiques pour obtenir des statistiques descriptives pour des variables quantitatives. Cliquer sur Diagrammes pour obtenir des diagrammes en btons, des diagrammes en secteurs ou des histogrammes. Cliquer sur Format pour dfinir lordre de prsentation des rsultats.

358 Chapitre 14

Statistiques des effectifs


Figure 14-3 Bote de dialogue Effectifs : Statistiques

Fractiles. Valeurs dune variable quantitative qui divisent les donnes tries en

classes par centime. Les quartiles (25ime, 50ime et 75ime centiles) divisent les observations en quatre classes de taille gale. Si vous souhaitez un nombre gal de classes diffrent de quatre, slectionnez Partition en n classes gales. Vous pouvez galement spcifier des centiles particuliers (par exemple, le 95ime centile, valeur au-dessus de 95 % des observations).
Tendance centrale. Les statistiques dcrivant la position de la distribution comprennent

la Moyenne, la Mdiane, le Mode et la Somme de toutes les valeurs.


Moyenne. Mesure de la tendance centrale. Moyenne arithmtique ; somme divise

par le nombre d'observations.


Mdiane. Valeur au-dessus ou au-dessous de laquelle se trouve la moiti des

observations ; 50e centile. Si le nombre d'observations est pair, la mdiane correspond la moyenne des deux observations du milieu lorsqu'elles sont tries dans l'ordre croissant ou dcroissant. La mdiane est une mesure de tendance centrale et elle n'est pas, l'inverse de la moyenne, sensible aux valeurs loignes.

359 Effectifs

Mode . Valeur qui revient le plus frquemment. Si plusieurs valeurs partagent

la plus grande frquence d'occurrence, chacune d'elles constitue un mode. La procdure Frquences ne rend compte que du plus petit mode.
Somme. Somme ou total des valeurs, pour toutes les observations n'ayant pas

de valeur manquante.
Dispersion. Les statistiques mesurant la variance ou la dispersion dans les donnes, comprennent lcart-type, la variance, lintervalle, le minimum, le maximum et lerreur standard (ES) de la moyenne. Ecart type. Mesure de la dispersion des valeurs autour de la moyenne. Dans le

cas d'une distribution normale, 68 % des observations se situent l'intrieur d'un cart-type de la moyenne et 95 % se situent l'intrieur de deux carts-types. Par exemple, si la moyenne d'ge est de 45 avec un cart-type gal 10, une distribution normale verra 95 % des observations se situer entre 25 et 65.
Variance. Mesure de la dispersion des valeurs autour de la moyenne, gale la

somme des carrs des carts par rapport la moyenne, divise par le nombre d'observations moins un. La variance se mesure en units, qui sont gales au carr des units de la variable.
Etendue. Diffrence entre la valeur maximale et la valeur minimale d'une variable

numrique (maximumminimum).
Minimum. Valeur la plus petite d'une variable numrique. Maximum. Plus grande valeur d'une variable numrique. ES Moyenne. Mesure du taux de variation de la valeur de la moyenne sur

des chantillons provenant de la mme distribution. Cette mesure permet de comparer approximativement la moyenne observe avec une valeur hypothtique (autrement dit, vous pouvez conclure que ces deux valeurs sont diffrentes si le rapport de la diffrence avec l'erreur standard est infrieur -2 ou suprieur +2).
Distribution. LAsymtrie et lAplatissement sont des statistiques qui dcrivent la forme et la symtrie de la distribution. Ces statistiques sont prsentes avec leurs erreurs standard. Skewness. Mesure de l'asymtrie d'une distribution. La distribution normale est

symtrique et possde une valeur d'asymtrie gale 0. Une distribution dont la valeur d'asymtrie est positive prsente une extrmit droite allonge. Une distribution caractrise par une importante asymtrie ngative prsente une

360 Chapitre 14

extrmit gauche plus allonge. Pour simplifier, une valeur d'asymtrie deux fois suprieure l'erreur standard correspond une absence de symtrie.
Kurtosis. Mesure de l'tendue du regroupement des observations autour d'un

point central. Dans le cas d'une distribution normale, la valeur de la statistique d'aplatissement est gale zro. Un aplatissement positif indique que les observations sont plus regroupes et prsentent des extrmits plus longues que dans le cas d'une distribution normale. Un aplatissement ngatif signifie que les observations sont moins regroupes et prsentent des extrmits plus courtes.
Valeurs sont des centres de classes. Si les valeurs dans vos donnes reprsentent des centres de classes (par exemple, les ges des individus trentenaires sont reprsents par le code 35), slectionnez cette option pour estimer la mdiane et les centiles des donnes originales, non regroupes.

Diagrammes des effectifs


Figure 14-4 Bote de dialogue Effectifs : Diagrammes

Type de diagramme. Un diagramme en secteurs montre la participation de chaque

partie lensemble. Chaque secteur du diagramme correspond un groupe dfini par une simple variable de regroupement. Un diagramme en btons montre leffectif de chaque valeur ou de chaque modalit sous la forme dun bton distinct, ce qui vous permet de comparer les modalits visuellement. Un histogramme est galement constitu de btons mais ils sont rpartis intervalles gaux. La hauteur de chaque

361 Effectifs

bton reprsente leffectif des valeurs dune variable quantitative appartenant lintervalle. Un histogramme montre la forme, le centre et la dispersion de la distribution. Si vous superposez une courbe normale sur lhistogramme, vous pouvez dterminer si les donnes sont distribues normalement.
Valeurs du diagramme. Dans les diagrammes en btons, laxe peut tre tiquet par

effectifs ou pourcentages de frquence.

Format des effectifs


Figure 14-5 Bote de dialogue Effectifs: Format

Ordre daffichage. Le tableau de effectifs peut tre affich en fonction des valeurs

relles des donnes ou de leffectif (frquence doccurrence) de ces valeurs et organis par valeurs croissantes ou valeurs dcroissantes. Cependant, si vous demandez un histogramme ou des centiles, SPSS part du principe que la variable est quantitative et affiche ses valeurs par ordre croissant.
Variables multiples. Si vous crez des tableaux statistiques pour des variables

multiples, vous pouvez afficher toutes les variables dans un tableau unique (Comparer variables) ou bien afficher un tableau statistique spar pour chaque variable (Sparer rsultats par variables).
Supprimer les tableaux avec plus de n modalits. Cette option vite laffichage des

tableaux ayant plus que le nombre spcifi de valeurs.

Descriptives

15

Chapitre

La procdure Descriptive affiche les rsums de statistiques univaries pour plusieurs variables en un seul tableau et calcule les valeurs standardises (scores z). Les variables peuvent tre ordonnes en fonction de la taille de leurs moyennes (en ordre ascendant ou descendant), alphabtiquement ou selon lordre dans lequel vous avez slectionn les variables (par dfaut). Lorsque les scores z sont enregistrs, ils sont ajouts aux donnes dans lditeur de donnes et sont disponibles pour les diagrammes SPSS, les listes de donnes et les analyses. Lorsque les variables sont enregistres avec des units diffrentes (par exemple, produit domestique brut par personne et pourcentage de la population sachant lire et crire), une transformation en score z place les variables sur une chelle commune pour que la comparaison soit plus facile.
Exemple. Si chaque observation dans vos donnes contient les totaux des ventes

quotidiennes pour chacun des membres du personnel commercial (par exemple, une entre pour Bob, une pour Kim, une pour Brian, etc.) rapports chaque jour pendant plusieurs mois, la procdure Descriptives peut calculer les ventes quotidiennes moyennes pour chacun des membres du personnel et ordonner les rsultats de la moyenne des ventes la plus leve la plus basse.
Statistiques. Taille de lchantillon, moyenne, minimum, maximum, cart-type,

variance, intervalle, somme, erreur standard de la moyenne, et aplatissement et asymtrie avec leurs erreurs standards (ES).
Donnes. Utilisez des variables numriques aprs les avoir visualises graphiquement

en cherchant des erreurs denregistrement, les valeurs loignes et les anomalies de distribution. La procdure Descriptives est trs efficace pour les gros fichiers (milliers dobservations).
Hypothses. La plupart des statistiques disponibles (y compris les carts z) sont bases sur une thorie normale et conviennent pour des variables continues (mesures de niveau dintervalle ou de rapport) avec distribution symtrique. Evitez les variables
363

364 Chapitre 15

avec des modalits dsordonnes ou des rpartitions asymtriques. La distribution des carts z a la mme forme que celle des donnes dorigine. Ainsi, le calcul des carts z nest pas une solution aux donnes posant des problmes.
Pour obtenir des statistiques descriptives
E A partir des menus, slectionnez : Analyse Statistiques descriptives Descriptives Figure 15-1 Bote de dialogue Descriptives

E Slectionnez une ou plusieurs variables.

Sinon, vous pouvez : Cliquez sur Enregistrer des valeurs standardises dans des variables pour enregistrer les carts z comme nouvelles variables. Cliquer sur Options pour les statistiques optionnelles et lordre daffichage.

365 Descriptives

Options Descriptives
Figure 15-2 Bote de dialogue Descriptives : Options

Moyenne et somme. La moyenne ou moyenne arithmtique saffiche par dfaut. Dispersion. Les statistiques qui mesurent ltendue ou les variations dans les donnes comprennent lcart-type, la variance, lintervalle, le minimum, le maximum, et lerreur standard (ES) de la moyenne. Ecart type. Mesure de la dispersion des valeurs autour de la moyenne. Dans le

cas d'une distribution normale, 68 % des observations se situent l'intrieur d'un cart-type de la moyenne et 95 % se situent l'intrieur de deux carts-types. Par exemple, si la moyenne d'ge est de 45 avec un cart-type gal 10, une distribution normale verra 95 % des observations se situer entre 25 et 65.
Variance. Mesure de la dispersion des valeurs autour de la moyenne, gale la

somme des carrs des carts par rapport la moyenne, divise par le nombre d'observations moins un. La variance se mesure en units, qui sont gales au carr des units de la variable.
Etendue. Diffrence entre la valeur maximale et la valeur minimale d'une variable

numrique (maximumminimum).

366 Chapitre 15

Minimum. Valeur la plus petite d'une variable numrique. Maximum. Plus grande valeur d'une variable numrique. E.S. moyenne. Mesure du taux de variation de la valeur de la moyenne sur

des chantillons provenant de la mme distribution. Cette mesure permet de comparer approximativement la moyenne observe avec une valeur hypothtique (autrement dit, vous pouvez conclure que ces deux valeurs sont diffrentes si le rapport de la diffrence avec l'erreur standard est infrieur -2 ou suprieur +2).
Distribution. Laplatissement et lasymtrie sont des statistiques qui caractrisent la

forme et la symtrie de la distribution. Ces statistiques sont prsentes avec leurs erreurs standard.
Kurtosis. Mesure de l'tendue du regroupement des observations autour d'un

point central. Dans le cas d'une distribution normale, la valeur de la statistique d'aplatissement est gale zro. Un aplatissement positif indique que les observations sont plus regroupes et prsentent des extrmits plus longues que dans le cas d'une distribution normale. Un aplatissement ngatif signifie que les observations sont moins regroupes et prsentent des extrmits plus courtes.
Skewness. Mesure de l'asymtrie d'une distribution. La distribution normale est

symtrique et possde une valeur d'asymtrie gale 0. Une distribution dont la valeur d'asymtrie est positive prsente une extrmit droite allonge. Une distribution caractrise par une importante asymtrie ngative prsente une extrmit gauche plus allonge. Pour simplifier, une valeur d'asymtrie deux fois suprieure l'erreur standard correspond une absence de symtrie.
Ordre daffichage. Par dfaut, les variables saffichent dans lordre dans lequel vous les avez slectionnes. En option, vous pouvez afficher les variables alphabtiquement, par moyennes croissantes ou par moyennes dcroissantes.

Fonctionnalits supplmentaires de la commande DESCRIPTIVES


Le langage de commande SPSS vous permet aussi de : Enregistrer les coordonnes standardises (carts z) pour certaines variables uniquement ( laide de la sous-commande VARIABLES). Spcifier le nom des nouvelles variables contenant des coordonnes standardises ( laide de la sous-commande VARIABLES).

367 Descriptives

Exclure de lanalyse les observations ayant des valeurs manquantes pour nimporte quelle variable ( laide de la sous-commande MISSING). Trier les variables affiches en utilisant la valeur dune statistique, et pas uniquement la moyenne ( laide de la sous-commande SORT). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Explorer

16

Chapitre

La procdure Explorer produit des rsums statistiques et des affichages graphiques pour toutes vos observations ou sparment pour des groupes dobservations. Il existe plusieurs raisons pour utiliser la procdure Explorer : le filtrage de donnes, lidentification des valeurs loignes, la description, la vrification dhypothses et la caractrisation des diffrences parmi les sous populations (groupes dobservations). Le filtrage de donnes peut vous indiquer les valeurs inhabituelles, les valeurs extrmes, les trous dans les donnes ou dautres particularits. Lexploration des donnes peut vous aider dterminer si les techniques statistiques que vous envisagez dutiliser pour lanalyse de vos donnes sont appropries. Lexploration peut indiquer que vous avez besoin de transformer les donnes si la technique ncessite une rpartition gaussienne. Vous pouvez galement choisir dutiliser des tests non paramtriques.
Exemple. Examiner la distribution des temps dapprentissage pour les souris dans un

labyrinthe avec quatre programmes de renforcement. Pour chacun des quatre groupes, vous pouvez voir si la rpartition des temps est approximativement gaussienne et si les quatre variances sont gales. Vous pouvez aussi identifier les observations avec les cinq plus grands et les cinq plus petits temps. Les botes moustaches et les diagrammes tige et feuille rsument graphiquement la rpartition des temps dapprentissage pour chacun des groupes.
Diagrammes et statistiques. Moyenne, mdiane, moyenne tronque 5 %,

erreur standard, variance, cart-type, minimum, maximum, intervalle, intervalle interquartile, asymtrie et aplatissement avec leurs erreurs standard, intervalle de confiance pour la moyenne (et niveaux de confiance spcifis), centiles, M-estimateur de Huber, Andrews, Hampel, Tukey, les cinq plus grandes et cinq plus petites valeurs, le Kolmogorov-Smirnov avec un seuil de signification Lilliefors pour tester la normalit, et la statistique Shapiro-Wilk. Botes moustaches, diagrammes tige et feuille, histogrammes, diagrammes de rpartition gaussienne, et dispersion/niveaux avec le test de Levene et les transformations.
369

370 Chapitre 16

Donnes. La procdure dExplorer peut tre utilise pour les variables quantitatives (Mesures de niveaux dintervalle ou de rapport). Une variable active (utilise pour rpartir les donnes en groupes dobservations) doit avoir un nombre raisonnable de valeurs distinctes (modalits). Ces valeurs peuvent tre des chanes de caractres courtes ou numriques. La variable dtiquette par observation, utilise pour tiqueter les valeurs extrmes dans les botes moustache, peut tre de courtes chanes de caractres, de longues chanes de caractres (15 premiers caractres) ou numriques. Hypothses. La distribution de vos donnes ne doit pas obligatoirement tre

symtrique ou gaussienne.
Figure 16-1 Rsultats dExplorer
Descriptifs Temps Planning Moyenne Intervale de confiance Limite infrieure pour la moyenne 95,0 % Limite suprieure Moyenne tronque 5 % Mdiane Variance Ecart-type Minimum Maximum Plage Intervalle interquartile Asymtrie Kurtosis Statistique Erreur std. Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Erreur std. Statistique Erreur std. 1 2.760 .165 2.387 3.133 2.761 2.850 .272 .521 2.0 3.5 1.5 .925 -.116 .687 -1.210 1.334 2 4.850 .422 3.895 5.805 4.889 4.900 1.783 1.335 2.3 6.7 4.4 2.250 -.559 .687 -.104 1.334 3 6.900 .445 5.893 7.907 6.911 7.050 1.982 1.408 4.5 9.1 4.6 2.400 -.197 .687 -.606 1.334 4 9.010 .289 8.357 9.663 8.994 9.000 .834 .913 7.8 10.5 2.7 1.650 .219 .687 -1.350 1.334

371 Explorer
Valeurs extrmes
Nombre d'observations Chane Temps Plus lev Valeur

Plus bas

1 2 3 4 5 1 2 3 4 5

31 33 39 32 36 2 7 1 11 3

4 4 4 4 4 1 1 1 2 1

10.5 9.9 9.8 9.5 9.3 2.0 2.1 2.3 2.3 2.5

Time Stem-and-Leaf Plot Diagramme Tige et feuille (dans le temps) 7.00 6.00 3.00 5.00 4.00 3.00 6.00 5.00 1.00 2 . 0133589 3 . 014577 4 . 568 5 . 05779 6 . 1379 7 . 268 8 . 012237 9 . 13589 10 . 5

Largeur de tige 1.0 Chaque feuille 1 observation(s)

Pour explorer vos donnes


E A partir des menus, slectionnez : Analyse Statistiques descriptives Explorer

372 Chapitre 16 Figure 16-2 Bote de dialogue Explorer

E Slectionnez au moins une variable dpendante.

Sinon, vous pouvez : Slectionner une ou plusieurs variables actives, dont les valeurs dfiniront les groupes dobservations. Slectionner une variable didentification pour tiqueter les observations. Cliquer sur Statistiques pour les M-estimateurs, les Valeurs loignes, les Centiles et les tableaux de frquences. Cliquez sur Diagrammes pour les histogrammes, les diagrammes de rpartition gaussiens avec tests et la dispersion/niveau avec test de Levene. Cliquez sur Options pour le traitement des valeurs manquantes.

373 Explorer

Statistiques dExplorer
Figure 16-3 Bote de dialogue Statistiques Explorer

Descriptives. Ces mesures de tendance centrale et de dispersion saffichent par dfaut. Les mesures de tendance centrale indiquent la position de la rpartition. On y trouve la moyenne, la mdiane et la moyenne tronque 5 %. Les mesures de dispersion montrent la dissimilarit des valeurs ; on y trouve lerreur standard, la variance, lcart-type, le minimum, le maximum, lintervalle, et lintervalle interquartile. Les statistiques descriptives comprennent aussi les mesures de la forme des rpartitions. Lasymtrie et laplatissement saffichent avec leurs erreurs standard. Lintervalle du niveau de confiance 95 % pour la moyenne saffiche aussi. Vous pouvez spcifier un niveau de confiance diffrent. Moyennes pondres. Estimations de la moyenne et de la mdiane de lchantillon

pour estimer la localisation. Les estimateurs calculs diffrent selon les pondrations quils appliquent aux observations. M-estimateur de Huber, Andrew, Hampel, et Tukey apparaissent.
Valeurs loignes. Affiche les cinq plus grandes et cinq plus petites valeurs, avec les

tiquettes dobservations.
Centiles. Affiche les valeurs pour le 5ime, 10ime, 25ime, 50ime, 75ime, 90ime,

et 95ime centiles.

374 Chapitre 16

Diagrammes dExplorer
Figure 16-4 Bote de dialogue Explorer : Diagrammes

Botes moustaches. Ces alternatives contrlent laffichage de botes moustaches quand vous avez plus dune variable dpendante. Niveaux de critre gnre un affichage spar pour chaque variable dpendante. Dans un affichage, les botes moustache sont donnes pour chacun des groupes dfinis par une variable active. Dpendantes gnre un affichage spar pour chaque groupe dfini par une variable active. Dans un affichage, les botes moustaches saffichent cte cte pour chaque variable dpendante. Cet affichage est particulirement utile lorsque les diffrentes variables reprsentent une seule caractristique mesure des moments diffrents. Caractristique. Le groupe caractristiques vous permet de choisir les diagrammes

tige et feuille et les histogrammes.


Graphes de rpartition gaussiens avec tests. Affiche les diagrammes de rpartition

gaussiens et les rsidus. La statistique de Kolmogorov-Smirnov avec un seuil de signification Lilliefors pour le test de normalit saffiche. Si des pondrations non entires sont spcifies, la statistique Shapiro-Wilk est calcule lorsque la taille dchantillon pondre est comprise entre 3 et 50. En cas de pondrations entires ou en labsence de pondration, le calcul est effectu lorsque la taille dchantillon pondre est comprise entre 3 et 5 000.

375 Explorer

Dispersion/niveau avec test de Levene. Contrle les transformations de donnes pour les diagrammes de dispersion par niveau. Pour tous les diagrammes de dispersion par niveau, la pente de la ligne de rgression et les tests de Levene portant sur lhomognit de la variance saffichent. Si vous slectionnez une transformation, les tests de Levene sont bass sur les donnes transformes. Si aucune variable active nest slectionne, les diagrammes de dispersion par niveau ne sont pas produits. Estimation dexposants produit un diagramme des logs naturels des intervalles interquartile opposs au logs naturels des mdianes pour toutes les cellules, en mme temps quune estimation de la transformation de lexposant pour arriver des variances gales dans les cellules. Un diagramme de dispersion par niveau aide dterminer lexposant pour quune transformation stabilise (rende plus gales) les variances entre groupes. Transformation Exposant vous permet de slectionner une des alternatives de lexposant, en suivant ventuellement les recommandations de lestimation de lexposant et de produire les diagrammes des donnes transformes. Lintervalle interquartile et la mdiane des donnes transformes sont dessins. Sans transformation produit des diagrammes de donnes brutes. Ceci est quivalent une transformation avec une puissance de 1.

Transformations de lexposant dExplorer


Voici les transformations de lexposant pour les diagrammes de dispersion par niveau. Pour transformer les donnes, vous devez slectionner un exposant pour la transformation. Vous avez le choix entre les options suivantes :
Log nprien. Transformation par log naturel. Il sagit de la valeur par dfaut. 1/racine carre. La rciproque de la racine carre est calcule pour chaque valeur

des donnes.
Rciproque. La rciproque de chaque valeur des donnes est calcule. Racine carre. La racine carre de chaque valeur des donnes est calcule. Carr. Chaque valeur des donnes est leve au carr. Cube. Chaque valeur des donnes est leve au cube.

376 Chapitre 16

Options dExplorer
Figure 16-5 Bote de dialogue Explorer : Options

Valeurs manquantes. Contrle le traitement des valeurs manquantes. Exclure toute observation incomplte. Les observations avec des valeurs

manquantes pour lune ou lautre des variables dpendantes ou actives sont exclues de toutes les analyses. Il sagit de la valeur par dfaut.
Exclure seulement les composantes non valides. Les observations sans valeur

manquante pour une variable dans un groupe (cellule) sont inclues dans lanalyse de ce groupe. Lobservation peut avoir des valeurs manquantes pour les variables utilises dans dautres groupes.
Signaler les valeurs manquantes. Les valeurs manquantes pour les variables actives

sont traites comme une modalit spare. Tout rsultat est produit pour cette modalit supplmentaire. Les tableaux de frquences contiennent les modalits pour les valeurs manquantes. Les valeurs manquantes pour une variable active sont inclues, mais tiquetes comme manquantes.

Fonctionnalits supplmentaires de la commande EXAMINE


La procdure Explorer utilise la syntaxe de la commande EXAMINE. Le langage de commande SPSS vous permet aussi de : demander le total des rsultats et des diagrammes en complment des rsultats et diagrammes relatifs aux groupes dfinis par les variables actives (au moyen de la sous-commande TOTAL) ; spcifier une chelle commune pour un groupe de botes moustaches (au moyen de la sous-commande SCALE) ; prciser les interactions des variables actives (au moyen de la sous-commande VARIABLES) ;

377 Explorer

spcifier les centiles autres que ceux par dfaut (au moyen de la sous-commande PERCENTILES) ; calculer les centiles laide de lune des cinq mthodes possibles (au moyen de la sous-commande PERCENTILES) ; spcifier toute transformation de lexposant pour les diagrammes de dispersion par niveau (au moyen de la sous-commande PLOT) ; prciser le nombre de valeurs extrmes afficher (au moyen de la sous-commande STATISTICS) ; indiquer les paramtres pour les M-estimateurs dun emplacement (au moyen de la sous-commande MESTIMATORS). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Tableaux croiss

17

Chapitre

La procdure de tableaux croiss tablit des tableaux deux entres ou entres multiples et permet 22 tests et mesures dassociations pour les tableaux deux entres. La structure du tableau et lordre des modalits dterminent quels test ou mesures effectuer. Les statistiques et les mesures dassociation de tableaux croiss ne sont calcules que pour les tableaux deux entres. Si vous spcifiez une ligne, une colonne et une strate de facteur (variable de contrle), SPSS forme un tableau de statistiques et de mesures pour chaque valeur de la strate de facteur (ou une combinaison de valeurs pour deux variables de contrle ou plus). Par exemple, si le sexe est un facteur de strate pour un tableau mari (oui, non) face la vie (est excitante, routinire ou ennuyeuse), les rsultats dun tableau deux entres pour les femmes sont calculs sparment de ceux des hommes et affichs sous forme de tableaux conscutifs.
Exemple. Les clients de PME ont-ils plus de probabilits dtre rentables en ventes de

services (par exemple, formation et conseil) que ceux de grandes socits ? A partir dune tabulation croise, vous pourriez apprendre que la majorit des PME (moins de 500 salaris) gnrent des bnfices de services levs, alors que la majorit des grandes socits (plus de 2 500 salaris) rapportent des bnfices de services bas.
Statistiques et mesures dassociation. Chi-deux de Pearson, Chi-deux du rapport de

vraisemblance, test dassociation linaire par linaire, test exact de Fisher, Chi-deux corrig de Yates, r de Pearson, rho de Spearman, coefficient de contingence, phi, V de Cramer, lambdas symtriques et asymtriques, tau de Goodman et Kruskal, coefficient dincertitude, gamma, d de Somer, tau-b de Kendall, tau-c de Kendall, coefficient ta, Kappa de Cohen, estimation de risque relatif, odds ratio, test de McNemar, et statistiques de Cochran et Mantel-Haenszel.

379

380 Chapitre 17

Donnes. Pour dfinir les modalits de chaque variable du tableau, utilisez des

variables numriques ou des variables sous forme de chanes de caractres courtes (huit caractres ou moins). Par exemple, pour sexe, vous pouvez codifier les donnes avec 1 et 2, ou avec homme et femme.
Hypothses. Des statistiques et des mesures partent du principe de modalits

ordonnes (donnes ordinales) ou de valeurs quantitatives (donnes dintervalle ou donnes de type ratio), tel que dcrit dans la section sur les statistiques. Dautres sont valides lorsque les variables du tableau ont des modalits dsordonnes (donnes nominales). Pour les statistiques bases sur le test Chi-deux (phi, V de Cramer, coefficient de contingence), les donnes doivent provenir dun chantillon alatoire avec une rpartition multinomiale. Remarque : Les variables ordinales peuvent tre des codes numriques reprsentant des modalits (par exemple, 1 = faible, 2 = moyen, 3 = lev) ou des valeurs de chane. Toutefois, lordre alphabtique des valeurs de chane est suppos reflter lordre rel des modalits. Par exemple, pour une variable chane comportant des valeurs Faible, Moyen, Elev, lordre des modalits est interprt comme Elev, Faible ou Moyen, ce qui ne correspond pas lordre correct. En rgle gnrale, il est recommand dutiliser les codes numriques pour reprsenter les donnes ordinales.

381 Tableaux croiss Figure 17-1 Rsultats de tableau crois


Rentabilit du service * Tabulation croise de l'entreprise Rentabilit du service Bas Elev Taille de l'entreprise

Tests du Khi-deux Signification asymptotique (bilatrale)

Valeur Chi-deux de Pearson Rapport de vraissemblance Association linaire par linaire N d'observations valides

Pour obtenir des tableaux croiss


E A partir des menus, slectionnez : Analyse Statistiques descriptives Tableaux croiss

382 Chapitre 17 Figure 17-2 Bote de dialogue Tableaux croiss

E Slectionnez des lignes de variables et des colonnes de variables.

Sinon, vous pouvez : Slectionner des variables de contrle. Cliquer sur Statistiques pour les tests et les mesures dassociation pour les tableaux deux entres ou les sous-tableaux. Cliquez sur Cellules pour les valeurs observes et thoriques, les pourcentages et les rsidus. Cliquez sur Format pour contrler lordre des modalits.

Strates de tableaux croiss


Si vous slectionnez des variables de strate, un tableau crois spar est produit pour chacune des modalits de variable de strate (variable de contrle). Par exemple, si vous avez une variable de ligne, une variable de colonne, et une variable de strate avec deux modalits, vous obtenez un tableau deux entres pour chacune des modalits de la variable de strate. Pour crer une autre strate de variables de contrle, cliquez sur Suivant. Les sous-tableaux sont produits pour chaque combinaison de modalits

383 Tableaux croiss

pour chaque variable de premier niveau avec chaque variable de second niveau, etc. Si les statistiques et les mesures dassociation sont requises, elles ne sappliquent quaux sous-tableaux deux entres.

Diagrammes en btons juxtaposs de tableaux croiss


Affichage de diagrammes en btons juxtaposs. Un diagramme en btons juxtaposs vous permet de rsumer vos donnes pour des groupes dobservations. Il y a un regroupement de btons pour chaque valeur de la variable que vous avez spcifie dans Ligne(s). La variable qui dfinit les btons dans chaque regroupement est la variable que vous avez spcifie dans Colonne(s). Il y a un ensemble de btons de couleurs ou de motifs diffrents pour chaque valeur de cette variable. Si vous spcifiez plus dune variable dans Colonnes ou Lignes, un diagramme en btons juxtaposs est produit pour chaque combinaison de deux variables.

Statistiques de tableaux croiss


Figure 17-3 Bote de dialogue Tableaux crois : Statistiques

Chi-deux. Pour les tableaux avec deux lignes et deux colonnes, slectionnez Chi-deux

pour calculer le Chi-deux de Pearson, le Chi-deux du rapport de vraisemblance, le test exact de Fisher et le test du Chi-deux de Yates corrig (correction de continuit). Pour les tableaux 2 2, le test exact de Fisher est calcul lorsquun tableau qui ne provient

384 Chapitre 17

pas de lignes ou de colonnes manquantes dans un tableau plus grand prsente une cellule avec une frquence attendue infrieure 5. Le Chi-deux corrig de Yates est calcul pour tous les autres tableaux 2 2. Pour les tableaux avec nimporte quel nombre de lignes ou de colonnes, slectionnez Chi-deux pour calculer le Chi-deux de Pearson et le rapport de vraisemblance du Chi-deux. Lorsque les deux variables du tableau sont quantitatives, le Chi-deux donne le test dassociation linaire par linaire.
Corrlations. Pour les tableaux dans lesquels les lignes et les colonnes contiennent des

valeurs ordonnes, les corrlations donnent le coefficient de corrlation de Spearman, rho (donnes numriques seulement). Le Spearman rho est une mesure dassociation entre les ordres de rang. Lorsque les deux variables (facteurs) du tableau sont quantitatives, les corrlations donnent le coefficient de corrlation de Pearson, r, une mesure de lassociation linaire entre les variables.
Nominal. Pour les donnes nominales (sans ordre intrinsque, comme Catholique, Protestant, Juif), vous pouvez slectionner le coefficient Phi et V de Cramer, le coefficient de contingence, Lambda (lambdas symtriques et asymtriques, et tau de Goodman et Kruskal) et le coefficient dincertitude. Coefficient de contingence. Mesure d'association base sur le Chi-deux. Les

valeurs sont toujours comprises entre 0 et 1, 0 indiquant l'absence d'association entre les variables de ligne et de colonne, et les valeurs proches de 1 indiquant un degr d'association lev entre les variables. La valeur maximale possible dpend du nombre de lignes et de colonnes dans le tableau.
Phi et V de Cramer. Mesure d'association calcule partir du Chi-deux. Elle est

obtenue en divisant la statistique du Chi-deux par la taille de l'chantillon, puis en prenant la racine carre du rsultat. Le V de Cramer est galement une mesure d'association base sur le Chi-deux.
Lambda. Mesure d'association refltant la rduction proportionnelle de l'erreur

lorsque les valeurs de la variable indpendante sont utilises pour prvoir la variable dpendante. La valeur 1 signifie que la variable indpendante prvoit parfaitement la variable dpendante. La valeur 0 signifie que la variable indpendante ne prvoit pas du tout la variable dpendante.
Coefficient d'incertitude. Mesure d'association qui indique la rduction

proportionnelle de l'erreur lorsque les valeurs d'une variable sont utilises pour prvoir celles d'une autre. Par exemple, la valeur 0,83 indique que la connaissance d'une variable rduit de 83 % l'erreur dans les prvisions de l'autre variable.

385 Tableaux croiss

Le programme calcule la fois des versions symtriques et asymtriques de ce coefficient.


Ordinal. Pour les tableaux dont les lignes et les colonnes contiennent des valeurs

ordonnes, slectionnez Gamma (ordre zro pour les tableaux 2 entres et conditionnel pour les tableaux de 3 10 entres), le tau-b de Kendall et le tau-c de Kendall. Pour prvoir les modalits de colonnes partir des modalits de lignes, slectionnez le d de Somers.
Gamma. Mesure d'association symtrique entre deux variables ordinales. Cette

mesure est situe entre -1 et 1. Les valeurs proches d'une valeur absolue de 1 indiquent une relation forte entre les deux variables. Les valeurs proches de 0 indiquent une relation faible ou inexistante. Pour les tableaux d'ordre 2, les gammas d'ordre 0 (zro) apparaissent. Pour les tableaux d'ordre 3 et les tableaux d'ordre n, les gammas conditionnels apparaissent.
D de Somers. Mesure d'intensit de la relation entre deux variables ordinales, qui

s'tend de -1 1. Les valeurs proches de 1 indiquent une forte relation entre les deux variables, et celles proches de zro indiquent une relation faible ou inexistante entre les variables. Le d de Somer est une extension asymtrique du gamma, qui ne diffre de celui-ci que par l'inclusion du nombre de paires non lies la variable indpendante. Le programme calcule galement une version symtrique de cette statistique.
Tau-b de Kendall. Mesure de corrlation non paramtrique pour variables ordinales

ou classes qui prend en considration les ex aequo. Le signe du coefficient indique la direction de la relation et sa valeur absolue indique sa force, les valeurs absolues les plus grandes indiquant les relations les plus fortes. Les valeurs peuvent varier de -1 +1 mais une valeur de -1 ou de +1 ne peut toutefois tre obtenue que dans des tableaux carrs.
Tau-c de Kendall. Mesure d'association non paramtrique pour variables ordinales

qui ne prend pas en considration les ex aequo. Le signe du coefficient indique la direction de la relation et sa valeur absolue indique sa force, les valeurs absolues les plus grandes indiquant les relations les plus fortes. Les valeurs peuvent varier de -1 +1 mais une valeur de -1 ou de +1 ne peut toutefois tre obtenue que dans des tableaux carrs.

386 Chapitre 17

Donnes nominales x intervalle. Lorsquune variable est qualitative et lautre quantitative, slectionnez Eta. La variable qualitative doit tre code numriquement. Eta. Mesure d'association dont les valeurs sont comprises entre 0 et 1, 0 indiquant

l'absence d'association entre les variables de ligne et de colonne, et les valeurs proches de 1 indiquant un degr d'association lev. Eta convient une variable dpendante continue mesure sur une chelle d'intervalle (par exemple, le revenu) et une variable indpendante ayant un nombre limit de modalits (par exemple, le sexe). Deux valeurs eta sont calcules : L'une traite la variable de ligne comme variable d'intervalle et l'autre traite la variable de colonne comme variable d'intervalle.
Kappa. Le Kappa de Cohen mesure la concordance entre deux indicateurs lorsque les

deux servent valuer le mme objet. La valeur 1 indique une concordance parfaite. La valeur 0 indique que la concordance ne dpasse pas celle due au hasard. Le Kappa n'est disponible que pour les tableaux dans lesquels les deux variables utilisent les mmes valeurs de modalit et possdent le mme nombre de modalits.
Risque. Pour les tableaux 2 x 2, mesure de la force de l'association entre la prsence

d'un facteur et la ralisation d'un vnement. Si l'intervalle de confiance de la statistique inclut une valeur de 1, il n'existe aucune association entre le facteur et l'vnement. L'odds ratio peut tre utilis comme estimation du risque relatif dans le cas o la ralisation du facteur est rare.
McNemar. Test non paramtrique pour deux variables dichotomiques lies. Il recherche les changements de rponse en utilisant la rpartition Chi-deux. Ce test est utile pour dtecter les changements avant-aprs dans les rponses dus une intervention exprimentale dans les plans. Pour les tableaux carrs plus volumineux, le test McNemar-Bowker de symtrie est report. Statistiques de Cochran et de Mantel-Haenszel. Les statistiques de Cochran et de Mantel-Haenszel peuvent tre utilises pour tester l'indpendance prsente entre une variable de critre dichotomique et une variable de rponse dichotomique, conditionnelle des modles covaris dfinis par une ou plusieurs variables de strate (de contrle). Remarque : alors que les autres statistiques sont calcules strate par strate, les statistiques de Cochran et de Mantel-Haenszel sont calcules une seule fois pour toutes les strates.

387 Tableaux croiss

Affichage de cellules (cases) de tableaux croiss


Figure 17-4 Bote de dialogue Tableaux croiss : Contenu des cases (cellules)

Pour vous aider dcouvrir des types dans les donnes qui contribuent un test du Chi-deux significatif, la procdure de Tableaux croiss affiche les frquences attendues et trois types de rsidus (dviations) qui mesurent la diffrence entre les frquences observes et les frquences attendues. Chaque cellule du tableau peut contenir toute combinaison deffectifs, de pourcentages et de rsidus slectionns.
Effectif. Nombre dobservations effectivement observes et nombre dobservations

attendues si les variables de ligne et de colonne sont indpendantes lune de lautre.


Pourcentages. Les pourcentages peuvent sadditionner par ligne ou par colonne. Les pourcentages du nombre total dobservations reprsentes dans le tableau (une strate) sont galement disponibles. Rsidus. Les rsidus non standardiss donnent la diffrence entre les valeurs

observes et les valeurs thoriques. Les rsidus standardiss et standardiss ajusts sont galement disponibles.
Non standardiss. Diffrence entre une valeur observe et la valeur thorique.

La valeur thorique correspond au nombre d'observations attendues dans la cellule quand il n'existe pas de relation entre les deux variables. Un rsidu positif indique que la cellule contient plus d'observations que si les variables de ligne et de colonne taient indpendantes.

388 Chapitre 17

Standardiss. Rsidu divis par une estimation de son cart-type. Egalement

appels rsidus de Pearson, les rsidus standardiss ont une moyenne de 0 et un cart-type de 1.
Standardiss ajusts. Rsidu d'une cellule (valeur observe moins valeur

thorique) divis par une estimation de son erreur standard. Le rsidu standardis qui en rsulte est exprim en carts par rapport la moyenne.
Pondrations non entires. En gnral, les effectifs de cellules sont des valeurs

entires, car ils reprsentent le nombre dobservations figurant dans chaque cellule. Toutefois, si le fichier de donnes est pondr par une variable de pondration avec des fractions (par exemple, 1,25), les effectifs de cellules peuvent galement tre des fractions. Vous pouvez tronquer ou arrondir les valeurs avant ou aprs le calcul des effectifs de cellules, ou utiliser des effectifs de cellules non entiers pour laffichage des tableaux et les calculs statistiques.
Effectifs de cellules arrondis. Les pondrations d'observation sont utilises telles

quelles, mais les pondrations cumules dans les cellules sont arrondies avant le calcul de toute statistique.
Effectifs de cellules tronqus. Les pondrations d'observation sont utilises telles

quelles, mais les pondrations cumules dans les cellules sont tronques avant le calcul de toute statistique.
Poids des observations arrondis. Les pondrations sont arrondies avant utilisation. Poids des observations tronqus. Les pondrations sont tronques avant utilisation. Aucun ajustement. Les pondrations d'observation sont utilises telles quelles ;

des effectifs de cellules non entiers sont galement utiliss. Toutefois, lorsque des statistiques exactes (disponibles uniquement avec l'option Tests exacts) sont demandes, les pondrations cumules dans les cellules sont tronques ou arrondies avant le calcul des statistiques du test exact.

389 Tableaux croiss

Format de tableau crois


Figure 17-5 Bote de dialogue Tableaux croiss : Format

Vous pouvez arranger les lignes par ordre croissant ou dcroissant de valeur de la variable de ligne.

Rcapituler

18

Chapitre

La procdure Rcapituler calcule les statistiques de sous-groupes pour les variables lintrieur des modalits de variables de regroupement. Tous les niveaux de variables de regroupement sont tabulation croise. Vous pouvez choisir lordre dans lequel les statistiques sont affiches. Les statistiques Rcapituler sont affiches pour chaque variable travers toutes les modalits. Les valeurs des donnes dans chaque modalit peuvent tre listes ou supprimes. Avec dimportants groupes de donnes, vous pouvez choisir de lister seulement les premires observations n.
Exemple : Quel est le montant moyen de ventes de produits par rgion et par

secteur de clientle ? Vous pouvez dcouvrir que le montant moyen des ventes est lgrement plus lev dans la rgion Ouest que dans les autres rgions, avec des socits commerciales dans la rgion Ouest apportant le montant moyen de ventes le plus lev.
Statistiques : Somme, nombre dobservations, moyenne, mdiane, mdiane groupe,

erreur standard pour la moyenne, minimum, maximum, plage, valeur de la variable pour la premire modalit de la variable de regroupement, valeur de la variable pour la dernire modalit de la variable de regroupement, cart-type, variance, aplatissement, erreur standard daplatissement, asymtrie, erreur standard dasymtrie, pourcentage de la somme totale, pourcentage de N total, pourcentage de la somme dans, pourcentage de N dans, moyennes gomtrique et harmonique.
Donnes : Les variables de regroupement sont des variables qualitatives dont les

valeurs peuvent tre numriques ou alphanumriques. Le nombre de modalits doit tre raisonnablement limit. Les autres variables doivent pouvoir tre classes.
Hypothses : Certains des sous-groupes statistiques optionnels, tels que la moyenne

et lcart-type sont bass sur la thorie normale et conviennent aux variables quantitatives ayant une distribution symtrique. Les statistiques robustes telles que la mdiane et lintervalle, conviennent aux variables quantitatives qui confirment ou infirment lhypothse de normalit.
391

392 Chapitre 18 Figure 18-1 Rcapituler Rsultat

Rsums d'observations Moyenne des ventes de produit par rgion et industrie Industrie Rgion Est Centre Ouest Gouvernement Finance Education Sant Total

Obtenir des rcapitulatifs des observations


E A partir des menus, slectionnez : Analyse Rapports Rcapitulatif des observations

393 Rcapituler Figure 18-2 Bote de dialogue Rapport rcapitulatif

E Slectionnez une ou plusieurs variables.

Sinon, vous pouvez : Slectionner au moins une variable de regroupement afin de diviser vos donnes en sous-groupes. Cliquer sur Options afin de modifier le titre du rsultat, ajouter une lgende au-dessous du rsultat, ou exclure les observations ayant des valeurs manquantes. Cliquer sur Statistiques pour obtenir des statistiques facultatives. Slectionner Afficher les observations afin de rpertorier les observations dans chaque sous-groupe. Par dfaut, le systme ne liste que les 100 premires observations de votre fichier. Vous pouvez augmenter ou diminuer la valeur de loption Limiter les observations aux n premires ou dslectionner cet lment pour rpertorier toutes les observations.

394 Chapitre 18

Options de Rcapituler
Figure 18-3 Bote de Dialogue Options de Rapport rcapitulatif

SPSS vous permet de modifier le titre de votre rsultat ou dajouter une lgende qui apparatra en dessous du tableau de sortie. Vous pouvez contrler les sauts de ligne dans les titres et lgendes en tapant \n tous les endroits o vous voulez insrer un saut de ligne dans le texte. Vous pouvez galement choisir dafficher ou de supprimer les sous-en-ttes des totaux et dinclure ou dexclure les observations ayant des valeurs manquantes pour toute variable prise en compte dans toute analyse. Il est souvent souhaitable de marquer les observations manquantes dans le rsultat par un point ou un astrisque. Saisir un caractre, une phrase, ou un code que vous souhaitez voir apparatre lorsquune valeur manque, sinon, aucun traitement spcial ne sapplique aux observations manquantes dans le rsultat.

395 Rcapituler

Rcapituler les statistiques


Figure 18-4 Bote de Dialogue Rapport rcapitulatif

Vous pouvez choisir lune des statistiques de sous-groupe suivantes pour les variables lintrieur de chaque modalit de chacune des variables de regroupement : Somme, nombre dobservations, moyenne, mdiane, mdiane groupe, erreur standard pour la moyenne, minimum, maximum, intervalle, valeur de la variable pour la premire modalit de la variable de regroupement, valeur de la variable pour la dernire modalit de la variable de regroupement, cart-type, variance, aplatissement, erreur standard daplatissement, asymtrie, erreur standard dasymtrie, pourcentage de somme totale, pourcentage de N total, pourcentage de la somme dans, pourcentage de N dans, moyenne gomtrique, moyenne harmonique. Lordre dans lequel les statistiques apparaissent dans la liste Variables correspond celui dans lequel elles seront affiches dans le rsultat. Les statistiques rcapitulatives sont aussi affiches pour chaque variable travers toutes les modalits.
Premire. Affiche la premire valeur rencontre dans le fichier de donnes. Moyenne gomtrique. Racine nime du produit des valeurs de donnes, n reprsentant le nombre d'observations.

396 Chapitre 18

Mdiane de groupes. Mdiane calcule pour les donnes codes en groupes. Par

exemple, pour les donnes d'ge, si chaque valeur de la trentaine est code 35, chaque valeur de la quarantaine est code 45, etc., la mdiane de groupes est la mdiane calcule partir des donnes codes.
Moyenne harmonique. Fonction utilise pour estimer la taille moyenne d'un groupe

lorsque la taille des chantillons diffre d'un groupe l'autre. La moyenne harmonique correspond au nombre total d'chantillons divis par la somme des rciproques des tailles de l'chantillon.
Kurtosis. Mesure de l'tendue du regroupement des observations autour d'un point central. Dans le cas d'une distribution normale, la valeur de la statistique d'aplatissement est gale zro. Un aplatissement positif indique que les observations sont plus regroupes et prsentent des extrmits plus longues que dans le cas d'une distribution normale. Un aplatissement ngatif signifie que les observations sont moins regroupes et prsentent des extrmits plus courtes. Dernire. Affiche la dernire valeur rencontre dans le fichier de donnes. Maximum. Plus grande valeur d'une variable numrique. Moyenne. Mesure de la tendance centrale. Moyenne arithmtique ; somme divise

par le nombre d'observations.


Mdiane. Valeur au-dessus ou au-dessous de laquelle se trouve la moiti des

observations ; 50e centile. Si le nombre d'observations est pair, la mdiane correspond la moyenne des deux observations du milieu lorsqu'elles sont tries dans l'ordre croissant ou dcroissant. La mdiane est une mesure de tendance centrale et elle n'est pas, l'inverse de la moyenne, sensible aux valeurs loignes.
Minimum. Valeur la plus petite d'une variable numrique. N. Nombre d'observations (ou d'enregistrements). Pourcentage de N total. Pourcentage du nombre total d'observations dans chaque

modalit.
Pourcentage de la somme totale. Pourcentage de la somme totale dans chaque

modalit.
Etendue. Diffrence entre la valeur maximale et la valeur minimale d'une variable numrique (maximumminimum).

397 Rcapituler

Skewness. Mesure de l'asymtrie d'une distribution. La distribution normale est

symtrique et possde une valeur d'asymtrie gale 0. Une distribution dont la valeur d'asymtrie est positive prsente une extrmit droite allonge. Une distribution caractrise par une importante asymtrie ngative prsente une extrmit gauche plus allonge. Pour simplifier, une valeur d'asymtrie deux fois suprieure l'erreur standard correspond une absence de symtrie.
Erreur standard du Kurtosis. Rapport de l'aplatissement avec son erreur standard pouvant tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'aplatissement positive importante indique que les extrmits de la distribution sont plus allonges que celles d'une distribution normale ; une valeur d'aplatissement ngative prsente des extrmits plus courtes (semblables celles d'une distribution uniforme sous forme de botes). Erreur standard du Skewness. Rapport de l'asymtrie avec son erreur standard pouvant

tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'asymtrie positive importante indique une extrmit allonge vers la droite ; une valeur ngative extrme produit une extrmit allonge vers la gauche.
Somme. Somme ou total des valeurs, pour toutes les observations n'ayant pas de

valeur manquante.
Variance. Mesure de la dispersion des valeurs autour de la moyenne, gale la somme des carrs des carts par rapport la moyenne, divise par le nombre d'observations moins un. La variance se mesure en units, qui sont gales au carr des units de la variable.

Moyennes

19

Chapitre

La procdure des moyennes calcule les moyennes de sous-groupes et les statistiques univaries correspondantes pour des variables dpendantes au sein des modalits dune ou de plusieurs variables indpendantes. Vous pouvez galement obtenir une analyse un facteur de la variance, un coefficient ta et des tests de linarit.
Exemple : Mesurez la quantit moyenne de lipides absorbe par trois diffrents types

dhuile alimentaire et effectuez une analyse un facteur de la variance pour voir si les moyennes divergent.
Statistiques : Somme, nombre dobservations, moyenne, mdiane, mdiane

groupe, erreur standard pour la moyenne, minimum, maximum, plage, valeur de la variable pour la premire modalit de la variable de regroupement, valeur de la variable pour la dernire modalit de la variable de regroupement, cart-type, variance, aplatissement, erreur standard daplatissement, asymtrie, erreur standard dasymtrie, pourcentage de la somme totale, pourcentage de N total, pourcentage de la somme dans, pourcentage de N dans, moyennes gomtrique et harmonique. Les options comportent une analyse de la variance, un coefficient ta, un coefficient ta-carr, ainsi que des tests de linarit R et R2.
Donnes : Les variables dpendantes sont quantitatives et les variables indpendantes sont qualitatives. Les valeurs des variables qualitatives peuvent tre soit numriques, soit des chanes courtes. Hypothses : Certains des sous-groupes statistiques optionnels, tels que la moyenne

et lcart-type sont bass sur la thorie normale et conviennent aux variables quantitatives ayant une distribution symtrique. Les statistiques robustes, telles que la mdiane, conviennent aux variables continues qui confirment ou infirment lhypothse de normalit. Lanalyse de la variance rsiste aux carts par rapport la normalit, condition que les donnes de chaque cellule soient symtriques. Lanalyse de la variance part galement du principe que les groupes sont issus de populations ayant la
399

400 Chapitre 19

mme variance. Pour vrifier cette hypothse, utilisez le test dhomognit de la variance de Levene, disponible dans la procdure ANOVA un facteur.
Figure 19-1 Rsultat des moyennes
Rapport Grammes de graisse absorbe Type d'huile Huile d'arachide Moyenne N Ecart-type Saindoux Moyenne N Ecart-type Huile de mas Moyenne N Ecart-type Total Moyenne N Ecart-type 72.00 6 13.34 85.00 6 7.77 62.00 6 8.22 73.00 18 13.56

Tableau ANOVA Somme des carrs 1596.000 1530.000 3126.000 Carr moyen 2 15 17 798.000 102.000

df

Grammes de graisse absorbe * Type d'huile

Entre groupes Combin Dans les groupes Total

F 7.824

Sig. .005

Pour obtenir des moyennes de sous-groupes


E A partir des menus, slectionnez : Analyse Comparer les moyennes Moyennes

401 Moyennes Figure 19-2 Bote de dialogue Moyennes

E Slectionnez au moins une variable dpendante. E Utilisez lune des mthodes suivantes pour slectionner des variables indpendantes

qualitatives : Slectionnez une ou plusieurs variables indpendantes. Des rsultats distincts sont prsents pour chaque variable indpendante. Slectionnez une ou plusieurs strates des variables indpendantes. Chaque strate divise une nouvelle fois lchantillon. Si vous avez une variable indpendante dans la strate 1 et une dans la strate 2, les rsultats sont prsents dans un tableau crois, par opposition aux tableaux spars pour chaque variable indpendante.
E Cliquez sur Options pour obtenir des statistiques facultatives, telles que la table danalyse de la variance, eta, eta-carr, R et R2.

402 Chapitre 19

Moyennes : Options
Figure 19-3 Bote de dialogue Moyennes : Options

Vous pouvez choisir lune des statistiques de sous-groupe suivantes pour les variables lintrieur de chaque modalit de chacune des variables de regroupement : Somme, nombre dobservations, moyenne, mdiane, mdiane groupe, erreur standard pour la moyenne, minimum, maximum, intervalle, valeur de la variable pour la premire modalit de la variable de regroupement, valeur de la variable pour la dernire modalit de la variable de regroupement, cart-type, variance, aplatissement, erreur standard daplatissement, asymtrie, erreur standard dasymtrie, pourcentage de somme totale, pourcentage de N total, pourcentage de la somme dans, pourcentage de N dans, moyenne gomtrique, moyenne harmonique. Vous pouvez changer lordre de prsentation des statistiques des sous-groupes. Lordre dans lequel les statistiques apparaissent dans la liste Cellule Statistiques correspond celui dans lequel elles seront affiches dans le rsultat. Les statistiques rcapitulatives sont aussi affiches pour chaque variable travers toutes les modalits.
Premire. Affiche la premire valeur rencontre dans le fichier de donnes.

403 Moyennes

Moyenne gomtrique. Racine nime du produit des valeurs de donnes, n reprsentant le nombre d'observations. Mdiane de groupes. Mdiane calcule pour les donnes codes en groupes. Par

exemple, pour les donnes d'ge, si chaque valeur de la trentaine est code 35, chaque valeur de la quarantaine est code 45, etc., la mdiane de groupes est la mdiane calcule partir des donnes codes.
Moyenne harmonique. Fonction utilise pour estimer la taille moyenne d'un groupe

lorsque la taille des chantillons diffre d'un groupe l'autre. La moyenne harmonique correspond au nombre total d'chantillons divis par la somme des rciproques des tailles de l'chantillon.
Kurtosis. Mesure de l'tendue du regroupement des observations autour d'un point central. Dans le cas d'une distribution normale, la valeur de la statistique d'aplatissement est gale zro. Un aplatissement positif indique que les observations sont plus regroupes et prsentent des extrmits plus longues que dans le cas d'une distribution normale. Un aplatissement ngatif signifie que les observations sont moins regroupes et prsentent des extrmits plus courtes. Dernire. Affiche la dernire valeur rencontre dans le fichier de donnes. Maximum. Plus grande valeur d'une variable numrique. Moyenne. Mesure de la tendance centrale. Moyenne arithmtique ; somme divise

par le nombre d'observations.


Mdiane. Valeur au-dessus ou au-dessous de laquelle se trouve la moiti des

observations ; 50e centile. Si le nombre d'observations est pair, la mdiane correspond la moyenne des deux observations du milieu lorsqu'elles sont tries dans l'ordre croissant ou dcroissant. La mdiane est une mesure de tendance centrale et elle n'est pas, l'inverse de la moyenne, sensible aux valeurs loignes.
Minimum. Valeur la plus petite d'une variable numrique. N. Nombre d'observations (ou d'enregistrements). Pourcentage de N total. Pourcentage du nombre total d'observations dans chaque

modalit.
Pourcentage de somme totale. Pourcentage de la somme totale dans chaque modalit. Etendue. Diffrence entre la valeur maximale et la valeur minimale d'une variable

numrique (maximumminimum).

404 Chapitre 19

Skewness. Mesure de l'asymtrie d'une distribution. La distribution normale est

symtrique et possde une valeur d'asymtrie gale 0. Une distribution dont la valeur d'asymtrie est positive prsente une extrmit droite allonge. Une distribution caractrise par une importante asymtrie ngative prsente une extrmit gauche plus allonge. Pour simplifier, une valeur d'asymtrie deux fois suprieure l'erreur standard correspond une absence de symtrie.
Erreur standard du Kurtosis. Rapport de l'aplatissement avec son erreur standard pouvant tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'aplatissement positive importante indique que les extrmits de la distribution sont plus allonges que celles d'une distribution normale ; une valeur d'aplatissement ngative prsente des extrmits plus courtes (semblables celles d'une distribution uniforme sous forme de botes). Erreur standard du Skewness. Rapport de l'asymtrie avec son erreur standard pouvant

tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'asymtrie positive importante indique une extrmit allonge vers la droite ; une valeur ngative extrme produit une extrmit allonge vers la gauche.
Somme. Somme ou total des valeurs, pour toutes les observations n'ayant pas de

valeur manquante.
Variance. Mesure de la dispersion des valeurs autour de la moyenne, gale la somme des carrs des carts par rapport la moyenne, divise par le nombre d'observations moins un. La variance se mesure en units, qui sont gales au carr des units de la variable. Statistiques pour premire strate Tableau Anova et eta. Affiche un tableau d'analyse unifactorielle de la variance et calcule ta et ta carr (mesures de l'association) pour chaque variable indpendante de la premire strate. Test de linarit. Calcule la somme des carrs, les degrs de libert et le carr moyen

associs aux composants linaires et non linaires, ainsi que le rapport F, le R et le R-deux. La linarit n'est pas calcule si la variable indpendante est une chane courte.

Cubes OLAP

20

Chapitre

La procdure de Cubes OLAP (Online Analytical Processing) calcule les totaux, les moyennes et autres statistiques univaries pour des variables rcapitulatives continues lintrieur de modalits dune ou plusieurs variables de regroupement qualitatives. Une strate spare dans le tableau est cre pour chaque modalit de chaque variable de regroupement.
Exemple. Ventes totales et moyennes pour diffrentes rgions et lignes de produits

lintrieur de chaque rgion.


Statistiques. Somme, nombre dobservations, moyenne, mdiane, mdiane groupe, erreur standard pour la moyenne, minimum, maximum, intervalle, valeur de la variable pour la premire modalit de la variable de regroupement, valeur de la variable pour la dernire modalit de la variable de regroupement, cart-type, variance, aplatissement, erreur standard daplatissement, asymtrie, erreur standard dasymtrie, pourcentage des observations totales, pourcentage de somme totale, pourcentage des observations totales dans les variables de regroupement, pourcentage de la somme totale dans les variables de regroupement, moyenne gomtrique et moyenne harmonique. Donnes. Les variables rcapitulatives sont quantitatives (variables continues

mesures sur une chelle dintervalle ou de rapport) et les variables de regroupement sont qualitatives. Les valeurs des variables qualitatives peuvent tre soit numriques, soit des chanes courtes.
Hypothses. Certains des sous-groupes statistiques optionnels, tels que la moyenne

et lcart-type sont bass sur la thorie normale et conviennent aux variables quantitatives ayant une distribution symtrique. Les statistiques robustes telles que la mdiane et lintervalle, conviennent aux variables quantitatives qui confirment ou infirment lhypothse de normalit.

405

406 Chapitre 20 Figure 20-1 Rsultat des cubes OLAP


Ventes pour 1996 par division et rgion

Division : total Rgion : total Somme Moyenne Mdiane Ecart-type

$145,038,250 $371,893 $307,500 $171,311

Ventes pour 1996 par division et rgion

Division : produits de consommation Rgion : est Somme $18,548,100 Moyenne $289,814.06 Mdiane $273,600.00 Ecart-type $80,674.66

Pour obtenir des cubes OLAP


E A partir des menus, slectionnez : Analyse Rapports Cubes OLAP

407 Cubes OLAP Figure 20-2 Bote de dialogue Cubes OLAP

E Slectionnez une ou plusieurs variables rcapitulatives continues. E Slectionnez une ou plusieurs variables qualitatives. E Eventuellement :

Slectionner dautres statistiques rcapitulatives (cliquez sur Statistiques...). Vous devez slectionner un ou plusieurs critres de regroupement pour pouvoir slectionner les statistiques rcapitulatives. Calculer les diffrences entre des paires de variables et des paires de groupes dfinies par un critre de regroupement (cliquez sur Diffrences). Crer des titres de tableaux personnaliss (cliquez sur Titre).

408 Chapitre 20

Cubes OLAP : Statistiques


Figure 20-3 Bote de dialogue Cubes OLAP : Statistiques

Vous pouvez choisir lune des statistiques de sous-groupe suivantes pour les variables rcapitulatives lintrieur de chaque modalit de chacune des variables de regroupement : Somme, Nombre dobservations, Moyenne, Mdiane, Mdiane de groupes, Erreur std de la moyenne, Minimum, Maximum, Intervalle, Premier (valeur de la variable pour la premire modalit de la variable de regroupement), Dernier (valeur de la variable pour la dernire modalit de la variable de regroupement), Ecart type, Variance, Aplatissement, Erreur standard de laplatissement, Asymtrie, Erreur std dasymtrie, Pourcentage de N (observations) totales, Pourcentage de somme tot., Pourcentage des observations totales dans les variables de regroupement, Pourcentage de la somme totale dans les variables de regroupement, Moyenne gomtrique et Moyenne harmonique. Vous pouvez changer lordre de prsentation des statistiques des sous-groupes. Lordre dans lequel les statistiques apparaissent dans la liste Cellule Statistiques correspond celui dans lequel elles seront affiches dans le rsultat. Les statistiques rcapitulatives sont aussi affiches pour chaque variable travers toutes les modalits.
Premire. Affiche la premire valeur rencontre dans le fichier de donnes. Moyenne gomtrique. Racine nime du produit des valeurs de donnes, n reprsentant le nombre d'observations.

409 Cubes OLAP

Mdiane de groupes. Mdiane calcule pour les donnes codes en groupes. Par

exemple, pour les donnes d'ge, si chaque valeur de la trentaine est code 35, chaque valeur de la quarantaine est code 45, etc., la mdiane de groupes est la mdiane calcule partir des donnes codes.
Moyenne harmonique. Fonction utilise pour estimer la taille moyenne d'un groupe

lorsque la taille des chantillons diffre d'un groupe l'autre. La moyenne harmonique correspond au nombre total d'chantillons divis par la somme des rciproques des tailles de l'chantillon.
Kurtosis. Mesure de l'tendue du regroupement des observations autour d'un

point central. Dans le cas d'une distribution normale, la valeur de la statistique d'aplatissement est gale zro. Un aplatissement positif indique que les observations sont plus regroupes et prsentent des extrmits plus longues que dans le cas d'une distribution normale. Un aplatissement ngatif signifie que les observations sont moins regroupes et prsentent des extrmits plus courtes.
Dernire. Affiche la dernire valeur rencontre dans le fichier de donnes. Maximum. Plus grande valeur d'une variable numrique. Moyenne. Mesure de la tendance centrale. Moyenne arithmtique ; somme divise par le nombre d'observations. Mdiane. Valeur au-dessus ou au-dessous de laquelle se trouve la moiti des

observations ; 50e centile. Si le nombre d'observations est pair, la mdiane correspond la moyenne des deux observations du milieu lorsqu'elles sont tries dans l'ordre croissant ou dcroissant. La mdiane est une mesure de tendance centrale et elle n'est pas, l'inverse de la moyenne, sensible aux valeurs loignes.
Minimum. Valeur la plus petite d'une variable numrique. N. Nombre d'observations (ou d'enregistrements). Pourcentage de N dans. Pourcentage du nombre d'observations pour le critre de

regroupement spcifi dans les modalits des autres critres de regroupement. Si vous n'avez qu'un seul critre de regroupement, cette valeur est identique au pourcentage du nombre total d'observations.
Pourcentage de la somme dans. Pourcentage de la somme pour le critre de

regroupement spcifi dans les modalits des autres critres de regroupement. Si vous n'avez qu'un seul critre de regroupement, cette valeur est identique au pourcentage de la somme totale.

410 Chapitre 20

Pourcentage de N total. Pourcentage du nombre total d'observations dans chaque

modalit.
Pourcentage de la somme totale. Pourcentage de la somme totale dans chaque

modalit.
Etendue. Diffrence entre la valeur maximale et la valeur minimale d'une variable numrique (maximumminimum). Skewness. Mesure de l'asymtrie d'une distribution. La distribution normale est

symtrique et possde une valeur d'asymtrie gale 0. Une distribution dont la valeur d'asymtrie est positive prsente une extrmit droite allonge. Une distribution caractrise par une importante asymtrie ngative prsente une extrmit gauche plus allonge. Pour simplifier, une valeur d'asymtrie deux fois suprieure l'erreur standard correspond une absence de symtrie.
Erreur standard du Kurtosis. Rapport de l'aplatissement avec son erreur standard pouvant tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'aplatissement positive importante indique que les extrmits de la distribution sont plus allonges que celles d'une distribution normale ; une valeur d'aplatissement ngative prsente des extrmits plus courtes (semblables celles d'une distribution uniforme sous forme de botes). Erreur standard du Skewness. Rapport de l'asymtrie avec son erreur standard pouvant

tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'asymtrie positive importante indique une extrmit allonge vers la droite ; une valeur ngative extrme produit une extrmit allonge vers la gauche.
Somme. Somme ou total des valeurs, pour toutes les observations n'ayant pas de

valeur manquante.
Variance. Mesure de la dispersion des valeurs autour de la moyenne, gale la somme des carrs des carts par rapport la moyenne, divise par le nombre d'observations moins un. La variance se mesure en units, qui sont gales au carr des units de la variable.

411 Cubes OLAP

Cubes OLAP : Diffrences


Figure 20-4 Bote de dialogue Cubes OLAP : Diffrences

Cette bote de dialogue vous permet de calculer les diffrences arithmtiques et de pourcentage qui existent entre des variables rcapitulatives ou entre des groupes dfinis par un critre de regroupement. Les diffrences sont calcules pour toutes les mesures slectionnes dans la bote de dialogue Cubes OLAP : Statistiques.
Diffrences entre les variables. Calcule les diffrences existant entre des paires de variables. Les valeurs des statistiques rcapitulatives de la seconde variable (variable moins) de chaque paire sont soustraites des valeurs des statistiques rcapitulatives de la premire variable de la paire. Pour les diffrences de pourcentage, la valeur de la caractristique de la variable moins est utilise en tant que dnominateur. Vous devez slectionner plusieurs variables rcapitulatives dans la bote de dialogue principale avant dindiquer les diffrences entre les variables. Diffrences entre les groupes. Calcule les diffrences existant entre les paires de groupes dfinies par une variable de regroupement. Les valeurs des statistiques rcapitulatives de la seconde modalit (modalit moins) dans chaque paire sont

412 Chapitre 20

soustraites des valeurs des statistiques rcapitulatives de la premire modalit de la paire. Les diffrences de pourcentage utilisent la valeur de la statistique rcapitulative pour la modalit moins en tant que dnominateur. Vous devez slectionner au moins une variable de regroupement dans la bote de dialogue principale avant dindiquer les diffrences entre groupes.

Cubes OLAP : Titre


Figure 20-5 Bote de dialogue Cubes OLAP : Titre

SPSS vous permet de modifier le titre de votre sortie ou dajouter une lgende qui apparatra au dessous du tableau de sortie. Vous pouvez galement contrler la rpartition des titres et lgendes sur plusieurs lignes en tapant \n partout o vous souhaitez insrer un saut de ligne dans le texte.

Tests T
Il existe trois types de test t :

21

Chapitre

Test T pour chantillons indpendants (test t pour deux chantillons). Permet de comparer la moyenne dune variable de deux groupes dobservations. Les statistiques descriptives pour chaque groupe et le test de Levene permettant dobtenir lgalit des variances sont disponibles ainsi que les valeurs t de variance gale et ingale, et quun intervalle de confiance de 95 % pour la diffrence des moyennes. Test T pour chantillons apparis (test t dpendant). Permet de comparer la moyenne

de deux variables pour un seul groupe. Ce test sert aussi pour les plans dtudes apparies ou de contrle dobservation. Les rsultat incluent les statistiques descriptives pour les variables de test, leurs corrlations, les statistiques descriptives pour les diffrences apparies, le test t et un intervalle de confiance de 95 %.
Test T pour chantillon unique. Permet de comparer la moyenne dune variable avec

une valeur connue ou suppose. Les statistiques descriptives des variables tests sont affiches avec le test t. Un intervalle de confiance de 95 % pour la diffrence entre la moyenne de la variable test et la valeur test suppose fait partie du rsultat par dfaut.

Test T pour chantillons indpendants


La procdure du Test T pour chantillons indpendants permet de comparer la moyenne de deux groupes dobservations. Idalement, pour ce test, les sujets doivent tre attribus de manire alatoire deux groupes, de manire ce que toute diffrence dans la rponse soit due au traitement (ou un manque de traitement) et non pas dautres facteurs. Ceci nest pas le cas si lon compare un revenu moyen pour les hommes et les femmes. Une personne nest pas alatoirement dsigne comme devant tre un homme ou une femme. Dans de telles situations, il faut sassurer que les diffrences dans les autres facteurs ne cachent pas ou naugmentent
413

414 Chapitre 21

de diffrence significative dans les moyennes. Les diffrences de revenu moyen peuvent tre influences par des facteurs tels que lducation et non par le sexe seul.
Exemple. Les patients souffrant dhypertension se voient assigns de faon alatoire un groupe placebo et un groupe auquel on donne un traitement. Les sujets du groupe placebo reoivent une pilule inactive et les sujets du groupe auquel on donne un traitement reoivent un nouveau mdicament suppos rduire lhypertension. Aprs que les sujets ont suivi le traitement pendant deux mois, le test t pour deux chantillons est utilis pour comparer la tension artrielle moyenne du groupe placebo celle du groupe qui suit le traitement. Chaque patient est examin une fois et appartient un groupe. Statistiques. Pour chaque variable, on a les lments suivants : taille de lchantillon,

moyenne, cart-type, et erreur standard de la moyenne. Pour la diffrence de la moyenne: moyenne, erreur standard, et intervalle de confiance (vous pouvez spcifier le niveau de confiance). Tests : Test de Levene sur lgalit des variances et tests t des variances combines et spares pour lgalit des moyennes.
Donnes. Les valeurs de la variable quantitative qui vous intresse se trouvent dans une seule colonne du fichier de donnes. SPSS utilise une variable de regroupement deux valeurs pour sparer les observations en deux groupes. Le critre de regroupement peut tre numrique (on peut avoir des valeurs telles que 1 et 2, ou 6,25 et 12,5) ou alphanumrique (telles que oui et non). Vous pouvez utiliser galement une variable quantitative, telle que lge, pour sparer les observations en deux groupes en prcisant une csure (la csure 21 provoque un groupe dont lge est infrieur 21 ans et un groupe dont lge est suprieur 21 ans). Hypothses. Pour le test t de variance gale, les observations doivent tre indpendantes, et les chantillons alatoires de distribution normale doivent avoir la mme variance de population. Pour le test t de variance gale, les observations doivent tre indpendantes, et les chantillons alatoires doivent avoir une distribution normale. Le test t pour deux chantillons est assez robuste pour se dpartir de la normalit. Lors de la vrification graphique des distributions, vrifiez quelles sont symtriques et nont pas de valeurs loignes.

415 Tests T Figure 21-1 Rsultat Test T pour chantillons indpendants


Statistiques de groupe Moyenne des Erreurs Standard 5.39 4.31

Tension Artrielle

Traitement

placebo Nouveau_ Mdicament

N 10 10

Moyenne 142.50 116.40

Ecart type 17.04 13.62

Test pour chantillons indpendants Test de Levene sur l'galit des variances

Test-t pour galit des moyennes Signification (Bilatrale) 18 .001 Diffrence Diffrence de des erreurs Moyennes Standard 26.10 6.90 Intervalle de confiance de la moyenne 95 % Infrieur 11.61 Suprieur 40.59

F Tension Artrielle

Signification .719

t 3.783

df

Hypothse de variances gales Hypothse de variances Ingales

.134

3.783

17.163

.001

26.10

6.90

11.56

40.64

Obtenir un test t pour chantillons indpendants


E A partir des menus, slectionnez : Analyse Comparer les moyennes Test T pour chantillons indpendants Figure 21-2 Bote de Dialogue Test T pour chantillons indpendants

416 Chapitre 21 E Slectionnez au moins une variable test quantitative. Un test t distinct est alors

calcul pour chaque variable.


E Slectionnez un seul critre de regroupement et cliquez sur Dfinir groupes pour

spcifier deux codes pour les groupes comparer.


E Vous pouvez galement cliquer sur Options pour contrler le traitement des donnes

manquantes et le niveau de lintervalle de confiance.

Dfinir Groupes Test T pour Echantillons Indpendants


Figure 21-3 Bote de dialogue Dfinir groupes pour variables numriques

Pour les critres de regroupement numrique, dfinissez les deux groupes du test t en spcifiant deux valeurs ou un point de sparation :
Utiliser les valeurs spcifies. Saisissez une valeur pour le Groupe 1 et une autre

pour le Groupe 2. Les observations qui ont une autre valeur sont exclues de lanalyse. Il nest pas ncessaire que les nombres soient des entiers (par exemple, 6,25 et 12,5 sont valides).
Csure. Vous avez galement la possibilit de saisir un nombre qui spare les

valeurs de la variable de regroupement en deux groupes. Toutes les observations ayant des valeurs infrieures la csure constituent un groupe et les observations ayant des valeurs suprieures ou gales la csure constituent lautre groupe.

417 Tests T Figure 21-4 Dfinir la bote de dialogue Groupes pour les variables caractres

Pour les critres de regroupement alphanumriques, entrez une chane pour le Groupe 1 et une autre pour le Groupe 2, par exemple oui et non. Les observations avec dautres chanes sont exclues de lanalyse.

Options Test T pour Echantillons Indpendants


Figure 21-5 Bote de dialogue Test T pour chantillons indpendants : Options

Intervalle de confiance. Par dfaut, un intervalle de confiance de 95 % pour la diffrence dans les moyennes est affich. Saisir une valeur comprise entre 1 et 99 pour demander un niveau de confiance diffrent. Valeurs manquantes. Quand vous testez plusieurs variables et que des donnes sont

manquantes pour au moins une variable, vous pouvez indiquer la procdure les observations inclure (ou exclure).

418 Chapitre 21

Exclure les observations analyse par analyse. Chaque test t utilise toutes les

observations qui ont des donnes valides pour les variables testes. La taille des chantillons peut varier dun test lautre.
Exclure toute observation incomplte. Chaque test t utilise seulement les

observations qui ont des donnes valides pour toutes les variables utilises dans les tests t requis. La taille des chantillons est constante durant les tests.

Test T pour chantillons apparis


La procdure du Test T pour Echantillons Apparis compare la moyenne de deux variables pour un seul groupe. Elle permet de calculer la diffrence de valeurs entre les deux variables pour chaque observation et de tester si la moyenne diffre de 0.
Exemple. Dans le cadre dune tude sur lhypertension, des mesures sont prises sur tous les patients au dbut de ltude, un traitement est administr, puis on procde une nouvelle mesure. Par consquent, chaque sujet est lobjet de deux mesures, souvent nommes mesures avant et aprs. Il existe une alternative ce test, il sagit dune tude apparie ou de contrle dobservation dans laquelle chaque dclaration dans le fichier de donnes contient la rponse du patient ainsi que celle de son sujet de contrle appari. Dans le cadre dune tude sur la tension artrielle, les patients et les contrles peuvent tre apparis selon lge (un patient g de 75 ans avec un membre du groupe de contrle g de 75 ans). Statistiques. Pour chaque variable, on a les lments suivants : moyenne, taille

dchantillon, cart-type, et erreur standard de la moyenne. Pour chaque paire de variables, on a les lments suivants : Corrlation, diffrence moyenne de moyennes, test t et intervalle de confiance pour la diffrence moyenne (vous pouvez prciser le niveau de confiance). Ecart-type et erreur standard de la diffrence moyenne.
Donnes. Pour chaque test appari, prcisez deux variables continues (niveau dintervalle de mesure ou niveau de ratio de mesure). Dans le cadre dune tude apparie ou de contrle dobservation, la rponse pour chaque sujet test et son sujet de contrle appari doit tre dans la mme observation du fichier de donnes. Hypothses. Les observations pour chaque paire devraient tre ralises dans les

mmes conditions. Les diffrences moyennes devraient suivre une distribution normale. Les variances de chaque variable peuvent tre gales ou ingales.

419 Tests T Figure 21-6 Test T pour chantillons apparis


Statistiques des chantillons apparis Ecart Type 13.62 17.04 Moyenne des erreurs Standard 4.31 5.39

Moyenne Paire 1 Aprs Traitement Avant Traitement 116.40 142.50

N 10 10

Test d'exemples apparis

Diffrences apparies Intervale de confiance de 95 % de la diffrence Infrieur Suprieur t df

Moyenne Paire 1 Aprs traitement Avant traitement

Ecart-type

Moyenne d'erreur std.

Signification (bilatrale)

-26.10

19.59

6.19

-40.11

-12.09

-4.214

.002

Obtenir un test t pour chantillons apparis


E A partir des menus, slectionnez : Analyse Comparer les moyennes Test T pour chantillons apparis Figure 21-7 Bote de dialogue Test T pour chantillons apparis

420 Chapitre 21 E Slectionnez une paire de variables, comme suit :

Cliquez sur chacune des deux variables. La premire variable apparat dans le groupe Choix courants comme Variable 1 et la seconde apparat comme Variable 2. Cliquez sur le bouton flch pour dplacer la paire vers la liste Variables apparies. Vous pouvez slectionner dautres paires de variables. Pour retirer une paire de variables de lanalyse, slectionnez une paire dans la liste des Variables Apparies et cliquez sur la flche.
E Vous pouvez galement cliquer sur Options pour contrler le traitement des donnes

manquantes et le niveau de lintervalle de confiance.

Options test T pour chantillons apparis


Figure 21-8 Bote de dialogue Test T pour chantillons apparis

Intervalle de confiance. Par dfaut, un intervalle de confiance de 95 % pour la diffrence dans les moyennes est affich. Saisir une valeur comprise entre 1 et 99 pour demander un niveau de confiance diffrent. Valeurs manquantes. Quand vous testez plusieurs variables et que des donnes sont manquantes pour au moins une variable, vous pouvez indiquer SPSS les observations inclure (ou exclure) : Exclure les observations analyse par analyse. Chaque test t utilise toutes les

observations qui ont des donnes valides pour la paire de variables testes. La taille des chantillons peut varier dun test lautre.
Exclure toute observation incomplte. Chaque test t utilise seulement les

observations qui ont des donnes valides pour toutes les paires de variables testes. La taille des chantillons est constante durant les tests.

421 Tests T

Test T pour chantillon unique


La procdure du Test T pour chantillon unique permet de tester si la moyenne dune seule variable diffre dune constante spcifie.
Exemples : Un chercheur souhaite tester si le QI moyen dun groupe dtudiants diffre de 100. Un fabricant cralier prlve un chantillon de botes partir dune chane de production et vrifie si le poids moyen des chantillons diffre de 1,3 livres lintervalle de confiance 95 %. Statistiques : Pour chaque variable test : moyenne, cart-type, et erreur standard de la moyenne. Diffrence moyenne entre chaque valeur de donne et la valeur test suppose, le test t vrifie que cette diffrence est gale 0 et vrifie galement lintervalle de confiance pour cette diffrence (vous pouvez prciser le niveau de confiance). Donnes : Afin de tester les valeurs dune variable quantitative par rapport une valeur test suppose, choisissez une variable quantitative et saisissez une valeur test suppose. Hypothses : Ce test suppose que les donnes sont distribues normalement ; cependant, ce test rsiste convenablement la normalit.
Figure 21-9 Rsultat Test T pour chantillon unique
Statistiques pour chantillon unique QI N Moyenne Ecart type Moyenne des erreurs standard 15 109.33 12.03 3.11

Les lignes et les colonnes ont t transposes.

Test pour chantillon unique Valeur de test = 100 Signification Diffrence (Bilatrale) de moyennes .009 9.33 Intervalle de confiance de la diffrence 95 % Infrieur 2.67 Suprieur 15.99

QI

t 3.005

df 14

422 Chapitre 21

Obtenir un test t pour chantillon unique


E A partir des menus, slectionnez : Analyse Comparer les moyennes Test T pour chantillon unique Figure 21-10 Bote de dialogue Test T pour chantillon unique

E Slectionnez au moins une variable tester par rapport la mme valeur suppose. E Entrez une valeur test numrique laquelle vous souhaitez comparer chaque moyenne

dchantillon.
E Vous pouvez galement cliquer sur Options pour contrler le traitement des donnes

manquantes et le niveau de lintervalle de confiance.

Options Test T pour chantillon unique


Figure 21-11 Bote de Dialogue Options Test T pour chantillon unique

423 Tests T

Intervalle de confiance : Par dfaut, un intervalle de confiance de 95 % pour la diffrence entre la moyenne et la valeur de test suppose est affich. Saisir une valeur comprise entre 1 et 99 pour demander un niveau de confiance diffrent. Valeurs manquantes : Quand vous testez plusieurs variables et que des donnes sont manquantes pour au moins une variable, vous pouvez indiquer la procdure les observations inclure (ou exclure). Exclure les observations analyse par analyse : Chaque test t utilise toutes les

observations qui ont des donnes valides pour les variables testes. La taille des chantillons peut varier dun test lautre.
Exclure toute observation incomplte : Chaque test t utilise seulement les

observations qui ont des donnes valides pour toutes les variables utilises dans nimporte lequel des tests t requis. La taille des chantillons est constante durant les tests.

Fonctionnalits supplmentaires de la commande T-TEST


Le langage de commande SPSS vous permet aussi de : Produire la fois des tests t pour un chantillon et pour des cahntillons indpendants en excutant une commande unique. Tester une variable avec chacune des variables dune liste dans un test t appari (avec la sous-commande PAIRS). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

ANOVA 1 facteur

22

Chapitre

La procdure de lanalyse de variance ANOVA 1 facteur permet deffectuer une analyse de variance univarie sur une variable quantitative dpendante par une variable critre simple (indpendant). Lanalyse de variance sert tester lhypothse dgalit des moyennes. Cette technique est une extension du test t pour deux chantillons. Dterminer que des diffrences existent parmi les moyennes ne vous suffit peut-tre pas. Vous voulez ventuellement savoir quelles sont les moyennes qui diffrent. Il existe deux types de tests pour comparer les moyennes : les contrastes a priori et les tests post hoc. Les contrastes sont des tests dfinis avant lexprience, et les tests post hoc sont effectus aprs lexprience. Vous pouvez aussi tester les tendances travers les modalits.
Exemple. Les beignets absorbent la graisse dans des proportions varies lorsquils sont cuisins. Une exprience est conduite partir de lutilisation de trois types de graisse : huile darachide, huile de mas, et saindoux. Lhuile darachide et lhuile de mas sont des graisses non satures, et le saindoux une graisse sature. Non seulement vous dterminez si la quantit de graisse absorbe dpend du type de graisse utilise, mais vous pouvez galement crer un contraste a priori afin de dterminer si le degr dabsorption de graisse diffre pour les graisses satures et non satures. Statistiques. Pour chaque groupe : nombre dobservations, moyenne, cart-type, erreur standard de la moyenne, minimum, maximum et intervalle de confiance 95 % de la moyenne. Test de Levene pour lhomognit de la variance, tableau danalyse de la variance et tests dgalit des moyennes pour chaque variable dpendante, contrastes a priori spcifis par lutilisateur et tests dintervalle et comparaisons multiples post hoc : Bonferroni, Sidak, test de Tukey, GT2 de Hochberg, Gabriel, Dunnett, test F de Ryan-Einot-Gabriel-Welsch (R-E-G-W F), test dintervalle de Ryan-Einot-Gabriel-Welsch (R-E-G-W Q), T2 de Tamhane, T3 de Dunnett, Games-Howell, test C de Dunnett, test de Duncan, Student-Newman-Keuls (S-N-K), B de Tukey, Waller-Duncan, Scheff et diffrence la moins significative.

425

426 Chapitre 22

Donnes. Les valeurs de la variable active devraient tre des nombres entiers, et la

variable dpendante devrait tre quantitative (niveau dintervalle de mesures).


Hypothses. Chaque groupe est un chantillon alatoire indpendant extrait dune

population normale. Lanalyse de la variance supporte les carts la normalit, bien que les donnes doivent tre symtriques. Les groupes devraient tre composs de populations variance gale. Pour tester cette hypothse, utiliser le test dhomognit de variance de Levene.
Figure 22-1 Rsultat ANOVA 1 facteur
ANOVA Somme des carrs Grammes de graisse absorbe Entre groupes Dans les groupes Total 1596.00

df 2

Carr moyen 798.00

F 7.824

Signification .005

1530.00 3126.00

15 17

102.00

Descriptions Intervale de confiance de 95 % pour la moyenne N Grammes graisse de absorbe Type d'huile Huile d'arachide Saindoux Huile de mas Total 6 6 6 18 Moyenne 72.00 85.00 62.00 73.00 Ecart-type 13.34 7.77 8.22 13.56 Erreur std. 5.45 3.17 3.36 3.20 Limite infrieure 58.00 76.84 53.37 66.26 Limite suprieure 86.00 93.16 70.63 79.74 Minimum 56 77 49 49 Maximum 95 97 70 97

Coefficients de contraste Type d'huile Huile d'arachide Contraste 1 -.5 Saindoux 1 Huile de mas -.5

Tests de contraste Valeur de contraste Grammes de graisse absorbe Suppose des variances gales Ne suppose pas des variances gales Contraste Contraste 1 1 18.00 18.00 Signification [bilatrale) 15 12.542 .003 .002

Erreur std. 5.05 4.51

t 3.565 3.995

df

427 ANOVA 1 facteur

Test d'homognit des variances Statistique de Levene Grammes de graisse absorbe .534

df1 2

df2 15

Signification .597

Obtenir une analyse de variance un facteur


E A partir des menus, slectionnez : Analyse Comparer les moyennes ANOVA 1 facteur Figure 22-2 Bote de dialogue ANOVA 1 facteur

E Slectionnez au moins une variable dpendante. E Slectionnez une variable active indpendante simple.

428 Chapitre 22

Contrastes ANOVA 1 facteur


Figure 22-3 Bote de dialogue ANOVA 1 facteur : Contrastes

Vous pouvez diviser les sommes des carrs inter-groupes en tendances composants ou spcifier les contrastes a priori.
Modle polynomial. Diviser les sommes des carrs inter-groupes en tendances composants. Vous pouvez tester la tendance dune variable dpendante travers les niveaux ordonns de la variable active. Par exemple, vous pourriez tester la tendance linaire (croissante ou dcroissante) des salaires perus les plus levs travers les niveaux ordonns. Degr. Vous pouvez choisir un polynme de premier, deuxime, troisime,

quatrime ou cinquime degr.


Coefficients. Contrastes a priori spcifis tester par la statistique t. Saisissez un coefficient pour chaque groupe (modalit) de la variable active et cliquez sur Ajouter aprs chaque saisie. Chaque nouvelle valeur sajoute au bas de la liste des coefficients. Pour spcifier des groupes de contrastes supplmentaires, cliquez sur Suivant. Utilisez Suivant et Prcdent pour vous dplacer entre les groupes de contrastes. Lordre des coefficients est important car il correspond lordre croissant des valeurs de modalit de la variable active. Le premier coefficient de la liste correspond la valeur la plus petite de la variable active, et le dernier coefficient correspond la valeur la plus leve. Par exemple, sil y a six modalits de variables actives, les coefficients 1, 0, 0, 0, 0,5 et 0,5 mettent en contraste le premier groupe avec les cinquime et sixime groupes. Pour la plupart des applications, les coefficients

429 ANOVA 1 facteur

devraient slever 0. Les groupes qui natteignent pas 0 peuvent aussi tre utiliss, mais un message davertissement saffiche.

Tests Post Hoc ANOVA 1 facteur


Figure 22-4 ANOVA 1 facteur : Comparaisons multiples a posteriori

Lorsque vous avez dtermin quil existe des diffrences parmi les moyennes, les tests dintervalles post hoc et de comparaisons multiples par paire peuvent dterminer les moyennes qui diffrent. Les tests dintervalle identifient les sous-groupes homognes de moyennes qui ne diffrent pas les uns des autres. Les comparaisons multiples apparies testent la diffrence entre les moyennes apparies et engendrent une matrice pour laquelle les astrisques indiquent les moyennes de groupes significativement diffrentes au niveau alpha 0.05.
Hypothse de variances gales :

Le test de Tukey, le GT2 de Hochberg, le test de Gabriel et le test de Scheff sont des tests de comparaisons multiples et dintervalle. Il existe dautres tests dintervalle, tels que le test B de Tukey, le S-N-K (Student-Newman-Keuls), le Duncan, le R-E-G-W F (F de Ryan-Einot-Gabriel-Welsch), le R-E-G-W Q (test dintervalle de Ryan-Einot-Gabriel-Welsch) et le Waller-Duncan. Les tests de comparaison multiple

430 Chapitre 22

disponibles sont les suivants : Bonferroni, test de diffrence significative de Tukey, Sidak, Gabriel, Hochberg, Dunnett, Scheff et LSD (diffrence la moins significative).
LSD. Utilisation de tests t pour effectuer toutes les comparaisons par paire entre

des moyennes de groupe. Le taux d'erreur n'est pas corrig dans le cas de comparaisons multiples.
Bonferroni. Utilise des tests t pour effectuer des comparaisons par paire entre

les moyennes de groupes, mais contrle le taux d'erreur global en spcif.iant comme taux d'erreur pour chaque test le taux d'erreur empirique divis par le nombre total de tests. Le seuil de signification observ est ainsi ajust en raison des comparaisons multiples ralises.
Sidak. Test de comparaisons multiples par paire reposant sur la statistique t. Le

test Sidak ajuste le seuil de signification en fonction des comparaisons multiples et fournit des bornes plus troites que le test Bonferroni.
Scheff. Excute des comparaisons par paire simultanes pour toutes les paires

de moyennes possibles. Utilise la distribution d'chantillonnage F. Peut servir examiner toutes les combinaisons linaires possibles de moyennes de groupe, et pas seulement des comparaisons par paire.
F de R-E-G-W (Ryan-Einot-Gabriel-Welsch). Procdure multiple descendante de

Ryan-Einot-Gabriel-Welsch base sur un test F.


Q de R-E-G-W (Ryan-Einot-Gabriel-Welsch). Procdure multiple descendante de

Ryan-Einot-Gabriel-Welsch base sur un intervalle de Student.


S-N-K. Ce test effectue toutes les comparaisons de moyennes par paire, l'aide

de la distribution des intervalles de Student. Lorsque la taille des chantillons est gale, il compare aussi les moyennes par paire dans les sous-ensembles homognes, en utilisant une procdure pas pas. Les moyennes sont tries dans l'ordre dcroissant et les diffrences extrmes sont testes en premier.
Tukey. Utilise les statistiques des intervalles studentises pour effectuer des

comparaisons de classes deux deux. Fixe le taux d'erreur exprimental au niveau du taux d'erreur de l'ensemble pour toutes des comparaisons par paire.
B de Tukey. Utilise la distribution des intervalles studentise pour effectuer des

comparaisons de classes deux deux. La valeur critique est la moyenne de la valeur correspondante du test de Tukey et du test de Student-Newman-Keuls.

431 ANOVA 1 facteur

Duncan. Ralise des comparaisons par paires en suivant un ordre pas pas

identique celui utilis dans le test de Student-Newman-Keuls, mais tablit un niveau de protection du taux d'erreur pour l'ensemble des tests, plutt que pour chaque test en particulier. Utilise la statistique d'intervalle de Student.
GT2 de Hochberg. Test de multiples comparaisons et intervalles apparis utilisant

le modulus maximum de Student. Similaire au test de Tukey.


Gabriel. Test de comparaison par paire qui utilise le modulus maximum de

Student. Il est plus efficace que le GT2 de Hochberg lorsque les tailles des cellules sont ingales. Le test de Gabriel offre plus de souplesse lorsque les tailles des cellules divergent beaucoup.
Waller-Duncan. Test de comparaisons multiples bas sur une statistique t et

utilisant une approche baysienne.


Dunnett. Test T de comparaisons multiples par paires comparant un ensemble

de traitements une moyenne de contrle unique. La dernire modalit est la modalit de contrle par dfaut. Vous pouvez galement choisir la premire modalit. Loption Bilatral teste que la moyenne un certain niveau (hormis la modalit de contrle) du facteur nest pas gale celle de la modalit de contrle. Loption <Contrle permet de tester si la moyenne est infrieure, un certain niveau du facteur, celle de la modalit de contrle. Loption >Contrle permet de tester si la moyenne est suprieure, un certain niveau du facteur, celle de la modalit de contrle.
Hypothse de variances ingales.

Les tests de comparaison multiple qui ne supposent pas de variances gales sont le T2 de Tamhane, le T3 de Dunnett, Games-Howell et le C de Dunnett.
T2 de Tamhane. Test des comparaisons apparies bas sur le test T. Ce test est

opportun lorsque les variances sont ingales.


T3 de Dunnett. Test des comparaisons par paires bas sur le module maximal de

Student. Ce test est opportun lorsque les variances sont ingales.


Games-Howell. Test des comparaisons apparies qui peut parfois tre souple. Ce

test est opportun lorsque les variances sont ingales.


C de Dunnett. Test des comparaisons par paires bas sur l'intervalle de Student. Ce

test est opportun lorsque les variances sont ingales.

432 Chapitre 22

Remarque : Il peut vous paratre plus facile dinterprter le rsultat partir de tests post hoc si vous dsactivez loption Masquer les lignes et les colonnes vides dans la bote de dialogue Proprits du tableau (dans le tableau pivotant activ, choisissez Proprits du tableau dans le menu Format).

Options ANOVA 1 facteur


Figure 22-5 Bote de dialogue ANOVA 1 facteur : Options

Statistiques. Choisissez une ou plusieurs des options suivantes : Caractristique. La procdure calcule le nombre dobservations, la moyenne,

lcart-type, lerreur standard de la moyenne, le minimum, le maximum, et les intervalles de confiance 95 % pour chaque variable dpendante de chaque groupe.
Effets fixes et alatoires. La procdure affiche lcart-type, lerreur standard

et lintervalle de confiance 95 % pour le modle effets fixes, ainsi que lerreur standard, lintervalle de confiance 95% et lestimation de la variance inter-composants pour le modle effets alatoires.
Test dhomognit de variance. La procdure calcule la statistique de Levene pour

tester lgalit des variances de groupe. Ce test ne dpend pas de lhypothse de normalit.

433 ANOVA 1 facteur

Brown-Forsythe. La procdure calcule la statistique de Brown-Forsythe pour tester

lgalit des moyennes de groupe. Il est prfrable dutiliser cette statistique (au lieu de la statistique F) lorsque lhypothse dgalit des variances nest pas satisfaite.
Welch. Calcule la statistique de Welch pour tester lgalit des moyennes de

groupe. Il est prfrable dutiliser cette statistique (au lieu de la statistique F) lorsque lhypothse dgalit des variances nest pas satisfaite.
Diagramme des moyennes. Affiche un diagramme qui reprsente les moyennes de

sous-groupes (les moyennes de chaque groupe dfinies par les valeurs de la variable active).
Valeurs manquantes. Contrle le traitement des valeurs manquantes. Exclure les observations analyse par analyse. Aucune observation avec valeur

manquante nest utilise, que ce soit pour la variable dpendante ou pour la variable active dune analyse donne. De mme, on nutilise pas dobservation en dehors de lintervalle spcifi pour la variable active.
Exclure toute observation incomplte. Les observations ayant des valeurs

manquantes pour la variable active ou pour toute variable dpendante contenue dans la liste dpendante de la bote de dialogue principale sont exclues de toutes les analyses. Si vous navez pas spcifi de variables multiples dpendantes, cela est sans effet.

Fonctionnalits supplmentaires de la commande ONEWAY


Le langage de commande SPSS vous permet aussi de : Obtenir des statistiques effets fixes et alatoires Ecart type, erreur standard de la moyenne et intervalles de confiance de 95 % pour le modle effets fixes. Erreur standard, intervalles de confiance de 95 % et estimation de la variance inter-composants pour le modle effets alatoires (en utilisant STATISTICS=EFFECTS). Spcifier les niveaux alpha pour la diffrence de moindre signification, tests de comparaison multiple Bonferroni, Duncan et Scheff (avec la sous-commande RANGES). Ecrire une matrice des moyennes, des carts-types et des frquences ou lire une matrice des moyennes, des frquences, des variances combines et des degrs de libert des variances combines. Ces matrices peuvent tre utilises la place

434 Chapitre 22

des donnes brutes pour obtenir une analyse un facteur de la variance (avec la sous-commande MATRIX). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Analyse GLM Univari

23

Chapitre

GLM Univari fournit un modle de rgression et une analyse de la variance pour plusieurs variables dpendantes par un ou plusieurs facteurs ou variables. Les variables actives divisent la population en groupes. Cette procdure de rgression linaire gnralise vous permet de tester les hypothses nulles propos des effets des autres variables sur la moyenne de diffrents regroupements de la variable dpendante. Vous pouvez rechercher les interactions entre les facteurs ainsi que les effets des diffrents facteurs, certains dentre eux tant alatoires. En outre, les effets et les interactions des covariables avec les facteurs peuvent tre inclus. Pour lanalyse de la rgression, les variables indpendantes (explicatives) sont spcifies comme covariables. Vous pouvez tester les modles quilibrs comme dsquilibrs. Un modle est quilibr si chaque cellule de ce modle contient le mme nombre dobservations. Lanalyse GLM Univari teste non seulement les hypothses mais elle produit galement des estimations. Vous disposez de contrastes a priori communs pour effectuer les tests dhypothse. En outre, lorsquun test F global se rvle significatif, vous pouvez utiliser les tests post hoc pour valuer les diffrences entre les moyennes spcifiques. Les moyennes marginales estimes fournissent des estimations des valeurs moyennes estimes pour les cellules dans le modle et les diagrammes des profils (diagrammes dinteraction) de ces moyennes vous permettent de visualiser plus facilement certaines des relations. Les rsidus, les prvisions, la distance de Cook et les valeurs influentes peuvent tre enregistres sous forme de nouvelles variables dans votre fichier de donnes pour vrifier les hypothses. Poids WLS. Vous permet de spcifier une variable utilise pour pondrer les observations pour une analyse pondre (WLS) des moindres carrs, peut-tre pour compenser les diffrents niveaux de prcision des mesures.

435

436 Chapitre 23

Exemple. Des donnes sont collectes sur les diffrents participants au Marathon de Paris sur plusieurs annes. Le temps effectu par chaque participant est la variable dpendante. Les autres facteurs comprennent le temps (froid, modr, chaud), le nombre de mois dentranement, le nombre de marathons prcdemment effectus et le sexe. Lge est considr comme co-variable. Vous devez trouver que le sexe a un effet significatif et que linteraction du sexe avec le temps est significatif. Mthodes. Les sommes des carrs de type I, II, III et IV peuvent servir valuer les

diffrentes hypothses. Le type III est la valeur par dfaut.


Statistiques. Tests dintervalle post hoc et comparaisons multiples : La diffrence la moins significative, Bonferroni, Sidak, Scheff, F multiple de Ryan-Einot-Gabriel-Welsch, lintervalle multiple de Ryan-Einot-Gabriel-Welsch, Student-Newman-Keuls, le test de Tukey, b de Tukey, Duncan, GT2 de Hochberg, Gabriel, le test t de Waller Duncan, Dunnett (unilatral, bilatral), T2 de Tamhane, T3 de Dunnett, Games-Howell et C de Dunnett. Statistiques descriptives : moyenne observe, cart-type et effectifs pour toutes les variables dpendantes dans toutes les cellules. Le test de Levene pour lhomognit de la variance. Diagrammes. Dispersion par niveau, rsiduels et profils (interaction). Donnes. La variable dpendante est quantitative. Les facteurs sont qualitatifs. Il peut

sagir de valeurs numriques ou alphanumriques de 8 caractres au maximum. Les covariables sont des variables quantitatives lies la variable dpendante.
Hypothses. Les donnes forment un chantillon alatoire dune population normale

ou gaussienne. Dans cette population, toutes les variances de cellule sont gales. Lanalyse de la variance supporte les carts la normalit, bien que les donnes doivent tre symtriques. Pour vrifier les hypothses, vous pouvez utiliser les tests dhomognit de la variance et les diagrammes de dispersion par niveau. Vous pouvez galement tudier les rsidus et les diagrammes de rsidus.

437 Analyse GLM Univari Figure 23-1 Rsultat GLM - Univari


Tests des effets inter-sujets Variable dpendante : SPVOL Somme des carrs de type III Carr moyen

Source Modle corrig Constante Farine Graisse Prcipit Graisse*Prcipit

df 11 1 3 2 2 4 14 26 25

F 12.376 6147.938 17.513 30.583 3.014 8.522

Sig. .000 .000 .000 .000 .082 .001

22.520 1016.981 8.691 10.118 .997 5.639 2.316 1112.960 24.835

2.047 1016.981 2.897 5.059 .499 1.410 .165

Erreur Total
Total corrig

1. R carr = .907 (R carr ajust = .833)


Graisse * prcipit Variable dpendante : SPVOL

Intervale de confiance de 95 %
Graisse prcipit Moyenne

Erreur std. Limite infrieure Limite suprieure .240 .239 .241 .241 .301 .203 .301 .203 .300 5.021 5.378 5.605 6.505 6.064 5.564 5.984 6.764 7.945 6.052 6.404 6.641 7.541 7.353 6.436 7.274 7.636 9.233

1 2 3

5.536 5.891 6.123 7.023 6.708 6.000 6.629 7.200 8.589

1 2 3

1 2 3

Pour obtenir des tables GLM - Univari


E A partir des menus, slectionnez : Analyse Modle linaire gnral Univari

438 Chapitre 23 Figure 23-2 Bote de dialogue Univari

E Slectionnez une variable dpendante. E Slectionnez les variables pour Facteur(s) fix(s), Facteur(s) alatoire(s) et

Covariable(s), en fonction de vos donnes.


E En option, vous pouvez utiliser WLS Weight pour prciser une variable de pondration

pour lanalyse des moindres carrs pondrs. Si la valeur de la variable de pondration est nulle, ngative ou manquante, lobservation est exclue de lanalyse. Une variable dj utilise dans le modle ne peut pas servir de variable de pondration.

439 Analyse GLM Univari

Modle GLM
Figure 23-3 Bote de dialogue Modle univari

Spcifier le modle : Un modle factoriel gnral contient tous les effets principaux des facteurs, des covariables et toutes les interactions facteur/facteur. Il ne contient pas de dinteractions de covariable. Slectionnez Autre pour indiquer un sous-ensemble dinteractions ou des interactions variable active/covariable. Vous devez indiquer tous les termes inclure dans le modle. Critres et covariables :Les covariables et facteurs sont numrs en indiquant (F)

pour facteur fix et (C) pour covariable. Dans une analyse univarie, (R) indique un facteur alatoire.
Modle : Le modle dpend de la nature de vos donnes. Aprs avoir slectionn
Autre, vous pouvez choisir les effets principaux et les interactions qui prsentent

un intrt pour votre analyse.


Somme des carrs Mthode de calcul des sommes des carrs. Pour les modles quilibrs ou non, auxquels aucune cellule ne manque, le type III est la mthode le plus frquemment utilise. Inclure une constante au modle : Lordonne est gnralement incluse dans le modle.

Si vous partez du principe que les donnes passent par lorigine, vous pouvez exclure la constante.

440 Chapitre 23

Termes construits
Pour les facteurs et covariables slectionns :
Interaction :Cre le terme dinteraction du plus haut niveau de toutes les variables

slectionnes. Il sagit de la valeur par dfaut.


Effets principaux :Cre un terme deffet principal pour chaque variable slectionne. Toutes dordre 2 :Cre toutes les interactions dordre 2 possibles des variables

slectionnes.
Toutes dordre 3 :Cre toutes les interactions dordre 3 possibles des variables

slectionnes.
Toutes dordre 4 :Cre toutes les interactions dordre 4 possibles des variables

slectionnes.
Toutes dordre 5 :Cre toutes les interactions dordre 5 possibles des variables

slectionnes.

Somme des carrs


Pour ce modle, vous pouvez choisir un type de sommes des carrs. Le type III est le plus courant et cest la valeur par dfaut.
Type I : Cette mthode est galement appele dcomposition hirarchique de la somme

des carrs. Chaque terme est ajust uniquement pour le terme qui le prcde dans le modle. La somme des carrs de type I est gnralement utilise pour : Une analyse de la variance quilibre dans laquelle tout effet principal est spcifi avant les effets dinteraction de premier ordre, et chaque effet de premier ordre spcifi avant ceux de second ordre, et ainsi de suite. Un modle de rgression polynomial dans lequel les termes dordre infrieur sont spcifis avant ceux dordre suprieur. Un modle par imbrication pur dans lequel le premier effet spcifi est imbriqu dans le second et le second spcifi dans le troisime, etc. (Cette forme dimbrication peut tre spcifie par la syntaxe uniquement.)

441 Analyse GLM Univari

Type II : Cette mthode calcule les sommes des carrs dun effet dans le modle ajust pour tous les autres effets appropris . Un effet appropri est un effet qui correspond tous les effets qui ne contiennent pas leffet tudier. La mthode des sommes des carrs de type II sert gnralement pour :

Une analyse de la variance quilibre. Tout modle qui contient un effet principal uniquement. Tout modle de rgression. Un modle par embotement pur. (Cette forme dembotement peut tre spcifie par la syntaxe.)
Type III : Valeur par dfaut. Cette mthode calcule les sommes des carrs dun effet

dans le modle comme les sommes des carrs ajuste pour tout autre effet qui ne le contient pas et orthogonal chaque effet qui le contient. Les sommes de carrs de type III prsentent lavantage essentiel quelles ne varient pas avec les frquences de cellule tant que la forme gnrale destimabilit reste constante. Ce type de somme des carrs est donc souvent considr comme utile pour les modles dsquilibrs auxquels aucune cellule ne manque. Dans le modle factoriel sans cellule manquante, cette mthode est quivalente la technique de Yates des carrs moyens pondrs. La mthode des sommes des carrs de type III sert gnralement pour : Tous les modles numrs dans les types I et II. Tous les modles quilibrs ou non qui ne contiennent pas de cellules vides.
Type IV : Cette mthode est conue pour une situation dans laquelle il manque des cellules. Pour chaque effet F dans le modle, si F nest inclus dans aucun autre effet, Type IV = Type III = Type II. Si F est inclus dans dautres effets, le Type IV distribue les contrastes effectuer parmi les paramtres dans F sur tous les effets de niveau suprieur de faon quitable. La mthode des sommes des carrs de type IV sert gnralement pour :

Tous les modles numrs dans les types I et II. Tous les modles quilibrs ou non qui contiennent des cellules vides.

442 Chapitre 23

Contrastes GLM
Figure 23-4 Bote de dialogue GLM Univari : Contrastes

Les contrastes servent tester les diffrences entre les niveaux dun facteur. Vous pouvez spcifier un contraste pour chaque facteur du modle (dans un modle de mesures rptes, pour chaque facteur inter-sujets). Les contrastes reprsentent des combinaisons linaires des paramtres. Le test des hypothses est fond sur lhypothse nulle LB =0, L tant la matrice des coefficients de contraste et B le vecteur de paramtre. Si un contraste est spcifi, SPSS cre une matrice L de telle sorte que les colonnes correspondant au facteur correspondent aux contrastes. Les colonnes restantes sont ajustes de telle sorte que la matrice L puisse tre estime. Le rsultat reprend une statistique F pour chaque ensemble de contrastes. Pour les diffrences de contraste, le systme affiche galement les intervalles de confiance simultans de type Bonferroni fonds sur la distribution t de Student.
Contrastes possibles

Les contrastes fournis sont cart, simple, diffrence, Helmert, rpte et modle polynomial. Pour les contrastes dcart et simple, vous pouvez choisir si la modalit de rfrence est la premire ou la dernire.

Types de contraste
Ecart. Compare la moyenne de chaque niveau (hormis une modalit de rfrence) la moyenne de tous les niveaux (grande moyenne). Les niveaux du facteur peuvent tre de nimporte quel ordre.

443 Analyse GLM Univari

Simple. Compare la moyenne de chaque niveau celle dun niveau donn. Ce type de contraste est utile lorsquil y a un groupe de contrle. Vous pouvez prendre la premire ou la dernire modalit en rfrence. Diffrence. Compare la moyenne de chaque niveau (hormis le premier) la moyenne

des niveaux prcdents. (Parfois appel contrastes dHelmert invers.)


Helmert. Compare la moyenne de chaque niveau de facteur (hormis le dernier) la moyenne des niveaux suivants. Rpt. Compare la moyenne de chaque niveau (hormis le premier) la moyenne du niveau suivant. Modle polynomial. Compare leffet linaire, leffet quadratique, leffet cubique

etc. Le premier degr de libert contient leffet linaire sur toutes les modalits, le second degr leffet quadratique, etc. Ces contrastes servent souvent estimer les tendances polynomiales.

Diagrammes de profils GLM


Figure 23-5 Bote de dialogue GLM Univari : Diagrammes des protocoles

Les diagrammes des profils (diagrammes dinteraction) sont utiles pour comparer les moyennes marginales dans votre modle. Un diagramme des profils est une courbe dont chaque point indique la moyenne marginale estime dune variable dpendante (ajuste pour les covariables) un niveau du facteur. Les niveaux dun second facteur

444 Chapitre 23

peuvent servir dessiner des courbes distinctes. Chaque niveau dans un troisime facteur peut servir crer un diagramme distinct. Tous les facteurs fixs et alatoire sont disponibles pour les diagrammes. Pour les analyses multivaries, les diagrammes des profils sont crs pour chaque variable dpendante. Dans une analyse mesures rptes, la fois les facteurs inter-sujets et intra-sujets peuvent tre utiliss dans les diagrammes des profils. GLM Multivari et GLM Mesures rptes sont disponibles uniquement si vous avez loption Statistiques avances installe. Un diagramme des profils pour un facteur montre si la moyenne marginale estime est croissante ou dcroissante sur les niveaux. Pour au moins deux facteurs, des courbes parallles indiquent quil ny a pas dinteraction entre les facteurs, ce qui signifie que vous recherchez les niveaux dun seul facteur. Les courbes non parallles indiquent une interaction.
Figure 23-6 Diagramme non parallle (gauche) et diagramme parallle (droite)

Aprs avoir slectionn des facteurs pour laxe horizontal afin de spcifier un diagramme et, ventuellement, des facteurs pour des courbes ou des diagrammes distincts, vous devez ajouter le diagramme la liste Diagrammes.

445 Analyse GLM Univari

Comparaisons post hoc GLM


Figure 23-7 Bote de dialogue GLM Univari : Comparaisons multiples post hoc pour les moyennes observes

Test de comparaison multiple post hoc. Lorsque vous avez dtermin quil existe des

diffrences parmi les moyennes, les tests dintervalles post hoc et de comparaisons multiples par paire peuvent dterminer les moyennes qui diffrent. Les comparaisons sont effectues sur des valeurs non-ajustes. Ces tests servent aux facteurs inter-sujets fixs seulement. Dans GLM - Mesures rptes, ces tests ne sont pas disponibles sil ny a pas de facteurs inter-sujets. Les tests de comparaisons multiples post hoc sont effectus pour la moyenne de tous les niveaux des facteurs intra-sujets. Pour GLM - Multivari, les tests post hoc sont effectus sparment pour chaque variable dpendante. GLM Multivari et GLM Mesures rptes sont disponibles uniquement si vous avez loption Statistiques avances installe. Les tests de diffrence significative de Bonferroni et Tukey servent gnralement comme tests de comparaison multiples. Le test de Bonferroni, fond sur la statistique t de Student, ajuste le niveau de signification observ en fonction du nombre de comparaisons multiples qui sont effectues. Le test t de Sidak ajuste galement le niveau de signification et fournit des limites plus strictes que le test de Bonferroni. Le test de Tukey utilise la statistique dintervalle selon Student pour effectuer des comparaisons par paire entre les groupes et fixe le taux derreur empirique au taux derreur du regroupement de toutes les comparaisons par paire. Lorsque vous testez

446 Chapitre 23

un grand nombre de paires de moyennes, le test de Tukey est plus efficace que celui de Bonferroni. Lorsquil y a peu de paires, Bonferroni est plus efficace. Le GT2 de Hochberg est similaire au test de Tukey mais il utilise un modulus maximum selon Student. Le test de Tukey est gnralement plus efficace. Le test de comparaison par paire de Gabriel utilise galement le modulus maximum selon Student. Il est plus efficace que le GT2 de Hochberg lorsque les tailles des cellules sont ingales. Le test de Gabriel offre plus de souplesse lorsque les tailles des cellules divergent beaucoup. Le test de comparaison multiple de Dunnett compare un ensemble de traitements une simple moyenne de contrle. La dernire modalit est la modalit de contrle par dfaut. Vous pouvez galement choisir la premire modalit. Vous pouvez galement choisir un test unilatral ou bilatral. Pour tester que la moyenne un certain niveau (hormis la modalit de contrle) du facteur nest pas gale celle de la modalit de contrle, utilisez le test double-face. Pour tester si la moyenne est infrieure, un certain niveau du facteur, celle de la modalit de contrle, slectionnez < Contrle. En outre, pour vrifier si la moyenne est suprieure, un certain niveau du facteur, celle de la modalit de contrle, slectionnez > Contrle. Ryan, Einot, Gabriel et Welsch (R-E-G-W) ont dvelopp deux tests dintervalles multiples descendants. Les procdures multiples descendantes testent dabord que toutes les moyennes sont gales. Si toutes les moyennes ne sont pas gales, lgalit est teste sur des sous-ensembles de moyennes. Le F de R-E-G-W est fond sur le test F et le Q de R-E-G-W est fond sur lintervalle selon Student. Ces tests sont plus efficaces que le test dintervalles multiples de Duncan et Student-Newman-Keuls (procdures multiples descendantes), mais ils sont conseills lorsque les cellules sont de taille ingale. Lorsque les variances sont ingales, utilisez le T2 de Tamhane (test de comparaisons par paire conservatif fond sur un test t), le T3 de Dunnett (comparaison par paire fonde sur le modulus maximal selon Student), le test de comparaison par paire de Games-Howell (parfois flexible) ou le C de Dunnett (test de comparaison par paire fond sur lintervalle selon Student). Le test dintervalles multiples de Duncan, Student-Newman-Keuls (S-N-K) et le b de Tukey sont des tests dintervalle qui classifient les moyennes de groupe et calculent une valeur dintervalle. Ces tests ne sont pas utiliss aussi souvent que les tests voqus prcdemment. Le test t de Waller-Duncan utilise une approche de Bayes. Ce test dintervalle utilise la moyenne harmonique de la taille de lchantillon lorsque les chantillons sont de tailles diffrentes.

447 Analyse GLM Univari

Le niveau de signification du test de Scheff est conu pour permettre toutes les combinaisons linaires possibles des moyennes de groupe tester, pas seulement par paire, disponibles dans cette fonction. Il en rsulte que le test de Scheff est souvent plus strict que les autres, ce qui signifie quune plus grande diffrence de moyenne est ncessaire pour tre significative. Le test de comparaison multiple par paire de diffrence la moins significative (LSD) est quivalent aux divers tests t individuels entre toutes les paires des groupes. Linconvnient de ce test est quil nessaie pas dajuster le niveau dimportance observe pour les comparaisons multiples.
Tests affichs. Les comparaisons par paire sont proposes pour LSD, Sidak,

Bonferroni, Games et Howell, T2 et T3 de Tamhane, C et T3 de Dunnett. Des sous-ensembles homognes pour les tests dintervalle sont proposs pour S-N-K, b de Tukey, Duncan, F et Q de R-E-G-W et Waller. Le test de Tukey, le GT2 de Hochberg, le test de Gabriel et le test de Scheff sont la fois des tests de comparaison multiple et des tests dintervalle.

Enregistrement GLM
Figure 23-8 Bote de dialogue GLM Univari : Enregistrement

448 Chapitre 23

Vous pouvez enregistrer les prvisions par le modle, les rsidus et les mesures associes sous forme de nouvelles variables dans lditeur de donnes. La plupart de ces variables peuvent servir tudier les hypothses relatives aux donnes. Pour enregistrer les valeurs afin de les utiliser dans une autre session SPSS, vous devez enregistrer le fichier de donnes en cours.
Prvisions. Valeurs que le modle estime pour chaque observation. Non standardiss. Valeur prvue par le modle pour la variable dpendante. Pondrs. Valeurs estimes non standardises pondres. Disponibles uniquement

lorsqu'une variable WLS a t pralablement slectionne.


Erreur standard. Estimation de l'cart-type de la valeur moyenne de la variable

dpendante, pour les observations ayant la mme valeur pour les variables indpendantes.
Diagnostics. Mesures permettant didentifier les observations avec des combinaisons inhabituelles de valeurs pour les variables indpendantes et les observations qui peuvent avoir un impact important sur le modle. Distance de Cook. Mesure permettant de savoir de combien les rsidus de toutes

les observations seraient modifis si une observation donne tait exclue du calcul des coefficients de rgression. Si la distance de Cook est leve, l'exclusion d'une observation changerait substantiellement la valeur des coefficients.
Valeurs influentes. Valeurs influentes non centres. Influence relative de chaque

observation sur la qualit d'ajustement du modle.


Rsidus. Un rsidu non standardis correspond la valeur relle de la variable

dpendante moins la valeur estime par le modle. Les rsidus standardiss, selon Student et supprims sont galement disponibles. Si vous avez choisi une variable de pondration, les rsidus standardiss pondrs sont disponibles.
Non standardiss. Diffrence entre la valeur observe et la valeur prvue par le

modle.
Pondrs. Rsidus estims non standardiss pondrs. Disponibles uniquement

lorsqu'une variable WLS a t pralablement slectionne.


Standardiss. Rsidu divis par une estimation de son cart-type. Egalement

appels rsidus de Pearson, les rsidus standardiss ont une moyenne de 0 et un cart-type de 1.

449 Analyse GLM Univari

Studentiss. Rsidu, divis par une estimation de son cart-type, qui varie d'une

observation une autre, selon la distance entre les valeurs et la moyenne des variables indpendantes pour chaque observation.
Supprimes. Rsidu d'une observation lorsque celle-ci est exclue du calcul des

coefficients de rgression. Il s'agit de la diffrence entre la valeur de la variable dpendante et la prvision ajuste.
Statistiques coefficients. Ecrit une matrice variance-covariance des estimations

des paramtres du modle dans un nouvel ensemble de donnes de la session en cours ou dans un fichier de donnes externe au format SPSS. Dautre part, pour chaque variable dpendante, il y aura une ligne destimations, une ligne de valeurs de signification pour les statistiques t correspondant aux estimations et une ligne de degrs de libert rsiduels. Pour un modle multivari, il y a les mmes lignes pour chaque variable dpendante. Vous pouvez utiliser ce fichier de matrice dans les autres procdures qui lisent un fichier de matrice SPSS.

Options GLM
Figure 23-9 Bote de dialogue GLM- Univari : Options

450 Chapitre 23

Des statistiques facultatives sont disponibles partir de cette bote de dialogue. Ces statistiques sont calcules laide de modle effets fixes.
Moyenne marginale estime. Slectionnez les facteurs et les interactions pour lesquels

vous souhaitez obtenir des estimations de la moyenne marginale de la population dans les cellules. Ces moyennes sont ajustes pour les covariables, si elles existent.
Comparer les effets principaux. Propose des comparaisons par paire non corriges

des moyennes marginales estimes pour tout effet principal dans le modle, la fois pour les facteurs inter-sujets et intra-sujets. Ceci nest valable que si les effets principaux sont slectionns dans la liste Afficher les moyennes.
Ajustement intervalle de confiance. Slectionnez lajustement aux intervalles et

la significativit des intervalles en adoptant lune des mthodes suivantes : la diffrence de moindre signification (LSD), lajustement Bonferroni ou lajustement de Sidak. Cet lment est disponible uniquement si Comparer les effets principaux est slectionn.
Afficher.Slectionnez Statistiques descriptives pour produire des moyennes, des carts-types et des effectifs pour toutes les variables dpendantes de toutes les cellules. Loption Estimation deffet de taille fournit une valeur partielle de Eta carr pour chaque effet et chaque estimation. La statistique dEta carr dcrit la proportion de la variabilit totale imputable au facteur. Slectionnez Puissance observe pour obtenir la puissance du test lorsque lautre hypothse est dfinie sur la base de la valeur observe. Slectionnez Estimation des paramtres pour produire des estimations de paramtres, des erreurs standard, des tests t, des intervalles de confiance et la puissance observe de chaque test. Slectionnez Matrice des coefficients de contraste pour obtenir la matrice L. Loption des tests dhomognit produit le test de Levene dhomognit de la variance pour chaque variable dpendante sur toutes les combinaisons de niveaux des facteurs inter-sujets, uniquement pour les facteurs inter-sujets. Les options des diagrammes de dispersion par niveau et de rsidus sont utiles pour vrifier les hypothses sur les donnes. Ceci nest pas valable sil ny a pas de facteurs. Slectionnez Diagrammes rsiduels pour produire un diagramme rsiduel observ/estim/standardis pour chaque variable dpendante. Ces diagrammes sont utiles pour vrifier lhypothse de variance gale. Slectionnez Manque dajustement pour vrifier si la relation entre la variable dpendante et les variables indpendantes peut tre convenablement dcrite par le modle. Fonction gnrale estime vous permet de construire des tests dhypothses personnaliss bass sur la fonction

451 Analyse GLM Univari

gnrale estime. Les lignes de nimporte quelle matrice des coefficients de contraste sont des combinaisons linaires de la fonction gnrale estime.
Niveau de signification. Vous souhaitez peut-tre ajuster le niveau de signification utilis dans les tests post hoc et le niveau de confiance utilis pour construire des intervalles de confiance. La valeur spcifie est galement utilise pour calculer lintensit observe pour le test. Lorsque vous spcifiez un niveau de signification, le niveau associ des intervalles de confiance est affich dans la bote de dialogue.

Fonctionnalits supplmentaires de la commande UNIANOVA


Le langage de commande SPSS vous permet aussi de : Spcifier les effets en cascade dans un modle ( laide de la sous-commande DESIGN). Spcifier les tests deffets par rapport une combinaison linaire deffets ou une valeur ( laide de la sous-commande TEST). Spcifier de multiples contrastes ( laide de la sous-commande CONTRAST). Inclure les valeurs manquantes pour lutilisateur ( laide de la sous-commande MISSING). Spcifier les critres EPS ( laide de la sous-commande CRITERIA). Construisez une matrice L personnalise, une matrice M ou une matrice K ( laide des sous-commandes LMATRIX, MMATRIX et KMATRIX). Pour les contrastes simples ou dcart, spcifier une modalit de rfrence intermdiaire ( laide de la sous-commande CONTRAST). Spcifier les mesures pour les contrastes polynomiaux ( laide de la sous-commande CONTRAST). Spcifier des termes derreur pour les comparaisons post hoc ( laide de la sous-commande POSTHOC). Calculer les moyennes marginales estimes pour chaque facteur ou interaction de facteurs parmi les facteurs de la liste ( laide de la sous-commande EMMEANS). Attribuer des noms aux variables temporaires ( laide de la sous-commande SAVE). Construire un fichier de matrice de corrlation ( laide de la sous-commande OUTFILE).

452 Chapitre 23

Construire un fichier de type matrice de donnes qui contient les statistiques provenant de la table ANOVA inter-sujets ( laide de la sous-commande OUTFILE). Enregistrer la matrice du plan dans un nouveau fichier de donnes ( laide de la sous-commande OUTFILE). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Corrlations bivaries

24

Chapitre

La procdure de corrlations bivaries calcule le coefficient de corrlation de Pearson, le rho de Spearman et le tau-b de Kendall avec leurs seuils de signification. Les corrlations mesurent comment les variables ou les ordres de rang sont lis. Avant de calculer un coefficient de corrlation, parcourez vos donnes pour rechercher les valeurs loignes (qui peuvent provoquer des rsultats errons) et les traces dune relation linaire. Le coefficient de corrlation de Pearson est une mesure dassociation linaire. Deux variables peuvent tre parfaitement lies, mais si la relation nest pas linaire, le coefficient de corrlation de Pearson nest pas une statistique approprie pour mesurer leur association.
Exemple. Le nombre de matchs de basket-ball remports par une quipe est-il li au nombre moyen de points marqus par match ? Un diagramme de dispersion indique quil existe une relation linaire. Lanalyse des donnes de la saison NBA 19941995 dmontre que le coefficient de corrlation de Pearson (0,581) est significatif au niveau 0,01. On peut penser que plus on a gagn de matchs dans une saison, moins ladversaire a marqu de points. Ces variables sont lies ngativement (0,401) et la corrlation est significative au niveau 0,05. Statistiques. Pour chaque variable, on a les lments suivants : nombre dobservations

avec des valeurs non manquantes, moyenne, et cart-type. Pour chaque paire de variables, on a les lments suivants : coefficient de corrlation de Pearson, rho de Spearman, tau-b de Kendall, produits des carts et covariance.
Donnes. Utilisez des variables quantitatives symtriques pour le coefficient de

corrlation de Pearson, et des variables quantitatives ou des variables avec des modalits ordonnes pour le rho de Spearman et le tau-b de Kendall.
Hypothses. Le coefficient de corrlation de Pearson part du principe que chaque

paire de variables est gaussienne bivarie.

453

454 Chapitre 24 Figure 24-1 Rsultats des corrlations bivaries


Corrlations Correlations Nombre de matchs gagns Corrlation de Pearson Nombre de matchs gagns Points marqus par match Points en dfense par match Signification (bilatrale) Nombre de matchs gagns Points marqus par match Points en dfense par match N Nombre de matchs gagns Points marqus par match Points en dfense par match **. Corrlation 0.01(bilatrale) : *. Corrlation 0.05(bilatrale) : 1.000 Points marqus par match .581** Points en dfense par match -.401*

.581**

1.000

.457*

-.401*

.457*

1.000

.001

.038

.001

.017

.038

.017

27

27

27

27

27

27

27

27

27

Pour obtenir des corrlations bivaries

A partir des menus, slectionnez :


Analyse Corrlation Bivarie

455 Corrlations bivaries Figure 24-2 Bote de dialogue Corrlations bivaries

E Slectionnez plusieurs variables numriques.

Les options suivantes sont galement disponibles :


Coefficients de corrlation. Pour des variables quantitatives, normalement

distribues, choisissez le coefficient de corrlation de Pearson. Si vos donnes ne sont pas distribues normalement ou si elles comportent des modalits ordonnes, choisissez le Tau-b de Kendall ou la corrlation de Spearman, qui mesure lassociation entre les ordres de rangs. Les coefficients de corrlation vont de la valeur 1 (relation ngative parfaite) +1 (relation positive parfaite). La valeur 0 indique labsence de relation linaire. Lors de linterprtation de vos rsultats, vous ne pouvez pas, partir de lexistence dune corrlation significative, conclure en lexistence dune relation de cause effet.
Test de signification. Vous pouvez choisir des probabilits bilatrales ou

unilatrales. Si la direction de lassociation est connue lavance, choisissez Unilatral. Sinon, slectionnez Bilatral.
Reprer les corrlations significatives. Les coefficients de corrlation significatifs

au niveau 0,05 sont identifis par un seul astrisque et ceux qui sont significatifs au niveau 0,01 sont identifis par deux astrisques.

456 Chapitre 24

Options de corrlations bivaries


Figure 24-3 Bote de dialogue Corrlations bivaries : Options

Statistiques. Pour les corrlations de Pearson, vous pouvez choisir lune des options

suivantes (ou les deux) :


Moyennes et carts-types.Affichs pour chaque variable. Le nombre

dobservations avec valeurs non manquantes est galement affich. Les valeurs manquantes sont examines variable par variable quel que soit votre rglage des valeurs manquantes.
Produits des carts et covariances. Indiqus pour chaque paire de variables. Le

produit des carts est gal la somme des produits des variables moyennes corriges. Ceci est le numrateur du coefficient de corrlation de Pearson. La covariance est une mesure non standardise de la relation entre deux variables, gale au produit des carts divis par N1.
Valeurs manquantes. Vous pouvez choisir lun des lments suivants : Exclure seulement les composantes non valides. Les observations avec des valeurs

manquantes pour lune ou les deux variables dune paire pour un coefficient de corrlation sont exclues de lanalyse. Etant donn que chaque coefficient est bas sur toutes les observations ayant des codes valides pour cette paire particulire de variables, la quantit maximale dinformations disponibles est utilise dans chaque calcul. Ceci peut aboutir un jeu de coefficients bas sur un nombre variable dobservations.
Exclure toute observation incomplte. Les observations avec des valeurs

manquantes pour une variable sont exclues de toutes les analyses.

457 Corrlations bivaries

Proprits supplmentaires des commandes CORRELATIONS et NONPAR CORR


Le langage de commande SPSS vous permet aussi de : Ecrire une f pour les corrlations de Pearson qui peut tre utilise la place de donnes brutes pour obtenir dautres analyses comme une analyse factorielle (avec la sous-commande MATRIX). Obtenir des corrlations de chaque variable dans une liste avec chaque variable dune seconde liste (en utilisant le mot cl WITH avec la sous-commande VARIABLES). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Corrlations partielles

25

Chapitre

La procdure des corrlations partielles calcule les coefficients de corrlation partielle qui dcrivent le rapport linaire entre deux variables tout en contrlant les effets dune ou plusieurs autres variables. Les corrlations sont des mesures dassociation linaire. Deux variables peuvent tre parfaitement lies mais, si leur rapport nest pas linaire, un coefficient de corrlation nest pas une statistique adapte pour mesurer leur association.
Exemple. Existe-t-il une relation entre le financement associ aux soins de sant et les taux dattaque ? Contre toute attente, une tude fait tat dune corrlation positive : Lorsque le financement associ aux soins de sant augmente, les taux dattaque augmentent. Cependant, le contrle du taux de visite aux fournisseurs de soins de sant supprime presque la corrlation positive observe. Le financement li aux soins de sant et les taux dattaque sont associs de manire positive car le nombre de personnes ayant accs aux soins de sant augmente en mme temps que le financement. De ce fait, le nombre de maladies dclares par les docteurs et les hpitaux augmente galement Statistiques. Pour chaque variable, on a les lments suivants : nombre dobservations

avec des valeurs non manquantes, moyenne, et cart-type. Matrices de corrlation partielle et simple, avec degrs de libert et seuils de signification.
Donnes. Utiliser des variables quantitatives et symtriques. Hypothses. La procdure des Corrlations Partielles suppose que chaque paire de variables prsente une corrlation normale.

459

460 Chapitre 25 Figure 25-1 Rsultats de Corrlations Partielles

Obtenir des corrlations partielles


E A partir des menus, slectionnez : Analyse Corrlation Partielle

461 Corrlations partielles Figure 25-2 Bote de dialogue Corrlations partielles

E Slectionnez au moins deux variables numriques pour lesquelles vous voulez

calculer des corrlations partielles.


E Slectionnez une ou plusieurs variables numriques de contrle.

Les options suivantes sont galement disponibles :


Test de signification. Vous pouvez choisir des probabilits bilatrales ou

unilatrales. Si la direction de lassociation est connue lavance, choisissez Unilatral. Sinon, slectionnez Bilatral.
Afficher le seuil exact de signification. La probabilit et les degrs de libert sont

affichs par dfaut pour chaque coefficient de corrlation. Si vous dslectionnez cette option, les coefficients significatifs au seuil 0,05 sont identifis par une astrisque, les coefficients significatifs au seuil de 0,01 par deux astrisques, et les degrs de libert sont supprims. Cette configuration affecte aussi bien les matrices de corrlation partielle que simple.

462 Chapitre 25

Options Corrlations partielles


Figure 25-3 Bote de dialogue Corrlations partielles : Options

Statistiques. Vous avez le choix entre les deux options suivantes : Moyennes et carts-types. Affichs pour chaque variable. Le nombre

dobservations avec valeurs non manquantes est galement affich.


Corrlations simples. Une matrice de corrlations simples entre toutes les

variables, y compris les variables de contrle, saffiche.


Valeurs manquantes. Vous avez le choix entre les options suivantes : Exclure toute observation incomplte. Les observations ayant des valeurs

manquantes pour une variable quelconque, y compris une variable de contrle, sont exclues de tous les calculs.
Exclure seulement les composantes non valides. Pour le calcul des corrlations

simples sur lesquelles se basent les corrlations partielles, une observation ayant des valeurs manquantes pour une composante ou les deux composantes dune paire de variables ne sera pas utilise. La suppression des composantes non valides seulement utilise autant de donnes que possible. Le nombre dobservations peut toutefois diffrer selon les coefficients. Lorsque la suppression des composantes non valides seulement est slectionne, les degrs de libert dun coefficient partiel donn sont bass sur le plus petit nombre dobservations utilises dans le calcul de lune quelconque des corrlations dordre zro.

463 Corrlations partielles

Fonctionnalits supplmentaires de la commande PARTIAL CORR


Le langage de commande SPSS vous permet aussi de : Lire une matrice de corrlation dordre zro ou crire une matrice de corrlation dordre zro (avec la sous-commande MATRIX). Obtenir des corrlations partielles entre deux listes de variables (en utilisant le mot-cl WITH dans la sous-commande VARIABLES). Obtenir des analyses multiples (avec les sous-commandes VARIABLES). Spcifier les valeurs des ordres demander (par exemple, la fois les corrlations partielles de premier et de second ordre) lorsque vous avez deux variables de contrle (avec la sous-commande VARIABLES). Supprimer les coefficients redondants (avec la sous-commande FORMAT). Afficher une matrice de corrlations simples lorsque certains coefficients ne peuvent pas tre calculs (avec la sous-commande STATISTICS). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Distances

26

Chapitre

Cette procdure permet de calculer de trs nombreuses statistiques mesurant les similitudes ou les diffrences (distances) entre des paires de variables ou dobservations. Vous pourrez ensuite utiliser ces mesures de similarit ou de dissimilarit avec dautres procdures, comme lanalyse factorielle, la classification ou le positionnement multidimensionnel, afin de simplifier lanalyse des ensembles de donnes complexes.
Exemple. Est-il possible de mesurer les similarits entre des paires de voitures

en fonction de certaines caractristiques, comme le nombre de cylindres, la consommation et la puissance ? En calculant les similarits existant entre des voitures, vous pouvez dterminer les voitures qui sont semblables et celles qui sont diffrentes. Dans loptique dune analyse plus formelle, vous pouvez appliquer une classification hirarchique ou un positionnement multidimensionnel aux similarits afin dexaminer la structure sous-jacente.
Statistiques. Pour les donnes dintervalle, les mesures de dissimilarit sont la distance

Euclidienne, le carr de la distance Euclidienne, la distance de Tchebycheff, la distance de Manhattan (bloc), la distance de Minkowski ou une mesure personnalise. Pour les donnes deffectif, les mesures sont Chi-deux et phi-deux. Pour les donnes binaires, les mesures de dissimilarit sont la distance Euclidienne, le carr de la distance Euclidienne, lcart de taille, la diffrence de motif, la variance, la forme, ou la mesure de Lance et Williams. Pour les donnes dintervalles, les mesures de similarit sont la corrlation de Pearson ou cosinus. Pour les donnes binaires, il sagit des mesures suivantes : Russel et Rao, indice de Sokal et Michener, Jaccard, Dice, Rogers et Tanimoto, Sokal et Sneath 1, Sokal et Sneath 2, Sokal et Sneath 3, Kulczynski 1, Kulczynski 2, Sokal et Sneath 4, Hamann, lambda, D dAnderberg, Y de Yule, Q de Yule, Ochiai, Sokal et Sneath 5, corrlation phi ttrachorique ou dispersion.

465

466 Chapitre 26

Pour obtenir des matrices de distance


E A partir des menus, slectionnez : Analyse Corrlation Indices Figure 26-1 Bote de dialogue Distances

E Slectionnez au minimum une ou deux variables numriques pour calculer

respectivement les distances existant entre des observations ou des variables.


E Slectionnez une possibilit dans le groupe Calculer les distances pour calculer les

proximits existant entre des observations ou des variables.

467 Distances

Distances : Mesures de dissimilarit


Figure 26-2 Bote de dialogue Indices : Mesures de dissimilarit

Dans le groupe Mesure, slectionnez la possibilit qui correspond au type de vos donnes (intervalle, effectif ou binaire). Ensuite, dans la liste droulante, slectionnez lune des mesures correspondant ce type de donnes. Les mesures disponibles sont, par type de donnes :
Intervalle. Distance Euclidienne, Carr de la distance Euclidienne, Distance de

Tchebycheff, Distance de Manhattan, Distance de Minkowski ou Autre.


Effectifs. Distance du Chi-deux ou Distance du phi-deux. Binaire. Distance Euclidienne, Carr de la distance Euclidienne, Ecart de taille,

Diffrence de motif, Variance, Forme, ou Lance et Williams. (Entrez des valeurs dans les champs Prsent et Absent pour indiquer les deux valeurs significatives. Aucune autre valeur ne sera prise en compte dans Distances.) Le groupe Transformer les valeurs vous permet de standardiser les valeurs des donnes pour les observations ou les variables avant le calcul des proximits. Ces transformations ne sappliquent pas aux donnes binaires. Les mthodes de standardisation disponibles sont Centrer-rduire, Entre 1 et 1, Entre 0 et 1, Maximum = 1, Moyenne = 1 et Ecart type = 1.

468 Chapitre 26

Le groupe Transformer les mesures vous permet de transformer les valeurs gnres par la mesure de distance. Elles sont appliques aprs le calcul de la mesure de distance. Les options possibles sont Valeurs absolues, Inverser le signe, et Rchelonner entre 0 et 1.

Indices : Mesures de similarit


Figure 26-3 Bote de dialogue Indices : Mesures de similarit

Dans le groupe Mesure, slectionnez la possibilit qui correspond au type de vos donnes (intervalle ou binaire). Ensuite, dans la liste droulante, slectionnez lune des mesures correspondant ce type de donnes. Les mesures disponibles sont, par type de donnes :
Intervalle. Corrlation de Pearson ou Cosinus. Binaire. Russel et Rao, Indice de Sokal et Michener, Jaccard, Dice, Rogers et

Tanimoto, Sokal et Sneath 1, Sokal et Sneath 2, Sokal et Sneath 3, Kulczynski 1, Kulczynski 2, Sokal et Sneath 4, Hamann, Lambda, D dAnderberg, Y de Yule, Q de Yule, Ochiai, Sokal et Sneath 5, Corrlation phi ttrachorique ou Dispersion. (Entrez des valeurs dans les champs Prsent et Absent pour indiquer les deux valeurs significatives. Aucune autre valeur ne sera prise en compte dans Distances.)

469 Distances

Le groupe Transformer les valeurs vous permet de standardiser les valeurs des donnes pour les observations ou les variables avant le calcul des proximits. Ces transformations ne sappliquent pas aux donnes binaires. Les mthodes de standardisation disponibles sont Centrer-rduire, Entre 1 et 1, Entre 0 et 1, Maximum = 1, Moyenne = 1 ou Ecart type = 1. Le groupe Transformer les mesures vous permet de transformer les valeurs gnres par la mesure de distance. Elles sont appliques aprs le calcul de la mesure de distance. Les options possibles sont Valeurs absolues, Inverser le signe, et Rchelonner entre 0 et 1.

Fonctionnalits supplmentaires de la commande PROXIMITIES


La procdure Distances utilise la syntaxe de la commande PROXIMITIES. Le langage de commande SPSS vous permet aussi de : Indiquez un nombre entier comme la puissance pour la mesure de distance de Minkowski. Indiquez des nombres entiers comme la puissance et la racine pour une mesure de distance personnalise. Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Rgression linaire

27

Chapitre

La rgression linaire estime les coefficients de lquation linaire, impliquant une ou plusieurs variables indpendantes, qui estiment le mieux la valeur de la variable dpendante. Par exemple, vous pouvez essayer destimer les ventes annuelles globales dun commercial (la variable dpendante) partir de variables indpendantes telles que lge, lducation et les annes dexprience.
Exemple. Le nombre de matches gagns par une quipe de basket-ball au cours dune

saison est-il li au nombre moyen de points marqus par lquipe chaque match ? Un diagramme de dispersion indique que ces variables ont un lien linaire. Le nombre de matches gagns et le nombre moyen de points marqu par lquipe adverse ont galement un lien linaire. Ces variables ont une relation ngative. Lorsque le nombre de matches gagns augmente, le nombre moyen de points marqus par les adversaires diminue. A laide de la rgression linaire, vous pouvez modliser la relation entre ces variables. Un bon modle peut tre utilis pour prvoir combien de matches les quipes vont gagner.
Statistiques. Pour chaque variable, on a les lments suivants : nombre dobservations

valides, moyenne et cart-type. Pour chaque modle : coefficients de rgression, matrice de corrlations, mesures et corrlations partielles, R multiple, R2, R2 ajust, variation de R2, erreur standard de lestimation, tableau danalyse de la variance, prvisions et rsidus. En plus, intervalles de confiance 95 % pour chaque coefficient de rgression, matrice variances-covariances, facteur dinflation de la variance, tolrance, test de Durbin-Watson, mesures de distances (Mahalanobis, Cook, et valeurs influentes), DfBta, diffrence de prvision, intervalles destimation et diagnostics des observations. Diagrammes : dispersion, diagrammes partiels, histogrammes et diagrammes de rpartition gaussiens.

471

472 Chapitre 27

Donnes. Les variables dpendantes et indpendantes doivent tre quantitatives. Les variables qualitatives, comme la religion, la qualification, la zone de rsidence, doivent tre enregistres sous forme de variables binaires (muettes) ou sous de tout autre type de variables de contraste. Hypothses. Pour chaque valeur de la variable indpendante, la distribution de la

variable dpendante doit tre normale. La variance de la distribution de la variable dpendante doit tre constante pour toutes les valeurs de la variable indpendante. La relation entre la variable dpendante et chaque variable indpendante doit tre linaire et toutes les observations doivent tre indpendantes.
Figure 27-1 Rsultat de rgression linaire

473 Rgression linaire

Rsum de modle

3,4

Variables Entres Modle 1 Points en dfense par match, points marqus par 1,2 match Supprimes R R carr

Erreur std. R carr ajust de l'estimation

.947

.898

.889

4.40

1. Variables indp. : (constante) points en dfense par match, points marqus par match 2. Toutes les variables requises entres. 3. Variable dpendante : nombre de matchs gagns 4. Mthode : introduction simultane

ANOVA 2 Somme des carrs Modle 1 Rgression Rsidus Total 4080.533 465.467 4546.000

df 2 24 26

Carr moyen 2040.266 19.394

F 105.198

Significatif .0001

1. Variables indp. : (constante) points en dfense par match, points marqus par match 2. Variable dpendante : nombre de matchs gagns

474 Chapitre 27

Coefficients non standardiss Modle (constante) Points marqus par match Points en dfense par match Erreur std.

Coefficients standardiss Bta

Variable dpendante : nombre de matchs gagns

Obtenir une analyse de rgression linaire


E A partir des menus, slectionnez : Analyse Rgression Linaire

475 Rgression linaire Figure 27-2 Bote de dialogue Rgression linaire

E Dans la bote de dialogue Rgression linaire, slectionnez une variable numrique

dpendante.
E Slectionnez une ou plusieurs variables indpendantes.

Sinon, vous pouvez : Grouper des variables indpendantes en blocs et spcifier diffrentes mthodes dentre pour diffrents sous-groupes de variables. Choisir une variable de slection pour limiter lanalyse un sous-groupe dobservations ayant une ou des valeurs particulires pour cette variable. Slectionner une variable didentification dobservations pour identifier des points sur les diagrammes. Slectionnez une variable de pondration WLS numrique pour une analyse des moindres carrs pondrs.

476 Chapitre 27

WLS. Permet d'obtenir un modle des moindres carrs pondr. Les points de donnes sont pondrs par l'inverse de leur variance. Ainsi, les observations dont la variance est leve ont moins d'impact sur l'analyse que celles dont la variance est faible. Si la valeur de la variable de pondration est nulle, ngative ou manquante, l'observation est exclue de l'analyse.

Mthodes de slection des variables de rgression linaire


La slection dune mthode vous permet de spcifier la manire dont les variables indpendantes sont entres dans lanalyse. En utilisant diffrentes mthodes, vous pouvez construire divers modles de rgression partir du mme groupe de variables.
Introduire (rgression). Procdure de slection de variables au cours de laquelle

toutes les variables d'un bloc sont introduites en une seule opration.
Pas pas. A chaque tape, le programme saisit la variable indpendante exclue

de l'quation ayant la plus petite probabilit de F, si cette probabilit est suffisamment faible. Les variables dj comprises dans l'quation de rgression sont limines si leur probabilit de F devient trop grande. Le processus s'arrte lorsqu'aucune variable ne peut plus tre introduite ou limine.
Eliminer bloc. Procdure de slection de variables dans laquelle toutes les

variables d'un bloc sont supprimes en une seule tape.


Elimination descendante. Procdure de slection de variables au cours de laquelle

toutes les variables sont entres dans l'quation, puis limines une une. La variable ayant la plus petite corrlation partielle avec la variable dpendante est la variable dont l'limination est tudie en premier. Si elle rpond aux critres d'limination, elle est supprime. Une fois la premire variable limine, l'limination de la variable suivante restant dans l'quation et ayant le plus petit coefficient de corrlation partielle est tudie. La procdure prend fin quand plus aucune variable de l'quation ne satisfait aux critres d'limination.
Introduction ascendante. Procdure de slection pas pas de variables, dans

laquelle les variables sont introduites squentiellement dans le modle. La premire variable considre est celle qui a la plus forte corrlation positive ou ngative avec la variable dpendante. Cette variable n'est introduite dans l'quation que si elle satisfait le critre d'introduction. Si la premire variable est introduite dans l'quation, la variable indpendante externe l'quation et qui prsente la plus forte corrlation partielle est considre ensuite. La

477 Rgression linaire

procdure s'interrompt lorsqu'il ne reste plus de variables satisfaisant au critre d'introduction. Les valeurs de significativit dans vos rsultats sont bases sur ladquation un modle unique. Par consquent, les valeurs de significativit ne sont gnralement pas valables lorsquon utilise une mthode progressive (Pas pas, Ascendante ou Descendante). Toutes les variables doivent respecter le critre de tolrance pour tre entres dans lquation, quelle que soit la mthode dentre spcifie. Le niveau de tolrance par dfaut est 0,0001. Une variable nest pas entre si elle fait passer la tolrance dune autre variable dj entre dans le modle en dessous du seuil de tolrance. Toutes les variables indpendantes slectionnes sont ajoutes dans un seul modle de rgression. Cependant, vous pouvez spcifier diffrentes mthodes dentre pour les sous-groupes de variables. Par exemple, vous pouvez entrer un bloc de variables dans le modle de rgression en utilisant la slection pas pas, et un second bloc en utilisant la slection ascendante. Pour ajouter un second bloc de variables au modle de rgression, cliquez sur Suivant.

Rgression linaire : Dfinir la rgle


Figure 27-3 Bote de dialogue Rgression linaire : Dfinir loi

Les observations dfinies par la rgle de slection sont incluses dans lanalyse. Par exemple, si vous slectionnez une variable, choisissez gale et saisissez 5 pour la valeur, alors seules les observations pour lesquelles la variable slectionne a une valeur gale 5 seront incluses dans lanalyse. Une valeur chane est galement permise.

478 Chapitre 27

Diagrammes de rgression linaire


Figure 27-4 Bote de dialogue Rgression linaire : Graphiques (diagrammes)

Les diagrammes peuvent aider valider les hypothses de normalit, linarit et dgalit des variances. Les diagrammes sont galement utiles pour dtecter les valeurs loignes, les observations loignes et les observations influentes. Aprs avoir t enregistrs comme variables nouvelles, les prvisions, rsidus et autres diagnostics sont disponibles dans lditeur de donnes pour construire des diagrammes avec les variables indpendantes. Les diagrammes suivants sont disponibles :
Diagrammes de dispersion. Vous pouvez afficher deux des lments suivants : la

variable dpendante, les prvisions standardises, les rsidus standardiss, les rsidus supprims, les prvisions ajustes, les rsidus standardiss et les rsidus supprims de Student. Affichez les rsidus standardiss par rapport aux prvisions standardises pour vrifier la linarit et lgalit des variances.
Liste des variables sources. Rpertorie la variable dpendante (DEPENDNT), ainsi

que les variables prvues et les rsidus suivants : prvisions standardises (*ZPRED), rsidus standardiss (*ZRESID), rsidus supprims (*DRESID), prvisions ajustes (*ADJPRED), rsidus de Student (*SRESID), rsidus supprims de Student (*SDRESID).
Gnrer tous les graphiques partiels. Affiche des diagrammes de dispersion des rsidus

de chaque variable indpendante et les rsidus de la variable dpendante lorsque les deux variables sont rgresses sparment par rapport au reste des variables

479 Rgression linaire

indpendantes. Au moins deux variables indpendantes doivent tre dans lquation pour produire un diagramme partiel.
Diagrammes des rsidus standardiss. Vous pouvez obtenir des histogrammes des rsidus standardiss et des diagrammes de rpartition gaussiens en comparant la rpartition des rsidus standardiss une rpartition gaussienne.

Si vous demandez des diagrammes, des statistiques rcapitulatives sont affiches pour les prvisions standardises et les rsidus standardiss (*ZPRED et *ZRESID).

Rgression linaire : Enregistrer de nouvelles variables


Figure 27-5 Bote de dialogue Rgression linaire : Enregistrer les nouvelles variables

480 Chapitre 27

Vous pouvez enregistrer les prvisions, les rsidus et autres statistiques utiles pour les diagnostics. Chaque slection ajoute une ou plusieurs variables votre fichier de donnes actif.
Prvisions. Valeurs prvues par le modle de rgression pour chaque observation. Non standardiss. Valeur prvue par le modle pour la variable dpendante. Standardiss. Transformation de chaque prvision en sa forme standardise. La

prvision moyenne est soustraite de la prvision, et la diffrence est divise par l'cart-type des prvisions. Les prvisions standardises ont une moyenne de 0 et un cart-type de 1.
Ajustes. Prvision pour une observation exclue du calcul des coefficients de

rgression.
Erreur standard prvision moyenne. Erreurs standard des prvisions. Estimation de

l'cart-type de la valeur moyenne de la variable dpendante, pour les observations ayant la mme valeur pour les variables indpendantes.
Distances. Mesures permettant didentifier les observations avec des combinaisons inhabituelles de valeurs pour les variables indpendantes et les observations qui peuvent avoir un impact important sur le modle. Mahalanobis. Mesure de la distance entre les valeurs d'une observation et la

moyenne de toutes les observations sur les variables indpendantes. Une distance de Mahalanobis importante identifie une observation qui a des valeurs extrmes pour des variables indpendantes.
Cook. Mesure permettant de savoir de combien les rsidus de toutes les

observations seraient modifis si une observation donne tait exclue du calcul des coefficients de rgression. Si la distance de Cook est leve, l'exclusion d'une observation changerait substantiellement la valeur des coefficients.
Valeurs influentes. Mesures de l'influence d'un point sur l'ajustement de la

rgression. La valeur influente centre varie de 0 (aucune influence sur la qualit de l'ajustement) (N-1)/N.
Intervalles de la prvision. Les limites suprieure et infrieure pour les intervalles de la prvision moyenne et individuelle. Moyenne. Limites infrieure et suprieure (deux variables) de l'intervalle de

prvision de la rponse moyenne prvue.

481 Rgression linaire

Individuelle. Limites infrieure et suprieure (deux variables) de l'intervalle de

prvision de la variable dpendante pour une observation particulire.


Intervalle de confiance. Entrez une valeur comprise entre 1 et 99,99 pour spcifier

le seuil de confiance pour les deux intervalles de la prvision. Vous devez slectionner Moyenne ou Individuelle avant d'entrer cette valeur. Les seuils d'intervalle de confiance typiques sont 90, 95 et 99.
Rsidus. La valeur relle de la variable indpendante moins la valeur prvue par lquation de rgression. Non standardiss. Diffrence entre la valeur observe et la valeur prvue par le

modle.
Standardiss. Rsidu divis par une estimation de son cart-type. Egalement

appels rsidus de Pearson, les rsidus standardiss ont une moyenne de 0 et un cart-type de 1.
Studentiss. Rsidu, divis par une estimation de son cart-type, qui varie d'une

observation une autre, selon la distance entre les valeurs et la moyenne des variables indpendantes pour chaque observation.
Supprimes. Rsidu d'une observation lorsque celle-ci est exclue du calcul des

coefficients de rgression. Il s'agit de la diffrence entre la valeur de la variable dpendante et la prvision ajuste.
Supprims studentiss. Rsidu supprim d'une observation, divis par son erreur

standard. La diffrence entre le rsidu supprim de Student et le rsidu de Student associ indique l'impact de l'limination d'une observation sur sa propre prdiction.
Influences individuelles. La modification des coefficients de rgression (DfBta(s)) et des prvisions (diffrence de prvision) qui rsulte de lexclusion dune observation particulire. Les valeurs DfBtas et de diffrence de prvision standardises sont galement disponibles ainsi que le rapport de covariance. DfBta(s). La diffrence de bta correspond au changement des coefficients de

rgression qui rsulte du retrait d'une observation particulire. Une valeur est calcule pour chaque terme du modle, y compris la constante.
DfBta(s) standardise. Diffrence standardise de la valeur bta. Modification

du coefficient de rgression, rsultant de l'exclusion d'une observation donne. Vous pouvez par exemple examiner les observations ayant des valeurs absolues suprieures 2, divises par la racine carre de N, N reprsentant le nombre

482 Chapitre 27

d'observations. Une valeur est calcule pour chaque terme du modle, y compris la constante.
Diffrence de prvision. La diffrence de prvision est le changement de la

prvision rsultant de l'exclusion d'une observation donne.


Dfprvision standardise. Diffrence standardise de la valeur ajuste.

Modification de la prvision qui rsulte de l'exclusion d'une observation donne. Vous pouvez par exemple examiner les valeurs standardises dont la valeur absolue est suprieure 2 fois la racine carre de p/N, p correspondant au nombre de paramtres du modle et N, au nombre d'observations.
Rapport de covariance. Rapport entre le dterminant de la matrice de

variance-covariance si une observation donne a t exclue du calcul des coefficients de rgression et le dterminant de la matrice de covariance avec toutes les observations incluses. Si le rapport est proche de 1, l'observation modifie peu la matrice de covariance.
Statistiques coefficients. Enregistre les coefficients de rgression dans un ensemble

de donnes ou dans un fichier de donnes. Les ensembles de donnes sont disponibles pour utilisation ultrieure dans la mme session mais ne sont pas enregistrs en tant que fichiers sauf si vous le faites explicitement avant la fin de la session. Les noms des ensembles de donnes doivent tre conformes aux rgles de dnomination de variables SPSS. Pour plus d'informations, reportez-vous Noms de variable dans Chapitre 5 p. 99.
Exporter les informations du modle dans un fichier XML. Les estimations de paramtres

et leurs covariances (facultatif) sont exportes vers le fichier spcifi au format XML (PMML). SmartScore et le serveur SPSS (produit spar) peuvent utiliser ce fichier de modle pour appliquer les informations du modle dautres fichiers de donnes des fins danalyse.

483 Rgression linaire

Statistiques de rgression linaire


Figure 27-6 Bote de dialogue Rgression linaire : Statistiques

Les statistiques suivantes sont disponibles :


Coefficients de rgression. Loption Estimations affiche le coefficient de rgression B, lerreur standard de B, le coefficient bta standardis, la valeur t de B et le niveau de signification bilatral de t. Loption Intervalles de confiance affiche les intervalles de confiance 95 % pour chaque coefficient de rgression ou une matrice de covariance. Loption Matrice de covariance affiche la matrice de variance-covariance des coefficients de rgression avec les covariances hors de la diagonale et les variances dans la diagonale. Une matrice de corrlation est galement affiche. Qualit de lajustement. Les variables entres et supprimes du modle sont listes et

les statistiques de la qualit de lajustement suivantes sont affiches : R multiple, R2 et R2 ajust, erreur standard de lestimation et un tableau danalyse de variance.
Variation de R-deux. Variation de la statistique du R2 obtenue en ajoutant ou en

enlevant une variable indpendante. Si la variation du R2 associe une variable est importante, cela signifie que la variable est une bonne explication de la variable dpendante.

484 Chapitre 27

Descriptives. Fournit le nombre dobservations valides, la moyenne et lcart-type

de chaque variable de lanalyse. Une matrice de corrlations avec le seuil de signification unilatral et le nombre dobservations pour chaque corrlation sont galement affichs.
Corrlation partielle :. Corrlation rsiduelle entre deux variables aprs l'limination

de la corrlation due leur association mutuelle avec les autres variables. Il s'agit de la corrlation entre la variable dpendante et une variable indpendante lorsque les effets linaires des autres variables indpendantes du modle ont t limins des deux variables.
Mesure. Il s'agit de la corrlation entre la variable dpendante et une variable indpendante lorsque les effets linaires des autres variables indpendantes du modle ont t limins de la variable indpendante. Elle est lie la modification du R-deux lorsqu'une variable est ajoute une quation. (Parfois appele corrlation semi-partielle.) Tests de colinarit. La colinarit (ou multicolinarit) est la situation indsirable o une variable indpendante est une fonction linaire dautres variables indpendantes. Les valeurs propres de la matrice des produits croiss dimensionns et non centrs, les indices de conditionnement et les proportions de dcomposition de variance sont affichs ainsi que les facteurs dinflation de la variance (VIF) et les tolrances pour les variables individuelles. Rsidus. Affiche le test de Durbin-Watson de corrlation srielle des rsidus et le diagnostic des observations correspondant au critre de slection (valeurs loignes de n carts-types).

485 Rgression linaire

Rgression linaire : Options


Figure 27-7 Bote de dialogue Rgression linaire : Options

Les options suivantes sont disponibles :


Paramtres des mthodes progressives. Ces options sont valables lorsque la mthode

de slection ascendante, descendante ou progressive a t slectionne. Des variables peuvent tre entres ou supprimes du modle soit en fonction de la signification (probabilit) de la valeur F, soit en fonction de la valeur F elle-mme.
Choisir la probabilit de F. Une variable est entre dans le modle si le seuil de

signification de la valeur F est suprieur la valeur Entre ; la variable est limine si ce seuil est suprieur la valeur Elimination. La valeur Entre doit tre infrieure la valeur Elimination et toutes deux doivent tre positives. Pour introduire davantage de variables dans le modle, diminuez la valeur Entre. Pour liminer davantage de variables du modle, rduisez la valeur Elimination.
Choisir la valeur de F. Une variable est introduite dans un modle si sa valeur F est

suprieure la valeur Entre et elle est limine si la valeur F est infrieure la valeur Elimination. La valeur Entre doit tre suprieure la valeur Elimination et toutes deux doivent tre positives. Pour introduire davantage de variables dans le modle, rduisez la valeur du champ Entre. Pour liminer davantage de variables dans le modle, augmentez la valeur du champ Elimination.

486 Chapitre 27

Inclure terme constant dans lquation. Par dfaut, le modle de rgression inclut un terme constant. Dslectionner cette option force la rgression jusqu lorigine, ce qui est rarement utilis. Certains rsultats de la rgression jusqu lorigine ne sont pas comparables aux rsultats de la rgression incluant une constante. Par exemple, R2 ne peut pas tre interprt de la manire habituelle. Valeurs manquantes. Vous pouvez choisir lun des lments suivants : Exclure toute observation incomplte. Seules les observations dont les valeurs sont

valides pour toutes les variables sont incluses dans les analyses.
Exclure seulement les composantes non valides. Les observations pour lesquelles

les donnes sont compltes pour la paire de variables corrles sont utilises pour calculer le coefficient de corrlation sur lequel lanalyse de rgression est base. Les degrs de libert sont bass sur le minimum N par paire.
Remplacer par la moyenne. Toutes les observations sont utilises pour les calculs,

en substituant la moyenne de la variable aux observations manquantes.

Fonctionnalits supplmentaires de la commande REGRESSION


Le langage de commande SPSS vous permet aussi de : Ecrire une matrice de corrlation ou lire une matrice la place de donnes brutes afin dobtenir une analyse de rgression (avec la sous-commande MATRIX). Spcifier des niveaux de tolrance (avec la sous-commande CRITERIA). Obtenir plusieurs modles pour des variables dpendantes diffrentes ou identiques (avec les sous-commandes METHOD et DEPENDENT). Obtenir des statistiques supplmentaires (avec les sous-commandes DESCRIPTIVES et STATISTICS). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Ajustement de fonctions

28

Chapitre

La procdure dajustement de fonctions produit des statistiques de rgression dajustement de fonctions et les diagrammes relatifs pour 11 modles diffrents de rgression dajustement de fonctions. Un modle diffrent est produit pour chaque variable dpendante. Vous pouvez aussi enregistrer les prvisions, les rsidus et les intervalles de la prvision comme nouvelles variables.
Exemple. Un fournisseur de services Internet suit le pourcentage dans le temps du

trafic de messages lectroniques infects par un virus sur ses rseaux. Un diagramme de dispersion rvle que la relation nest pas linaire. Vous pouvez ajuster un modle quadratique ou cubique en fonction des donnes, vrifier la validit des hypothses et la qualit dajustement du modle.
Statistiques. Pour chaque modle : coefficients de rgression, R multiples, R2, R2

ajust, erreur standard de la prvision, tableau danalyse de la variance, prvisions, rsidus et intervalles de prvision. Modles : linaire, logarithmique, inverse, quadratique, cubique, de puissance, compos, en S, logistique, de croissance et exponentiel.
Donnes.Les variables dpendantes et indpendantes doivent tre quantitatives. Si

vous slectionnez Temps partir de lensemble de donnes actif comme variable indpendante (au lieu de slectionner une variable), la procdure Ajustement de fonctions gnre une variable de temps o la dure entre les observations est uniforme. Si Temps est slectionn, la variable dpendante doit tre une mesure de sries chronologiques. Lanalyse des sries chronologiques ncessite une structure de fichier de donnes dans lequel chaque observation (range) reprsente un ensemble dobservations des moments diffrents et o la dure entre les observations est uniforme.
Hypothses. Vrifiez vos donnes graphiquement pour dterminer comment

sont relies les variables indpendantes et dpendantes (de manire linaire ou exponentielle, etc.). Les rsidus dun bon modle doivent tre rpartis alatoirement
487

488 Chapitre 28

et doivent tre normaux. Si vous utilisez un modle linaire, les hypothses suivantes doivent tre vrifies : pour chaque valeur de la variable indpendante, la distribution de la variable dpendante doit tre normale. La variance de la distribution de la variable dpendante doit tre constante pour toutes les valeurs de la variable indpendante. La relation entre la variable dpendante et la variable indpendante doit tre linaire, et toutes les observations doivent tre indpendantes.
Figure 28-1 Ajustement de fonctions - Tableau rcapitulatif

Figure 28-2 Ajustement de fonctions - Analyse de la variance (ANOVA)

Figure 28-3 Ajustement de fonctions - Coefficients

489 Ajustement de fonctions Figure 28-4 Ajustement de fonctions - Diagramme

Pour obtenir un ajustement de fonctions


E A partir des menus, slectionnez : Analyse Rgression Ajustement de fonctions

490 Chapitre 28 Figure 28-5 Bote de dialogue Ajustement de fonctions

E Slectionnez au moins une variable dpendante. Un modle diffrent est produit

pour chaque variable dpendante.


E Slectionnez une variable indpendante (une variable dans le fichier de travail ou dans lensemble de donnes actif ou Temps). E Eventuellement :

Slectionner une variable pour tiqueter des observations dans les diagrammes de dispersion. Pour chaque point du diagramme de dispersion, utilisez loutil de slection de points pour afficher la valeur de la variable avec Etiquette dobservation. Cliquez sur Enregistrer pour enregistrer les prvisions, les rsidus et les intervalles de prvision comme nouvelles variables. Les options suivantes sont galement disponibles :
Inclure terme constant dans lquation. Evalue un terme constant dans lquation

de rgression. La constante est incluse par dfaut.

491 Ajustement de fonctions

Reprsenter sous forme graphique. Reprsente graphiquement les valeurs de la

variable dpendante et chaque modle slectionn face la variable indpendante. Un diagramme spar est produit pour chaque variable dpendante.
Afficher le tableau ANOVA. Affiche un tableau rcapitulatif de lanalyse de la

variance pour chaque modle slectionn.

Modles dajustement de fonctions


Vous pouvez choisir des modles de rgression dajustement de fonctions. Pour dterminer quel modle utiliser, reprsentez vos donnes sous forme graphique. Si vos variables semblent tre lies linairement, utilisez un modle de rgression linaire simple. Lorsque vos variables ne sont pas lies linairement, essayez de transformer vos donnes. Lorsque la transformation namliore pas les choses, vous devrez peut-tre utiliser un modle plus labor. Observez un diagramme de dispersion de vos donnes. Si le diagramme ressemble une fonction mathmatique que vous reconnaissez, ajustez vos donnes en fonction de ce type de modle. Par exemple, si vos donnes ressemblent une fonction exponentielle, utilisez un modle exponentiel.
Linaire. Modle dont l'quation est Y = b0 + (b1 * t). Les valeurs de la srie sont modlises comme fonction linaire du temps. Logarithmique. Modle dont l'quation est Y = b0 + (b1 * ln(t)). Inverse. Modle dont l'quation est Y = b0 + (b1 / t). Quadratique. Modle dont l'quation est Y = b0 + (b1 * t) + (b2 * t**2). Le modle quadratique peut tre utilis pour modliser une srie qui dcolle ou qui s'amortit de manire oscillatoire. Cubique. Modle dfini par l'quation Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3). De puissance. Modle dont l'quation est Y = b0 * (t**b1) ou ln(Y) = ln(b0) + (b1 *

ln(t)).
Compos. Modle dont l'quation est la suivante : Y = b0 * (b1**t) ou ln(Y) = ln(b0)

+ (ln(b1) * t).
En S. Modle dont l'quation est Y = e**(b0 + (b1/t)) ou ln(Y) = b0 + (b1/t). Logistique. Modle dont l'quation est Y = 1 / (1/u + (b0 * (b1**t))) ou ln(1/y-1/u)= ln (b0) + (ln(b1)*t), u tant la valeur de la borne suprieure. Aprs avoir slectionn la logistique, prcisez la valeur de la borne suprieure utiliser dans l'quation de

492 Chapitre 28

rgression. La valeur doit tre un nombre positif suprieur la plus grande valeur de la variable dpendante.
De croissance. Modle dont l'quation est Y = e**(b0 + (b1 * t)) ou ln(Y) = b0 +

(b1 * t).
Exponentielle. Modle dont l'quation est Y = b0 * (e**(b1 * t)) ou ln(Y) = ln(b0) +

(b1 * t).

Enregistrement de lajustement de fonctions


Figure 28-6 Bote de dialogue Ajustement de fonctions : Enregistrer

Enregistrer les variables. Pour chaque modle slectionn, vous pouvez enregistrer les prvisions, les rsidus (valeur observe de la variable dpendante moins la prvision du modle) et les intervalles de prvision (limites suprieure et infrieure). Les nouveaux noms de variable et les tiquettes descriptives saffichent dans un tableau dans la fentre de rsultats. Calculer une prvision. Si, dans lensemble de donnes actif, vous slectionnez Temps

la place dune variable comme variable indpendante, vous pouvez spcifier une priode de prvision au-del de la fin de la srie chronologique. Vous avez le choix entre les options suivantes :
A partir dune estimation limite une priode. Prvoit les valeurs pour toutes les

observations du fichier, partir des observations de la priode destimation. La priode destimation qui saffiche en bas de la bote de dialogue est dfinie avec la bote de sous dialogue Intervalle de loption Slectionner des observations

493 Ajustement de fonctions

du menu Donnes. Si aucune priode destimation na t dfinie, toutes les observations sont utilises pour prvoir les valeurs.
Jusqu. Prvoit les valeurs jusqu la date, lheure ou le numro de lobservation

spcifi, partir des observations de la priode destimation. Cette fonctionnalit peut tre utilise pour prvoir les valeurs au-del de la dernire observation de la srie chronologique. Les variables courantes de date dfinies dterminent les zones de texte disponibles pour la spcification de la fin de la priode de prvision. Si aucune variable de date nest dfinie, vous pouvez spcifier le numro de lobservation finale. Utilisez loption Dfinir des dates... dans le menu Donnes pour crer des variables de date.

Analyse discriminante

29

Chapitre

Lanalyse discriminante est utile pour construire un modle de prvision de groupe daffectation bas sur les caractristiques observes de chaque observation. La procdure gnre une fonction discriminante (ou, pour plus de deux groupes, un ensemble de fonctions discriminantes) base sur les combinaisons linaires des variables explicatives qui donnent la meilleure discrimination entre groupes. Les fonctions sont gnres partir dun chantillon dobservations pour lesquelles le groupe daffectation est connu. Les fonctions peuvent alors tre appliques aux nouvelles observations avec des mesures de variables explicatives, mais de groupe daffectation inconnu. Remarque : la variable de groupe peut avoir plus de deux valeurs. Les codes de la variable de regroupement doivent cependant tre des nombres entiers, et vous devez spcifier leur valeur minimale et maximale. Les observations dont les valeurs se situent hors des limites sont exclues de lanalyse.
Exemple. En moyenne, les habitants des pays des zones tempres consomment plus de calories par jour que ceux des tropiques, et une plus grande proportion de ces habitants vit en ville. Un chercheur veut combiner ces informations en une fonction pour dterminer comment un individu peut tre diffrenci selon les deux groupes de pays. Le chercheur pense que la taille de la population et des informations conomiques peuvent aussi tre importantes. Lanalyse discriminante vous permet destimer les coefficients de la fonction discriminante linaire, qui ressemble la partie droite dune quation de rgression linaire multiple. Ainsi, en utilisant les coefficients a, b, c et d, la fonction est :
D = a * climat + b * urbain + c * population + d * Produit National Brut par habitant

495

496 Chapitre 29

Si ces variables sont utiles pour tablir la diffrence entre les deux zones climatiques, les valeurs de D seront diffrentes pour les pays temprs et les pays tropicaux. Si vous utilisez une mthode de slection des variables pas pas, vous pouvez dcouvrir que vous navez pas forcment besoin dinclure les quatre variables dans la fonction.
Statistiques. Pour chaque variable, on a les lments suivants : moyenne, carts-types,

ANOVA un facteur. Pour chaque analyse : Test de Box, matrice de corrlation intra-classe, matrice de covariance intra-classe, matrice de covariance de chaque classe, matrice de covariance totale. Pour chaque fonction discriminante canonique : valeur propre, pourcentage de la variance, corrlation canonique, lambda de Wilks, Chi-deux. Pour chaque pas : probabilits priori, coefficients de fonction de Fisher, coefficients de fonction non standardiss, lambda de Wilks pour chaque fonction canonique.
Donnes. La variable de regroupement doit avoir un nombre limit de modalits distinctes, codifies sous forme de nombres entiers. Les variables indpendantes nominales doivent tre recodes en variables muettes ou de contraste. Hypothses. Les observations doivent tre indpendantes. Les variables explicatives

doivent avoir une distribution gaussienne multivarie, et les matrices de variance-covariance intra-groupes doivent tre gales entre groupes. On part de lhypothse que les groupes daffectation sont mutuellement exclusifs (cest--dire quaucune observation nest affecte plus dun groupe) et collectivement exhaustifs (cest--dire que toutes les observations sont affectes un groupe). La procdure est la plus efficace lorsque laffectation un groupe est une variable rellement qualitative. Si laffectation un groupe est base sur les valeurs dune variable continue (par exemple, QI lev contre QI bas), vous devez envisager dutiliser la rgression linaire pour exploiter les informations plus riches donnes par la variable continue elle-mme.
Figure 29-1 Rsultats danalyse discriminante
Valeurs propres % de variance 100.0 Corrlation canonique .707

Fonction 1

Valeur propre 1.002

% cumul 100.0

497 Analyse discriminante


Lambda de Wilks

Test de fonction(s) 1

Lambda de Wilks .499

Khi-deux 31.934

Df 4

Sig. .000

Matrice de structure Fonction 1 CALORIES LOG_GDP URBAIN (%) LOG_POP .986 .790 .488 .082

Obtenir une analyse discriminante


E A partir des menus, slectionnez : Analyse Classification Analyse discriminante

498 Chapitre 29 Figure 29-2 Bote de dialogue Analyse discriminante : Classement

E Slectionnez une variable de regroupement valeur entire et cliquez sur Dfinir intervalle pour spcifier les modalits considrer. E Slectionnez les variables indpendantes (ou explicatives). (Si votre variable de

regroupement na pas de valeurs entires, la procdure de recodification automatique du menu Transformer permettra den crer un avec des valeurs entires.)
E Slectionnez la mthode de saisie des variables indpendantes.

Entrer les variables simultanment. Entre simultanment toutes les variables

indpendantes qui satisfont aux critres de tolrance.


Utiliser la mthode pas pas. Utilise la mthode pas pas pour contrler lentre

et la suppression de variables.
E Vous pouvez galement slectionner les observations avec une variable de slection.

499 Analyse discriminante

Dfinition dintervalles pour lanalyse discriminante


Figure 29-3 Bote de dialogue Analyse discriminante : Dfinir intervalle

Spcifiez la valeur minimum et maximum de la variable de regroupement pour lanalyse. Les observations avec des valeurs hors de cet intervalle ne sont pas utilises dans lanalyse discriminante mais elles sont classes dans un des groupes existants en fonction des rsultats de lanalyse. Les valeurs minimum et maximum doivent tre des entiers.

Slection des observations pour lanalyse discriminante


Figure 29-4 Bote de dialogue Analyse discriminante : Enregistrer

Pour slectionner les observations pour votre analyse :


E Dans la bote de dialogue Analyse discriminante, slectionnez une variable de

slection.
E Cliquez sur Valeur pour entrer un entier comme valeur de slection.

Seules les observations avec la valeur spcifie pour la variable de slection sont utilises pour driver les fonctions discriminantes. Les rsultats des statistiques et de classification sont gnrs pour les observations slectionnes et celles qui ne le sont pas. Ce processus fournit une mthode de classification des nouvelles observations

500 Chapitre 29

reposant sur des donnes existantes ou de partitionnement de vos donnes dans un sous-ensemble de test ou de formation en vue deffectuer une validation sur le modle cr.

Statistiques de lanalyse discriminante


Figure 29-5 Bote de dialogue Analyse discriminante: Statistiques

Descriptives. Les options disponibles sont moyennes (y compris carts-types),

ANOVA 1 facteur et Test M de Box.


Moyennes. Affichage de la moyenne totale et de la moyenne de groupe, ainsi que

des carts-types des variables indpendantes.


ANOVA 1 facteur. Effectue pour chacune des variables indpendantes une analyse

de variance 1 facteur pour tester l'galit des moyennes de groupe.


Test de Box. Test d'galit des matrices de covariance des classes. Pour les

chantillons de taille suffisamment importante, une valeur p non significative indique qu'il n'est pas dmontr que les matrices diffrent. Ce test est sensible aux dviations par rapport la distribution gaussienne multivarie.
Coefficients de la fonction. Les options disponibles sont les coefficients de la

classification de Fisher et les coefficients non standardiss.

501 Analyse discriminante

Fisher. Affiche les coefficients de la fonction de classification de Fisher qui

peuvent tre directement utiliss pour la classification. Un groupe de coefficients est obtenu pour chaque groupe et une observation est affecte au groupe qui a le plus grand score discriminant.
Non standardiss. Affiche les coefficients non standardiss de la fonction

discriminante.
Matrices. Les matrices de coefficients pour variables indpendantes disponibles sont

la matrice de corrlation intra-classe, la matrice de covariance intra-classe, la matrice de covariance de chaque classe et la matrice de covariance totale.
Corrlations intra-classe. Affiche une matrice de corrlations intra-classe globale,

en calculant la moyenne des matrices de covariance distinctes pour tous les groupes avant de calculer les corrlations.
Covariance intra-classe. Affiche une matrice de covariances intra-classe globale,

qui peut diffrer de la matrice de covariance totale. Cette matrice est obtenue en calculant la moyenne des matrices de covariances distinctes de tous les groupes.
Covariance de chaque classe. Affiche des matrices de covariances distinctes pour

chaque groupe.
Covariance totale. Affiche la matrice de covariance de toutes les observations

comme si elles provenaient d'un seul chantillon.

Mthode pas pas de lanalyse discriminante


Figure 29-6 Bote de dialogue Analyse discriminante : Mthode pas pas

502 Chapitre 29

Mthode. Slectionnez la statistique utiliser pour ajouter ou supprimer de nouvelles variables. Les options possibles sont le lambda de Wilks, la variance rsiduelle, la distance de Mahalanobis, le plus petit rapport F et le V de Rao. Avec le V de Rao, vous pouvez spcifier laugmentation minimum de V pour entrer une variable. Lambda de Wilks. Mthode de slection des variables pour une analyse

discriminante pas pas qui slectionne les variables entrer dans l'quation d'aprs leur capacit faire baisser le lambda de Wilks. A chaque tape, les variables sont entres dans l'analyse d'aprs leur capacit faire baisser le lambda de Wilks.
Variance rsiduelle. A chaque tape, la variable qui minimise la somme des

variations rsiduelles entre les groupes est saisie.


Distance de Mahalanobis. Mesure de la distance entre les valeurs d'une observation

et la moyenne de toutes les observations sur les variables indpendantes. Une distance de Mahalanobis importante identifie une observation qui a des valeurs extrmes pour des variables indpendantes.
Plus petit rapport F. Mthode de slection des variables en analyse pas pas,

fonde sur la maximisation d'un rapport F calcul partir de la distance de Mahalanobis entre des groupes.
V de Rao. Mesure des diffrences entre des moyennes de groupes. Egalement

appele trace de Lawley-Hotelling. A chaque tape, la variable qui maximise l'augmentation du V de RAO est entre. Aprs avoir slectionn cette option, entrez la valeur minimale que doit avoir une variable pour entrer dans l'analyse.
Critres. Les options disponibles sont Choisir la valeur de F et Choisir la probabilit de F.

Entrez des valeurs pour ajouter et supprimer des variables.


Choisir la valeur de F. Une variable est introduite dans un modle si sa valeur F est

suprieure la valeur Entre et elle est limine si la valeur F est infrieure la valeur Elimination. La valeur Entre doit tre suprieure la valeur Elimination et toutes deux doivent tre positives. Pour introduire davantage de variables dans le modle, rduisez la valeur du champ Entre. Pour liminer davantage de variables dans le modle, augmentez la valeur du champ Elimination.
Choisir la probabilit de F. Une variable est entre dans le modle si le seuil de

signification de la valeur F est suprieur la valeur Entre ; la variable est limine si ce seuil est suprieur la valeur Elimination. La valeur Entre doit tre infrieure la valeur Elimination et toutes deux doivent tre positives. Pour introduire davantage de variables dans le modle, diminuez la valeur Entre. Pour liminer davantage de variables du modle, rduisez la valeur Elimination.

503 Analyse discriminante

Afficher. Loption Rcapitulation des tapes affiche les statistiques de toutes les

variables aprs chaque tape. Loption Test F des distances entre couples affiche une matrice de rapports F apparis pour chaque paire de groupes.

Analyse discriminante : Classement


Figure 29-7 Bote de dialogue Analyse discriminante : Classement

Probabilits priori. Ces valeurs sont utilises pour le classement. Vous pouvez spcifier des probabilits priori gales pour toutes les classes (Egales pour toutes les classes). Vous pouvez sinon laisser les effectifs de classes observs dans votre chantillon calculer les probabilits daffectation un groupe (A calculer selon les effectifs). Afficher. Les options daffichage disponibles sont les rsultats par observation, le rcapitulatif et la classification par limination. Rsultats par observation. Les codes du groupe actuel, du groupe prvu, des

probabilits a posteriori et des scores discriminants sont affichs pour chaque observation.
Rcapitulatif. Nombre d'observations correctement et incorrectement affectes

chacune des classes sur la base de l'analyse discriminante. Parfois appels matrice de confusion .
Classification par limination. Classement de chaque observation de l'analyse par

les fonctions drives de l'ensemble des observations autres que cette observation. Cette classification est galement appele mthode U .

504 Chapitre 29

Remplacer les valeurs manquantes par la moyenne. Slectionnez cette option pour

remplacer la valeur manquante dune variable indpendante par la moyenne de cette variable, mais seulement durant la phase de classification.
Utiliser la matrice dinertie. Vous pouvez choisir de classer les observations en utilisant une matrice de covariance intra-classe ou une matrice de covariance pour chaque classe. Intra-classe. La matrice de covariances intra-classes globale est utilise pour

classifier les observations.


Classe par classe. Les matrices de covariances de chaque groupe sont utilises

pour la classification. Comme la classification repose sur les fonctions discriminantes et pas sur les variables d'origine, cette option n'est pas toujours quivalente la discrimination quadratique.
Diagrammes. Les options de diagramme disponibles sont toutes classes combines, classe par classe, et carte des rgions daffectation. Toutes classes combines. Cre un diagramme de dispersion de tous les groupes,

des valeurs des deux premires fonctions discriminantes. S'il n'y a qu'une seule fonction, un histogramme est trac la place.
Classe par classe. Cre des diagrammes de dispersion classe par classe pour les

deux premires valeurs de fonction discriminante. Lorsqu'il n'y a qu'une seule fonction, des histogrammes sont affichs la place.
Carte des rgions d'affectation. Diagramme des limites servant classifier les

observations en fonction de valeurs de fonction. Les numros correspondent aux groupes auxquels les observations ont t affectes. La moyenne de chaque groupe est indique par un astrisque l'intrieur de ses limites. La carte n'est pas affiche s'il n'existe qu'une seule fonction discriminante.

505 Analyse discriminante

Enregistrement de lanalyse discriminante


Figure 29-8 Bote de dialogue Analyse discriminante : Enregistrer

Vous pouvez ajouter de nouvelles variables votre fichier de donnes actif. Les options disponibles sont classe(s) daffectation (une seule variable), valeurs du facteur discriminant (une variable pour chaque fonction discriminante dans la solution), et probabilits daffectation un groupe en fonction des valeurs du facteur discriminant (une variable pour chaque groupe). Vous pouvez galement exporter les informations du modle vers le fichier spcifi au format XML (PMML). SmartScore et le serveur de SPSS (produit spar) peuvent utiliser ce fichier de modle pour appliquer les informations du modle dautres fichiers de donnes des fins danalyse.

Fonctionnalits supplmentaires de la commande DISCRIMINANT


Le langage de commande SPSS vous permet aussi de : effectuer plusieurs analyses discriminantes avec une seule commande et contrler lordre dentre des variables (au moyen de la sous-commande ANALYSIS). spcifier des probabilits priori pour la classification (au moyen de la sous-commande PRIORS). afficher les matrices des coordonnes factorielles et les matrices des corrlations structurelles aprs rotation (au moyen de la sous-commande ROTATE). limiter le nombre de fonctions discriminantes extraites (au moyen de la sous-commande FUNCTIONS).

506 Chapitre 29

restreindre la classification aux observations slectionnes (ou non slectionnes) pour lanalyse (au moyen de la sous-commande SELECT). lire et analyser une matrice de corrlation (au moyen de la sous-commande MATRIX). crer une matrice de corrlation pour une analyse ultrieure (au moyen de la sous-commande MATRIX). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Analyse factorielle

30

Chapitre

Lanalyse factorielle essaie didentifier des variables sous-jacentes, ou facteurs, qui permettent dexpliquer le patron des corrlations lintrieur dun ensemble de variables observes. Lanalyse factorielle est souvent utilise pour rduire un ensemble de donnes. Lanalyse factorielle est souvent utilise dans la factorisation, en identifiant un petit nombre de facteurs qui expliquent la plupart des variances observes dans le plus grand nombre de variables manifestes. On peut galement utiliser lanalyse factorielle pour gnrer des hypothses concernant des mcanismes de causalit ou pour afficher des variables pour une analyse ultrieure (par exemple, pour identifier la colinarit avant une analyse de rgression linaire). La procdure danalyse factorielle offre une trs grande flexibilit : Il existe sept mthodes dextraction de facteur. Il existe cinq mthodes de rotation, dont directe Oblimin et Promax pour les rotations non orthogonales. Il existe trois mthodes pour calculer les facteurs, et ces facteurs peuvent tre enregistrs en tant que variables pour des analyses ultrieures.
Exemple : Quelle est lattitude sous-jacente qui pousse les personnes rpondre dune certaine manire aux questions concernant un sondage politique ? Lexamen des corrlations parmi les lments dun sondage rvle quil y a des recouvrements significatifs parmi divers sous-groupes dlments. Les questions sur les impts ont tendance tre en corrlation, de mme que les questions thmes militaires, etc. Avec lanalyse factorielle, vous pouvez enquter sur le nombre de facteurs sous-jacents, et, dans de nombreux cas, vous pouvez identifier le concept reprsent par ces facteurs. De plus, vous pouvez calculer les facteurs pour chaque rpondant, facteurs que vous pouvez utiliser pour des analyses ultrieures. Par exemple, sur la base des facteurs, vous pouvez dvelopper un modle logistique de rgression pour prvoir le comportement de vote.

507

508 Chapitre 30

Statistiques : Pour chaque variable, on a les lments suivants : nombre dobservations valides, moyenne et cart-type. Pour chaque analyse factorielle : matrice de corrlation des variables, incluant des seuils de signification, dterminant, inverse ; les matrices des corrlations reconstitues, incluant lanti-image ; les solutions initiales (qualits de reprsentation, valeurs propres et pourcentage de variance expliqu) ; mesure dadquation dchantillonnage de Kaiser-Meyer-Olkin et le test de sphricit de Bartlett ; structure avant rotation, incluant les saturations sur les facteurs, la qualit de reprsentation, et les valeurs propres; structure aprs rotation, incluant une matrice de forme aprs rotation et une matrice de transformation. Pour rotations obliques : type et matrices de structure aprs rotation ; matrice factorielle de coefficient de facteur et matrice factorielle de facteur de covariance. Diagrammes : Diagramme de valeurs propres et carte factorielle du premier, du deuxime et du troisime facteur. Donnes : Les variables doivent tre quantitatives au niveau de l Intervalle ou du

rapport . Les donnes qualitatives (comme la religion ou le pays dorigine) ne conviennent pas pour lanalyse factorielle. Les donnes pour lesquelles la corrlation de Pearson calcule a un sens conviennent pour lanalyse factorielle.
Hypothses : Les donnes doivent possder une distribution gaussienne bivarie pour

chaque paire de variables et les observations doivent tre indpendantes. Le modle danalyse factorielle spcifie que les variables sont dtermines par des facteurs communs (les facteurs estims par le modle) et des facteurs uniques (qui ne sont pas corrls entre les variables observes); les estimations calcules se basent sur lhypothse que tous les facteurs uniques ne sont pas en corrlation entre eux ainsi quavec les facteurs communs.

509 Analyse factorielle Figure 30-1 Sortie danalyse factorielle


Statistiques descriptives Moyenne Esprance de vie moyenne des femmes 72.833
Mortalit infantile (nombre de dcs sur 1 000 naissances vivantes) Personnes sachant lire (%) Taux de natalit pour 1 000 personnes Fcondit : nombre moyen d'enfants Personnes habitant en ville (%) Log (base 10) de GDP_CAP Croissance dmographique (% par anne) Rapport entre les naissances et les dcs Taux de mortalit pour 1 000 personnes Log (base 10) de Population

Ecart. Type 8.272 32.222 18.625 10.552 1.593 22.835 .608 1.156 2.313 3.174 .686

N Analyse 72 72 72 72 72 72 72 72 72 72 72

35.132 82.472 24.375 3.205 62.583 3.504 1.697 3.577 8.038 4.153

Qualit de reprsentation Initiale Extraction 1.000 .953 .949 .825 .943 .875 .604 .738 .945 .925 .689 .292 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000

LIFEEXPF LITERACY BIRTH_RT FERTILTY URBAN LOG_GDP POP_INCR B_TO_D DEATH_RT LOG_POP

BABYMORT 1.000

Mthode d'extraction : Analyse en composantes principales

510 Chapitre 30
Total des variables explicatives Valeurs propres initiales Composante 1 2 3 4 5 6 7 8 9 10 11 Total 6.960 2.579 .612 .361 .218 .130 6.131E-02 3.775E-02 2.610E-02 9.840E-03 4.461E-03 % de variance 63.275 23.446 5.562 3.281 1.985 1.183 .557 .343 .237 8.946E-02 4.055E-02 % cumul 63.275 86.721 92.283 95.564 97.549 98.732 99.290 99.633 99.870 99.959 100.000 Sommes des carrs charges Total 6.960 2.579 % de variance 63.275 23.446 % cumul 63.275 86.721 Sommes des carrs pour la rotation Total 6.910 2.629 % de variance 62.819 23.902 % cumul 62.819 86.721

Mthode d'extraction : analyse en composantes principales

511 Analyse factorielle

Matrice pivote des composants

Composant BIRTH_RT FERTILTY LITERACY LIFEEXPF BABYMORT POP_INCR LOG_GDP URBAN DEATH_RT B_TO_D LOG_POP .614 1 .969 .931 -.880 -.856 .853 .847 -.794 -.561 .226 .469 -.469 .476 .327 .539 -.827 .741 -.520 2

En composantes principales Mthode de rotation : Varimax avec normalisation de Kaiser.

Matrice des transformations des composants

Composant

1 2

1 .982 .190

2 -.190 .982

Mthode d'extraction : Analyse en composantes principales Mthode de rotation : Varimax avec normalisation de Kaiser.

512 Chapitre 30

Component Plot in Rotated Space


1.0 birth to death ratio people living in cit average female life .5 log (base 10) of gdp people who read (%) fertility: average n birth rate per 100 0.0

population increase

Component 2

-.5

log (base 10) of pop

infant mortality (de

death rate per 1000 -1.0 -1.0 -.5 0.0 .5 1.0

Component 1

Obtenir une analyse factorielle


E A partir des menus, slectionnez : Analyse Factorisation Analyse factorielle E Slectionnez les variables pour lanalyse factorielle.

513 Analyse factorielle Figure 30-2 Bote de dialogue Analyse factorielle

Slection des observations pour lanalyse factorielle


Figure 30-3 Slectionnez la bote de dialogue Analyse factorielle

Pour slectionner les observations pour votre analyse :


E Slectionnez une variable de slection. E Cliquez sur Valeur pour entrer un entier comme valeur de slection.

Seules les observations ayant cette valeur pour la variable de slection sont utilises dans lanalyse factorielle.

514 Chapitre 30

Descriptives danalyse factorielle


Figure 30-4 Bote de dialogue Analyse Factorielle : Descriptives...

Statistiques : Les descriptives univaries incluent la moyenne, lcart-type et le nombre

dobservations valides pour chaque variable. La structure initiale affiche la qualit de reprsentation initiale, les valeurs propres et le pourcentage de variance expliqu.
Matrice de corrlation : Les options disponibles sont les coefficients, les seuils de signification, les dterminants, les inverses, les reproduits, lanti-image et lindice KMO et le test de sphricit de Bartlett. Indice KMO et test de sphricit de Bartlett. Mesure de l'adquation de

l'chantillonnage de Kaiser-Meyer-Olkin qui teste si les corrlations partielles entre les variables sont faibles. Le test de sphricit de Bartlett teste si la matrice des corrlations est une matrice d'identit, ce qui indiquerait que le modle de facteur n'est pas adapt.
Reconstitue. Matrice des corrlations estime partir de la solution factorielle.

Les rsidus (diffrence entre les corrlations estimes et observes) sont galement affichs.
Anti-image. La matrice de corrlation des anti-images contient les opposs des

coefficients de corrlation partielle ; la matrice de covariance des anti-images contient les opposs des covariances partielles. Dans un bon modle factoriel, la plupart des lments hors diagonale doivent tre petits. La mesure d'adquation d'chantillonnage pour une variable est affiche sur la diagonale de la matrice de corrlation des anti-images.

515 Analyse factorielle

Extraction danalyse factorielle


Figure 30-5 Bote de dialogue Analyse Factorielle : Extraction

Mthode : Vous permet de spcifier la mthode dextraction de facteur. Les mthodes

disponibles sont les Composantes principales, les Moindres carrs non pondrs, les Moindres carrs gnraliss, le Maximum de vraisemblance, la Factorisation en axes principaux, lAlpha-maximisation et la Factorisation en projections.
Analyse en composantes principales. Mthode d'extraction de facteur utilise

pour former des combinaisons linaires non corrles des variables observes. La premire composante principale a une variance maximale. Les autres composantes expliquent progressivement des portions plus petites de la variance sans tre corrles les unes aux autres. L'analyse des composantes principales est utilise pour obtenir la solution factorielle initiale. Elle peut tre utilise quand la matrice des corrlations est singulire.
Mthode des moindres carrs non pondrs. Mthode d'extraction de facteur qui

minimise la somme des carrs des diffrences entre les matrices de corrlations observes et reconstitues en ignorant les diagonales.
Mthode des Moindres carrs gnraliss. Mthode d'extraction de facteur qui

minimise la somme des carrs des diffrences entre les matrices de corrlations observes et reconstitues. Les corrlations sont pondres par l'inverse de leur unicit, de faon ce que les variables prsentant une forte unicit reoivent une pondration infrieure celles prsentant une faible unicit.

516 Chapitre 30

Mthode du maximum de vraisemblance. Mthode d'extraction de facteur qui

fournit les estimations de paramtres les plus susceptibles d'avoir gnr la matrice de corrlations observe si l'chantillon est issu d'une distribution gaussienne multivarie. Les corrlations sont pondres par l'inverse de l'unicit des variables et un algorithme itratif est utilis.
Factorisation en axes principaux. Mthode d'extraction de facteurs partir de

la matrice des corrlations initiales o les coefficients de corrlation multiple au carr sont placs sur la diagonale comme estimation initiale des qualits de reprsentation. Ces cartes factorielles sont utilises pour une nouvelle estimation des qualits de reprsentation qui remplace alors l'ancienne sur la diagonale. Les itrations se poursuivent jusqu' ce que les variations des qualits de reprsentation d'une itration l'autre satisfassent le critre de convergence de l'extraction.
Alpha de Cronbach. Mthode d'extraction de facteur qui considre les variables

dans l'analyse comme un chantillon issu de la population des variables potentielles. Cette mthode maximise l'alpha de Cronbach des facteurs.
Factorisation en projections. Mthode d'extraction de facteur dveloppe par

Guttman et base sur la thorie d'une image. La partie commune de la variable, appele image partielle, est dfinie comme sa rgression linaire sur les autres variables, plutt qu'une fonction de facteurs hypothtiques.
Analyser : Vous permet de spcifier si lanalyse porte sur une matrice de corrlation ou sur une matrice de covariance. Matrice de corrlation. Utile si les variables de votre analyse sont mesures selon

des chelles diffrentes.


Matrice de covariance. Utile lorsque vous souhaitez appliquer lanalyse factorielle

plusieurs groupes avec des variances diffrentes pour chaque variable.


Extraire : Vous pouvez retenir tous les facteurs dont les valeurs propres dpassent une

valeur spcifique ou retenir un nombre spcifique de facteurs.


Afficher : Vous permet de demander la solution factorielle avant rotation et un

diagramme des valeurs propres.

517 Analyse factorielle

Structure factorielle sans rotation. Affiche les corrlations factorielles sans rotation

(matrice de projections factorielles), les qualits de reprsentation et les valeurs propres de la solution factorielle.
Diagramme des valeurs propres. Diagramme reprsentant la variance associe

chaque facteur. Permet de dterminer le nombre de facteurs conserver. Gnralement, le diagramme montre une coupure franche entre la forte pente des facteurs levs et la trane graduelle du reste (valeurs propres).
Maximum des itrations pour converger : Vous permet de spcifier le nombre maximum de pas que lalgorithme peut utiliser pour estimer la solution.

Rotation danalyse factorielle


Figure 30-6 Bote de dialogue Analyse factorielle : Rotation

Mthode : Vous permet de slectionner la mthode de rotation des facteurs. Les

mthodes disponibles sont Varimax, Oblimin directe, Quartimax, Equamax ou Promax.


Mthode varimax. Mthode de rotation orthogonale qui minimise le nombre de

variables ayant de fortes corrlations sur chaque facteur. Simplifie l'interprtation des facteurs.
Critre oblimin direct. Mthode de rotation oblique (non orthogonale). Lorsque

delta est nul (valeur par dfaut), les solutions sont les plus obliques. Plus la valeur de delta est ngative, moins les facteurs sont obliques. Pour remplacer la valeur nulle par dfaut de delta, entrez un nombre infrieur ou gal 0,8.

518 Chapitre 30

Mthode quartimax. Mthode de rotation qui rduit le nombre de facteurs requis

pour expliquer chaque variable. Simplifie l'interprtation des variables observes.


Equamax. Mthode de rotation qui est une combinaison de la mthode Varimax

(qui simplifie les facteurs) et de la mthode Quartimax (qui simplifie les variables). Le nombre de variables pesant sur un facteur et le nombre de facteurs ncessaires pour expliquer une variable sont minimiss.
Rotation Promax. Rotation oblique qui permet aux facteurs d'tre corrls. Peut

tre calcule plus rapidement qu'une rotation oblimin directe, aussi est-elle utile pour les vastes ensembles de donnes.
Afficher : Vous permet dinclure le rsultat de la structure aprs rotation, et galement

dafficher les cartes factorielles sur le premier, le second et le troisime facteur (Cartes factorielles).
Structure aprs rotation. Vous devez slectionner une mthode de rotation pour

obtenir une structure aprs rotation. Pour les rotations orthogonales, la matrice de forme aprs rotation et la matrice de transformation factorielle sont affiches. Pour les rotations obliques, le programme affiche la matrice des projections factorielles, la matrice de structure et la matrice des corrlations de facteurs.
Diagramme des Contributions des Facteurs. Diagramme en trois dimensions des

contributions des trois premiers facteurs. Pour une solution deux facteurs, un diagramme en deux dimensions est affich. Le diagramme n'est pas affich si un seul facteur est extrait. Les diagrammes affichent des solutions ayant subi une rotation si cette dernire est demande.
Maximum des itrations pour converger : Vous permet de spcifier le nombre maximum de pas que lalgorithme peut utiliser pour raliser la rotation.

519 Analyse factorielle

Scores danalyse factorielle


Figure 30-7 Bote de dialogue Scores de lAnalyse Factorielle

Enregistrer dans des variables : Vous permet de crer une nouvelle variable pour chaque facteur selon la structure finale. Slectionnez une des mthodes alternatives suivantes pour calculer les facteurs : Rgression, Bartlett, ou Anderson-Rubin. Mthode de rgression. Mthode d'estimation des coefficients factoriels. Les

carts obtenus ont une moyenne de 0 et une variance gale au carr de la corrlation multiple entre les coefficients factoriels estims et les vraies valeurs du facteur. Les carts peuvent tre corrls mme lorsque les facteurs sont orthogonaux.
Facteurs de Bartlett. Mthode d'estimation des coefficients factoriels. Les rsultats

ont une moyenne de 0. La somme des carrs des facteurs uniques dans la plage de variables est minimise.
Mthode d'Anderson-Rubin. Mthode d'estimation des coefficients factoriels

; variante de la mthode de Bartlett qui garantit l'orthogonalit des facteurs estims. Les rsultats obtenus affichent une moyenne de 0 et un cart-type de 1 et ne sont pas corrls.
Afficher la matrice des coefficients factoriels : Vous permet de montrer les coefficients

par lesquels les variables sont multiplies pour obtenir les facteurs. Cela permet galement de montrer les corrlations entre les facteurs.

520 Chapitre 30

Options danalyse factorielle


Figure 30-8 Bote de dialogue des Options de lAnalyse Factorielle

Valeurs manquantes : Vous permet de spcifier comment traiter les valeurs

manquantes. Les options disponibles sont dexclure Toute observation incomplte, Seulement les observationsappariesou Remplacer par la moyenne.
Affichage des projections : Vous permet de contrler le format des matrices de rsultat. Triez les coefficients par leur taille et supprimez les coefficients dont la valeur absolue est infrieure la valeur spcifie.

Fonctionnalits supplmentaires de la commande FACTOR


Le langage de commande SPSS vous permet aussi de : spcifier des critres de convergence pour les itrations lors de lextraction et de la rotation ; dfinir des diagrammes factoriels individuels aprs rotation ; indiquer le nombre de facteurs enregistrer ; spcifier les valeurs des diagonales pour la mthode de factorisation en axes principaux ; crer des matrices de corrlation ou des matrices de projections factorielles sur un disque pour une analyse ultrieure ; lire et analyser des matrices de corrlation ou des matrices de projections factorielles.

521 Analyse factorielle

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Choix dune procdure de classification

31

Chapitre

Vous pouvez effectuer des analyses de classes laide de la procdure TwoStep, de la classification hirarchique ou des nues dynamiques. Chaque procdure utilise un algorithme diffrent pour la cration des classes, et chacune delles comporte des options qui ne sont pas disponibles dans les autres procdures.
Analyse du composant Classe TwoStep. La procdure Analyse du composant Classe TwoStep est la mthode privilgie pour de nombreuses applications. Elle offre les fonctionnalits spcifiques suivantes :

Slection automatique du meilleur nombre de classes, en plus des mesures de slection parmi des modles de classe. Possibilit de crer simultanment des modles de classe sur la base de variables qualitatives et continues. Possibilit denregistrer le modle de classe dans un fichier XML externe, puis de lire ce fichier et de mettre jour le modle de classe laide des donnes les plus rcentes. En outre, la procdure Analyse du composant Classe TwoStep permet danalyser des fichiers de donnes volumineux.
Classification hirarchique. La procdure Classification hirarchique est limite

des fichiers de donnes plus petits (centaines dobjets classer), mais offre les fonctionnalits spcifiques suivantes : Possibilit de classer des observations ou des variables.

523

524 Chapitre 31

Possibilit de calculer plusieurs solutions possibles et denregistrer des classes daffectation pour chacune de ces solutions. Plusieurs mthodes de formation de classes, de transformation de variables et de mesure de la dissimilarit entre les classes. Tant que toutes les variables sont du mme type, la procdure Classification hirarchique peut analyser des variables dintervalle (continues), deffectif ou binaires.
Nues dynamiques. La procdure Nues dynamiques est limite aux donnes continues et exige que vous indiquiez au pralable le nombre de classes. Elle offre nanmoins les fonctionnalits spcifiques suivantes :

Possibilit denregistrer les distances partir des centres de classes pour chaque objet. Possibilit de lire les centres de classes initiaux partir dun fichier SPSS externe et denregistrer les centres de classes finaux dans un fichier de ce type. En outre, la procdure Nues dynamiques permet danalyser des fichiers de donnes volumineux.

Analyse TwoStep Cluster

32

Chapitre

La procdure danalyse TwoStep Cluster est un outil dexploration conu pour rvler des groupements naturels (ou classes) au sein dun ensemble de donnes. Lalgorithme utilis par cette procdure possde plusieurs fonctionnalits qui le distinguent des techniques de classification standard :
Gestion des donnes qualitatives et continues. En supposant que les variables

soient indpendantes, une distribution jointe multinomiale-normale peut tre place sur des variables qualitatives et continues.
Slection automatique du nombre de classes. En comparant les valeurs dun critre

de modle-choix dans diffrentes solutions de classification, la procdure peut dterminer automatiquement le nombre optimal de classes.
Evolutivit. En construisant une arborescence de fonctionnalits de classe (CF)

qui rcapitule les enregistrements, lalgorithme TwoStep vous permet danalyser des fichiers de donnes volumineux.
Exemple. Les entreprises du domaine des produits de consommation et du commerce de dtail utilisent rgulirement des techniques de classification des donnes qui dcrivent les habitudes dachat, le sexe, lge, le niveau de revenu, etc. de leurs clients. Ces socits adaptent leurs stratgies de marketing et de dveloppement produit chaque groupe de consommation afin daugmenter les ventes et de dvelopper la fidlit la marque. Statistiques. Cette procdure produit des critres dinformation (AIC ou BIC) par

nombre de classes dans la solution, effectifs de classe pour la classification finale et statistiques descriptives par classe pour la classification finale.
Diagrammes. Cette procdure produit des diagrammes en btons pour les frquences

de classe, des diagrammes en secteurs pour les frquences de classe et des diagrammes dimportance pour les variables.

525

526 Chapitre 32 Figure 32-1 Bote de dialogue Analyse du composant Classe TwoStep

Mesure de distance. Cette slection dtermine la faon dont la similarit entre deux

classes est calcule.


Log-vraisemblance. La mesure de vraisemblance place une distribution de

probabilit sur les variables. Les variables continues sont considres comme tant distribues normalement alors que les variables qualitatives sont considres comme tant multinomiales. Toutes les variables sont considres comme tant indpendantes.
Euclidienne. La mesure euclidienne est la distance en ligne droite entre deux

classes. Elle peut tre utilise uniquement lorsque toutes les variables sont continues.
Nombre de classes. Cette slection vous permet dindiquer la faon dont le nombre de classes doit tre dtermin.

527 Analyse TwoStep Cluster

Dterminer automatiquement. Cette procdure dterminera automatiquement le

meilleur nombre de classes en utilisant le critre dfini dans le groupe Critre de classification. Vous pouvez galement entrer un nombre entier positif qui dfinit le nombre maximal de classes que la procdure doit prendre en compte.
Indiquer une valeur fixe. Vous permet dindiquer le nombre de classes (valeur fixe)

dans la solution. Entrez un entier positif.


Nombre de variables continues. Ce groupe fournit un rcapitulatif des spcifications de

standardisation des variables continues qui sont dfinies dans la bote de dialogue Options. Pour plus d'informations, reportez-vous Options de la procdure danalyse TwoStep Cluster p. 529.
Critre de classification. Cette slection dtermine la faon dont lalgorithme de

classification automatique dtermine le nombre de classes. Vous pouvez spcifier le critre dinformation baysien (BIC) ou le critre dinformation dAkaike (AIC).
Donnes. Cette procdure fonctionne avec des variables continues et qualitatives. Les

observations reprsentent les objets classer et les variables reprsentent les attributs sur lesquels est base la classification.
Tri par observation. Remarque : larborescence des fonctionnalits de classe et la

solution finale peuvent dpendre de lordre des observations. Pour rduire les effets de tri, classez les observations de manire alatoire. Vous pouvez obtenir diffrentes solutions pour lesquelles les observations ont t tries de manire alatoire, afin de vrifier la stabilit dune solution donne. Lorsque cela savre difficile en raison de fichiers trs volumineux, vous pouvez effectuer plusieurs fois lopration sur un chantillon des observations tries de diffrentes manires alatoires.
Hypothses. La mesure de la distance de vraisemblance considre que les variables

du modle de classe sont indpendantes. De plus, chaque variable continue est considre comme ayant une distribution normale (gaussienne) et chaque variable qualitative comme ayant une distribution multinomiale. Des tests internes empiriques indiquent que la procdure est assez rsistante aux violations de lhypothse dindpendance et des hypothses de distribution, mais vous devez savoir comment ces hypothses sont vrifies. Utilisez la procdureCorrlations bivaries pour tester lindpendance de deux variables continues. Utilisez la procdureTableaux croiss pour tester lindpendance de deux variables qualitatives. Utilisez la procdureMoyennes pour tester lindpendance entre une variable continue et une variable qualitative. Utilisez la procdureExplorer pour tester la normalit dune variable continue. Utilisez la

528 Chapitre 32

procdureTest du Chi-deux pour tester si une variable qualitative comporte une distribution multinominale spcifie.
Pour effectuer une procdure danalyse TwoStep Cluster
E A partir des menus, slectionnez : Analyse Classification Classification TwoStep E Slectionnez une ou plusieurs variables qualitatives ou continues.

Sinon, vous pouvez : Ajuster les critres sur lesquels est base la construction des classes. Slectionner les paramtres de gestion du bruit, daffectation de mmoire, de standardisation de variable et dentre de modle de classe. Demander des tableaux et des diagrammes facultatifs. Enregistrer les rsultats de modle dans le fichier de travail ou dans un fichier XML externe.

529 Analyse TwoStep Cluster

Options de la procdure danalyse TwoStep Cluster


Figure 32-2 Bote de dialogue Options de la procdure danalyse TwoStep Cluster

Traitement des valeurs loignes. Ce groupe permet de traiter les valeurs loignes, notamment lors de la classification, si larborescence des fonctionnalits de classe (CF) est sature. Larborescence CF est sature si elle ne peut plus accepter dautres observations dans un noeud feuille et quaucun noeud feuille ne peut tre divis.

Si vous slectionnez la gestion du bruit et que larborescence CF est sature, larborescence est reconstruite lorsque vous placez des observations de feuilles clates dans une feuille bruit . Une feuille est clate si elle contient un pourcentage infrieur au pourcentage dobservations correspondant la taille maximale de la feuille. Une fois que larborescence est reconstruite, les valeurs

530 Chapitre 32

loignes sont places dans larborescence CF si cela est possible. Sinon, les valeurs loignes sont supprimes. Si vous ne slectionnez pas la gestion du bruit et que larborescence CF est sature, elle sera reconstruite laide dun seuil de changement de distance suprieur. Aprs la classification finale, les valeurs ne pouvant tre affectes une classe deviennent des valeurs loignes tiquetes. Un numro didentification de 1 est affect la classe de valeur loigne et cette dernire nest pas prise en compte dans le nombre de classes.
Allocation de mmoire. Ce groupe vous permet dindiquer la quantit de mmoire maximale en mgaoctets (Mo) que lalgorithme de classe doit utiliser. Si la procdure dpasse cette limite, elle utilisera le disque pour stocker les informations ne pouvant pas tre enregistres en mmoire. Spcifiez une valeur suprieure ou gale 4.

Consultez ladministrateur systme pour connatre la plus grande valeur que vous pouvez spcifier sur votre systme. Lalgorithme risque de ne pas trouver le nombre correct ou souhait de classes si cette valeur est trop basse.
Standardisation de variable. Lalgorithme de classification fonctionne avec des variables continues standardises. Les variables continues non standardises doivent tre laisses comme tant A standardiser . Pour gagner du temps et viter trop de calculs, vous pouvez slectionner une variable continue dj standardise comme variable Standardises .

Options avances Critres de rglage de larborescence CF. Les paramtres dalgorithme de classification suivants sappliquent de faon spcifique larborescence CF et doivent tre modifis avec le plus grand soin : Seuil de modification de distance initiale. Il sagit du seuil initial utilis pour

construire larborescence CF. Si linsertion dune observation dans une feuille de larborescence CF provoque une troitesse infrieure au seuil, la feuille nest pas divise. Si ltroitesse dpasse le seuil, la feuille est divise.
Nombre maximum de branches (par noeud feuille). Nombre maximum de noeuds

enfant quun noeud feuille peut contenir.

531 Analyse TwoStep Cluster

Profondeur maximum de larborescence. Nombre maximum de niveaux que

larborescence CF peut contenir.


Nombre maximal de noeuds. Ceci indique le nombre maximal de noeuds de larbre

CF pouvant tre gnrs par la procdure, daprs la fonction (bd+1 1) / (b 1), b tant le nombre maximal de branches et d, la profondeur maximale de larbre. Notez quune arborescence CF trop volumineuse risque dpuiser les ressources du systme et davoir des effets dfavorables sur les performances de la procdure. Chaque noeud exige au moins 16 octets.
Mettre jour le modle de classe. Ce groupe vous permet dimporter et de mettre

jour un modle de classe gnr dans une analyse prcdente. Le fichier dentre contient larborescence CF au format XML. Le modle est ensuite mis jour avec les donnes du fichier actif. Vous devez slectionner les noms des variables dans la bote de dialogue principale dans le mme ordre que celui dans lequel ils ont t spcifis dans lanalyse prcdente. Le fichier XML demeure inchang, sauf si vous enregistrez les informations du nouveau modle en utilisant le mme nom de fichier. Pour plus d'informations, reportez-vous Rsultats de lanalyse TwoStep Cluster p. 533. Si vous avez indiqu la mise jour dun modle de classe, les options relatives la gnration de larborescence CF spcifies pour le modle dorigine sont utilises. Plus prcisment, les paramtres de mesure de la distance, de gestion du bruit, daffectation de mmoire ou les critres de rglage de larborescence CF pour le modle enregistr sont utiliss et tous les paramtres de ces options dans les botes de dialogue sont ignors. Remarque : Lorsque vous effectuez une mise jour dun modle de classe, la procdure considre quaucune des observations slectionnes dans lensemble de donnes actif na t utilise pour crer le modle de classe dorigine. La procdure considre galement que les observations utilises dans la mise jour du modle sont issues de la mme population dobservations utilise pour crer le modle dorigine. En dautres termes, les moyennes et les variances des variables continues et les niveaux des variables qualitatives sont considrs comme tant identiques dans les deux groupes dobservations. Si votre nouveau groupe dobservations ne provient pas de la mme population que votre ancien groupe, excutez la procdure Analyse du composant Classe TwoStep sur les groupes dobservations combins pour obtenir de meilleurs rsultats.

532 Chapitre 32

Diagrammes de lanalyse TwoStep Cluster


Figure 32-3 Bote de dialogue Diagrammes de lanalyse TwoStep Cluster

Dans le graphique de pourcentage de classe. Fait apparatre les graphiques indiquant

la variation de classe de chaque variable. Pour chaque variable qualitative, un diagramme en btons juxtaposs est produit, indiquant la frquence de modalit par ID de classe. Pour chaque variable continue, un diagramme de variation est produit, indiquant les variations par ID de classe.
Diagramme en secteurs de classe. Fait apparatre un diagramme en secteurs indiquant

le pourcentage et le nombre dobservations dans chaque classe.


Diagramme dimportance des variables. Fait apparatre plusieurs diagrammes diffrents

indiquant limportance de chaque variable dans chaque classe. Le rsultat est tri par ordre dimportance de chaque variable.
Rang des variables. Cette option dtermine si des diagrammes seront crs pour

chaque classe (Par variable) ou pour chaque variable (Par classe).


Mesure de limportance. Cette option vous permet de slectionner la mesure

de limportance des variables reprsenter. Loption Chi-deux ou test T de signification indique une statistique Chi-deux de Pearson comme importance dune variable qualitative et une statistique t comme importance dune variable

533 Analyse TwoStep Cluster

continue. Loption Signification indique 1, moins la valeur p pour le test dgalit des moyennes pour une variable continue et la frquence thorique avec le groupe global des donnes pour une variable qualitative.
Niveau de confiance. Cette option vous permet de dfinir le niveau de confiance

pour le test dgalit de la distribution dune variable dans une classe par rapport la distribution globale de la variable. Indiquez un nombre infrieur 100 et suprieur ou gale 50. Si les diagrammes sont crs par variable ou si la mesure de la signification est reprsente, la valeur du niveau de confiance apparat sous la forme dune ligne verticale dans les diagrammes dimportance des variables.
Omettre les variables non significatives. Les variables non significatives au niveau

de confiance spcifi napparaissent pas dans les diagrammes dimportance des variables.

Rsultats de lanalyse TwoStep Cluster


Figure 32-4 Bote de dialogue des rsultats de lanalyse du composant Classe TwoStep

Statistiques. Ce groupe fournit des options daffichage pour les tableaux des rsultats

de la classification. Les statistiques descriptives et les frquences de classe sont produites pour le modle de classe final alors que le tableau du critre dinformation fait apparatre des rsultats pour une plage de solutions de classe.

534 Chapitre 32

Descriptives par classe. Fait apparatre deux tableaux qui dcrivent les variables

dans chaque classe. Dans un tableau, les moyennes et les carts-types sont indiqus pour les variables continues par classe. Lautre tableau indique les effectifs des variables qualitatives par classe.
Frquences de classe. Fait apparatre un tableau indiquant le nombre

dobservations dans chaque classe.


Critre dinformation (AIC ou BIC). Fait apparatre un tableau contenant les

valeurs dAIC ou de BIC en fonction du critre choisi dans la bote de dialogue principale, pour diffrents nombres de classes. Ce tableau est fourni uniquement lorsque le nombre de classes est dtermin automatiquement. Si le nombre de classes est fixe, ce paramtre est ignor et le tableau nest pas fourni.
Ensemble de donnes actif. Ce groupe vous permet denregistrer des variables dans

lensemble de donnes actif.


Crer une variable dappartenance une classe ; Cette variable contient un numro

didentification de classe pour chaque observation. Le nom de cette variable est tsc_n, n tant un nombre entier positif qui indique lordinal de lopration denregistrement de lensemble de donnes actif effectue par cette procdure au cours dune session.
Fichiers XML. Le modle de classe final et larborescence CF reprsentent deux types de fichiers de rsultats pouvant tre exports au format XML. Exporter le modle final. Le modle de classe final est export vers le fichier

indiqu au format XML (PMML). SmartScore et le serveur de SPSS (produit spar) peuvent utiliser ce fichier de modle pour appliquer les informations du modle dautres fichiers de donnes des fins danalyse.
Exporter larborescence CF. Cette option vous permet denregistrer ltat actuel

de larborescence de classe et de le mettre jour ultrieurement en utilisant des donnes plus rcentes.

Classification hirarchique

33

Chapitre

Cette procdure tente didentifier les classes dobservations (ou de variables) relativement homognes bases sur des caractristiques slectionnes, en utilisant un algorithme qui dbute avec chaque observation (ou variable) dans une classe spare et qui combine les classes jusqu ce quil nen reste quune. Vous pouvez analyser des variables non normes ou vous pouvez choisir parmi un assortiment de transformations standardises. Les mesures de distance ou de similarit sont gnres par la procdure Proximities (Proximits). Les statistiques saffichent chaque tape pour vous aider choisir la meilleure solution.
Exemple : Y a-t-il des classes identifiables de spectacles tlvisuels qui attirent

des audiences similaires lintrieur de chaque classe ? Avec une classification hirarchique, vous pouvez reclasser les spectacles tlvisuels (observations) en classes homognes bases sur les caractristiques du spectateur. Cette mthode peut tre utilise pour identifier des segments des fins commerciales. Vous pouvez aussi classer les villes (observations) en groupes homognes pour permettre la slection de villes comparables afin de tester diverses stratgies commerciales.
Statistiques : Chane des agrgations, matrice de distances (ou des similarits) et classe daffectation pour une seule solution ou un ensemble de solutions. Diagrammes : arbres hirarchiques et Stalactites. Donnes : Les variables peuvent tre des donnes quantitatives, binaires ou deffectif. Lchelle des variables est un lment important : des diffrences dchelle qui peuvent affecter votre (vos) solution(s) en classes hirarchiques. Si vos variables sont dchelles trs diffrentes (par exemple, une variable est mesure en dollars et lautre est mesure en annes), vous devez envisager de les standardiser (ceci peut tre fait automatiquement avec la procdure de la classification hirarchique). Tri par observation. Si des distances ex aequo ou des similitudes se prsentent dans les

donnes de saisie ou entre les classes mises jour au cours de lopration de jointure, la solution de classe qui en rsulte risque de dpendre de lordre des observations dans
535

536 Chapitre 33

le fichier. Vous pouvez obtenir diffrentes solutions pour lesquelles les observations ont t tries de manire alatoire, afin de vrifier la stabilit dune solution donne.
Hypothses : Les mesures de distance ou de similarit utilises doivent convenir aux donnes analyses (Voir la procdure Proximities (proximits) pour plus de renseignements sur le choix des mesures de distances et de similarit). Vous devez aussi inclure toutes les variables appropries dans votre analyse. Lomission de variables influentes peut aboutir une solution errone. Parce que la classification hirarchique est une mthode dexploration, les rsultats doivent tre considrs comme provisoires tant quils ne sont pas confirms avec un chantillon indpendant.
Figure 33-1 Rsultat de classification hirarchique

Classe(s) d'affectation Etiquette Argentina Brazil Chile Domincan R. Indonesia Austria Canada Denmark Italy Japan Norway Switzerland Bangladesh India Bolivia Paraguay 4 3 2 Classes Classes Classes 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 4 4 1 1 1 1 2 2 2 2 2 2 2 3 3 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1

Observation 1

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

537 Classification hirarchique

Stalactite Vertical
16:Paraguay Observation 8:Denmark 12 11:Norway 7:Canada 10:Japan 6:Austria 14:India

5:Indonesia

Nombre De Classes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

X X X X X X X X XX X X X XX X X X X X X X X X X X X X X X X X X X X X X X XX X X X XX X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X XX X X X XX X X X X X X XX X X X XX X X X X X X XX X X X XX X X X X X X XX X X X XX X X X X X X XX X X X XX X X X X X X XX X X X XX X X X X X X XX X X X XX X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X X X X X X X XX X X X X X XX X X X X XX X X X X X XX X X X XX X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

* * * * * * C L A S S I F I C A T I O N H I E R A R C H I Q U E * * * * * *

Arbre hirarchique utilisant la distance moyenne (entre les groupes) Distance redimensionne pour classe combine OBSERVATION 0 5 10 15 20 25 Etiquette Num +---------+---------+---------+---------+---------+ LIFEEXPF BABYMORT LITERACY BIRTH_RT FERTILTY URBAN LOG_GDP POP_INCR B_TO_D DEATH_RT LOG_POP 2 5 3 6 10 1 8 4 9 7 11

Obtenir une classification hirarchique


E A partir des menus, slectionnez : Analyse Classification Classification hirarchique

1:Argentina

15:Bolivia

5 2:Brazil

3:Chile

9:Italy

14

13

10

16

15

11

538 Chapitre 33 Figure 33-2 Bote de dialogue Classification hirarchique

E Si vous classez des observations, slectionnez au moins une variable numrique. Si

vous classez des variables, slectionnez au moins trois variables numriques. Vous avez la possibilit de slectionner une variable didentification pour tiqueter les observations.

539 Classification hirarchique

Mthode de classification hirarchique


Figure 33-3 Bote de dialogue Classification hirarchique : Mthode

Mthode dagrgation : Les choix disponibles sont : la Distance moyenne entre

classes, la Distance moyenne dans les classes, lAgrgation suivant le saut minimum, lAgrgation suivant le diamtre, les Barycentres, la Mdiane et la Mthode de Ward.
Mesure : Il permet de spcifier la mesure de distance ou de similarit devant tre

utilise pour la classification. Slectionnez le type de donnes et la mesure approprie de distance ou de similarit :
Intervalle : Les choix possibles sont la Distance Euclidienne, le Carr de la distance

Euclidienne, le Cosinus, la Corrlation de Pearson, la Distance de Tchebycheff, la Distance de Manhattan (bloc), la Distance de Minkowski, et Autre.
Effectif : Les choix possibles sont la Distance du Chi-deux et la Distance du

phi-deux.
Binaire. Les choix possibles sont la Distance Euclidienne, le Carr de la distance

Euclidienne, lEcart de taille, la Diffrence de motif, la Variance, la Dispersion, la Forme, lIndice de Sokal et Michener, la Corrlation phi ttrachorique, le Lambda, le D dAnderberg, Dice, Hamann, Jaccard, Kulczynski 1, Kulczynski 2,

540 Chapitre 33

Lance et Williams, Ochiai, Rogers et Tanimoto, Russel et Rao, Sokal et Sneath 1, Sokal et Sneath 2, Sokal et Sneath 3, Sokal et Sneath 4, Sokal et Sneath 5, le Y de Yule, et le Q de Yule.
Transformer les valeurs : Vous permet de standardiser les valeurs des donnes pour les

observations ou les valeurs avant le calcul des proximits (non disponible pour les donnes binaires). Les mthodes de standardisation disponibles sont Centrer-rduire, Entre 1 et 1, Entre 0 et 1, Maximum = 1, Moyenne = 1 ou Ecart type = 1.
mesures : Vous permet de transformer les valeurs gnres par la mesure de distance.

Elles sont appliques aprs le calcul de la mesure de distance. Les choix possibles sont Valeurs absolues, Inverser le signe, et Rchelonner entre 0 et 1.

Statistiques de la classification hirarchique


Figure 33-4 Bote de dialogue Classification hirarchique : Statistiques

Chane des agrgations : Affiche les observations ou les classes combines chaque

tape, les distances entre les observations ou les classes en cours de combinaison, et le dernier niveau de classe auquel une observation (ou une variable) a rejoint la classe.
Matrice des distances : Indique les distances ou les similarits entre lments. Classe(s) daffectation : Affiche le groupe auquel chaque observation appartient lors dune ou plusieurs tapes de la combinaison de classes. Les options disponibles sont Une seule partition, Plusieurs partitions ou Aucune.

541 Classification hirarchique

Diagrammes (graphiques) de classification hirarchique


Figure 33-5 Bote de dialogue Classification hirarchique : Graphiques (diagrammes)

Arbre hirarchique : Affiche un arbre hirarchique. Les arbres hirarchiques peuvent tre utiliss pour valuer la cohsion des groupes forms et ils fournissent des renseignements sur le nombre appropri de groupes conserver. Stalactites : Affiche un diagramme en stalactite, incluant toutes les classes ou une classe spcifique. Les diagrammes en stalactite affichent des informations sur la faon dont les observations sont regroupes chaque itration de lanalyse. Orientation vous permet de slectionner un diagramme vertical ou horizontal.

Enregistrement des nouvelles variables de classification hirarchique


Figure 33-6 Bote de dialogue Classification hirarchique : Enregistrer les nouvelles...

542 Chapitre 33

Classe(s) daffectation : Vous permet de sauvegarder les classes daffectation pour une ou plusieurs ou aucune partition(s). Les variables sauvegardes peuvent alors tre utilises pour des analyses ultrieures pour explorer dautres diffrences entre groupes.

Fonctionnalits supplmentaires de la syntaxe de commande CLUSTER


La procdure de classification hirarchique utilise la syntaxe de commande CLUSTER. Le langage de commande SPSS vous permet aussi de : Utiliser plusieurs mthodes de classification dans une seule analyse. Lire et analyser une matrice de proximit. Ecrire une matrice de proximit analyser ultrieurement. Indiquer des valeurs pour la puissance et la racine dans la mesure de distance personnalise (Puissance). Spcifier les noms des variables enregistres. Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Nues dynamiques

34

Chapitre

Cette procdure cherche identifier des groupes dobservations relativement homognes daprs des caractristiques slectionnes, au moyen dun algorithme qui peut traiter de grands nombres dobservations. Lalgorithme vous demande toutefois dindiquer le nombre de classes. Vous pouvez indiquer les centres de classe initiaux si vous connaissez cette information. Vous pouvez choisir entre deux mthodes de classement des observations, soit la mise jour des centres de classe de faon itrative, soit la classification seule. Vous pouvez enregistrer lappartenance une classe, les informations de distance et les centres de classes finaux. Vous pouvez ventuellement indiquer une variable dont les valeurs servent tiqueter les rsultats par observations. Vous pouvez galement demander des statistiques F danalyse de la variance. Bien que ces statistiques soient opportunistes (la procdure cherche former des groupes qui diffrent), la taille relative des statistiques fournit des informations sur la contribution de chaque variable la sparation des groupes.
Exemple. Quels sont les groupes de programmes de tlvision identifiables qui attirent des publics similaires au sein de chaque groupe ? Grce lanalyse des nues dynamiques, vous pouvez classer les programmes de tlvision (observations) en k groupes homognes daprs les caractristiques des tlspectateurs. Cette mthode peut tre utilise pour identifier des segments des fins commerciales. Vous pouvez aussi classer les villes (observations) en groupes homognes pour permettre la slection de villes comparables afin de tester diverses stratgies commerciales. Statistiques. Solution complte : centres de classes initiaux, tableau ANOVA. Chaque observation: information de classe, distance au centre de classe. Donnes. Les variables doivent tre quantitatives au niveau intervalle ou ratio. Si vos variables sont binaires ou sont des effectifs, utilisez la procdure de classification hirarchique.

543

544 Chapitre 34

Ordre des observations et des centres de classe initiaux. Lalgorithme par dfaut permettant de choisir les centres de classe initiaux varie en fonction du tri par observation. Loption Utiliser les nouveaux centres de la bote de dialogue Itrer rend la solution rsultante potentiellement dpendante du tri par observation, quel que soit le mode de slection des centres de classe initiaux. Si vous utilisez lune de ces mthodes, vous pouvez obtenir diffrentes solutions pour lesquelles les observations ont t tries de manire alatoire, afin de vrifier la stabilit dune solution donne. Si vous indiquez les centres de classe initiaux et que vous nutilisez pas loption Utiliser les nouveaux centres, vous vitez tout problme li au tri par observation. Toutefois, le tri des centres de classe initiaux risque daffecter la solution, sil existe des distances ex aequo entre les observations et les centres de classe. Pour valuer la stabilit dune solution donne, vous pouvez comparer les rsultats des analyses pour lesquelles les valeurs des centres initiaux ont t permutes de diffrentes manires. Hypothses. Les distances sont calcules laide de la distance euclidienne simple. Si vous souhaitez utiliser une autre distance ou une mesure de similarit, utilisez la procdure de classification hirarchique. Il est important de prendre en compte la mise lchelle des variables. Si vos variables sont mesures selon des chelles diffrentes (une variable est exprime en dollars par exemple et une autre en annes), vos rsultats risquent dtre errons. Dans ces cas, vous pouvez envisager de standardiser vos variables avant deffectuer lanalyse des nues dynamiques (cela peut tre fait dans la procdure Descriptives). La procdure suppose que vous avez slectionn le nombre voulu de classes et que vous avez inclus toutes les variables pertinentes. Si vous avez choisi un nombre de classes inadquat ou omis de variables importantes, vos rsultats risquent dtre errons.

545 Nues dynamiques Figure 34-1 Rsultats de lanalyse des nues dynamiques
Centres de classes initiaux Classe ZURBAN ZLIFEEXP ZLITERAC ZPOP_INC ZBABYMOR ZBIRTH_R ZDEATH_R ZLOG_GDP ZB_TO_D ZFERTILT ZLOG_POP 1 -1.88606 -3.52581 -2.89320 .93737 4.16813 2.68796 4.41517 -1.99641 -.52182 2.24070 .24626 2 -1.54314 -1.69358 -1.65146 .16291 1.38422 .42699 .63185 -1.78455 -.31333 .75481 2.65246 3 1.45741 .62725 -.51770 3.03701 -.69589 .33278 -1.89037 .53091 4.40082 .46008 -1.29624 4 .55724 .99370 .88601 -1.12785 -.88983 -1.08033 .63185 1.22118 -.99285 -.76793 -.74406

Historique des itrations Changements dans les centres de classes Itration 1 2 3 4 5 6 7 8 9 10 1 1.932 .000 .861 .604 .000 .000 .623 .000 .000 .000 2 2.724 .471 .414 .337 .253 .199 .160 .084 .080 .097 3 3.343 .466 .172 .000 .237 .287 .000 .000 .000 .185 4 1.596 .314 .195 .150 .167 .071 .000 .074 .077 .000

546 Chapitre 34

Centres de classes finaux Classe ZURBAN ZLIFEEXP ZLITERAC ZPOP_INC ZBABYMOR ZBIRTH_R ZDEATH_R ZLOG_GDP ZB_TO_D ZFERTILT ZLOG_POP 1 -1.70745 -2.52826 -2.30833 .59747 2.43210 1.52607 2.10314 -1.77704 -.29856 1.51003 .83475 2 -.30863 -.15939 .13880 .13400 .22286 .12929 -.44640 -.58745 .19154 -.12150 .34577 3 .16816 -.28417 -.81671 1.45301 .25622 1.13716 -.71414 -.16871 1.45251 1.27010 -.49499 4 .62767 .80611 .73368 -.95175 -.80817 -.99285 .31319 .94249 -.84758 -.87669 -.22199

Distances entre les centres de classes finaux 1 Classe 1 2 3 4 5.627 5.640 7.924 2.897 3.249 5.246 2 5.627 3 5.640 2.897 4 7.924 3.249 5.246

547 Nues dynamiques

ANOVA Classe Carr Moyen 10.409 19.410 18.731 18.464 18.621 19.599 13.628 17.599 16.316 18.829 3.907 df 3 3 3 3 3 3 3 3 3 3 3 Erreur Carr Moyen .541 .210 .229 .219 .239 .167 .444 .287 .288 .168 .877 df 68 68 68 68 68 68 68 68 68 68 68 F 19.234 92.614 81.655 84.428 77.859 117.339 30.676 61.313 56.682 112.273 4.457 Sig. .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .006

ZURBAN ZLIFEEXP ZLITERAC ZPOP_INC ZBABYMOR ZBIRTH_R ZDEATH_R ZLOG_GDP ZB_TO_D ZFERTILT ZLOG_POP

Les tests F ne doivent tre utiliss qu' des fins descriptives car les classes sont choisies pour maximiser les diffrences entre les observations des diffrentes classes. Les seuils de signification observs ne sont pas corrigs par la suite et ne peuvent donc pas tre interprts en tant que tests de lhypothse Selon laquelle les moyennes de classe sont gales.

Obtenir une analyse de nues dynamiques


E A partir des menus, slectionnez : Analyse Classification Nues dynamiques

548 Chapitre 34 Figure 34-2 Bote de dialogue Nues dynamiques

E Slectionnez les variables utiliser dans lanalyse. E Spcifiez le nombre de classes. Le nombre de classes doit tre au moins de deux et ne

doit pas tre suprieur au nombre dobservations contenues dans le fichier de donnes.
E Slectionnez soit la mthode Itrer et classer soit la mthode Classer seulement. E Vous avez la possibilit de slectionner une variable didentification pour tiqueter les

observations.

Efficacit de la classification en nues dynamiques


La commande danalyse des nues dynamiques est efficace essentiellement parce quelle ne calcule pas les distances entre toutes les paires dobservations, comme cest le cas dans de nombreux algorithmes de classification, y compris celui utilis par la commande de classification hirarchique de SPSS.

549 Nues dynamiques

Pour plus defficacit, prenez un chantillon dobservations et utilisez la mthode


Itrer et classer pour dterminer les centres de classe. Slectionnez Ecrire les centres finaux dans Fichier. Ensuite, restaurez la totalit du fichier de donnes et slectionnez la mthodeClasser seulement puis slectionnez Lire les fichiers initiaux partir de pour classer tout le fichier en utilisant les centres qui sont estims partir

de lchantillon. Vous pouvez crire et lire depuis un fichier ou un ensemble de donnes. Les ensembles de donnes sont disponibles pour utilisation ultrieure dans la mme session mais ne sont pas enregistrs en tant que fichiers sauf si vous le faites explicitement avant la fin de la session. Les noms des ensembles de donnes doivent tre conformes aux rgles de dnomination de variables SPSS. Pour plus d'informations, reportez-vous Noms de variable dans Chapitre 5 p. 99.

Itration de la classification en nues dynamiques


Figure 34-3 Bote de dialogue Nues dynamiques : Itrer

Remarque : Ces options sont disponibles uniquement si vous avez slectionn la mthode Itrer et classer dans la bote de dialogue Analyse de nues dynamiques.
Maximum des itrations. Limite le nombre des itrations dans lalgorithme des nues dynamiques. Litration sarrte aprs ce nombre ditrations mme si le critre de convergence nest pas satisfait. Ce nombre doit tre compris entre 1 et 999.

Pour reproduire lalgorithme utilis par la commande de classement rapide Quick Cluster dans les versions de SPSS antrieures la version 5.0, indiquez 1 comme Maximum des itrations.
Critre de convergence. Dtermine le moment o litration sarrte. Il reprsente une proportion de la distance minimale entre les centres de classes initiaux et doit donc tre plus grand que 0 mais plus petit que 1. Si le critre est gal 0,02 par exemple, litration cesse lorsquune itration complte ne dplace plus aucun des centres

550 Chapitre 34

dune distance de plus de deux pour cent de la plus petite distance entre nimporte quels centres initiaux.
Utiliser les nouveaux centres. Vous permet de demander la mise jour des centres aprs laffectation de chaque observation. Si vous ne slectionnez pas cette option, les nouveaux centres seront calculs lorsque toutes les observations auront t affectes.

Enregistrement des analyses de classes de nues dynamiques


Figure 34-4 Bote de dialogue Nues dynamiques : Enregistrer les nouvelles variables...

Vous pouvez enregistrer des informations sur la solution relatives aux nouvelles variables utiliser dans les analyses ultrieures :
Classe(s) daffectation. Cre une nouvelle variable indiquant la classe daffectation finale de chaque observation. Les valeurs de la nouvelle variable vont de 1 au nombre de classes. Distance au centre de classe. Cre une nouvelle variable indiquant la distance euclidienne entre chaque nouvelle variable et son centre de classification.

551 Nues dynamiques

Options danalyses des classes de nues dynamiques


Figure 34-5 Bote de dialogue Nues dynamiques : Options

Statistiques. Vous pouvez slectionner les statistiques suivantes : Centres de classes initiaux, Tableau ANOVA, et Affectation et distances au centre. Centres de classe initiaux. Premire estimation des moyennes des variables

de chacune des classes. Par dfaut, le nombre d'observations assez espaces slectionn dans les donnes est gal au nombre de classes. Les centres de classes initiaux sont utiliss pour une premire classification et sont ensuite mis jour.
Tableau ANOVA. Affiche un tableau d'analyse de la variance, incluant les tests

F univaris pour chacune des variables de la classification. Les tests F sont uniquement descriptifs et les probabilits qui en rsultent ne doivent pas tre interprtes. Le tableau ANOVA n'apparat pas si toutes les observations sont affectes une seule classe.
Affectations et distances au centre. Affiche pour chaque observation l'affectation

de classe finale et la distance euclidienne entre l'observation et le centre de classe utilis pour classer l'observation. Affiche galement la distance euclidienne entre les centres de classe finaux.
Valeurs manquantes. Les options disponibles sont Exclure toute observation incomplte

ou Exclure seulement les composantes non valides.


Exclure toute observation incomplte. Exclut de lanalyse les observations qui ont

des valeurs manquantes pour une variable de grappe.


Exclure seulement les composantes non valides. Affecte des observations aux

classes bases sur des distances calcules partir de toutes les variables nayant pas de valeur manquante.

552 Chapitre 34

Fonctionnalits supplmentaires de la commande QUICK CLUSTER


La procdure de nues dynamiques utilise la syntaxe de commande QUICK CLUSTER. Le langage de commande SPSS vous permet aussi de : Accepter les premires observations k comme centres de classes initiaux, vitant ainsi le passage de donnes normalement utilis pour les estimer. Spcifier les centres de classe initiaux directement comme faisant partie de la syntaxe de commande. Spcifier les noms des variables enregistres. Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Tests non paramtriques

35

Chapitre

La procdure de tests non paramtriques propose plusieurs tests qui ne ncessitent pas dhypothse concernant la forme de la distribution sous-jacente.
Test Chi-deux : Tabule une variable en modalits et calcule une statistique Chi-deux base sur les diffrences entre les frquences observes et les frquences attendues. Test binomial : Compare la frquence observe dans chaque modalit dune variable dichotomique avec les frquences attendues de la distribution binomiale. Suites en squence : Teste si lordre doccurrence de deux valeurs dune variable

est alatoire.
Test Kolmogorov-Smirnov pour un chantillon : Compare la fonction de distribution

cumule observe pour une variable avec une distribution thorique spcifie, qui peut tre normale, uniforme, exponentielle ou Poisson.
Tests de deux chantillons indpendants : Compare deux groupes dobservations

dune variable. Le test U de Mann-Whitney, le test de Kolmogorov-Smirnov pour deux chantillons, le test de ractions extrmes Moses et les suites en squences Wald-Wolfowitz sont disponibles.
Tests de deux chantillons lis : Compare les distributions de deux variables. Le test

de Wilcoxon, le test des signes et le test de McNemar sont disponibles.


Tests de plusieurs chantillons indpendants : Compare deux groupes dobservations ou plus dune variable. Le test de Kruskal-Wallis, le test de la mdiane et le test de Jonckheere-Terpstra sont disponibles. Tests de plusieurs chantillons lis : Compare les distributions de deux variables ou plus. Le test de Friedman, le test W de Kendall et le test Q de Cochran sont disponibles.

Les quartiles et la moyenne, lcart-type, le minimum, le maximum, et le nombre dobservations sont disponibles pour tous les tests ci-dessus.
553

554 Chapitre 35

Test du Chi-deux
La procdure de test du Chi-deux tabule une variable en modalits et calcule une statistique Chi-deux. Ce test de qualit de lajustement compare les frquences observes et attendues dans chaque modalit pour vrifier si toutes les modalits contiennent la mme proportion de valeurs ou si chaque modalit contient une proportion de valeurs spcifies par lutilisateur.
Exemples : Le test du Chi-deux peut tre utilis pour dterminer si un sac de bonbons

contient les mmes proportions de bonbons bleus, marrons, verts, oranges, rouges et jaunes. Vous pouvez aussi tester si le sac de bonbons contient 5 % de bonbons bleus, 30 % de bonbons marrons, 10 % de bonbons verts, 20 % bonbons oranges, 15 % de bonbons rouges et 15 % de bonbons jaunes.
Statistiques : Moyenne, cart-type, minimum, maximum, et quartiles. Le nombre et le pourcentage dobservations manquantes et non manquantes, le nombre de cas observs et attendus pour chaque modalit, les rsidus et la statistique du Chi-deux. Donnes : Utilisez des variables qualitatives numriques ordonnes ou dsordonnes

(niveau de mesure ordinal ou nominal). Pour convertir des variables chanes en variables numriques, utilisez la procdure de recodage automatique, disponible dans le menu Transformer.
Hypothses : Les tests non paramtriques ne ncessitent pas dhypothses sur la forme de la distribution sous-jacente. On part du principe que les donnes constituent un chantillon alatoire. Les frquences attendues pour chaque modalit doivent tre au moins gales 1,20 % des modalits au maximum doivent avoir des frquences infrieures 5.

555 Tests non paramtriques Figure 35-1 Rsultat de test du Chi-deux


Couleur du bonbon haricot N N Observ(e)s Thoriques 6 18.8 33 9 17 22 26 113
Tests statistiques Couleur du Bonbon Haricot 27.973 5 .000

Rsidu -12.8 14.2 -9.8 -1.8 3.2 7.2

Bleu Marron Vert Jaune Orange Rouge Total

18.8 18.8 18.8 18.8 18.8

Khi-deux df

Signification Asymptotique

1. 0 cellule. 0 % de frquences faibles. 18,8 frquences faibles thoriques


Couleur du bonbon haricot N N Observ(e)s Thoriques 6 18.8 33 9 17 22 26 113 18.8 18.8 18.8 18.8 18.8 Rsidu -12.8 14.2 -9.8 -1.8 3.2 7.2

Bleu Marron Vert Jaune Orange Rouge Total

556 Chapitre 35
Tests statistiques Couleur du Bonbon Haricot 1.041 5 .959

Khi-deux df

Signification Asymptotique

1. 0 cellule. 0 % de frquences faibles. 5,7 frquences faibles thoriques

Pour obtenir un test Chi-deux


E A partir des menus, slectionnez : Analyse Tests non paramtriques Chi-deux Figure 35-2 Bote de dialogue Test du Chi-deux

E Slectionnez des variables de test. Chaque variable produit un test distinct. E Vous pouvez galement cliquer sur Options pour les statistiques descriptives, les

quartiles et le contrle du traitement des donnes manquantes.

557 Tests non paramtriques

Valeurs et intervalles thoriques du test du Chi-deux


Intervalle thorique. Par dfaut, chaque valeur distincte de la variable est dfinie comme modalit. Pour tablir des modalits dans un intervalle spcifique, slectionnez loption Dans les limites spcifies, et indiquez les valeurs entires pour les limites infrieure et suprieure. Des modalits sont tablies pour chaque valeur entire comprise dans lintervalle, et les observations lextrieur des limites sont exclues. Par exemple, si vous spcifiez une valeur de 1 pour la limite infrieure et une valeur de 4 pour la limite suprieure, seules les valeurs entires comprises entre 1 et 4 sont utilises pour le test du Chi-deux. Valeurs thoriques. Par dfaut, toutes les modalits ont des valeurs thoriques gales. Les modalits peuvent avoir des proportions attendues dfinies par lutilisateur. Slectionnez Valeurs, indiquez une valeur suprieure 0 pour chaque modalit de variable de test et cliquez ensuite sur Ajouter. Chaque fois que vous ajoutez une valeur, celle-ci apparat au bas de la liste des valeurs. Lordre des valeurs est important. Il correspond lordre croissant des valeurs des modalits de la variable de test. La premire valeur de la liste correspond la valeur de groupe la plus basse de la variable de test et la dernire valeur correspond la valeur la plus leve. Les lments de la liste des valeurs sont additionns et chaque valeur est ensuite divise par cette somme pour calculer la proportion dobservations attendues dans la modalit correspondante. Par exemple, une liste de valeurs de 3, 4, 5, 4 indique les proportions attendues de 3/16, 4/16, 5/16 et 4/16.

Test du Chi-deux : Options


Figure 35-3 Bote de dialogue Test du Chi-deux : Options

558 Chapitre 35

Statistiques : Vous pouvez choisir lune des statistiques rcapitulatives, ou bien les

deux.
Caractristique : Affiche la moyenne, lcart-type, le minimum, le maximum, et le

nombre dobservations non manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes. Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.


Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour lune ou lautre variable sont exclues de toutes les analyses.

Fonctionnalits supplmentaires de la commande NPAR TESTS (test du Chi-deux)


Le langage de commande SPSS vous permet aussi de : Spcifier des valeurs minimale et maximale diffrentes, ou des frquences attendues pour diffrentes variables (avec la sous-commande CHISQUARE). Tester la mme variable avec diffrentes frquences attendues ou utiliser diffrentes plages (avec la sous-commande EXPECTED). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Test binomial
La procdure de test binomial compare les frquences observes des deux modalits dune variable dichotomique avec les frquences que lon peut attendre dune distribution binomiale avec un paramtre de probabilit spcifi. Par dfaut, le paramtre de probabilit pour les deux groupes est de 0,5. Pour modifier les probabilits, vous pouvez entrer un test de proportion pour le premier groupe. La probabilit pour le second groupe sera de 1 moins la probabilit spcifie pour le premier groupe.

559 Tests non paramtriques

Exemple : Quand vous lancez une pice, la probabilit de tomber sur le ct face est

de 1/2. Sur la base de cette hypothse, une pice est lance 40 fois, et les rsultats sont enregistrs (pile ou face). Du test binomial, il se peut que vous observiez que les 3/4 des lancements sont tombs sur le ct face et que le seuil de signification observ est bas (0,0027). Ces rsultats indiquent quil est peu probable que la probabilit pour que la pice tombe sur le ct face soit gale 1/2. La pice est probablement truque.
Statistiques : Moyenne, cart-type, minimum, maximum, nombre dobservations avec des valeurs non manquantes et quartiles. Donnes : Les variables testes doivent tre numriques et dichotomiques. Pour

convertir des variables chanes en variables numriques, utilisez la procdure de recodage automatique, disponible dans le menu Transformer. Une variable dichotomique est une variable qui ne peut prendre que deux valeurs possibles : oui ou non, vrai ou faux, 0 ou 1, etc. Si les variables ne sont pas dichotomiques, vous devez spcifier une csure. La csure rpartit les observations dont la valeur est suprieure la csure dans un groupe et le reste des observations dans un autre groupe.
Hypothses : Les tests non paramtriques ne ncessitent pas dhypothses sur la forme

de la distribution sous-jacente. On part du principe que les donnes constituent un chantillon alatoire.
Figure 35-4 Rsultat du test binomial
Test binomial Signification Asymptotique (Bilatrale) .0031

Pice

Groupe 1 Groupe 2 Total

Modalit Face Pile

N 30 10 40

Proportion Observe .75 .25 1.00

Test de Proportion .50

1.

Bas sur l'approximation Z

Pour obtenir un test binomial


E A partir des menus, slectionnez : Analyse Tests non paramtriques Binomial

560 Chapitre 35 Figure 35-5 Bote de dialogue Test binomial

E Slectionnez une ou plusieurs variables numriques tester. E Vous pouvez galement cliquer sur Options pour les statistiques descriptives, les

quartiles et le contrle du traitement des donnes manquantes.

Test binomial : Options


Figure 35-6 Bote de dialogue Test binomial

Statistiques : Vous pouvez choisir lune des statistiques rcapitulatives, ou bien les

deux.

561 Tests non paramtriques

Caractristique : Affiche la moyenne, lcart-type, le minimum, le maximum, et le

nombre dobservations non manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes. Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.


Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour toutes les variables testes sont exclues de toutes les analyses.

Fonctionnalits supplmentaires de la commande NPAR TESTS (Test binomial)


Le langage de commande SPSS vous permet aussi de : Slectionner des groupes spcifiques (et en exclure dautres) lorsquune variable comporte plus de deux modalits (avec la sous-commande BINOMIAL). Spcifier diffrentes csures ou probabilits pour diffrentes variables (avec la sous-commande BINOMIAL). Tester la mme variable avec diffrentes csures ou probabilits (avec la sous-commande EXPECTED). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Suites en squences
La procdure Suites en squences teste si lordre doccurrence de deux valeurs dune variable est alatoire. Une squence est une suite dobservations semblables. Un chantillon comportant trop ou trop peu de squences suggre que lchantillon nest pas alatoire.
Exemples : Supposons que 20 personnes soient sondes pour dterminer si elles achteraient un produit donn. On peut douter que lchantillon soit alatoire si toutes les personnes sont du mme sexe. Les suites en squences peuvent tre utilises pour dterminer si lchantillon a t tir au hasard.

562 Chapitre 35

Statistiques : Moyenne, cart-type, minimum, maximum, nombre dobservations avec des valeurs non manquantes et quartiles. Donnes : Les variables doivent tre numriques. Pour convertir des variables chanes en variables numriques, utilisez la procdure de recodage automatique, disponible dans le menu Transformer. Hypothses : Les tests non paramtriques ne ncessitent pas dhypothses sur la forme de la distribution sous-jacente. Utilisez des chantillons distribution de probabilit continue.
Figure 35-7 Rsultat de Suites en Squences
Suites en squences
Valeur de test 1 Observations < Valeur de test Observations >= Valeur de test Total des observations Nombre de squences Z Signification asymptotique (bilatrale)

Sexe 1.00 7 13 20 15 2.234 .025

1.

Mdiane

Pour obtenir un test de suites


E A partir des menus, slectionnez : Analyse Tests non paramtriques Squences

563 Tests non paramtriques Figure 35-8 Bote de dialogue Suites en squences

E Slectionnez une ou plusieurs variables numriques tester. E Vous pouvez galement cliquer sur Options pour les statistiques descriptives, les

quartiles et le contrle du traitement des donnes manquantes.

Csure des Suites en squences


Csure : Spcifie une csure pour dichotomiser les variables que vous avez choisies.

Vous pouvez utiliser soit la moyenne, la mdiane ou le mode observs, soit une valeur spcifie comme csure. Les observations dont les valeurs sont infrieures la csure sont assignes un groupe et les observations dont les valeurs sont suprieures la csure sont assignes lautre groupe. Un test est ralis pour chaque csure choisie.

564 Chapitre 35

Options des Suites en squences


Figure 35-9 Bote de dialogue Suites en squences : Options

Statistiques : Vous pouvez choisir lune des statistiques rcapitulatives, ou bien les

deux.
Caractristique : Affiche la moyenne, lcart-type, le minimum, le maximum, et le

nombre dobservations non manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes. Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.


Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour lune ou lautre variable sont exclues de toutes les analyses.

Fonctionnalits supplmentaires de la commande NPAR TESTS (Suites en squences)


Le langage de commande SPSS vous permet aussi de : Spcifier diffrentes csures pour diffrentes variables ( laide de la sous-commande RUNS). Tester la mme variable par rapport diffrentes csures personnalises ( laide de la sous-commande RUNS). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

565 Tests non paramtriques

Test Kolmogorov-Smirnov pour un chantillon


Le test de Kolmogorov-Smirnov pour un chantillon compare la fonction de distribution cumule observe dune variable avec une distribution thorique spcifie, qui peut tre normale, uniforme, de Poisson ou exponentielle. Le Z de Kolmogorov-Smirnov est calcul partir de la plus grande diffrence (en valeur absolue) entre les fonctions de distribution cumules observes et thoriques. Le test de qualit de lajustement contrle si les observations peuvent avoir t raisonnablement dduites de la distribution spcifie.
Exemple : La plupart des tests paramtriques ncessitent des variables distribues

normalement. Le test de Kolmogorov-Smirnov pour un chantillon permet de vrifier quune variable (par exemple Revenu) est distribue normalement.
Statistiques : Moyenne, cart-type, minimum, maximum, nombre dobservations avec des valeurs non manquantes et quartiles. Donnes : Utilisez des variables quantitatives (mesure dintervalle ou de rapport). Hypothses : Le test de Kolmogorov-Smirnov part du principe que les paramtres de la distribution tester sont prciss a priori. Cette procdure estime les paramtres partir dun chantillon. Lchantillon de moyenne et lchantillon dcart type sont les paramtres pour une distribution normale. Les valeurs minimum et maximum de lchantillon dfinissent lintervalle de la distribution uniforme, lchantillon de moyenne est le paramtre pour la distribution de Poisson et lchantillon de lcart-type est le paramtre pour la distribution exponentielle. La puissance du test dtecter les abandons de la distribution hypothtique peut tre srieusement diminue. Pour le test dune distribution normale avec des paramtres estims, considrez le test K-S Lilliefors ajust (disponible dans la procdure dexploration).

566 Chapitre 35 Figure 35-10 du test de Kolmogorov-Smirnov pour un chantillon


Test Kolmogorov-Smirnov pour un chantillon Revenu 20 Moyenne Ecart type Diffrences les plus extrmes Absolues Positives Ngatives Z de Kolmogorov-Smirnov Signification asymptotique (bilatrale) 1. Distribution tester normale 2. Calcul partir de donnes 56250.00 45146.40 .170 .170 -.164 .760 .611

N Paramtres gaussiens 1,2

Pour obtenir un test de Kolmogorov-Smirnov pour un chantillon


E A partir des menus, slectionnez : Analyse Tests non paramtriques K-S 1 chantillon

567 Tests non paramtriques Figure 35-11 Bote de dialogue Test de Kolmogorov-Smirnov pour un chantillon

E Slectionnez une ou plusieurs variables numriques tester. Chaque variable produit

un test distinct.
E Vous pouvez galement cliquer sur Options pour les statistiques descriptives, les

quartiles et le contrle du traitement des donnes manquantes.

Options du test de Kolmogorov-Smirnov pour un chantillon


Figure 35-12 Bote de dialogue K-S pour un chantillon : Options

Statistiques : Vous pouvez choisir lune des statistiques rcapitulatives, ou bien les

deux.

568 Chapitre 35

Caractristique : Affiche la moyenne, lcart-type, le minimum, le maximum, et le

nombre dobservations non manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes. Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.


Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour lune ou lautre variable sont exclues de toutes les analyses.

Fonctions supplmentaires de commandes NPAR TESTS (test de Kolmogorov-Smirnov pour un chantillon)


Le langage de commande SPSS vous permet galement de spcifier des paramtres pour la distribution du test (avec la sous-commande K-S). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Tests pour deux chantillons indpendants


La procdure des tests pour deux chantillons indpendants compare deux groupes dobservations en fonction dune variable.
Exemple. De nouveaux appareils dentaires qui sont censs tre plus confortables,

avoir une apparence plus agrable et provoquer des progrs plus rapides pour le redressage des dents ont t dvelopps. Pour savoir si les nouveaux appareils doivent tre ports aussi longtemps que les anciens, 10 enfants sont choisis de faon alatoire pour porter les anciens appareils et 10 autres pour porter les nouveaux appareils. Le test U de Mann-Whitney peut par exemple vous montrer que les sujets portant les nouveaux appareils ne doivent pas les porter aussi longtemps que les sujets utilisant les anciens appareils.
Statistiques. Moyenne, cart-type, minimum, maximum, nombre dobservations avec

des valeurs non manquantes et quartiles. Tests : U de Mann-Whitney, ractions extrmes de Moses, Z de Kolmogorov-Smirnov, suites de Wald-Wolfowitz.
Donnes. Utilisez des variables numriques qui peuvent tre ordonnes.

569 Tests non paramtriques

Hypothses. Utilisez des chantillons indpendants, alatoires. Le test U de

Mann-Whitney exige que les deux chantillons tests soient de forme semblable.
Figure 35-13 Rsultat pour deux chantillons indpendants
Ranks Mean Rank 14.10 6.90 Sum of Ranks 141.00 69.00

N Time Worn in Days Type of Braces Old Braces New Braces Total 10 10 20

Tests statistiques 2 Temps coul en jours U de Mann-Whitney 14.000 W de Wilcoxon Z Signification Asymptotique (Bilatrale) Signification exacte [2*(sig. Unilatrale)] 69.000 -2.721 .007
1

.005

1. Ex quo non corrigs. 2. Critre de regroupement qualitatif numrique : type d'appareil

Pour effectuer les tests pour deux chantillons indpendants


E A partir des menus, slectionnez : Analyse Tests non paramtriques 2 chantillons indpendants

570 Chapitre 35 Figure 35-14 Bote de dialogue Tests pour deux chantillons indpendants

E Slectionnez une ou plusieurs variables numriques. E Slectionnez une variable de regroupement et cliquez sur Dfinir groupes... pour

scinder le fichier en deux groupes ou chantillons.

Types de tests pour deux chantillons indpendants


Type de test. Quatre tests sont disponibles pour tester si deux chantillons (groupes)

proviennent de la mme population. Le test U de Mann-Whitney est le plus populaire des tests pour deux chantillons indpendants. Il quivaut au test de Wilcoxon et au test de Kruskal-Wallis pour deux groupes. Les tests de Mann-Whitney servent vrifier que deux chantillons dune population ont une position quivalente. Les observations des deux groupes sont combines et ordonnes, et il leur est attribu un rang moyen en cas dex aequo. Le nombre dex aequo doit tre petit par rapport au nombre total dobservations. Si les populations ont une position identique, les rangs doivent tre attribus de faon alatoire entre les deux chantillons. Le test calcule le nombre de fois quun rsultat du groupe 1 prcde un rsultat du groupe 2, ainsi que le nombre de fois quun rsultat du groupe 2 prcde un rsultat du groupe 1. La statistique du U de Mann-Whitney est la plus petite de ces deux nombres. La statistique de la somme

571 Tests non paramtriques

de rangs de Wilcoxon W, galement affiche, est la somme des rangs du plus petit chantillon. Si les deux chantillons ont le mme nombre dobservations, W est la somme des rangs du groupe nomm en premier dans la bote de dialogue Dfinition des deux groupes dchantillons indpendants. Le test Z de Kolmogorov-Smirnov et les suites en squences de Wald-Wolfowitz sont des tests plus gnraux qui dtectent les diffrences de position et la forme des distributions. Le test Z de Kolmogorov-Smirnov est bas sur la diffrence absolue maximum entre les fonctions de distribution cumules observes pour les deux chantillons. Lorsque cette diffrence est significative, on considre que les deux distributions sont diffrentes. Le test des suites en squences de Wald-Wolfowitz combine et ordonne les observations des deux groupes. Si les deux chantillons proviennent de la mme population, les deux groupes doivent tre disperss de faon alatoire dans tout le classement. Le test des ractions extrmes de Moses part du principe que la variable exprimentale influence certains sujets dans une direction et dautres sujets dans la direction oppose. Le test vrifie les rponses extrmes par rapport un groupe de contrle. Ce test permet dtudier lintervalle du groupe de contrle et de mesurer quel point les valeurs extrmes du groupe exprimental influencent lamplitude lorsque ce test est associ au groupe de contrle. Le groupe de contrle est dfini par la valeur du groupe 1 dans la bote de dialogue Dfinition des deux groupes dchantillons indpendants. Les observations des deux groupes sont combines et ordonnes. Lintervalle du groupe de contrle se calcule en effectuant la diffrence entre les rangs des valeurs les plus grandes et les plus petites du groupe de contrle plus 1. Puisque des valeurs loignes peuvent occasionnellement et facilement fausser lintervalle damplitude, 5 % des observations de contrle sont filtres automatiquement chaque extrmit.

Dfinition de deux groupes dchantillons indpendants


Figure 35-15 Bote de dialogue Tests pour deux chantillons indpendants : Dfinir groupes

572 Chapitre 35

Pour scinder le fichier en deux groupes ou chantillons, indiquez un nombre entier pour le groupe 1 et une autre valeur pour le groupe 2. Les observations avec dautres valeurs sont exclues de lanalyse.

Tests pour deux chantillons indpendants : Options


Figure 35-16 Bote de dialogue Deux chantillons indpendants : Options

Statistiques. Vous pouvez choisir lune des statistiques rcapitulatives, ou bien les

deux.
Caractristique.Indique la moyenne, lcart-type, le minimum, le maximum, et

le nombre dobservations sans valeurs manquantes.


Quartiles. Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes. Contrle le traitement des valeurs manquantes. Exclure les observations test par test. Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.


Exclure toute observation incomplte. Les observations avec des valeurs

manquantes pour lune ou lautre variable sont exclues de toutes les analyses.

Fonctionnalits supplmentaires de la commande NPAR TESTS (tests pour deux chantillons indpendants)
Le langage de commande SPSS vous permet galement de spcifier le nombre dobservations devant tre filtres pour le test de Moses (avec la sous-commande MOSES).

573 Tests non paramtriques

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Tests pour deux chantillons lis


La procdure des tests pour deux chantillons lis compare les distributions pour deux variables.
Exemple : En gnral, une famille qui vend sa maison peroit-elle le prix demand ?

En appliquant le test de Wilcoxon aux donnes de 10 foyers, vous apprendrez que sept familles peroivent moins que le prix demand, quune famille peroit plus que le prix demand et que deux familles peroivent le prix demand.
Statistiques : Moyenne, cart-type, minimum, maximum, nombre dobservations

avec des valeurs non manquantes et quartiles. Tests : Classement Wilcoxon, Signe, McNemar.
Donnes : Utilisez des variables numriques qui peuvent tre ordonnes. Hypothses : Bien quaucune distribution particulire ne soit suppose pour les deux variables, on part du principe que la distribution de la population des diffrences lies est symtrique.
Figure 35-17 Analyse pour deux chantillons lis
Rangs Rangs Moyen 7 1
1

N Prix demand Rangs - Prix de vente Ngatifs Rangs Positifs Ex aequo Total 1. Prix demand < Prix de vente 2. Prix demand > Prix de vente 3. Prix demand = Prix de vente

Somme des rangs 34.50 1.50

4.93 1.50

23 10

574 Chapitre 35
Tests statistiques
2

Z Signification Asymptotique (Bilatrale)

Prix demand - Prix de vente -2.3131 .021

1. Bas sur les rangs positifs 2. Test de Wilcoxon

Pour obtenir des tests pour deux chantillons lis


E A partir des menus, slectionnez : Analyse Tests non paramtriques 2 chantillons lis Figure 35-18 Bote de dialogue Tests pour deux chantillons lis

575 Tests non paramtriques E Slectionnez des paires de variables de la manire dcrite ci-dessous :

Cliquez sur chacune des deux variables. La premire variable apparat dans le groupe Choix courants comme Variable 1 et la seconde apparat comme Variable 2. Cliquez sur le bouton flch pour dplacer la paire dans la liste Paire(s) tester. Vous pouvez slectionner dautres paires de variables. Pour supprimer une paire de variables de lanalyse, slectionnez une paire dans la liste Paire(s) tester et cliquez sur le bouton flch.

Types de tests pour deux chantillons lis


les tests de cette section comparent les distributions pour deux variables lies. Le test quil convient dutiliser dpend du type de donnes. Si vos donnes sont continues, utilisez le test de Signe ou le test de Wilcoxon. Le test de signe calcule les diffrences entre les deux variables pour toutes les observations, et classe les diffrences comme tant positives, ngatives ou lies. Si les deux variables sont rparties de la mme manire, le nombre de diffrences positives et le nombre de diffrences ngatives ne diffrent pas de faon significative. Le test de Wilcoxon prend en compte les informations relatives au signe des diffrences, ainsi qu lamplitude des diffrences entre paires. Comme le test de Wilcoxon intgre plus de renseignements sur les donnes, il est plus puissant que le test des signes. Si vos donnes sont binaires, utilisez le test de McNemar. Ce test sutilise frquemment lors de situations de mesures rptes, au cours desquelles la rponse du sujet est provoque deux fois, une fois avant quun vnement spcifi se produise et une fois aprs quun vnement spcifi sest produit. Le test de McNemar dtermine si le taux de rponses initial (avant lvnement) est gal au taux de rponse final (aprs lvnement). Ce test est utile pour dtecter les changements dans les rponses dues une intervention exprimentale dans les plans avant et aprs. Si vos donnes sont qualitatives, utilisez le test dHomognit marginale. Ce test est un dveloppement du test de McNemar dune rponse binaire une rponse multinomiale. Il recherche les changements de rponse en utilisant la distribution Chi-deux et permet de dtecter les changements de rponse dus une intervention exprimentale dans les plans avant et aprs. Le test dhomognit marginale nest disponible que si vous avez install les tests exacts SPSS.

576 Chapitre 35

Tests pour deux chantillons lis : Options


Figure 35-19 Bote de dialogue Tests pour deux chantillons lis : Options

Statistiques : Vous pouvez choisir lune des statistiques rcapitulatives, ou bien les

deux.
Caractristique :Indique la moyenne, lcart-type, le minimum, le maximum, et

le nombre dobservations sans valeurs manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes. Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.


Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour lune ou lautre variable sont exclues de toutes les analyses.

Fonctionnalits supplmentaires de la commande NPAR (Deux chantillons lis)


Le langage de commande SPSS vous permet galement de tester une variable avec chaque variable dune liste. Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

577 Tests non paramtriques

Tests pour plusieurs chantillons indpendants


La procdure de Tests pour Plusieurs Echantillons Indpendants compare deux groupes dobservations ou plus sur une variable.
Exemple : Trois marques dampoules 100 watts diffrent-elles par leur dure moyenne

de fonctionnement ? A partir de lanalyse de variance dordre 1 de Kruskal-Wallis, vous apprendrez peut-tre que les trois marques diffrent par leur dure de vie moyenne.
Statistiques : Moyenne, cart-type, minimum, maximum, nombre dobservations avec des valeurs non manquantes et quartiles. Tests : H de Kruskal-Wallis, mdiane. Donnes : Utilisez des variables numriques qui peuvent tre ordonnes. Hypothses : Utilisez des chantillons indpendants, alatoires. Le test du H de Kruskal-Wallis ncessite que les chantillons tests soient de forme similaire.
Figure 35-20 Rsultat des Tests pour plusieurs chantillons indpendants
Rangs Rang Moyen 15.20 25.50 5.80

Heures Marque Marque A Marque B Marque C Total


Tests statistiques 1,2 Heures 25.061 2 .000

N 10 10 10 30

Khi-deux df Signification Asymptotique

1. Test de Kruskal-Wallis 2. Critre de regroupement qualitatif numrique : Marque

578 Chapitre 35

Pour obtenir des tests pour plusieurs chantillons indpendants


E A partir des menus, slectionnez : Analyse Tests non paramtriques K chantillons indpendants Figure 35-21 Bote de dialogue Tests pour plusieurs chantillons indpendants

E Slectionnez une ou plusieurs variables numriques. E Slectionnez une variable de regroupement et cliquez sur Dfinir intervalle pour

spcifier les valeurs entires minimale et maximale pour la variable de regroupement.

Tests pour Plusieurs Echantillons Indpendants : Types de tests


Trois tests permettent de dterminer si plusieurs chantillons indpendants proviennent de la mme population. Le test du H de Kruskal-Wallis, le test de la Mdiane et le test de Jonckheere-Terpstra testent tous si plusieurs chantillons indpendants proviennent de la mme population. Le test H de Kruskal-Wallis, extension du test du U de Mann-Whitney, est lquivalent non paramtrique de lanalyse de variance dordre 1 et dtecte les diffrences dans la position de la distribution. Le test de la mdiane, test plus gnral mais moins puissant, dtecte les diffrences de position et de forme des distributions. Le test du H de Kruskal-Wallis et le test de la mdiane supposent quil nexiste aucun classement a priori des k populations partir desquelles les chantillons sont tirs.

579 Tests non paramtriques

Lorsquil existe un classement naturel a priori (ascendant ou descendant) des k populations, le test de Jonckheere-Terpstra est plus puissant. Par exemple, les k populations peuvent reprsenter k tempratures croissantes. Lhypothse selon laquelle diffrentes tempratures produisent la mme distribution des rponses est teste contre lhypothse alternative selon laquelle laccroissement de temprature fait augmenter la magnitude de la rponse. Ici, lhypothse alternative est ordonne ; le test de Jonckheere-Terpstra est donc le plus appropri. Le test de Jonckheere-Terpstra nest disponible que si vous avez install les Tests Exacts de SPSS.

Tests pour Plusieurs Echantillons Indpendants : Dfinir lIntervalle


Figure 35-22 Bote de dialogue Plusieurs chantillons indpendants : Dfinir lintervalle

Pour dfinir lintervalle, entrez des valeurs entires pour Minimum et Maximum qui correspondent la modalit la plus basse et la plus haute du critre de regroupement. Les observations dont les valeurs se trouvent lextrieur des limites sont exclues. Par exemple, si vous spcifiez une valeur minimale de 1 et une valeur maximale de 3, seules les valeurs entires comprises entre 1 et 3 seront utilises. La valeur minimale doit tre infrieure la valeur maximale, et les deux valeurs doivent tre spcifies.

580 Chapitre 35

Options des Tests pour Plusieurs Echantillons Indpendants


Figure 35-23 Bote de dialogue Plusieurs chantillons indpendants : Options

Statistiques : Vous pouvez choisir lune des statistiques rcapitulatives, ou bien les

deux.
Caractristique :Indique la moyenne, lcart-type, le minimum, le maximum, et

le nombre dobservations sans valeurs manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes. Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.


Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour lune ou lautre variable sont exclues de toutes les analyses.

Fonctionnalits supplmentaires de la commande NPAR TESTS (K chantillons indpendants)


Le langage de commande SPSS vous permet galement de spcifier une valeur diffrente de la mdiane observe pour le test de la mdiane (avec la sous-commande MEDIAN). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

581 Tests non paramtriques

Tests pour plusieurs chantillons lis


La procdure de Tests pour Plusieurs Echantillons Lis compare les distributions de deux variables ou plus.
Exemple : Le public associe-t-il diffrents niveaux de prestige un docteur, un avocat,

un officier de police et un enseignant ? On demande dix personnes de classer ces quatre mtiers par ordre de prestige. Le test de Friedman indique que le public associe effectivement diffrents niveaux de prestige ces quatre professions.
Statistiques : Moyenne, cart-type, minimum, maximum, nombre dobservations avec des valeurs non manquantes et quartiles. Tests : Friedman, W de Kendall et Q de Cochran. Donnes : Utilisez des variables numriques qui peuvent tre ordonnes. Hypothses : Les tests non paramtriques ne ncessitent pas dhypothses sur la forme de la distribution sous-jacente. Utilisez des chantillons dpendants, alatoires.
Figure 35-24 Rsultat des Tests pour Plusieurs Echantillons Lis
Rangs Rang Moyen 1.50 2.50 3.40 2.60

Mdecin Homme de loi Policier Enseignant

Tests statistiques N Khi-deux df Signification asymptotique 1. Test de Friedman

10 10.920 3 .012

582 Chapitre 35

Pour obtenir des tests pour plusieurs chantillons lis


E A partir des menus, slectionnez : Analyse Tests non paramtriques K chantillons lis Figure 35-25 Bote de dialogue Tests pour plusieurs chantillons lis

E Slectionnez deux variables numriques ou plus tester.

Tests pour plusieurs chantillons lis de types de tests


Trois tests sont disponibles pour comparer les distributions de plusieurs variables lies. Le test de Friedman est lquivalent non paramtrique dun plan de mesures rptes sur un chantillon ou dune analyse de variance dordre 2 avec une observation par cellule. Le test de Friedman teste lhypothse nulle selon laquelle k variables lies proviennent de la mme population. Pour chaque observation, les variables k sont classes de 1 k. La statistique de test est base sur ces classements. Le test W de Kendall est une standardisation de la statistique de Friedman. Le test W de Kendall peut tre interprt comme le coefficient de concordance, qui est une mesure de laccord entre les valuateurs. Chaque observation est un juge ou un indicateur, et chaque variable est une personne ou un lment jug. Pour chaque variable, la somme des rangs est calcule. Le W de Kendall se situe entre 0 (pas daccord) et 1 (accord total).

583 Tests non paramtriques

Le Q de Cochran est identique au test de Friedman mais sapplique lorsque toutes les rponses sont binaires. Ce test est une extension du test de McNemar K chantillons. Le Q de Cochran teste lhypothse nulle selon laquelle plusieurs variables dichotomiques lies ont la mme moyenne. Les variables sont mesures sur le mme individu ou sur des individus comparables.

Statistiques des tests pour plusieurs chantillons lis


Figure 35-26 Bote de dialogue Statistiques pour Plusieurs Echantillons Lis

Vous pouvez choisir les statitistiques.


Caractristique :Indique la moyenne, lcart-type, le minimum, le maximum, et

le nombre dobservations sans valeurs manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles.

Fonctionnalits supplmentaires de la commande NPAR TESTS (K chantillons lis)


Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Analyse des rponses multiples

36

Chapitre

Deux procdures sont proposes pour lanalyse des vecteurs comportant plusieurs variables dichotomiques ou plusieurs modalits. La procdure Frquences multirponses affiche les tableaux de frquences. La procdure des Tableaux croiss multirponses affiche des tableaux croiss deux ou trois dimensions. Avant dutiliser lune de ces procdures, vous devez dfinir des vecteurs multirponses.
Exemple : Cet exemple illustre lutilisation des lments multirponses dans une

tude de march. Ces donnes sont fictives et ne doivent pas tre considres comme relles. Une compagnie arienne est parfois amene interroger les passagers dun trajet donn pour valuer la concurrence. Dans cet exemple, American Airlines veut savoir si ses passagers utilisent dautres compagnies ariennes pour couvrir le trajet Chicago-New York et connatre limportance relative des horaires et du service dans le choix dune compagnie arienne. Lhtesse distribue chaque passager un court questionnaire lors de lembarquement. La premire question est la suivante : Entourez toutes les compagnies ariennes par lesquelles vous avez effectu au moins un vol dans les six derniers mois parmi American, United, TWA, USAir et dautres. Il sagit dune question rponses multiples, car le passager peut entourer plus dune rponse. Cependant, cette question ne peut pas tre code directement, parce quune variable SPSS ne peut avoir quune valeur pour chaque cas. Vous devez utiliser plusieurs variables pour mapper les rponses chaque question. Ceci peut tre fait de deux manires. Lune consiste dfinir une variable correspondant chaque choix possible (par exemple, American, United, TWA, USAir et dautres). Si le passager entoure United, le numro de code 1 est affect la variable united, sinon cest le code 0 qui lui est affect. Il sagit de la mthode de codage de variables dichotomie multiple. Lautre mthode permettant de mapper les rponses est la mthode des modalits multiples, o vous devez estimer le nombre maximal de rponses possibles la question et dfinir le mme nombre de variables, avec des codes correspondant la compagnie arienne emprunte. En utilisant un chantillon de questionnaires, vous vous apercevrez peut-tre que personne na emprunt plus de trois compagnies
585

586 Chapitre 36

diffrentes pour ce trajet. Qui plus est, vous vous rendrez compte que, du fait de la drglementation des compagnies ariennes, 10 autres compagnies figurent dans la modalit Autre. A laide de la mthode multirponses, vous pouvez dfinir trois variables, codes comme suit : 1 = american, 2 = united, 3 = twa, 4 = usair, 5 = delta, etc. Si un passager entoure American et TWA, la premire variable porte le code 1, la seconde le code 3, et la troisime un code sans valeur. Un autre passager a peut-tre entour American et ajout Delta. Ainsi, la premire variable porte le code 1, la seconde le code 5, et la troisime un code sans valeur. Si vous utilisez la mthode des dichotomies multiples, dun autre ct, vous finissez par vous retrouver avec 14 variables diffrentes. Les deux mthodes de codage sont possibles dans le cadre de cette enqute. Cependant, votre choix dpendra de la rpartition des rponses.

Dfinition de vecteurs multirponses


La procdure de dfinition de vecteurs multirponses regroupe des variables itemaires dans des vecteurs de dichotomies ou de modalits, pour lesquels vous pouvez obtenir des tableaux de frquences et des tableaux croiss. Vous pouvez dfinir jusqu 20 vecteurs multirponses. Chaque vecteur doit avoir un nom unique. Pour liminer un vecteur, slectionnez-le dans la liste des vecteurs multirponses et cliquez sur Eliminer. Pour modifier un vecteur, slectionnez-le dans la liste, modifiez-en les caractristiques et cliquez sur Changer. Vous pouvez coder vos variables itemaires sous forme de dichotomies ou de modalits. Pour utiliser des variables dichotomiques, slectionnez Variables dichotomiques afin de crer un vecteur de dichotomies multiples. Entrez une valeur entire dans Valeur compte. Chaque variable ayant au moins une occurrence de la valeur compte devient une modalit du vecteur de dichotomies multiples. Slectionnez Modalits pour crer un vecteur de modalits multiples ayant le mme intervalle de valeurs que les variables qui le composent. Entrez des nombres entiers pour le minimum et le maximum de lintervalle des modalits du vecteur de modalits multiples. SPSS totalise chaque valeur entire contenue dans lintervalle pour toutes les variables qui le composent. Les modalits vides ne sont pas tabules. A chaque vecteur multirponses doit tre attribu un nom unique de 7 caractres maximum. La procdure ajoute un signe dollar ($) devant le nom que vous avez attribu. Les noms rservs suivants ne doivent pas tre utiliss : casenum, sysmis, jdate, date, time, length et width. Le nom du vecteur multirponses doit uniquement tre utilis dans les procdures multirponses. Vous ne pouvez pas faire rfrence aux noms des vecteurs multirponses dans les autres procdures. A titre facultatif,

587 Analyse des rponses multiples

vous pouvez entrer une tiquette de variable dcrivant le vecteur multirponses. Cette tiquette peut comporter jusqu 40 caractres.
Dfinir des vecteurs de rponses multiples
E A partir des menus, slectionnez : Analyse Rponses multiples Dfinir des groupes Figure 36-1 Bote de dialogue Dfinition des vecteurs multirponses

E Slectionnez deux ou plusieurs variables. E Si vos variables sont codes comme dichotomies, indiquez la valeur que vous

souhaitez calculer. Si elles sont codes comme modalits, dfinissez leur intervalle.
E Entrez un nom unique pour chaque vecteur multirponses. E Cliquez sur Ajouter pour ajouter les vecteurs multirponses la liste des vecteurs

dfinis.

588 Chapitre 36

Tableaux de frquences des rponses multiples


La procdure Frquences multirponses produit des tableaux de frquences pour les vecteurs multirponses. Vous devez dabord dfinir un ou plusieurs vecteurs multirponses (voir Dfinir les vecteurs multirponses ). Pour les vecteurs de dichotomies multiples, les noms de modalit apparaissant dans le rsultat proviennent dtiquettes de variable dfinies pour les variables itemaires du groupe. Si les tiquettes de variable ne sont pas dfinies, les noms de variables servent dtiquettes. Pour les vecteurs de modalits multiples, les tiquettes des modalits proviennent des tiquettes de valeurs de la premire variable du groupe. Si les modalits manquantes de la premire variable sont prsentes pour dautres variables du groupe, dfinissez une tiquette de valeurs pour les modalits manquantes.
Valeurs manquantes : Les cas de valeurs manquantes sont exclus tableau par tableau.

Vous pouvez donc choisir lune ou les deux solutions suivantes :


Exclure les observations ayant une information incomplte lintrieur des dichotomies : Ceci permet dexclure les observations ayant des valeurs

manquantes pour toute variable issue du tableau crois du vecteur de dichotomies multiples. Ceci sapplique seulement aux vecteurs multirponses dfinis comme vecteurs de dichotomies. Par dfaut, une observation est considre manquante pour un vecteur de dichotomies multiples si aucune de ses variables composantes ne contient de valeur compte. Les cas de valeurs manquantes pour certaines variables, mais pas toutes, sont inclus dans les tabulations du groupe si au moins une variable contient la valeur compte.
Exclure toute observation ayant une information incomplte lintrieur des modalits : Cela permet dexclure les observations ayant des valeurs manquantes

pour toute variable provenant du tableau crois du vecteur des modalits multiples. Ceci sapplique seulement aux vecteurs multirponses dfinis comme des vecteurs de modalits. Par dfaut, une observation est considre manquante pour un vecteur de modalits multiples si aucune de ses composantes na de valeurs valides lintrieur de lintervalle dfini.
Exemple : Chaque variable cre partir dune question de lenqute est une variable

lmentaire. Pour analyser un lment multirponses, vous devez combiner les variables dans lun des deux types de vecteurs multirponses : vecteur de modalits multiples ou vecteur de dichotomies multiples. Par exemple, si dans une enqute, une compagnie arienne vous demande la compagnie (American Airlines, United Airlines ou TWA) que vous avez emprunte au cours des six derniers mois, si vous utilisez des

589 Analyse des rponses multiples

variables dichotomiques et avez dfini un vecteur de dichotomies multiples, chacune des trois variables du vecteur devient une modalit de la variable de regroupement. Les effectifs et les pourcentages correspondant aux trois compagnies ariennes saffichent dans un tableau de frquences. Si vous dcouvrez quaucun des rpondants na mentionn plus de deux compagnies, vous pouvez crer deux variables, chacune ayant trois codes, un par compagnie arienne. Si vous dfinissez un vecteur de modalits multiples, les valeurs sont tabules et les mmes codes sont ajouts dans toutes les variables lmentaires. Le vecteur de valeurs rsultant est le mme que pour chacune des variables itemaires. Par exemple, 30 rponses pour United reprsentent la somme des cinq rponses United pour la compagnie arienne 1 et des 25 rponses United pour la compagnie 2. Les effectifs et les pourcentages correspondant aux trois compagnies ariennes saffichent dans un tableau de frquences.
Statistiques : Tableaux de frquences contenant des effectifs, des pourcentages de

rponses, des pourcentages de cas, le nombre de cas valables, et le nombre de cas manquants.
Donnes : Utilisez des vecteurs multirponses. Hypothses : Les effectifs et pourcentages reprsentent une description utile des donnes de nimporte quelle distribution. Procdures apparentes : La procdure Dfinir Vecteurs multirponses vous permet

de dfinir des vecteurs multirponses.


Figure 36-2 Rsultat de la mthode des frquences de rponses multiples

Pour obtenir des tableaux de frquences de rponses multiples


E A partir des menus, slectionnez : Analyse Rponses multiples Effectifs

590 Chapitre 36 Figure 36-3 Bote de dialogue Frquences de rponses multiples

E Slectionnez un ou plusieurs vecteurs multirponses.

Tableaux croiss des rponses multiples


La procdure Tableaux croiss de rponses multiples classe, par tableaux croiss, des vecteurs multirponses dfinis, des variables itemaires ou une combinaison. Vous pouvez galement obtenir des pourcentages de cellules bass sur des observations ou des rponses, modifier la gestion des valeurs manquantes ou obtenir des tableaux croiss apparis. Vous devez dabord dfinir un ou plusieurs vecteurs multirponses (veuillez consulter Pour Dfinir des vecteurs multirponses ). Pour les vecteurs de dichotomies multiples, les noms de modalit apparaissant dans le rsultat proviennent dtiquettes de variable dfinies pour les variables itemaires du groupe. Si les tiquettes de variable ne sont pas dfinies, les noms de variables servent dtiquettes. Pour les vecteurs de modalits multiples, les tiquettes des modalits proviennent des tiquettes de valeurs de la premire variable du groupe. Si les modalits manquantes de la premire variable sont prsentes pour dautres variables du groupe, dfinissez une tiquette de valeurs pour les modalits manquantes. SPSS affiche les tiquettes de modalit des colonnes sur trois lignes, avec jusqu huit caractres par ligne. Pour viter de scinder les mots, vous pouvez inverser les lments lignes et les lments colonnes ou redfinir les tiquettes.

591 Analyse des rponses multiples

Exemple. Les vecteurs de dichotomies multiples et les vecteurs de modalits multiples

peuvent tre croiss avec dautres variables dans cette procdure. Dans le cadre dune enqute mene auprs de passagers de compagnies ariennes, voici ce qui leur a t demand : Parmi les compagnies ariennes suivantes, entourez toutes celles avec lesquelles vous avez voyag au moins une fois durant les six derniers mois (American, United, TWA). Est-il plus important de privilgier lhoraire ou le service ? Choisissez une seule rponse. Aprs avoir saisi les donnes en tant que dichotomies ou modalits multiples, et aprs les avoir combines dans un vecteur, vous pouvez croiser les choix de compagnie arienne dclars avec la question relative au service ou aux horaires.
Statistiques. Tableau crois avec cellule, ligne, colonne, et effectif total, et avec les pourcentages ligne, colonne, et effectif total. Les pourcentages cellule peuvent tre bass sur les observations ou les rponses. Donnes. Utilisez des vecteurs multirponses ou des variables qualitatives numriques. Hypothses. Les effectifs et pourcentages offrent une description utile des donnes qui

suivent tout type de distribution.


Procdures apparentes. La procdure Dfinir Vecteurs multirponses vous permet

de dfinir des vecteurs multirponses.


Figure 36-4 Rsultat Tableaux croiss de rponses multiples

Pour obtenir des tableaux croiss des rponses multiples


E A partir des menus, slectionnez : Analyse Rponses multiples Tableaux croiss

592 Chapitre 36 Figure 36-5 Bote de dialogue Tableaux Croiss de rponses multiples

E Slectionnez une ou plusieurs variables numriques ou vecteurs multirponses pour

chaque dimension de tableau crois.


E Dfinissez lintervalle de chaque variable itemaire.

Sinon, vous pouvez obtenir un tableau crois bilatral pour chaque modalit de variable de contrle ou chaque vecteur multirponses. Slectionnez un ou plusieurs lments pour la liste de strate(s).

Dfinir Intervalles Tableaux croiss De rponses multiples


Figure 36-6 Dfinir bote de dialogue Intervalle Variables Tableaux croiss de rponses multiples

Les intervalles des valeurs doivent tre dfinis pour toute variable itemaire de tableaux croiss. Entrez les valeurs entires de modalits minimum et maximum que vous souhaitez tabuler. Les modalits se situant en dehors de lintervalle sont exclues de

593 Analyse des rponses multiples

lanalyse. Les valeurs se situant lintrieur de lintervalle inclusif sont supposes tre des nombres entiers (les nombres non entiers sont tronqus).

Options Tableaux croiss de rponses multiples


Figure 36-7 Bote de dialogue Options Tableaux croiss de rponses multiples

Pourcentages de cellule. Les effectifs des cellules sont toujours affichs. Vous pouvez choisir dafficher les pourcentages lignes, les pourcentages colonnes, et les pourcentages tableau bilatral (total). Pourcentages bass sur. Vous pouvez baser les pourcentages cellules sur les

observations (ou rpondants). Ceci nest pas possible si vous slectionnez la fonction qui permet dapparier les variables entre les vecteurs de modalits multiples. Vous pouvez aussi baser les pourcentages cellules sur les rponses. Pour les vecteurs de dichotomies multiples, le nombre de rponses est gal au nombre de valeurs comptes travers les observations. Pour les vecteurs de modalits multiples, le nombre de rponses correspond au nombre de valeurs comprises dans lintervalle dfini.
Valeurs manquantes. Vous avez le choix entre les deux options suivantes : Exclure les observations ayant une information incomplte lintrieur des dichotomies. Ceci permet dexclure les observations ayant des valeurs manquantes

pour toute variable issue du tableau crois du vecteur de dichotomies multiples. Ceci sapplique seulement aux vecteurs multirponses dfinis comme vecteurs de dichotomies. Par dfaut, une observation est considre manquante pour un vecteur de dichotomies multiples si aucune de ses variables composantes ne contient de valeur compte. Les observations ayant des valeurs manquantes pour

594 Chapitre 36

certaines, mais pas toutes, les variables sont incluses dans les tableaux croiss du groupe si au moins une variable contient la valeur compte.
Exclure toute observation ayant une information incomplte lintrieur des modalits. Cela permet dexclure les observations ayant des valeurs manquantes

pour toute variable provenant du tableau crois du vecteur des modalits multiples. Ceci sapplique seulement aux vecteurs multirponses dfinis comme des vecteurs de modalits. Par dfaut, une observation est considre manquante pour un vecteur de modalits multiples si aucune de ses composantes na de valeurs valides lintrieur de lintervalle dfini. Par dfaut, lorsque vous croisez deux vecteurs de modalits multiples, SPSS tabule chaque variable du premier groupe avec chaque variable du second groupe et additionne les effectifs de chaque cellule. Par consquent, certaines rponses peuvent apparatre plus dune fois dans un tableau. Vous pouvez choisir loption suivante :
Apparier les variables entre les vecteurs rponses. Cela permet dapparier la premire variable du premier groupe avec la premire variable du second groupe, etc. Si vous slectionnez cette option, SPSS base les pourcentages cellules sur les rponses plutt que sur les rpondants. On ne peut apparier les vecteurs de dichotomies multiples ou les variables itemaires.

Fonctionnalits supplmentaires de la commande MULT RESPONSE


Le langage de commande SPSS vous permet aussi de : Obtenir des tableaux croiss ayant jusqu cinq dimensions (avec la sous-commande BY). Modifier les options de formatage du rsultat, y compris la suppression des tiquettes de valeurs (avec la sous-commande FORMAT). Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Tableaux de Rsultats

37

Chapitre

Les listes dobservations et les statistiques descriptives sont des outils de base permettant dtudier et de prsenter des donnes. Vous pouvez obtenir les listes dobservations laide de lditeur de Donnes ou de la procdure Rcapituler, les effectifs de frquence et les statistiques descriptives laide de la procdure Frquences, et les statistiques de sous-population laide de la procdure Moyennes. Chacune de ces procdures utilise un format destin rendre les informations claires. Si vous souhaitez afficher les informations dans un format diffrent, les procdures Tableaux de bord en lignes et Tableaux de bord en colonnes vous permettent de contrler la prsentation des donnes.

Tableaux de bord en lignes


Tableaux de bord en lignes produit des tableaux de bord dans lesquels diffrentes statistiques rcapitulatives sont disposes en lignes. Les listes dobservations sont galement disponibles, avec ou sans statistiques rcapitulatives.
Exemple. Une socit possdant une chane de magasins conserve des dossiers sur les employs comprenant le salaire, lanciennet, le magasin et le service o chaque employ travaille. Vous pourriez gnrer un tableau de bord fournissant les informations individuelles sur les employs (liste) divises par magasin et par division (critres dagrgation), avec les statistiques rcapitulatives (par exemple, salaire moyen) pour chaque magasin, division et par division dans chaque magasin. Variables en colonnes. Donne la liste des variables de tableau pour lesquelles vous voulez obtenir des listes dobservations ou des statistiques rcapitulatives, et contrle le format daffichage des Variables en colonnes. Variables de ventilation. Donne la liste des critres dagrgation optionnels qui

divisent le tableau de bord en groupes et contrle les statistiques rcapitulatives et les formats daffichage des colonnes de ventilation. Pour les critres dagrgation
595

596 Chapitre 37

multiples, il y aura un groupe spar pour chaque modalit de chaque critre dagrgation lintrieur des modalits du critre dagrgation prcdent dans la liste. Les critres dagrgation doivent tre des variables qualitatives discrtes qui divisent les observations en un nombre limit de modalits significatives. Les valeurs individuelles de chaque critre dagrgation apparaissent, tries, dans une colonne spare gauche des Variables en colonnes.
Tableau de bord. Contrle les caractristiques globales du tableau de bord, y compris les statistiques rcapitulatives globales, laffichage des valeurs manquantes, la numrotation des pages et les titres. Afficher les observations. Affiche les valeurs relles (ou les tiquettes de valeurs) des

variables de Variables en colonnes pour chaque observation. La liste produite peut tre nettement plus longue quun tableau de bord.
Aperu. Naffiche que la premire page du tableau de bord. Cette option est utile pour

avoir un aperu du format de votre tableau sans traiter le tableau entier.


Les donnes sont dj tries. Pour les rapports avec critres dagrgation, le fichier de

donnes doit tre tri par valeur des critres dagrgation avant de gnrer le tableau de bord. Si votre fichier de donnes est dj tri par valeur des critres dagrgation, vous pouvez gagner du temps de traitement en slectionnant cette option. Cette option est particulirement utile aprs avoir vu un aperu du tableau.

597 Tableaux de Rsultats

Echantillon de rsultat
Figure 37-1 Tableau de bord combin avec listes dobservations et statistiques rcapitulatives

Pour obtenir un rapport rcapitulatif : Rcapitulatifs en lignes


E A partir des menus, slectionnez : Analyse Rapports Tableaux de bord en lignes

598 Chapitre 37 E Slectionnez une ou plusieurs variables pour les variables en colonnes. Une colonne

est gnre dans le tableau de bord pour chaque variable slectionne.


E Pour les tableaux tris et affichs par sous-groupe, slectionnez une ou plusieurs

variables pour les critres dagrgation.


E Pour les tableaux avec statistiques rcapitulatives de sous-groupe dfinies par des

critres dagrgation, slectionnez le critre dagrgation dans la liste et cliquez sur Tableau rcapitulatif dans le groupe Variables de ventilation pour spcifier les mesures rcapitulatives.
E Pour les tableaux avec statistiques rcapitulatives globales, cliquez sur Fonction dans

le groupe Tableau pour spcifier les mesures rcapitulatives.


Figure 37-2 Bote de dialogue Tableaux de bord en lignes

Format des Colonnes de donnes/Ventilations des Tableaux de bord


Les botes de dialogue Format contrlent les titres et largeurs des colonnes, lalignement du texte et laffichage des valeurs de donnes ou des tiquettes de valeurs. Format colonne de donnes contrle le format des Variables en colonnes du

599 Tableaux de Rsultats

ct droit de la page du tableau de bord. Format colonne de ventilation contrle le format des Colonnes de ventilation du ct gauche.
Figure 37-3 Bote de dialogue Tableau de bord : Format colonne de donnes

Titre de la colonne. Pour la variable slectionne, contrle le titre de la colonne. Les

titres longs sont automatiquement ajusts dans la colonne. Utilisez la touche Entre pour insrer manuellement des sauts de lignes aux endroits o vous voulez ajuster les titres.
Position des valeurs dans la colonne. Pour la variable slectionne, contrle

lalignement des valeurs de donnes ou des tiquettes de donnes dans la colonne. Lalignement des valeurs ou des tiquettes naffecte pas lalignement des titres de colonnes. Vous pouvez soit indenter le contenu de la colonne dun nombre de caractres donn, soit centrer le contenu de la colonne.
Contenu de la colonne. Pour la variable slectionne, contrle laffichage soit des valeurs de donnes, soit des tiquettes de valeurs dfinies. Les valeurs de donnes sont affiches pour toutes les valeurs qui ne possdent pas dtiquette de valeur dfinie. (Non disponible pour les Variables en colonnes dans les Tableaux de bord en colonnes)

600 Chapitre 37

Fonctions rcapitulatives des Tableaux pour/Fonctions rcapitulatives Finales


Les deux botes de dialogue Fonctions rcapitulatives contrlent laffichage des statistiques rcapitulatives pour les agrgats et pour lensemble du tableau de bord. Loption Fonctions rcapitulatives contrle les statistiques de sous-groupe pour chaque modalit dfinie par les critres dagrgation. Fonctions rcapitulatives Finales contrle les statistiques globales affiches la fin du tableau de bord.
Figure 37-4 Bote de dialogue Tableau de bord : Fonction rcapitulative

Les statistiques rcapitulatives disponibles sont la somme des valeurs, la moyenne des valeurs, la valeur minimale, la valeur maximale, le nombre dobservations, le pourcentage dobservations situes au-dessus ou en dessous dune valeur spcifie, le pourcentage dobservations comprises lintrieur dun intervalle donn de valeurs, lcart-type, laplatissement, la variance et lasymtrie.

Options de Ventilation de Tableau de Bord


Options de Ventilation contrle lespacement et la pagination des informations de modalit de ventilation.

601 Tableaux de Rsultats Figure 37-5 Bote de dialogue Options de Ventilation des Tableaux de bord

Gestion des pages. Contrle lespacement et la pagination des modalits du critre dagrgation slectionn. Vous pouvez spcifier un nombre de lignes vides entre les modalits de ventilation ou commencer chaque modalit de ventilation sur une nouvelle page. Lignes sauter avant fonctions lmentaires. Contrle le nombre de lignes vides

entre les tiquettes ou les donnes des modalits de ventilation et les statistiques rcapitulatives. Cette option est particulirement utile pour les tableaux de bords combins incluant des listes dobservations individuelles et des statistiques rcapitulatives pour les modalits de ventilation ; dans ces tableaux, vous pouvez insrer des espaces entre les listes dobservations et les statistiques rcapitulatives.

Options du Tableau de bord


Options du Tableau de bord contrle le traitement et laffichage des valeurs manquantes et la numrotation des pages du tableau de bord.
Figure 37-6 Bote de dialogue Tableau de bord : Options colonne de ventilation ...

602 Chapitre 37

Exclure les observations avec des valeurs manquantes. Elimine (du tableau de bord) toute observation avec des valeurs manquantes pour lune des variables du tableau de bord. Reprsentation des valeurs manquantes. Vous permet de spcifier le symbole reprsentant les valeurs manquantes dans le fichier de donnes. Ce symbole ne peut comporter quun caractre et sert reprsenter les valeurs manquantes par dfaut et valeur utilisateur manquante . Paginer partir de. Vous permet de spcifier un numro pour la premire page du

tableau de bord.

Prsentation du Tableau de bord


Prsentation du Tableau de bord contrle la largeur et la longueur de chaque page du tableau de bord, lemplacement du tableau sur la page et linsertion de lignes vides et dtiquettes.
Figure 37-7 Bote de dialogue Tableau : Prsentation

603 Tableaux de Rsultats

Mise en page. Contrle les marges de page exprimes en lignes (haut et bas) et en

caractres (gauche et droite), et reporte lalignement lintrieur des marges.


Titres et bas de page. Contrle le nombre de lignes sparant les titres et les pieds de page du corps du tableau de bord. Variables de ventilation. Contrle laffichage des colonnes de ventilation. Si des

critres dagrgation multiples sont spcifis, ils peuvent tre affichs en colonnes spares ou dans la premire colonne. Placer tous les critres dagrgation dans la premire colonne produit un tableau de bord plus troit.
Titres des colonnes. Contrle laffichage des titres de colonnes, y compris le

soulignement des titres, lespacement entre les titres et le corps du tableau, et lalignement vertical des titres de colonnes.
Lignes de variables en colonnes et tiquettes de ventilation. Contrle lemplacement

des informations de Variables en colonnes (valeurs de donnes et/ou statistiques rcapitulatives) par rapport aux tiquettes de ventilation au dbut de chaque modalit de ventilation. La premire ligne des informations de Variables en colonnes peut commencer soit sur la mme ligne que ltiquette de modalit de ventilation, soit un nombre donn de lignes aprs cette tiquette. (Non disponible pour les Tableaux de bord en colonnes)

Titres du Tableau de bord


Titres du Tableau de bord contrle le contenu et lemplacement des titres et pieds de page du tableau de bord. Vous pouvez spcifier jusqu dix lignes de titre et jusqu dix lignes de pieds de page, avec des composants justifis gauche, centrs et justifis droite sur chaque ligne.

604 Chapitre 37 Figure 37-8 Bote de dialogue Tableau : Titres

Si vous insrez des variables dans les titres ou les pieds de page, ltiquette de valeur actuelle ou la valeur de la variable est affiche dans le titre ou le pied de page. Dans les titres, ltiquette de valeur correspondant la valeur de la variable au dbut de la page est affiche. Dans les pieds de page, ltiquette de valeur correspondant la valeur de la variable la fin de la page est affiche. Sil ny a aucune tiquette de valeur, la valeur relle est affiche.
Variables spciales. Les variables spciales DATE et PAGE vous permettent dinsrer

la date actuelle ou le numro de page dans lune des lignes dun en-tte ou dun pied de page. Si votre fichier de donnes contient des variables nommes DATE ou PAGE, vous ne pouvez pas utiliser ces variables dans les titres ou les pieds de page des tableaux.

Tableaux de bord en colonnes


Tableaux de bord en colonnes produit des tableaux de bord dans lesquels diffrentes statistiques rcapitulatives apparaissent en colonnes spares.

605 Tableaux de Rsultats

Exemple. Une socit possdant une chane de magasins conserve des dossiers sur

les employs comprenant le salaire, lanciennet et le service o chaque employ travaille. Vous pourriez gnrer un tableau de bord fournissant des statistiques rcapitulatives sur les salaires (par exemple moyenne, minimum, maximum) pour chaque division.
Variables en colonnes. Fournit la liste des variables du tableau de bord pour lesquelles vous voulez des statistiques rcapitulatives et contrle le format daffichage et les statistiques rcapitulatives affiches pour chaque variable. Variables de ventilation. Fournit la liste des critres dagrgation optionnels qui divisent le tableau de bord en groupes et contrle les formats daffichage des colonnes de ventilation. Pour les critres dagrgation multiples, il y aura un groupe spar pour chaque modalit de chaque critre dagrgation lintrieur des modalits du critre dagrgation prcdent dans la liste. Les critres dagrgation doivent tre des variables qualitatives discrtes qui divisent les observations en un nombre limit de modalits significatives. Tableau de bord. Contrle les caractristiques globales du tableau de bord, y compris laffichage des valeurs manquantes, la numrotation des pages et les titres. Aperu. Naffiche que la premire page du tableau de bord. Cette option est utile pour

avoir un aperu du format de votre tableau sans traiter le tableau entier.


Les donnes sont dj tries. Pour les rapports avec critres dagrgation, le fichier de donnes doit tre tri par valeur des critres dagrgation avant de gnrer le tableau de bord. Si votre fichier de donnes est dj tri par valeur des critres dagrgation, vous pouvez gagner du temps de traitement en slectionnant cette option. Cette option est particulirement utile aprs avoir vu un aperu du tableau.

606 Chapitre 37

Echantillon de rsultat
Figure 37-9 Tableau de bord avec statistiques rcapitulatives en colonnes

Pour obtenir un rapport rcapitulatif : Rcapitulatifs en colonnes


E A partir des menus, slectionnez : Analyse Rapports Tableaux de bord en colonnes E Slectionnez une ou plusieurs variables pour les variables en colonnes. Une colonne

est gnre dans le tableau de bord pour chaque variable slectionne.


E Pour modifier la mesure rcapitulative dune variable, slectionnez la variable dans la liste Variables en colonnes et cliquez sur Fonction. E Pour obtenir plus dune mesure rcapitulative pour une variable, slectionnez la

variable dans la liste source et dplacez-la dans la liste Variables en colonnes plusieurs fois, une fois pour chaque mesure rcapitulative que vous souhaitez.
E Pour afficher une colonne contenant la somme, la moyenne, le rapport ou une autre fonction de colonnes existantes, cliquez sur Insrer le total. Une variable appele total

est alors place dans la liste Variables en colonnes.


E Pour les tableaux tris et affichs par sous-groupe, slectionnez une ou plusieurs

variables pour les critres dagrgation.

607 Tableaux de Rsultats Figure 37-10 Bote de dialogue Tableaux de bord en colonnes

Fonction rcapitulative des Colonnes de donnes


Fonctions rcapitulatives contrle les statistiques rcapitulatives affiches pour la variable de colonne de donnes slectionne.

608 Chapitre 37 Figure 37-11 Bote de dialogue Tableau de bord : Fonction rcapitulative

Les statistiques rcapitulatives disponibles sont la somme des valeurs, la moyenne des valeurs, la valeur minimale, la valeur maximale, le nombre dobservations, le pourcentage dobservations situes au-dessus ou en dessous dune valeur spcifie, le pourcentage dobservations comprises lintrieur dun intervalle donn de valeurs, lcart-type, laplatissement, la variance et lasymtrie.

Fonction lmentaire des Colonnes de Donnes pour colonne de total


Variables rcapituler contrle les statistiques rcapitulatives totales qui rcapitulent deux ou plusieurs Variables en colonnes. Les statistiques rcapitulatives totales sont la somme des colonnes, la moyenne des colonnes, le minimum, le maximum, la diffrence entre les valeurs de deux colonnes, le quotient des valeurs dune colonne divises par les valeurs dune autre colonne et le produit des valeurs de colonnes multiplies.

609 Tableaux de Rsultats Figure 37-12 Bote de dialogue Tableau de bord : Colonnes

Somme des colonnes. La colonne total reprsente la somme des colonnes de la liste

Variables rcapituler.
Moyenne des colonnes. La colonne total reprsente la moyenne des colonnes de la liste Variables rcapituler. Minimum des colonnes. La colonne total reprsente la somme minimale des colonnes

de la liste Variables rcapituler.


Maximum des colonnes. La colonne total reprsente la somme maximale des colonnes

de la liste Variables rcapituler.


1re colonne 2me colonne. La colonne total reprsente la diffrence des colonnes de la liste Variables rcapituler. La liste Variables rcapituler doit contenir exactement deux colonnes. 1re colonne / 2me colonne. La colonne total reprsente le quotient des colonnes de la

liste Variables rcapituler. La liste Variables rcapituler doit contenir exactement deux colonnes.
% 1re colonne / 2me colonne. La colonne total reprsente le pourcentage de la

premire colonne par rapport la seconde colonne de la liste Variables rcapituler. La liste Variables rcapituler doit contenir exactement deux colonnes.
Produit des colonnes. La colonne total reprsente le produit des colonnes de la liste

Variables rcapituler.

610 Chapitre 37

Format des Colonnes du Tableau de bord


Les options de format des Variables en colonnes et de ventilation pour les Tableaux de bord en colonnes sont identiques celles dcrites pour les Tableaux de bord en lignes.

Tableaux de bord en Colonnes : Options de Ventilation


Options de Ventilation contrle laffichage des sous-totaux, lespacement et la pagination des modalits de ventilation.
Figure 37-13 Bote de dialogue Options de Ventilation des Tableaux de bord

Sous-total. Contrle laffichage des sous-totaux pour les modalits de ventilation. Gestion des pages. Contrle lespacement et la pagination des modalits du critre dagrgation slectionn. Vous pouvez spcifier un nombre de lignes vides entre les modalits de ventilation ou commencer chaque modalit de ventilation sur une nouvelle page. Lignes sauter avant sous-total. Contrle le nombre de lignes vides entre les donnes

des modalits de ventilation et les sous-totaux.

611 Tableaux de Rsultats

Options des Tableaux de bord en Colonnes


Options contrle laffichage des totaux gnraux, laffichage des valeurs manquantes et la pagination dans les Tableaux de bord en colonnes.
Figure 37-14 Bote de dialogue Tableau de bord : Options colonne de ventilation ...

Total gnral. Affiche et tiquette un total gnral pour chaque colonne ; affich au

bas de la colonne.
Exclure les observations avec des valeurs manquantes. Vous pouvez exclure les valeurs manquantes du tableau ou slectionner un caractre unique indiquant les valeurs manquantes dans le tableau de bord.

Prsentation du Tableau de bord en Colonnes


Les options de prsentation pour les Tableaux de bord en colonnes sont identiques celles prsentes pour les Tableaux de bord en lignes.

Fonctionnalits supplmentaires de la commande REPORT


Le langage de commande SPSS vous permet aussi de : Afficher diffrentes fonctions rcapitulatives dans les colonnes dune ligne de fonction unique.

612 Chapitre 37

Insrer des fonctions rcapitulatives dans les Variables en colonnes pour des variables autres que la variable de la colonne de donnes, ou pour diverses combinaisons (fonctions composites) de fonctions rcapitulatives. Utiliser la Mdiane, le Mode, la Frquence et le Pourcentage comme des fonctions rcapitulatives. Contrler plus prcisment le format daffichage des statistiques rcapitulatives. Insrer des lignes vides divers emplacements du tableau de bord. Insrer des lignes vides toutes les n observations dans les listes. Du fait de la complexit de la syntaxe de la commande REPORT, vous trouverez peut-tre utile, lorsque vous construirez un nouveau tableau de bord avec syntaxe, dapprocher le tableau gnr partir des botes de dialogue, de copier et coller la syntaxe correspondante, puis de prciser cette syntaxe afin dobtenir le tableau de bord exact que vous souhaitez. Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Analyse de fiabilit

38

Chapitre

Lanalyse de fiabilit vous permet dtudier les proprits des chelles de mesure et des lments qui les constituent. La procdure danalyse de fiabilit calcule plusieurs mesures frquemment utilises de la fiabilit de lchelle et propose galement des informations sur les relations entre les diffrents lments de lchelle. Les coefficients de corrlation intra-classe peuvent tre utiliss pour calculer les estimations de fiabilit inter-coefficients.
Exemple. Mon questionnaire mesure-t-il de faon fidle la satisfaction de la clientle ? Lanalyse de la fiabilit vous permet de dterminer dans quelle mesure les lments de votre questionnaire sont lis les uns aux autres et vous procure un indice gnral de la consistance ou de la cohrence interne de lchelle dans son ensemble. Elle vous permet enfin didentifier les lments qui posent problme et quil faudrait exclure de lchelle. Statistiques. Descriptions de chaque variable et pour lchelle, statistiques

rcapitulatives sur les lments, corrlations et covariances entre lments, prvisions de fiabilit, tableau dANOVA, coefficients de corrlation intra-classe, T2 dHotelling et test dadditivit de Tukey.
Modles. Les modles suivants de fiabilit sont disponibles : Alpha (Cronbach). Il sagit dun modle de cohrence interne, fond sur la

corrlation moyenne entre lments.


Split-half. Ce modle fractionne lchelle en deux et examine la corrlation entre

les deux parties.


Guttman. Ce modle calcule les limites minimales de Guttman pour une fiabilit

vraie.

613

614 Chapitre 38

Parallle. Ce modle part de lhypothse que tous les lments ont des variances

gales et des variances derreur gales en cas de rplication.


Parallle strict. Ce modle se fonde sur les mmes hypothses que le modle

parallle mais envisage galement que tous les lments ont la mme moyenne.
Donnes. Les donnes peuvent tre dichotomiques, ordinales ou constituer des

intervalles, mais elles doivent tre codes en numrique.


Hypothses. Les observations doivent tre indpendantes, les erreurs ne doivent pas tre corrles entre lments. Chaque paire dlments doit avoir une distribution gaussienne bivarie. Les chelles doivent tre additives, de sorte que chaque lment est linairement reli au total. Procdures apparentes. Si vous souhaitez explorer la dimensionnalit des lments

de votre chelle (pour voir si plusieurs lments de base sont ncessaires au modle des calculs), utilisez Analyse factorielle ou Positionnement multidimensionnel. Pour identifier des groupes homognes de variables, utilisez la classification hirarchique pour classer les variables.
Obtenir une analyse de fiabilit
E A partir des menus, slectionnez : Analyse Echelle Analyse de la fiabilit...

615 Analyse de fiabilit Figure 38-1 Bote de dialogue Analyse ditems

E Slectionnez deux variables (lments) au moins en tant que composants potentiels

dune chelle additive.


E Slectionnez un modle dans la liste droulante Modle.

616 Chapitre 38

Statistiques de lanalyse de fiabilit


Figure 38-2 Bote de dialogue Analyse ditems : Statistiques

Vous pouvez slectionner diffrentes statistiques dcrivant votre chelle et vos lments. Les statistiques mises par dfaut regroupent le nombre dobservations, le nombre dlments et les prvisions de fiabilit de la faon suivante : Modles alpha : Coefficient alpha. Pour les donnes dichotomiques, il sagit dun quivalent du coefficient Kuder-Richardson 20 (KR20). Modles Split-half : Corrlation entre les sous-chelles, fiabilit Split-half de Guttman, fiabilit de Spearman-Brown (longueur gale ou ingale) et coefficient alpha pour chaque moiti. Modles de Guttman : Coefficients de fiabilit lambda 1 lambda 6. Modles parallle et parallle strict : test de qualit de lajustement du modle, estimation de la variance de lerreur, variance commune et relle, estimation de la corrlation commune entre lments, estimation de la fiabilit et estimation de la fiabilit non biaise.
Caractristiques pour. Produit des statistiques descriptives pour les chelles ou les lments sur les observations. Item. Produit des statistiques descriptives pour les items sur les observations.

617 Analyse de fiabilit

Echelle. Produit des statistiques descriptives pour les chelles. Echelle sans litem. Affiche les statistiques rcapitulatives en comparant chaque

item lchelle compose des autres items. Les statistiques incluent la moyenne et la variance de lchelle si litem a t supprim de lchelle, la corrlation entre litem et lchelle compose des autres items, et lalpha de Cronbach si litem a t supprim de lchelle.
Principales statistiques. Fournit des statistiques descriptives de la distribution des lments sur lensemble des lments dans lchelle. Moyennes. Statistiques rcapitulatives pour les moyennes d'lment. Les

moyennes d'lment minimale, maximale et intermdiaire sont affiches, ainsi que le rapport de la moyenne maximale la moyenne minimale.
Variances. Statistique rcapitulative des variances d'lment. Les valeurs de

variance maximale, minimale et moyenne sont affiches, ainsi que la plage et la variance des variances d'lment, et le rapport entre les variances d'lment maximale et minimale.
Covariances. Statistiques rcapitulatives pour les covariances d'lment. Les

covariances entre lments minimale, maximale et intermdiaire sont affiches, ainsi que l'intervalle et la variance des covariances entre lments, et le rapport de la covariance entre lments maximale la covariance minimale.
Corrlations. Statistiques rcapitulatives pour les corrlations d'lment. Les

corrlations entre lments minimale, maximale et intermdiaire sont affiches, ainsi que l'intervalle et la variance des corrlations entre lments, et le rapport de la corrlation entre lments maximale la corrlation minimale.
Cohrence inter-items. Produit des matrices de corrlations et de covariances entre

lments.
Tableau ANOVA. Produit des tests de moyennes gales. Test F. Affiche un tableau d'analyse de la variance des mesures rptes.

618 Chapitre 38

Chi-deux de Friedman. Affiche le test de Friedman (Chi-deux) et le coefficient de

concordance de Kendall. Cette option convient aux donnes organises sous forme de rangs. Le test du Chi-deux remplace le test F habituel dans le tableau ANOVA.
Chi-deux de Cochran. Affiche la valeur Q de Cochran. Cette option est approprie

pour les donnes dichotomiques. Le Q de Cochran remplace le test F habituel dans le tableau ANOVA.
T-carr de Hotelling. Produit un test multivari bas sur lhypothse nulle que tous les

lments sur lchelle ont la mme moyenne.


Test dadditivit de Tukey. Produit un test bas sur lhypothse quil ny a pas dinteraction multiplicative entre les lments. Coefficient de corrlation intra-classe. Produit des mesures dhomognit ou de

cohrence des valeurs par observation.


Modle. Slectionnez le modle de calcul du coefficient de corrlation intra-classe.

Les modles disponibles sont Mixte deux facteurs, Alatoire deux facteurs et Alatoire un facteur. Slectionnez Mixte deux facteurs lorsque les effets de population sont alatoires et les effets ditem sont fixes, slectionnez Alatoire deux facteurs lorsque les effets de population et les effets ditems sont alatoires. Slectionnez Alatoire un facteur lorsque les effets sur les gens sont alatoires.
Type. Slectionnez le type dindex. Les types disponibles sont Homognit et

Cohrence absolue.
Intervalle de confiance. Spcifiez le niveau de lintervalle de confiance. La valeur

par dfaut est 95 %.


Valeur test. Spcifiez la valeur hypothtique du coefficient pour le test

dhypothse. Il sagit de la valeur par rapport laquelle la valeur observe est compare. La valeur par dfaut est 0.

Fonctionnalits supplmentaires de la commande RELIABILITY


Le langage de commande SPSS vous permet aussi de : Lire et analyser une matrice de corrlation. Enregistrer une matrice de corrlation analyser ultrieurement. Spcifier un fractionnement autre quen deux moitis gales quant au nombre dlments pour la mthode Split-half.

619 Analyse de fiabilit

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Positionnement multidimensionnel

39

Chapitre

Le positionnement multidimensionnel tente de dterminer une structure dans un ensemble de mesures de distance entre objets ou observations. Pour cela, il affecte les observations des positions particulires dans un espace conceptuel ( deux ou trois dimensions gnralement) de telle sorte que les distances entre les points dans lespace correspondent le mieux possible aux dissimilarits donnes. Dans la plupart des cas, les dimensions de cet espace conceptuel peuvent tre interprtes et utilises pour mieux comprendre les donnes. Si vous avez mesur objectivement les variables, vous pouvez utiliser le positionnement multidimensionnel comme technique de factorisation (le Positionnement multidimensionnel calcule pour vous les distances partir des donnes multivaries, le cas chant). Le positionnement multidimensionnel peut galement sappliquer des estimations subjectives de dissimilarit entre objets ou concepts. Dautre part, le positionnement multidimensionnel peut grer les informations de dissimilarit provenant de plusieurs sources, comme cest le cas lorsquil y a plusieurs indicateurs ou plusieurs rpondants au questionnaire.
Exemple. Comment les gens peroivent-ils les relations entre diffrentes voitures ?

Si les donnes que vous obtenez de vos rpondants indiquent des valuations de similarit entre diffrentes modles, le positionnement multidimensionnel peut servir identifier les dimensions qui dcrivent les perceptions des consommateurs. Vous pouvez trouver, par exemple, que le prix et la taille du vhicule dfinissent un espace deux dimensions qui tient compte des similarits reportes par les rpondants.
Statistiques. Pour chaque modle : matrice des donnes, positionnement optimis des donnes de la matrice, stress S (de Young), stress S (de Kruskal), RSQ, coordonnes des stimuli, stress moyen et RSQ pour chaque stimulus (modles RMDS). Pour les modles des diffrences individuelles : pondrations des sujets et indice de singularit

621

622 Chapitre 39

pour chaque sujet. Pour chaque matrice dans les modles de positionnement multidimensionnel rpliqus : stress et RSQ pour chaque stimulus. Diagrammes : coordonnes des stimulus ( deux ou trois dimensions), diagramme de dispersion des disparits par rapport aux distances.
Donnes. Si vos donnes sont dissemblables, toutes les dissemblances doivent tre

quantitatives et mesures avec les mmes units et chelles. Si vos donnes sont multivaries, les variables peuvent tre quantitatives, binaires mais peuvent aussi tre des donnes deffectif. Le positionnement des variables est un enjeu de taille : les diffrences de positionnement peuvent affecter votre solution. Si vos variables prsentent de grandes diffrences de positionnement (par exemple, si une variable est mesure en dollar et lautre en anne), vous devez envisager de les standardiser (et cela automatiquement par la procdure de positionnement multidimensionnel).
Hypothses. La procdure de positionnement multidimensionnel est relativement

indpendante de toute hypothse de distribution. Assurez-vous que vous avez slectionn le niveau de mesure appropri (ordinal, intervalle ou rapport) dans la bote de dialogue Positionnement multidimensionnel : Options afin de garantir la justesse des rsultats.
Procdures apparentes. Si votre but est la factorisation, vous pouvez galement envisager lanalyse factorielle, plus particulirement si vos donnes sont quantitatives. Si vous souhaitez identifier des groupes dobservations similaires, envisagez de complter votre analyse par positionnement multidimensionnel avec une analyse des nues dynamiques ou une analyse de la classification hirarchique. Obtenir une analyse par positionnement multidimensionnel
E A partir des menus, slectionnez : Analyse Echelle Positionnement dimensionnel

623 Positionnement multidimensionnel Figure 39-1 Bote de dialogue Positionnement multidimensionnel

E Dans Distances, slectionnez Donnes en matrice(s) ou Calcules partir des donnes. E Si vos donnes sont des distances, slectionnez au moins quatre variables numriques pour analyse. (Vous pouvez galement cliquer sur Former pour indiquer la forme de

la matrice de distance.)
E Si vous souhaitez que SPSS cre les distances avant de les analyser, slectionnez au moins une variable numrique. (Vous pouvez aussi cliquer sur Mesure pour spcifier

le type de mesure de distance dsir.) Chaque critre de regroupement peut tre numrique ou de chane et vous pouvez crer des matrices distinctes pour chaque modalit dun critre de regroupement (numrique ou alphanumrique). Pour cela, dplacez cette variable dans Matrices individuelles pour en tablir la liste.

Forme des donnes du positionnement multidimensionnel


Figure 39-2 Bote de dialogue Positionnement multidimensionnel : Forme

624 Chapitre 39

Si votre ensemble de donnes actif reprsente les distances au sein dun ensemble dobjets ou entre deux ensembles dobjets, vous devez indiquer la forme de votre matrice de donnes afin dobtenir des rsultats corrects. Remarque : Vous pouvez slectionner Carr symtrique si la bote de dialogue Modle indique une conditionnalit de ligne.

Positionnement multidimensionnel : crer une mesure


Figure 39-3 Bote de dialogue Positionnement multidimensionnel : Calcul de lindice de dissimilarit

Le positionnement multidimensionnel utilise les donnes de dissimilarit pour crer une solution de codage. Si vos donnes sont multivaries (valeurs des variables mesures), vous devez crer des donnes de dissimilarit afin de calculer une solution de positionnement multidimensionnel. Vous pouvez spcifier les dtails de cration de mesures de dissimilarit partir de vos donnes.
Mesure. Vous permet de spcifier la mesure de dissimilarit adapte votre analyse.

Slectionnez une possibilit dans le groupe Mesure correspondant votre type de donnes, puis slectionnez lune des mesures dans la liste droulante correspondant ce type de mesure. Les possibilits sont :
Intervalle. Distance Euclidienne, Carr de la distance Euclidienne, Distance de

Tchebycheff, Distance de Manhattan, Distance de Minkowski ou Autre.

625 Positionnement multidimensionnel

Compter. Distance du Chi-deux ou Distance du phi-deux. Binaire. Distance Euclidienne, Carr de la distance Euclidienne, Ecart de taille,

Diffrence de motif, Variance ou Lance et Williams.


Crer une matrice de distances. Vous permet de choisir lunit danalyse. Les possibilits sont Par variables ou Par observations. Transformer les valeurs. Dans certains cas, comme lorsque les variables sont

mesures selon des chelles trs diffrentes, vous voudrez peut-tre standardiser des valeurs avant de calculer les proximits (ne sapplique pas aux donnes binaires). Slectionnez une mthode de standardisation dans la liste droulante. Si aucune standardisation nest requise, choisissez Aucune).

Modle de positionnement multidimensionnel


Figure 39-4 Bote de dialogue Positionnement multidimensionnel : Modle

Une estimation correcte dun modle de positionnement multidimensionnel dpend des aspects des donnes et du modle lui-mme.
Niveau de mesure. Vous permet de spcifier le niveau de vos donnes. Les possibilits

sont Ordinales, Intervalle ou Rapport. Si vos variables sont ordinales, la slection de loption Dlier des observations lies demande quelles soient traites en tant que variables continues, de telle sorte que les liens (mmes valeurs pour des observations diffrentes) soient rsolus de manire optimale.
Conditionnalit. Vous permet de spcifier les comparaisons pertinentes. Les

possibilits sont Matrice, Ligne et Inconditionnel.

626 Chapitre 39

Dimensions. Vous permet de spcifier la dimensionnalit de la ou des solutions de

positionnement. Une seule solution est calcule pour chaque nombre de lintervalle. Indiquez des nombres entiers entre 1 et 6. La valeur minimale 1 nest autorise que si vous slectionnez loption Distance Euclidienne comme modle de positionnement. Pour nobtenir quune seule solution, indiquez le mme nombre en tant que minimum et maximum.
Modle de positionnement. Vous permet de spcifier les hypothses sous lesquelles le positionnement est effectu. Les possibilits existantes sont Distance Euclidienne ou Distance Euclidienne des diffrences individuelles (connue galement en tant que INDSCAL). Pour le modle Distance Euclidienne des diffrences individuelles, vous pouvez slectionner loption Permet la pondration ngative, si cela convient vos donnes.

Positionnement multidimensionnel : Options


Figure 39-5 Bote de dialogue Positionnement multidimensionnel : Options

Vous pouvez spcifier les options de votre analyse par positionnement multidimensionnel.
Afficher. Vous permet dafficher les diffrents types daffichage. Les options possibles

sont Diagrammes des stimuli, Diagrammes des sujets, Matrice des donnes et Rcapitulatif des options du modle.

627 Positionnement multidimensionnel

Critres. Vous permet de dterminer quand litration doit sinterrompre. Pour modifier les valeurs par dfaut, entrez des valeurs pour la Convergence du stress S, le Minimum du stress S et le Maximum des itrations. Traiter les dissimilarits infrieures n comme des valeurs manquantes. Ces distances

sont exclues de lanalyse.

Fonctionnalits supplmentaires de la commande ALSCAL


Le langage de commande SPSS vous permet aussi de : Utiliser trois types de modles supplmentaires, ASCAL, AINDS et GEMSCAL dans la documentation relative au Positionnement multidimensionnel. Effectuer des transformations polynomiales sur lintervalle et les donnes de type ratio. Analyser les similarits (plutt que les distances) avec des donnes ordinales. Analyser les donnes nominales. Enregistrer diverses matrices de coordonnes et de pondration dans des fichiers et les relire pour lanalyse. Contraindre le dpliage multidimensionnel. Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Statistiques de ratio

40

Chapitre

La procdure Statistiques de ratio permet dobtenir la liste exhaustive des statistiques rcapitulatives qui servent dcrire le rapport entre deux variables dchelle. Vous pouvez trier le rsultat sur la base des valeurs dune variable de regroupement, dans lordre croissant ou dcroissant. Vous pouvez supprimer le rapport des statistiques de ratio dans le document de sortie et enregistrer les rsultats dans un fichier externe.
Exemple : Le rapport existant entre le prix estimatif et le prix de vente des maisons est-il uniforme dans chacun de ces cinq comts ? Daprs les rsultats, vous pouvez conclure que la distribution des rapports varie considrablement dun comt lautre. Statistiques : Mdiane, moyenne, moyenne pondre, intervalles de confiance,

coefficient de dispersion (COD), coefficient de variation avec mdiane centre, coefficient de variation avec moyenne centre, diffrentiel li au prix (PRD), cart-type, cart absolu moyen (AAD), intervalle, valeurs minimale et maximale, et index de concentration calculs pour un intervalle ou un pourcentage dfini par lutilisateur dans le rapport mdian.
Donnes : Utilisez des codes numriques ou alphanumriques courts pour coder les variables de regroupement (mesures de niveau nominal ou ordinal). Hypothses : Vous devez utiliser des variables dchelle acceptant les valeurs positives pour les variables qui dfinissent le numrateur et le dnominateur du rapport. Pour obtenir des statistiques de ratio
E A partir des menus, slectionnez : Analyse Statistiques descriptives Ratio 629

630 Chapitre 40 Figure 40-1 Bote de dialogue Statistiques de ratio

E Slectionnez la variable du numrateur. E Slectionnez la variable du dnominateur. E Eventuellement :

Slectionner une variable de regroupement et prciser lordre de prsentation des groupes dans le rsultat. Choisissez si vous souhaitez afficher les rsultats dans lEditeur de rsultats. Choisissez ou non denregistrer les rsultats dans un fichier externe en vue dune utilisation ultrieure, et prcisez le nom du fichier dans lequel les rsultats sont enregistrs.

631 Statistiques de ratio

Statistiques de ratio
Figure 40-2 Bote de dialogue Statistiques de ratio

Tendance centrale : Les mesures de tendance centrale sont des statistiques qui dcrivent la distribution des rapports. Mdiane : La valeur telle que le nombre de ratios infrieurs cette valeur est

identique au nombre de ratios suprieurs cette valeur.


Moyenne : Rsultat de la somme des ratios divise par le nombre total de ratios. Moyenne pondre : Rsultat de la division de la moyenne du numrateur par la

moyenne du dnominateur. La moyenne pondre correspond galement la moyenne des ratios pondre par le dnominateur.
Intervalles de confiance : Affiche les intervalles de confiance de la moyenne,

de la mdiane et de la moyenne pondre (si demande). Affectez une valeur suprieure ou gale 0 et infrieure 100 au niveau de confiance.
Dispersion : Ces statistiques permettent de mesurer le degr de variation, ou de rpartition, au niveau des valeurs observes. AAD : Lcart absolu moyen est gal la somme des carts absolus des ratios

relatifs la mdiane, divise par le nombre total de ratios.

632 Chapitre 40

COD : Le coefficient de dispersion rsulte de lexpression de lcart moyen absolu

en pourcentage de la mdiane.
PRD : Le diffrentiel li au prix, ou index de rgressivit, rsulte de la division de

la moyenne par la moyenne pondre.


Mdiane centre COV : Le coefficient de variation avec mdiane centre rsulte

de lexpression de la racine de la moyenne des carrs de lcart par rapport la mdiane en pourcentage de la mdiane.
Moyenne centre COV : Le coefficient de variation avec moyenne centre rsulte

de lexpression de lcart-type en tant que pourcentage de la moyenne.


Ecart type : Lcart-type est la racine carre positive de la somme des carrs des

carts des ratios relatifs la moyenne divise par le nombre total des ratios moins un.
Intervalle : Rsultat de la soustraction du ratio minimal au ratio maximal. Minimum : Le minimum est le plus petit ratio. Maximum : Le maximum est le plus grand ratio. Index de concentration. Le coefficient de concentration mesure le pourcentage des ratios compris dans un intervalle. Vous pouvez le calculer de deux manires : Ratios entre : Dans ce cas, vous dfinissez lintervalle de manire explicite en

prcisant les valeurs minimale et maximale. Entrez les valeurs des proportions infrieure et suprieure, puis cliquez sur Ajouter pour obtenir un intervalle.
Ratios dans : Dans ce cas, vous dfinissez lintervalle de manire implicite

en indiquant le pourcentage de la mdiane. Entrez une valeur comprise entre 0 et 100, et cliquez sur Ajouter. La limite infrieure de lintervalle est gale (1 0,01valeur)mdiane et la limite suprieure est gale (1 + 0,01valeur)mdiane.

Prsentation de lutilitaire de diagramme

41

Chapitre

Les procdures du menu Diagrammes et de nombreuses procdures du menu Analyse permettent de crer des diagrammes et des graphiques haute rsolution. Ce chapitre prsente lutilitaire de diagramme.

Cration et modification dun diagramme


Avant de crer un diagramme, vous devez disposer de donnes dans lditeur de donnes. Vous pouvez saisir les donnes directement dans lditeur de donnes, ouvrir un fichier de donnes dj enregistr ou lire une feuille de calcul, un fichier de donnes dlimit par des tabulations ou un fichier de base de donnes. Llment Didacticiel du menu Aide propose des exemples en ligne de cration et de modification de diagramme ; le systme daide en ligne explique comment crer et modifier tous les types de diagrammes.

Cration du diagramme
E Aprs avoir obtenu vos donnes dans Data Editor, slectionnez Gnrateur de diagrammes depuis le menu Graphes. La bote de dialogue Gnrateur de diagrammes

apparat.

633

634 Chapitre 41 Figure 41-1 Bote de dialogue Gnrateur de diagrammes

La bote de dialogue Gnrateur de diagrammes est utilise pour les types de diagrammes communs qui apparaissent dans longlet Galerie. Si vous devez crer un diagramme qui nest pas disponible dans le Gnrateur de diagrammes, vous pouvez aussi slectionner un type de diagramme spcifique partir du menu Graphes.
E Dans le Gnrateur de diagrammes, faites glisser licne reprsentant le diagramme

dans le canevas, la large zone qui saffiche au dessus de la galerie.

635 Prsentation de lutilitaire de diagramme E Faites glisser les variables de la liste Variables vers les zones de dpalcement de laxe. (Pour plus dinformations sur le Gnrateur de diagrammes, cliquez sur Aide.)

Lorsque la dfinition du diagramme est termine, il ressemblera au diagramme suivant.


Figure 41-2 Bote de dialogue Gnrateur de diagrammes avec des zones de dplacement compltes

E Si vous devez changer les statistiques ou modifier les attributs des axes ou des lgendes, cliquez sur Proprits des lments.

636 Chapitre 41 Figure 41-3 Fentre Proprit des lments

E Slectionnez llment modifier dans la liste Modifier les proprits de. (Pour plus dinformations sur les proprits spcifiques, cliquez sur Aide.) E Dans la bote de dialogue Gnrateur de diagrammes, cliquez sur OK pour crer le

diagramme. Le diagramme apparat dans lEditeur de rsultats.

637 Prsentation de lutilitaire de diagramme Figure 41-4 Diagramme en btons affich dans la fentre du Viewer

Modification dun diagramme


Pour modifier un diagramme, double-cliquez nimporte o dans le diagramme affich dans le Viewer. Le diagramme apparat dans lditeur de diagrammes.

638 Chapitre 41 Figure 41-5 Diagramme initial dans lditeur de diagrammes

Vous pouvez modifier tout lment du diagramme ou choisir un autre type de diagramme pour reprsenter les mmes donnes. Pour ajouter, afficher ou masquer des lments, utilisez les menus de Chart Editor.

Pour modifier un lment de diagramme


E Slectionnez llment modifier.

639 Prsentation de lutilitaire de diagramme E A partir des menus, slectionnez : Affichage Proprits

La fentre Proprits apparat. Les onglets de la fentre Proprits dpendent des choix effectus. Laide en ligne explique comment afficher les onglets ncessaires.
Figure 41-6 Fentre Proprits

Ces modifications typiques incluent : Modification du texte du diagramme. Modification de la couleur et du motif de remplissage des btons. Ajout de texte au diagramme (par exemple, un titre ou une annotation). Modification de lemplacement de la ligne dorigine des btons.

640 Chapitre 41

Ci-dessous figure un diagramme modifi.


Figure 41-7 Diagramme modifi

Les modifications apportes au diagramme sont enregistres lorsque vous fermez la fentre de diagramme. Le diagramme modifi apparat alors dans le Viewer.

641 Prsentation de lutilitaire de diagramme

Options de dfinition du diagramme


Lorsque vous dfinissez un diagramme, vous pouvez ajouter des titres et modifier les options de cration du diagramme. Dans le Gnrateur de diagrammes, cliquez sur longlet Elments facultatifs pour spcifier les titres, les sous-titres et les notes de bas de page. Vous pouvez cliquer sur Options pour contrler plusieurs options de diagramme, telles que le traitement des valeurs manquantes ou lutilisation des modles. Les sections suivantes expliquent comment dfinir ces caractristiques lors de la dfinition du diagramme.

Titres, sous-titres et notes de bas de page


Lors de la dfinition initiale du diagramme, vous pouvez spcifier deux lignes de titre, une ligne de sous-titre et deux lignes de note de bas de page. Pour spcifier des titres ou des notes de bas de page lors de la dfinition dun diagramme, cliquez sur Elments facultatifs dans la bote de dialogue Gnrateur de diagrammes. Faites ensuite glisser un des items dans le canevas. Vous pouvez modifier le texte associ litem en cliquant sur Proprits des lments et en slectionnant litem dans la liste Modifier les proprits de. Chaque ligne peut contenir jusqu 72 caractres. Le nombre de caractres pouvant tre contenus par le diagramme dpend de la police et de la taille utilises. Par dfaut, la plupart des titres sont aligns gauche et tronqus droite sils sont trop longs. Les titres des diagrammes en secteurs sont quant eux centrs par dfaut et tronqus des deux cts sils sont trop longs. Les titres, les sous-titres et les notes de bas de page sont reprsents par des zones de texte dans Chart Editor. Dans Chart Editor, vous pouvez ajouter ou supprimer des zones de texte et modifier leur contenu, leur police, leur taille ou leur justification.

Options
La bote de dialogue Options contient des options correspondant au diagramme que vous crez. Cette bote de dialogue est disponible en cliquant sur Options.

642 Chapitre 41 Figure 41-8 Options

Valeurs manquantes
Critres dagrgation :

Si des valeurs manquantes figurent dans les donnes des variables utilises pour dfinir des modalits ou des sous-groupes, slectionnez Inclure de sorte que les modalits des valeurs manquantes utilisateur (valeurs identifies comme manquantes par lutilisateur) soient incluses dans le diagramme. Ces modalits agissent galement en tant que critres dagrgation lors du calcul de la statistique. Les modalits manquantes figurent sur laxe de modalits ou dans la lgende, et se traduisent par

643 Prsentation de lutilitaire de diagramme

exemple par lajout dun bton supplmentaire ou dun secteur dans les diagrammes en secteurs. Sil nexiste aucune valeur manquante, les modalits manquantes napparaissent pas. Si vous avez slectionn cette option et que vous ne voulez plus afficher la modalit Manquant une fois le diagramme trac, slectionnez ce dernier, puis choisissez Proprits dans le menu Modifier. Cliquez sur longlet Modalits et dplacez les modalits masquer vers la liste Exclues.
Statistiques rcapitulatives et valeurs dobservations

Vous pouvez slectionner une des alternatives suivantes pour exclure les observations ayant des valeurs manquantes :
Exclure toute la liste pour obtenir une base cohrente pour le diagramme. Si

lune des variables du diagramme comporte une valeur manquante pour une observation donne, lobservation est intgralement exclue du diagramme.
Exclure variable par variable pour optimiser lutilisation des donnes. Si une

variable slectionne comporte des valeurs manquantes, les observations contenant ces valeurs manquantes sont exclues lors de lanalyse de la variable. Pour connatre la diffrence entre les exclusions de valeurs manquantes de type Exclure toute observation incomplte et Exclure les observations variable par variable, tudiez les figures suivantes qui reprsentent le diagramme en btons correspondant chacune des deux options.

644 Chapitre 41 Figure 41-9 Exclusion des valeurs manquantes de toute observation incomplte

Figure 41-10 Exclusion des valeurs manquantes des observations variable par variable

Ces diagrammes ont t crs partir dune version du fichier Employee data.sav. Cette dernire a t modifie afin que les variables du salaire actuel et du type de poste occup contiennent quelques valeurs manquantes par dfaut (vides). Dans dautres observations, la valeur 0 a t saisie et dfinie comme manquante. Loption Afficher les groupes dfinis par des valeurs manquantes tant slectionne pour les deux diagrammes, la modalit Manquant est ajoute aux types de poste affichs. Dans

645 Prsentation de lutilitaire de diagramme

chaque diagramme, les valeurs de la fonction rcapitulative Nombre dobservations figurent dans les tiquettes des btons. 26 observations des deux diagrammes comportent une valeur manquante par dfaut pour le type de poste occup, et 13 la valeur manquante utilisateur (0). Dans le diagramme avec exclusion de toute observation incomplte, le nombre dobservations est identique pour les deux variables de chaque regroupement de btons. En effet, si une valeur est manquante, lobservation est exclue pour toutes les variables. Dans le diagramme avec exclusion des observations variable par variable, le nombre dobservations non manquantes de chaque variable dune modalit donne est reprsent indpendamment des valeurs manquantes dans les autres variables.

Modles de diagramme
Vous pouvez appliquer la plupart des attributs et des lments textuels dun diagramme un autre. Il est possible de modifier un diagramme, de lenregistrer en tant que modle, puis dutiliser le modle pour crer toute une srie de diagrammes similaires. Pour utiliser un modle lors de la cration dun diagramme, cliquez sur Ajouter dans le groupe Modles. Une bote de dialogue standard de slection de fichier apparat. Si vous ajoutez plusieurs modles, ils sont appliqus dans lordre dans lequel ils saffichent dans la liste Fichiers de modle. Vous pouvez changer cet ordre si ncessaire. Pour appliquer un modle un diagramme qui figure dj dans Chart Editor, slectionnez dans les menus :
Fichier Appliquer modle de diagramme...

Une bote de dialogue standard de slection de fichier apparat. Slectionnez le fichier utiliser comme modle. Si vous tes en train de crer un diagramme, le nom du fichier slectionn apparat dans le groupe Modle lorsque vous revenez dans la bote de dialogue de dfinition du diagramme. Les modles permettent demprunter le format dun diagramme et de lappliquer au diagramme en cours de cration. En gnral, toutes les informations de formatage de lancien diagramme applicables au nouveau diagramme sappliquent automatiquement. Par exemple, si lancien diagramme est un diagramme en btons juxtaposs dont les btons ont t colors en vert et en jaune et le nouveau diagramme est un diagramme curviligne multiple, les lignes de ce dernier seront vertes et jaunes. Si lancien diagramme est un diagramme en btons simples comportant des ombrages

646 Chapitre 41

et le nouveau diagramme est un diagramme curviligne simple, les lignes de ce dernier nauront pas dombrages car ceux-ci ne sappliquent pas aux diagrammes curvilignes. Si le diagramme modle comporte des titres, mais pas le nouveau diagramme, les titres du diagramme modle sont repris. Si des titres sont dfinis dans le nouveau diagramme, ils remplacent ceux du diagramme modle.
Pour crer un modle de diagramme
E Crez un diagramme. E Modifiez le diagramme afin quil contienne les attributs souhaits dans le modle. E A partir des menus de lditeur de diagrammes, slectionnez : Fichier Enregistrer modle de diagramme... E Dans la bote de dialogue Enregistrer le modle de diagramme, indiquez les

caractristiques du diagramme enregistrer dans le modle. Laide en ligne dcrit ces paramtres en dtail.
E Cliquez sur Poursuivre. E Entrez le nom de fichier et lemplacement du nouveau modle. Lextension du

modle est .sgt.

Courbes ROC

42

Chapitre

Cette procdure constitue un moyen efficace dvaluer les performances des mthodes de classement ne mettant en uvre quune seule variable deux modalits et utilises pour la classification des sujets.
Exemple : Une banque envisage de classer correctement ses clients en modalits, savoir ceux qui assumeront ou non le remboursement de leur prt. Des mthodes particulires sont dveloppes afin de supporter la prise de dcision. Les courbes ROC peuvent tre utilises pour valuer le mode de fonctionnement optimal de ces mthodes. Statistiques : La zone infrieure la courbe ROC comporte un intervalle de confiance ainsi que les coordonnes de cette courbe. Diagrammes : Courbe ROC Mthodes. Lestimation de la zone situe sous la courbe ROC peut tre calcule de faon paramtrique ou non laide du modle exponentiel bingatif. Donnes : Les variables de test sont quantitatives. Les variables de test se composent

souvent des probabilits issues dune analyse discriminante, dune rgression logistique ou des scores indiqus sur une chelle arbitraire et spcifiant la force de conviction dun indicateur lorsquun sujet se rapporte lune ou lautre des modalits. La variable dtat peut tre dun type quelconque et indique la vritable modalit laquelle un sujet appartient. La valeur de la variable dtat indique la modalit considrer comme positive.
Hypothses : Les nombres croissants dune chelle dindicateurs confirment que le

sujet appartient une modalit, tandis que les nombres dcroissants dune chelle confirment quil appartient une autre modalit. Lutilisateur doit choisir la direction positive. On suppose galement que la vritable modalit laquelle chaque sujet appartient est connue.

647

648 Chapitre 42 Figure 42-1 Rsultat de la courbe ROC

649 Courbes ROC

Pour obtenir une courbe ROC


E A partir des menus, slectionnez : Graphes Courbe ROC... Figure 42-2 Bote de dialogue Courbe ROC

E Slectionnez une ou plusieurs variables de probabilit de test. E Slectionnez une variable dtat. E Identifiez la valeur positive de la variable dtat.

650 Chapitre 42

Courbe ROC : Options


Figure 42-3 Bote de dialogue Courbe ROC : Options

Vous pouvez indiquer les options suivantes pour votre analyse ROC :
Classification Permet de spcifier si la valeur du point de csure doit tre incluse

ou exclue lors dune classification positive. Ce paramtre na pas de consquence sur le rsultat.
Direction du test Permet de spcifier la direction de lchelle en fonction de la modalit positive. Paramtres pour une erreur standard de zone Vous permet de spcifier la mthode

utilise pour estimer lerreur standard de la zone situe sous la courbe. Les mthodes disponibles sont des valeurs exponentielles non paramtriques et bi-ngatives. Vous permet galement de dfinir le niveau de lintervalle de confiance. Les valeurs de lintervalle se situent entre 50,1 % et 99,9 %.
Valeurs manquantes : Vous permet de spcifier comment traiter les valeurs manquantes.

Outils

43

Chapitre

Ce chapitre dcrit les fonctions du menu Outils et vous indique comment rordonner les listes de variables cible en utilisant les menus systmes de Windows.

Informations de la variable
La bote de dialogue Variables affiche des informations sur la dfinition des variables pour les variables couramment slectionnes, y compris: le format des Donnes ltiquette Variable les valeurs manquantes spcifies les tiquettes Valeurs
Figure 43-1 la bote de dialogue Variables

651

652 Chapitre 43

Aller . Permet daccder la variable slectionne dans la fentre de lditeur de donnes. Coller. Permet de coller les variables slectionnes dans la fentre syntaxe dsigne lemplacement du curseur.

Pour modifier les dfinitions de variables, utilisez laffichage des variables dans lditeur de donnes.
Pour obtenir des informations sur les variables
E A partir des menus, slectionnez : Outils Variables E Slectionnez la variable dont vous souhaitez afficher les informations de dfinition

variable.

Commentaires de fichier de donnes


Vous pouvez inclure des commentaires descriptifs dans le fichier de donnes. Pour les fichiers de donnes au format SPSS, les commentaires sont enregistrs avec le fichier de donnes.
Pour ajouter, modifier, supprimer ou afficher les commentaires de fichier de donnes
E A partir des menus, slectionnez : Outils Commentaires de fichier de donnes. E Pour afficher les commentaires dans le Viewer, slectionnez Afficher les commentaires dans la sortie.

Les commentaires ne sont pas limits en longueur, mais ne doivent pas dpasser 80 octets (en gnral, cela correspond 80 caractres dans les langues sur un octet) par ligne. Les lignes sont automatiquement interrompues par un renvoi la ligne suivante partir de 80 caractres. La police utilise pour afficher les commentaires est celle utilise pour les rsultats texte de manire donner une reprsentation fidle de laffichage dans le Viewer.

653 Outils

Un cachet de date (la date actuelle entre parenthses) est automatiquement ajout la fin de la liste des commentaires ds que vous modifiez un commentaire ou que vous en ajoutez un. Ceci peut entraner des ambiguts au niveau des dates associes aux commentaires lorsque vous modifiez un commentaire ou que vous insrez un nouveau commentaire entre deux commentaires existants.

Groupes de Variables
Vous pouvez limiter le nombre de variables devant safficher dans les listes des variables source de la bote de dialogue. Pour cela, dfinissez et utilisez des groupes de variables. Ceci est particulirement utile pour les fichiers de donnes avec un grand nombre de variables. Les petits groupes de variables facilitent la recherche et la slection des variables pour votre analyse et peuvent aussi augmenter votre performance sur SPSS. Si votre fichier de donnes a un grand nombre de variables et si les botes de dialogue souvrent lentement, le fait de rduire les listes source de botes de dialogue en sous-groupes de variables plus petits devrait permettre de rduire le temps ncessaire louverture des botes de dialogue.

Dfinir des groupes de variables


La procdure Dfinir des groupes de variables cre des sous-groupes de variables pour permettre dafficher les listes source de botes de dialogue.

654 Chapitre 43 Figure 43-2 Dfinir bote de dialogue Dfinir des groupes

Nom du groupe. Les noms de groupes peuvent contenir jusqu 12 caractres. Tous

les caractres, y compris vides, peuvent tre utiliss. Les noms de Groupes sont indiffrents aux observations.
Variables du groupe. Toute combinaison de variables numriques, alphanumriques

et alphanumriques longues peuvent tre comprises dans un groupe. Lordre des variables dans le groupe na pas deffet sur lordre daffichage des variables dans les listes source de la bote de dialogue. Une variable peut appartenir de multiples groupes.
Pour dfinir des groupes de variables
E A partir des menus, slectionnez : Outils Dfinir des groupes E Slectionnez les variables inclure dans le groupe. E Saisir un nom de groupe (jusqu 12 caractres).

655 Outils E Cliquez sur .

Utiliser les groupes


La procdure Utiliser des groupes limite le nombre de variables affiches dans les listes source de la bote de dialogue aux groupes slectionns que vous avez dfinis.
Figure 43-3 Utiliser la bote de dialogue Dfinir des groupes

Groupes utiliss. Affiche les groupes utiliss pour produire les listes source de variables dans les botes de dialogue. Les variables apparaissent dans les listes source dans lordre alphabtique ou dans lordre du fichier. Lordre des groupes et lordre des variables dans le groupe nont pas deffet sur lordre des listes source de variables. Par dfaut, deux groupes dfinis par dfaut sont utiliss. ALLVARIABLES. Ce groupe contient toutes les variables du fichier de donnes, y compris les nouvelles variables cres pendant une session. NEWVARIABLES. Ce groupe contient seulement les nouvelles variables cres pendant

la session. Vous pouvez enlever ces groupes de la liste et en slectionner dautres, mais il doit y avoir au moins un groupe dans la liste. Si vous nenlevez pas le groupe ALLVARIABLES de la liste des Groupes utiliss, tous les autres groupes que vous incluez ne sont pas significatifs.

656 Chapitre 43

Pour limiter les listes source de bote de dialogue des groupes de variables dfinis
E A partir des menus, slectionnez : Outils Utiliser des groupes E Slectionnez les groupes de variables dfinis qui contiennent les variables que vous

souhaitez voir apparatre dans les listes source de la bote de dialogue.

Rordonner Listes Variables Cible


Les variables apparaissent dans les listes cible de la bote de dialogue dans lordre dans lequel elles sont slectionnes partir de la liste source. Si vous souhaitez modifier lordre des variables dune liste cible, mais que vous ne souhaitez pas dslectionner toutes les variables et les reslectionner dans le nouvel ordre, vous pouvez faire remonter et redescendre les variables dans la liste cible en utilisant le menu systme dans le coin suprieur gauche de la bote de dialogue ( laquelle vous pouvez accder en cliquant sur la partie gauche de la barre de titre de la bote de dialogue).
Figure 43-4 Menu systme de Windows avec rordonnance de la liste cible

Faire remonter slection. Fait remonter la ou les variables slectionnes dune position

dans la liste destination.

657 Outils

Faire redescendre slection. Fait descendre la ou les variables slectionnes dune position dans la liste destination.

Vous pouvez dplacer simultanment les variables multiples si elles sont attenantes (regroupes). Vous ne pouvez pas dplacer les groupes de variables non attenantes.

Options

44

Chapitre

Les commandes Options permettent de contrler un grand nombre de paramtres, y compris : le journal de session qui enregistre toutes les commandes excutes dans chaque session lordre daffichage des variables dans les listes source des botes de dialogue les lments affichs et masqus dans les nouveaux rsultats le modle de tableau pour les nouveaux tableaux pivotants et le modle de graphiques pour les nouveaux diagrammes interactifs les formats montaires personnaliss (devises) les fichiers et fonctions autoscript permettant de personnaliser les rsultats
Pour modifier les paramtres doptions
E A partir des menus, slectionnez : Edition Options E Cliquez sur les onglets correspondant aux paramtres que vous souhaitez modifier. E Modifiez les paramtres. E Cliquez sur OK ou sur Appliquer.

659

660 Chapitre 44

Options gnrales
Figure 44-1 Bote de dialogue Options, onglet Gnral

Listes de variables. Contrle laffichage des variables dans les listes de botes de

dialogue. Vous pouvez afficher des noms de variables ou des tiquettes de variable. On peut afficher les variables dans lordre alphabtique ou dans lordre du fichier qui correspond lordre dans lequel elles interviennent dans le fichier de donnes (et dans lequel elles sont affiches dans la fentre Editeur de donnes). Lordre daffichage affecte seulement la liste des variables source. Les listes de variables cible reproduisent toujours lordre dans lequel les variables ont t slectionnes.
Journal de session. Fichier-journal de toutes les commandes excutes dans une

session. Celui-ci comprend les commandes saisies et excutes dans les fentres de syntaxe, ainsi que les commandes gnres par les choix de bote de dialogue. Vous pouvez modifier le fichier-journal et rutiliser les commandes dans dautres sessions. Vous pouvez activer ou dsactiver la fonction journal, ajouter au fichier-journal ou lcraser et slectionner le nom et lemplacement du fichier-journal. Vous pouvez

661 Options

copier la syntaxe de commande partir du fichier-journal et lenregistrer dans un fichier de syntaxe pour lutiliser avec le systme de production automatise.
Rpertoire temporaire. Contrle lemplacement des fichiers temporaires crs au cours

dune session. En mode distribu (disponible avec la version serveur), cette option naffecte pas lemplacement des fichiers de donnes temporaires. En mode distribu, lemplacement des fichiers temporaires est contrl par la variable denvironnement SPSSTMPDIR, qui ne peut tre dfinie que sur lordinateur excutant la version serveur du programme. Si vous devez modifier lemplacement du rpertoire temporaire, contactez votre administrateur systme.
Liste des fichiers rcemment utiliss. Cette procdure permet de contrler le nombre de fichiers rcemment utiliss qui apparaissent dans le menu Fichier. Ouvrir la fentre de syntaxe au dmarrage. Les fentres de syntaxe sont des fentres

de fichier de texte utilises pour saisir, modifier, et excuter les commandes SPSS. Si vous travaillez frquemment avec la syntaxe de commande, slectionnez cette option pour ouvrir automatiquement une fentre de syntaxe au dbut de chaque session SPSS. Ceci est particulirement utile pour les utilisateurs avertis de SPSS qui prfrent travailler avec la syntaxe de commande plutt que les botes de dialogue. (non disponible avec la version Student).
Pas daffichage scientifique pour les petits nombres dans les tableaux. Supprime

laffichage scientifique pour les petites valeurs dcimales dans le rsultat. Les valeurs dcimales trs petites sont affiches au format suivant : 0 (ou 0,000).
Type de Viewer au dmarrage. Contrle le type dEditeur de rsultats utilis et le

format des rsultats. Le Viewer produit des tableaux pivotants interactifs et des diagrammes interactifs. Le Viewer en mode brouillon convertit les tableaux pivotants en sortie texte et les diagrammes en mtafichiers.
Units de mesure. Systme de mesure utilis (Points, Pouces, ou Centimtres) pour spcifier les attributs tels que les marges de cellules du tableau pivotant, les largeurs de cellules et lespace dimpression entre les tableaux Langage. Contrle le langage utilis dans les rsultats. Ne sapplique ni aux rsultats

texte simple, ni aux graphiques interactifs, ni aux cartes (disponible avec le module complmentaire Maps). La liste des langages disponibles dpend des fichiers de langage installs.

662 Chapitre 44

Remarque : Les scripts personnaliss fonds sur des chanes de texte propres un langage dans le rsultat risquent de ne pas tre excuts correctement lorsque vous modifiez le langage des rsultats. Pour plus d'informations, reportez-vous Options script p. 679.
Notification. Cette procdure contrle la faon dont SPSS notifie que votre excution

est termine et que les rsultats sont accessibles dans le Viewer.

Options Viewer
Les options daffichage du rsultat avec lexplorateur affectent seulement le nouveau rsultat produit aprs modification de la configuration. Un rsultat dj affich dans le Viewer nest pas affect par les changements de ces paramtres.
Figure 44-2 Bote de dialogue Options, onglet Editeur de rsultats

663 Options

Etat initial rsultats. Cette procdure dtermine quels lments seront automatiquement

affichs ou masqus chaque fois que vous excuterez une procdure et combien dlments sont initialement aligns. Vous pouvez contrler laffichage des lments suivants : Log, Avertissements, Remarques, Titre, Tableau pivotant, Diagramme, et Rsultat texte (sortie non affiche dans les tableaux pivotants). Vous pouvez galement dmarrer ou arrter laffichage des commandes SPSS dans le journal. Vous pouvez copier la syntaxe de commande partir du journal et lenregistrer dans un fichier de syntaxe pour lutiliser dans le systme de production automatis. Remarque : Tous les lments de rsultat sont affichs aligns gauche dans le Viewer. Seul lalignement des rsultats imprims est affect par les paramtres dalignement. Les lments centrs et aligns droite sont identifis par un symbole situ au-dessus et gauche des lments en question.
Police du titre. Cette procdure permet de contrler le style de police, la taille, et la couleur des titres de sortie. Police du titre de la page. Cette procdure permet de contrler tous les styles de

police, la taille et la couleur des nouveaux titres de page et de ceux gnrs par la syntaxe de commande TITLE et SUBTITLE ou crs dans le menu Insertion laide de loption Nouveau titre de page.
Taille de page rsultats texte. Cette procdure permet de contrler la largeur de page

dans la sortie de texte (exprime en nombre de caractres), ainsi que la longueur de page (exprime en nombre de lignes). Dans certaines procdures, certaines statistiques sont affiches seulement en format Large.
Police rsultats texte. Police utilise pour la sortie de texte. Le rsultat texte SPSS est prvu pour tre utilis dans une police monoespace ( espacement fixe). Si vous slectionnez une police qui nest pas monoespace, le tableau de rsultats ne sera pas correctement align. La police des rsultats texte est galement utilise dans lAssistant de texte pour afficher le contenu des fichiers qui ne seraient pas aligns si la police tait monoespace.

Options du Viewer en mode brouillon


Les options daffichage des rsultats dans le Viewer affectent seulement le nouveau rsultat produit aprs modification des paramtres Un rsultat dj affich dans le Viewer nest pas affect par les changements de ces paramtres.

664 Chapitre 44 Figure 44-3 Bote de dialogue Options, onglet Editeur de rsultats en mode brouillon

Afficher items rsultats. Contrle les lments afficher automatiquement chaque excution dune procdure. Vous pouvez contrler laffichage des lments suivants : Journal, Avertissement, Remarques, Titre, Rsultats en tableau (les tableaux pivotants sont convertis en sortie texte), Diagramme et Rsultats texte (rsultats en sparation despace).Vous pouvez galement dmarrer ou arrter laffichage des commandes SPSS dans le journal. Vous pouvez copier la syntaxe de commande partir du journal et lenregistrer dans un fichier de syntaxe pour lutiliser dans le systme de production automatis. Sauts de page entre. Insre des sauts de page entre les rsultats partir de diffrentes

procdures et/ou entre des lments de rsultat individuels.


Police. Police utilise pour les nouveaux rsultats. Seules les polices espacement

fixe (monoespaces) sont disponibles car le rsultat texte en sparation despace ne salignera pas correctement avec une police proportionnelle.

665 Options

Rsultats en tableau. Contrle les paramtres pour les rsultats de tableaux pivotants convertis en rsultat texte, sous forme de tableaux. Les spcifications de largeur de colonne et de sparateur de colonne ne sont disponibles que si vous slectionnez Espaces comme sparateur de colonne. Pour les rsultats avec sparation tabulaire, tous les sauts de lignes sont supprims et chaque colonne a la largeur de la plus longue tiquette ou la valeur de la colonne par dfaut. Pour limiter la largeur des colonnes et insrer des sauts de ligne dans les longues tiquettes, spcifiez un nombre de caractres pour la largeur de la colonne.

Remarque : Cependant, la sortie avec des tabulations de sparation ne salignera pas correctement dans le Viewer en mode brouillon. Ce format est utile pour copier et coller les rsultats dans des traitements de texte dans lesquels vous pouvez utiliser nimporte quelle police (et pas uniquement des polices espacement fixe) et dfinir les onglets permettant daligner les rsultats correctement.
Rsultats texte. Pour des sorties texte autres que des rsultats de tableaux pivotants convertis, contrle la largeur de page (exprime en nombre de caractres) et la longueur de page (exprime en nombre de lignes). Dans certaines procdures, certaines statistiques sont affiches seulement en format Large.

Options Etiquettes Rsultats


Les options Etiquettes Rsultats permettent de contrler laffichage des variables et les informations sur la valeur des donnes dans les tableaux de lgende et les tableaux pivotants. Vous pouvez afficher les noms de variables et/ou les tiquettes de variable dfinies ainsi que les valeurs de donnes relles et/ou les tiquettes valeur dfinies. Les variables descriptives et les tiquettes de valeurs (affichage des variables de lditeur de donnes, colonnes Etiquettes et Valeurs) facilitent souvent linterprtation des rsultats. Les tiquettes longues peuvent cependant tre gnantes dans certains tableaux.

666 Chapitre 44 Figure 44-4 Bote de dialogue Options, onglet Etiquettes de rsultats

Les options Etiquettes Rsultats affectent seulement le nouveau rsultat produit aprs modification des paramtres. Un rsultat dj affich dans le Viewer nest pas affect par les changements de ces paramtres. Un rsultat dj affich dans le Viewer nest pas affect par les changements de ces paramtres. Cette configuration naffecte que le rsultat du tableau pivotant. Le rsultat texte ne se trouve pas affect par ces paramtres.

667 Options

Options de diagramme
Figure 44-5 Bote de dialogue Options, onglet Diagrammes

Modle de diagramme. Les diagrammes peuvent utiliser soit les paramtres

slectionns ici, soit les paramtres provenant dun fichier de modle de diagramme. Cliquez sur Parcourir pour slectionner un fichier de modle de diagramme. Pour crer un fichier de modle de diagramme, crez un diagramme avec les attributs que vous souhaitez et enregistrez-le comme modle (choisissez loption Enregistrer diagramme Modle dans le menu Fichier).
Ratio daspect diagramme. Le rapport largeur hauteur du cadre extrieur de nouveaux diagrammes. Vous pouvez spcifier un rapport largeur hauteur de 0,1 10,0. Les valeurs infrieures 1 donnent des diagrammes plus hauts que larges. Les valeurs suprieures 1donnent des diagrammes plus larges que hauts. Une valeur 1 donne un diagramme carr. Ds quun diagramme est cr, le ratio de son aspect peut tre modifi.

668 Chapitre 44

Lancement de JVM au dmarrage. Les fonctions de reprsentation graphique requirent

lemploi de Java Virtual Machine (JVM). Par dfaut, le JVM se lance lorsque vous dmarrez une session SPSS. Si vous dslectionnez (dsactivez) cette option, il se peut que SPSS dmarre plus vite, mais il devrait y avoir de lgers retards pendant le lancement du JVM lors de la premire utilisation du Gnrateur de diagrammes ou de la cration dun diagramme dans la session.
Police. Police utilise pour tout le texte des nouveaux diagrammes. Prfrence de cycle de style. Les affectations initiales des couleurs et/ou motifs

pour de nouveaux diagrammes. Loption Couleurs uniquement utilise seulement les couleurs pour diffrencier les lments de diagramme et nutilise pas de motif. Loption Motifs uniquement utilise seulement les styles de courbe, les symboles des marques ou les motifs de remplissage pour diffrencier les lments de diagramme. Elle nutilise pas de couleur.
Cadre. Permet de contrler laffichage des cadres intrieurs et extrieurs des nouveaux diagrammes. Quadrillage. Permet de contrler laffichage des quadrillages de laxe dchelle et de laxe des modalits des nouveaux diagrammes. Cycles de style. Personnalise les couleurs, les styles de ligne, les symboles de marque

et les motifs de remplissage pour les nouveaux diagrammes. Vous pouvez changer lordre des couleurs et des motifs utiliss lors de la cration dun diagramme. Remarque : Ces paramtres nont pas deffet sur les diagrammes interactifs (menu Graphes, sous-menu Interactive).

Donnes Couleurs des lments :


Prcisez lordre dans lequel les couleurs doivent tre utilises pour les lments de donnes (comme les btons et les marques) de votre nouveau diagramme. Les couleurs sont utilises ds que vous effectuez une slection incluant loption Couleur dans la zone de groupe Prfrence de cycle de style de la bote de dialogue principale Options de diagramme. Par exemple, si vous crez un diagramme en btons juxtaposs comprenant deux groupes, et que vous slectionnez Couleurs puis motifs dans la bote de dialogue principale Options de diagramme, les deux premires couleurs de la liste

669 Options

des diagrammes regroups sont utilises comme couleurs des btons du nouveau diagramme.
Pour modifier lordre dutilisation des couleurs
E Slectionnez Diagramme simple, puis slectionnez une couleur utilise pour les

diagrammes sans modalits.


E Slectionnez Diagramme regroup pour modifier le cycle des couleurs des diagrammes

avec modalits. Pour modifier la couleur dune modalit, slectionnez la modalit concerne, puis choisissez une couleur dans la palette. Sinon, vous pouvez : insrer une nouvelle modalit avant la modalit slectionne ; dplacer une modalit slectionne ; supprimer une modalit slectionne. paramtrer la squence sur la valeur par dfaut ; modifier une couleur en slectionnant son puits, puis en cliquant sur Edition.

Courbes des lments de donnes


Prcisez lordre dans lequel les styles doivent tre utiliss pour les lments de donnes de la courbe de votre nouveau diagramme. Les styles de courbe sont utiliss si votre diagramme inclut des lments de donnes de courbe et que vous effectuez une slection incluant loption Types dans la zone de groupe Prfrence de cycle de style de la bote de dialogue principale Options de diagramme. Par exemple, si vous crez un diagramme curviligne comprenant deux groupes, et que vous slectionnez Motifs uniquement dans la bote de dialogue principale Options de diagramme, les deux premiers styles de la liste des diagrammes regroups sont utiliss comme motifs des courbes du nouveau diagramme.
Pour modifier lordre dutilisation des styles de lignes
E Slectionnez Diagramme simple, puis slectionnez un style de courbe utilis pour les

diagrammes curvilignes sans modalits.

670 Chapitre 44 E Slectionnez Diagramme regroup pour modifier le cycle des motifs des diagrammes

curvilignes avec modalits. Pour modifier le style de courbe dune modalit, slectionnez la modalit concerne, puis choisissez un style de courbe dans la palette. Sinon, vous pouvez : insrer une nouvelle modalit avant la modalit slectionne ; dplacer une modalit slectionne ; supprimer une modalit slectionne. paramtrer la squence sur la valeur par dfaut ;

Marques des lments de donnes


Prcisez lordre dans lequel les symboles doivent tre utiliss pour les lments de donnes des marques de votre nouveau diagramme. Les styles de marque sont utiliss si votre diagramme inclut des lments de donnes de marque et que vous effectuez une slection incluant loption Types dans la zone de groupe Prfrence de cycle de style de la bote de dialogue principale Options de diagramme. Par exemple, si vous crez un diagramme de dispersion comprenant deux groupes, et que vous slectionnez Motifs uniquement dans la bote de dialogue principale Options de diagramme, les deux premiers symboles de la liste des diagrammes regroups sont utiliss comme marques du nouveau diagramme.
Pour modifier lordre dutilisation des styles de marques
E Slectionnez Diagramme simple, puis slectionnez un symbole de marque utilis pour

les diagrammes sans modalits.


E Slectionnez Diagramme regroup pour modifier le cycle des motifs des diagrammes

avec modalits. Pour modifier le symbole de marque dune modalit, slectionnez la modalit concerne, puis choisissez un symbole dans la palette. Sinon, vous pouvez : insrer une nouvelle modalit avant la modalit slectionne ; dplacer une modalit slectionne ; supprimer une modalit slectionne. paramtrer la squence sur la valeur par dfaut ;

671 Options

Remplissages des lments de donnes


Prcisez lordre dans lequel les styles de remplissage doivent tre utiliss pour les lments de donnes de bton et daire de votre nouveau diagramme. Les styles de remplissage sont utiliss si votre diagramme inclut des lments de donnes de bton et daire, et que vous effectuez une slection incluant loption Types dans la zone de groupe Prfrence de cycle de style de la bote de dialogue principale Options de diagramme. Par exemple, si vous crez un diagramme en btons juxtaposs comprenant deux groupes, et que vous slectionnez Motifs uniquement dans la bote de dialogue principale Options de diagramme, les deux premiers styles de la liste des diagrammes regroups sont utiliss comme motifs de remplissage des btons du nouveau diagramme.
Pour modifier lordre dutilisation des styles de remplissage
E Slectionnez Diagramme simple, puis slectionnez un motif de remplissage utilis pour

les diagrammes sans modalits.


E Slectionnez Diagramme regroup pour modifier le cycle des motifs des diagrammes

avec modalits. Pour modifier le motif de remplissage dune modalit, slectionnez la modalit concerne, puis choisissez un motif de remplissage dans la palette. Sinon, vous pouvez : insrer une nouvelle modalit avant la modalit slectionne ; dplacer une modalit slectionne ; supprimer une modalit slectionne. paramtrer la squence sur la valeur par dfaut ;

672 Chapitre 44

Options diagrammes interactifs


Figure 44-6 Bote de dialogue Options, onglet Interactif

Pour des diagrammes interactifs (menus Graphes, sous-menu Interactive), les options suivantes sont disponibles :
AspectGraphique. Slectionnez un modle de graphiques dans la liste des fichiers et

cliquez sur OK ou Appliquer. Par dfaut, la liste affiche les modles de graphiques enregistrs dans le rpertoire Looks du rpertoire dans lequel le programme est install. Vous pouvez utiliser lun des modles de graphiques fournis avec le programme, ou vous pouvez crer le vtre dans lditeur de graphiques interactifs (depuis un diagramme activ, choisissez Modles de graphiques dans le menu Format).
Rpertoire. Permet de slectionner un rpertoire de modles de graphiques.

Utilisez Parcourir pour ajouter des rpertoires la liste.


Parcourir. Cette procdure permet de slectionner un modle de graphiques

partir dun autre rpertoire.

673 Options

Donnes enregistres avec diagramme. Contrle les informations enregistres avec des diagrammes interactifs une fois que les diagrammes ne sont plus attachs au fichier donnes qui les a crs (par exemple, si vous ouvrez un fichier Viewer enregistr dans une session prcdente). Enregistrer des donnes avec le diagramme vous permet dexcuter la plupart des fonctions interactives disponibles pour les diagrammes attachs au fichier donnes qui les a crs (sauf dajouter des variables qui ntaient pas incluses dans le diagramme original). Cependant, ceci peut substantiellement augmenter la taille des fichiers Viewer, particulirement pour les fichiers donnes importants. Rsolution de limpression. Contrle la rsolution dimpression de diagrammes

interactifs. Dans la plupart des cas, loption Mtafichier vecteur produira une impression plus rapide et offrira les meilleurs rsultats. Dans le cas des bitmaps, les diagrammes basse rsolution simpriment plus rapidement et les diagrammes haute rsolution ont un meilleur aspect.
Units de mesure. Le systme de mesure utilis (Points, Pouces ou Centimtres) pour

spcifier des attributs comme la taille de la rgion de donnes dans un diagramme.


Lecture des fichiers de donnes Pre-8.0. Pour les fichiers de donnes crs avec les

versions prcdentes de SPSS, la lecture des donnes partir de formats de fichiers externes et les nouvelles variables cres dans une session, vous pouvez spcifier le nombre minimum de valeurs de donnes pour une variable numrique utilis pour classifier la variable en tant que variable dchelle ou nominale. Les variables avec moins que le nombre spcifi de valeurs uniques sont classes comme nominales. Remarque : A lexception du niveau de mesure, ces paramtres naffectent que les diagrammes interactifs (menu Graphes, sous-menu Interactif).

Options tableaux pivotants


Les options de tableaux pivotants dfinissent le modle de tableau par dfaut utilis pour de nouveaux rsultats de tableaux pivotants. Le modle de tableau peut contrler une varit dattributs de tableaux pivotants, y compris laffichage et la largeur du quadrillage; le style de police, la taille, la couleur; et la couleur de fond.

674 Chapitre 44 Figure 44-7 Bote de dialogue Options, onglet Tableaux pivotants

Modle de tableaux. Slectionnez un modle de tableau dans la liste des fichiers et cliquez sur OK ou sur Appliquer. Par dfaut, la liste affiche les modles de tableau enregistrs dans le rpertoire Looks dans lequel le programme est install. Vous pouvez utiliser lun des modles de tableau SPSS ou en crer un dans lditeur de tableaux pivotants (dans le menu Format, choisissez Modles de tableaux). Parcourir... Cette procdure permet de slectionner un modle de tableau partir

dun autre rpertoire.


Dfinir le rpertoire des modles de tableaux. Cette procdure permet de modifier

le rpertoire des modles de tableau par dfaut.


Ajustement largeur de colonne pour Cette procdure permet de contrler lajustement

automatique des largeurs de colonnes des tableaux pivotants.

675 Options

Etiquettes seulement. Cette procdure permet dajuster la largeur de colonne

par rapport la largeur de ltiquette colonne. Cela produit des tableaux plus compacts, mais les valeurs de donnes plus larges que ltiquette ne seront pas affichs (des astrisques indiquent les valeurs trop larges pour tre affiches).
Etiquettes et donnes. Cette procdure permet dajuster la largeur de colonne

par rapport la plus grande largeur, soit celle de ltiquette colonne, soit celle de la valeur des donnes. Cela produit des tableaux plus larges, mais garantit que toutes les valeurs seront affiches.
Mode de modification par dfaut . Contrle lactivation des tableaux pivotants dans la fentre du Viewer ou dans une fentre spare. Par dfaut, le fait de double-cliquer sur un tableau pivotant active le tableau dans la fentre du Viewer. Vous pouvez choisir dactiver les tableaux pivotants dans une fentre spare ou de slectionner une dfinition de taille qui ouvrira de plus petits tableaux pivotants dans la fentre du Viewer et de plus grands tableaux pivotants dans une fentre spare.

676 Chapitre 44

Options de donnes
Figure 44-8 Bote de dialogue Options, onglet Donnes

Options de transformation et fusion Chaque fois que SPSS excute une commande, il

lit le fichier de donnes. Certaines transformations de donnes (telles que Calculer et Recoder) et certaines transformations de fichiers (telles que Ajouter Variables et Ajouter Observations) ne ncessitent pas de passe de donnes spare, et lexcution de ces commandes peut tre retarde jusqu ce que SPSS lise les donnes pour excuter une autre commande, telle quune procdure statistique. Pour les gros fichiers de donnes, slectionner Calculer les valeurs avant leur utilisation pour retarder lexcution et enregistrer le temps de traitement.
Afficher format nouvelles variables numriques. Cette procdure permet de contrler la largeur daffichage par dfaut et le nombre de positions dcimales par dfaut des nouvelles variables numriques. Il nexiste pas de format daffichage par dfaut pour les nouvelles variables chanes. Si une valeur est trop grande pour le format daffichage spcifi, les premires dcimales sont arrondies et les valeurs sont ensuite

677 Options

converties en notation scientifique Les formats daffichage naffectent pas les valeurs de donnes internes. Par exemple, la valeur 123456.78 peut tre arrondie 123457 pour laffichage, mais la valeur originale non arrondie est utilise pour tout calcul.
Dfinir sicle pour annes sur 2 chiffres : Dfinit lintervalle dannes pour les variables de format de date entrs et/ou affichs avec des annes deux chiffres (par exemple,10/28/86, 29-OCT-87). Le paramtrage de lintervalle automatique est bas sur lanne en cours, commenant 69 annes avant et finissant 30 annes aprs lanne en cours (ajouter lanne en cours donne un intervalle total de 100 annes). Pour un intervalle personnalis, lanne de fin est automatiquement dtermine en fonction de la valeur que vous entrez pour lanne de dbut. Gnrateur de nombres alatoires. Deux types de gnrateur de nombres alatoires

sont disponibles :
Compatible avec SPSS 12. Gnrateur de nombres alatoires utilis dans SPSS 12

et les versions prcdentes. Si vous avez besoin de reproduire des rsultats alatoires gnrs dans des versions prcdentes sur la base d'une valeur de gnrateur spcifie, utilisez ce gnrateur de nombres alatoires.
Mersenne Twister. Gnrateur de nombres alatoires plus rcent et plus fiable

pour les simulations. Si la reproduction de rsultats alatoires partir de SPSS 12 ou d'une version antrieure n'est pas un problme, utilisez ce gnrateur de nombres alatoires.

Options montaires (devises)


Vous pouvez afficher jusqu cinq formats montaires personnaliss (devises) qui peuvent comprendre des caractres spciaux de prfixe et suffixe, et qui peuvent recevoir un traitement spcial pour les valeurs ngatives. Les cinq noms de format montaire personnalis sont CCA, CCB, CCC, CCD, et CCE. Vous ne pouvez pas modifier les noms de format ou en ajouter de nouveaux. Pour modifier un format montaire personnalis, slectionnez le nom du format partir de la liste source et procdez aux modifications souhaites.

678 Chapitre 44 Figure 44-9 Bote de dialogue Options, onglet Devises

Les prfixes et suffixes dfinis pour les formats montaires servent uniquement laffichage. Vous ne pouvez saisir de valeur dans lditeur de donnes en utilisant des caractres montaires personnaliss.

Cration de formats montaires personnaliss


E Cliquez sur longlet Devise. E Slectionnez un des formats de devises dans la liste (CCA, CCB, CCC, CCD et CCE). E Saisissez les valeurs de prfixe, suffixe, et de sparateur dcimal E Cliquez sur OK ou sur Appliquer.

679 Options

Options script
Utilisez longlet Scripts pour spcifier le fichier de procdures globales et le fichier autoscript, et slectionner les sous-routines dautoscript utiliser. Vous pouvez utiliser les scripts pour automatiser de nombreuses fonctions dans SPSS, y compris la personnalisation des tableaux pivotants.
Procdures globales. Le fichier de procdure globale est une bibliothque de

sous-routines script et de fonctions script qui peuvent tre nommes par fichier script, y compris les fichiers autoscript. Remarque : Le fichier de procdures globales livr avec SPSS est slectionn par dfaut. Nombre des scripts livrs avec SPSS utilisent des fonctions et des sous-routines de ce fichier de procdures globales et ne seront pas oprationnelles si vous spcifiez un fichier de procdures globales diffrent.
Autoscripts.Un fichier dautoscript est un recueil de sous-routines script excutes

automatiquement chaque fois que vous lancez des procdures qui crent certains types dobjet de sortie.

680 Chapitre 44 Figure 44-10 Bote de dialogue Options, onglet Scripts

Toutes les sous-routines du fichier courant autoscript sont affiches, ce qui vous permet dautoriser, ou non, les sous-routines individuelles.

Pour spcifier des options pour fichiers de procdures globales et autoscripts


E Cliquez sur longlet Scripts. E Slectionnez Permettre lautoscript. E Slectionnez les sous-routines dautoscript souhaites.

Vous pouvez aussi spcifier un fichier dautoscript diffrent ou un fichier de procdure globale.

Personnalisation des menus et des barres doutils


Editeur de menu

45

Chapitre

Vous pouvez utiliser lditeur de menu pour personnaliser vos menus SPSS. Avec lditeur de menu vous pouvez : Ajouter des lments de menus qui excutent des scripts SPSS personnaliss. Ajouter des lments de menu qui excutent des fichiers de syntaxe de commande SPSS. Ajouter des lments de menu qui lancent dautres applications et envoient automatiquement des donnes SPSS vers dautres applications. SPSS peut envoyer des donnes vers dautres applications dans les formats suivants : SPSS, Excel 4.0, Lotus 1-2-3 version 3, SYLK, tabul, et dBASE IV.

Pour ajouter des items aux menus


E A partir des menus, slectionnez : Outils Editeur de menu E Dans la bote de dialogue Editeur de menu, double-cliquez sur le menu dans lequel

vous voulez rajouter un nouvel lment.


E Slectionnez llment de menu au-dessus de laquelle vous voulez quapparaisse

la nouvelle option.
E Cliquez sur Insrer item pour insrer un nouvel lment de menu. 681

682 Chapitre 45 E Slectionnez le type de fichier du nouvel lment (fichier de script, fichier de syntaxe

de commande ou application externe).


E Cliquez sur Parcourir pour slectionner un fichier attacher llment de menu. Figure 45-1 Bote de dialogue Editeur de menu

Vous pouvez galement ajouter des menus entirement nouveaux et des sparateurs entre les lments de menu. Vous pouvez galement envoyer automatiquement le contenu de lditeur de donnes vers une autre application lorsque vous slectionnez cette application dans les menus SPSS.

Personnalisation des barres doutils


Vous pouvez personnaliser les barres doutils SPSS et crer de nouvelles barres doutils. Les barres doutils peuvent contenir tous les outils disponibles dans SPSS, y compris les outils utiliss pour toutes les procdures des menus. Elles peuvent galement contenir des outils personnaliss permettant de lancer dautres applications, dexcuter des fichiers de syntaxe de commande ou des fichiers de script.

683 Personnalisation des menus et des barres doutils

Montrer barres doutils


Utilisez Montrer barres doutils pour afficher ou masquer les barres doutils, les personnaliser et en crer de nouvelles. Les barres doutils peuvent contenir tous les outils disponibles dans SPSS, y compris les outils utiliss pour toutes les procdures des menus. Elles peuvent galement contenir des outils personnaliss permettant de lancer dautres applications, dexcuter des fichiers de syntaxe de commande ou des fichiers de script.
Figure 45-2 Bote de dialogue Montrer barres doutils

Pour personnaliser les barres doutils


E A partir des menus, slectionnez : Affichage Barres doutils... E Slectionnez la barre doutils que vous voulez personnaliser et cliquez sur Personnaliser, ou cliquez sur Nouvelle barre doutils pour crer une barre doutils. E Pour les nouvelles barres doutils, indiquez le nom de la barre, slectionnez les fentres dans lesquelles vous voulez quelle apparaisse et cliquez sur Personnaliser.

684 Chapitre 45 E Slectionnez un lment dans la liste Modalits pour afficher les outils disponibles

dans cette modalit.


E Faites glisser et lchez les outils que voulez inclure dans la barre doutils affiche

dans la bote de dialogue.


E Pour supprimer un outil dans une barre doutils, le faire glisser nimporte o en dehors

de la barre doutils affiche dans la bote de dialogue. Pour crer un outil personnalis pour ouvrir un fichier, excuter un fichier de syntaxe de commande ou excuter un script :
E Cliquez sur Nouvel outil dans la bote de dialogue Personnaliser barre doutils. E Indiquez une tiquette dcrivant loutil. E Slectionnez laction que vous voulez affecter loutil (ouvrir un fichier, excuter un

fichier de syntaxe de commande ou excuter un script).


E Cliquez sur Parcourir pour slectionner un fichier ou une application associer

loutil. Les nouveaux outils saffichent dans la modalit dfinie par lutilisateur, qui peut aussi contenir des lments de menu dfinis par lutilisateur.

Proprits barre doutils


Utilisez Proprits des barres doutils pour slectionner les types de fentres dans lesquelles vous voulez voir apparatre la barre doutils slectionne. Cette bote de dialogue sert aussi crer des noms ou de nouvelles barres doutils.

685 Personnalisation des menus et des barres doutils Figure 45-3 Bote de dialogue Proprits barre doutils

Pour dfinir des proprits des barres doutils


E A partir des menus, slectionnez : Affichage Barres doutils... E Pour les barres doutils existantes, cliquez sur Personnaliser, puis sur Proprits dans

la bote de dialogue Personnaliser barre doutils.


E Pour les nouvelles barres doutils, cliquez sur Nouvel outil. E Slectionnez les types de fentres dans lesquelles vous voulez voir apparatre la barre

doutils. Pour les nouvelles barres doutils, indiquez aussi un nom de barre.

Personnaliser barre doutils


Utilisez la bote de dialogue Personnaliser barre doutils pour personnaliser les barres doutils existantes et en crer de nouvelles. Les barres doutils peuvent contenir tous les outils disponibles dans SPSS, y compris les outils utiliss pour toutes les procdures des menus. Elles peuvent galement contenir des outils personnaliss permettant de lancer dautres applications, dexcuter des fichiers de syntaxe de commande ou des fichiers de script.

686 Chapitre 45 Figure 45-4 Bote de dialogue Personnaliser barre doutils

Crer nouvel outil


Utilisez la bote de dialogue Crer nouvel outil pour crer des outils personnaliss permettant de lancer dautres applications, dexcuter des fichiers de syntaxe de commande et dexcuter des fichiers de script.

687 Personnalisation des menus et des barres doutils Figure 45-5 Bote de dialogue Crer nouvel outil

Editeur bitmap de barre doutils


Utilisez lditeur BMP pour crer des icnes personnalises pour les boutons des barres doutils. Cela est tout particulirement utile pour les outils personnaliss crs pour excuter des scripts, de la syntaxe et dautres applications.

688 Chapitre 45 Figure 45-6 Editeur BMP

Pour modifier les images bitmap de la barre doutils


E A partir des menus, slectionnez : Affichage Barres doutils... E Slectionnez la barre doutils personnaliser et cliquez sur Personnaliser. E Cliquez sur loutil avec licne bitmap que vous voulez modifier dans lexemple

de barre doutils.
E Cliquez sur Modifier outil.

689 Personnalisation des menus et des barres doutils E Utilisez la bote outils et la palette de couleurs pour modifier limage bitmap ou

crer une nouvelle icne bitmap.

Systme de production

46

Chapitre

Le Systme de Production permet dexcuter SPSS en mode automatis. SPSS fonctionne seul et prend fin aprs avoir excut la dernire commande, ce qui vous permet dexcuter dautres tches pendant quil fonctionne. Le mode Production est utile si vous excutez souvent le mme ensemble danalyses longues, telles que des rapports hebdomadaires. Le Systme de Production utilise des fichiers de syntaxe de commande pour indiquer au programme la marche suivre. Un fichier de syntaxe de commande est un fichier texte simple contenant une syntaxe de commande. Vous pouvez utiliser nimporte quel diteur de texte pour crer ce fichier. Vous pouvez galement gnrer une syntaxe de commande en collant les slections de la bote de dialogue dans une fentre de syntaxe ou en modifiant le fichier-journal. Aprs que vous avez cr des fichiers de syntaxe et que vous les avez intgrs dans une tche de production, vous pouvez les afficher et les modifier partir du systme de production.

691

692 Chapitre 46 Figure 46-1 Systme de production

Format de saisie de syntaxe. Permet de contrler la forme des rgles de syntaxe

utilises pour la tche :


Interactif. Chaque commande doit se terminer par un point. Les points peuvent

figurer nimporte o dans la commande et les commandes peuvent occuper plusieurs lignes. Par contre, lorsquun point reprsente le dernier caractre non vide dune ligne, il est considr comme la fin de la commande. Les lignes suivantes et les nouvelles commandes peuvent commencer nimporte o sur une nouvelle ligne. Voici les rgles interactives appliques lorsque vous slectionnez et excutez des commandes dans une fentre de syntaxe.
Commande. Chaque commande doit commencer au dbut dune nouvelle ligne

(aucun espace vide avant le dbut de la commande) et les lignes suivantes doivent commencer par un dcrochement dau moins un espace. Pour mettre en retrait de nouvelles commandes, vous pouvez entrer le signe plus, un tiret ou un point pour le premier caractre au dbut de la ligne, puis mettre en retrait la commande relle. Le point la fin de la commande est optionnel. Ce paramtre est compatible avec les rgles de syntaxe des fichiers de commande qui accompagnent la commande INCLUDE.

693 Systme de production

Comportement derreur de syntaxe. Permet de contrler le traitement des conditions

derreur dans la tche :


Poursuivre. Les erreurs figurant dans la tche narrtent pas automatiquement le

traitement des commandes. Les commandes des fichiers de tches de production sont traites comme une partie du flux de commandes normal et le traitement des commandes se poursuit normalement.
Arrter. Le traitement des commandes sarrte lorsque la premire erreur dun

fichier de tches de production est dtecte. Ce paramtre est compatible avec le comportement des fichiers de commande qui accompagnent la commande INCLUDE.
Rsultats de la tche de production. Chaque squence de production cre un fichier

de rsultats portant le mme nom que la tche de production et lextension .spo. Par exemple, un fichier de tche de production intitul prodjob.spp cre un fichier de rsultats intitul prodjob.spo. Le fichier de rsultats est un document du Viewer.
Type de rsultat. Les sorties du Viewer sont sous forme de tableaux pivotants et de

graphiques haute rsolution et interactifs. Le Viewer en mode brouillon produit les rsultats texte et des fichiers images (metafiles ou mtafichiers) des graphiques. Les rsultats texte peuvent tre modifis dans le Viewer en mode brouillon, linverse des graphiques.

Utilisation de lUtilitaire de Production


E Crez un fichier de syntaxe de commande. E Dmarrez le Systme de production, disponible dans le menu Dmarrage. E Indiquez les fichiers de syntaxe que vous souhaitez utiliser dans la tche de production. Cliquez sur Ajouter pour slectionner les fichiers de syntaxe. E Enregistrer le fichier de Tche de production. E Excutez le fichier de Tche de production. Cliquez sur le bouton Excuter de la barre

doutils ou choisissez dans les menus :


Excuter Tche de production

694 Chapitre 46

Options dexportation
Les options dexportation permettent denregistrer les tableaux pivotants SPSS et les lments texte au format HTML, texte, Word/RTF et Excel, et denregistrer des diagrammes sous divers formats communment utiliss par dautres applications.
Figure 46-2 Bote de dialogue Options dexportation

Exporter

Cette liste droulante indique les lments que vous souhaitez exporter.
Document rsultat. Exporte toute combinaison de tableaux pivotants, rsultat texte et

diagrammes. Pour les formats HTML et texte, les diagrammes sont exports dans le format dexportation du diagramme slectionn. Pour le format document HTML, les tableaux sont intgrs par rfrence, et vous devez exporter les tableaux sous un format adapt pour permettre leur intgration dans des documents HTML. Pour le format document texte, une ligne est insre dans le fichier texte pour chaque diagramme, indiquant le nom de fichier du diagramme export. Pour le format Word/RTF, les diagrammes sont exports au format mtafichier Windows et incorpors dans le document Word. Les diagrammes ne sont pas inclus dans les documents Excel.
Document Rsultat (sans Graphiques). Exporte les tableaux pivotants et les rsultats texte. Les diagrammes du Viewer sont ignors. Graphiques uniquement. Nexporte que les graphiques. Pour les documents HTML et texte, les formats dexportation sont les suivants : mtafichier amlior (EMF), mtafichier Windows (WMF), bitmap Windows (BMP), PostScript encapsul

695 Systme de production

(EPS), JPEG, TIFF, PNG et PICT Macintosh. Pour les documents Word/RTF, les diagrammes sont toujours exports au format mtafichier Windows.
Format dexportation

Pour les documents de rsultat, les options disponibles sont HTML, texte, Word/RTF et Excel ; pour les formats HTML et texte, les diagrammes sont exports au format du diagramme slectionn. Pour Graphiques Seulement, slectionnez un format dexportation de graphiques dans la liste droulante. Pour les documents de rsultat, les tableaux pivotants et le texte sont exports de la faon suivante :
Fichier HTML (*.htm). Les tableaux pivotants sont exports comme des tableaux

HTML. Les rsultats texte sont publis au format HTML pr-format.


Fichier texte (*.txt). Les tableaux pivotants peuvent tre exports en format tabul

ou avec espaces. Tous les rsultats texte sont exports en format avec espaces.
Fichier Excel (*.xls). Les lignes, colonnes et cellules des tableaux pivotants sont

exportes comme des lignes, colonnes et cellules Excel, avec tous les attributs de formatage (bordures de cellule, styles de police, couleurs darrire-plan, etc.). Le rsultat texte est export avec tous les attributs de police. Chaque ligne du rsultat texte est une ligne dans le fichier Excel, avec le contenu de toute la ligne dans une seule cellule.
Fichier Word/RTF (*.doc). Les tableaux pivotants sont exports en tant que tableaux

Word, avec tous les attributs de formatage (bordures de cellule, styles de police, couleurs darrire-plan, etc.). La sortie texte est exporte au format RTF. Le rsultat texte dans SPSS apparat toujours dans une police espacement fixe (monoespac) et est export avec les mmes attributs de police. Une police espacement fixe (monoespac) est ncessaire pour le bon alignement des rsultats texte spars par des espaces.
Format dimage

Loption Format dimage contrle le format dexportation des diagrammes. Les diagrammes peuvent tre exports aux formats suivants : mtafichier amlior (EMF), mtafichier Windows (WMF), bitmap Windows (BMP), PostScript encapsul (EPS), JPEG, TIFF, PNG ou PICT Macintosh. Les noms des diagrammes exports comprennent le nom de fichier de la tche de production, un numro squentiel, et lextension du format choisi. Si la tche de production prodjob.spp exporte des diagrammes au format mtafichier Windows,

696 Chapitre 46

les noms des diagrammes seraient prodjob1.wmf, prodjob2.wmf, prodjob3.wmf, et ainsi de suite.
Options de texte et dimage

Les options dexportation de texte (spar par des tabulations ou par des espaces, par exemple) et les options dexportation de diagrammes (paramtres des couleurs, taille et rsolution, par exemple) sont dfinies dans SPSS et ne peuvent pas tre modifies dans le systme de production. Pour modifier les options dexportation de texte et de diagrammes, utilisez loption Exporter du menu Fichier de SPSS.
Exportation du Viewer en mode brouillon

La seule option dexportation disponible pour les rsultats du Viewer en mode brouillon consiste exporter les rsultats en texte simple. Les diagrammes ne peuvent tre exports par le Viewer en mode brouillon.

Invites utilisateur
Les symboles de macro dfinis dans un fichier de tche de production et utiliss dans un fichier de syntaxe de commande simplifient les tches comme lexcution de la mme analyse pour diffrents fichiers de donnes ou lexcution du mme ensemble de commandes pour diffrents ensembles de variables. Vous pouvez par exemple dfinir les symboles de macro @datfile pour que le systme vous demande un nom de fichier de donnes chaque fois que vous excutez une tche de production qui utilise la chane @datfile au lieu dun nom de fichier dans le fichier de syntaxe de commande.

697 Systme de production Figure 46-3 Bote de dialogue Invites utilisateur

Symbole de macro. Nom de macro utilis dans le fichier de syntaxe de commande pour appeler la macro qui demande lutilisateur de saisir des informations. Le nom du symbole de macro doit commencer par un @. Remarque : Ces symboles macro ne sont pas lis aux macros cres par lutilitaire de macro SPSS en utilisant DEFINE-!ENDDEFINE. Invite. Etiquette descriptive qui saffiche lorsque la tche de production vous demande

de saisir des informations. Vous pouvez par exemple utiliser la phrase Quel fichier de donnes souhaitez-vous utiliser ? pour identifier un champ qui exige un nom de fichier de donnes.
Dfaut. Valeur que la tche de production donne par dfaut si vous ne tapez pas une valeur diffrente. Cette valeur saffiche lorsque la tche de production vous demande cette information. Vous pouvez remplacer ou modifier cette valeur pendant lexcution.

698 Chapitre 46

Mettre la valeur entre guillemets. Tapez O ou Oui si vous souhaitez que la valeur soit mise entre guillemets. Sinon, laissez le champ vide ou tapez N ou Non. Par exemple, vous devez entrer Oui pour les spcifications de nom de fichier car les spcifications de ce type doivent tre places entre guillemets.
Figure 46-4 Invites de macro dans un fichier de syntaxe de commande

Sollicitation de macros de production


Le systme de production SPSS vous demande des valeurs chaque fois que vous excutez une tche de production qui contient des symboles de macro dfinis. Vous pouvez remplacer ou modifier les valeurs par dfaut affiches. SPSS remplace alors ces valeurs par les symboles de macro dans tous les fichiers de syntaxe de commande associs la tche de production.

699 Systme de production Figure 46-5 Bote de dialogue Sollicitation de macros de production

Remarque : Ces symboles macro ne sont pas lis aux macros cres par lutilitaire de macro SPSS en utilisant DEFINE-!ENDDEFINE et la tche de production vous invitera saisir ces valeurs mme si aucun des fichiers de syntaxe de commande de la tche ninclut de rfrences ces macros dfinies.

Options de production
Les options de production vous permettent de : Spcifier un diteur de texte par dfaut pour les fichiers de syntaxe auxquels on a accd par le bouton de modification de la bote de dialogue principale. Excuter la tche de production comme une opration de fond invisible ou afficher SPSS et les rsultats quil gnre au fur et mesure de lexcution de la tche. Dfinir un serveur distant, un nom de domaine, un ID utilisateur ainsi quun mot de passe pour lanalyse distribue (applicable uniquement si vous disposez dun accs rseau la version serveur de SPSS). Si vous ne fournissez pas ces informations, les paramtres par dfaut de la bote de dialogue de connexion au serveur de SPSS seront utiliss. Vous ne pouvez slectionner que les serveurs distants que vous avez prcdemment dfinis dans la bote de dialogue dajout de serveur de SPSS (menu Fichier, Changer serveur, Ajouter).

700 Chapitre 46 Figure 46-6 Options

Modification des options de production


Dans les menus du Systme de production choisissez
Edition Options

Contrle du format des tches de production


Plusieurs paramtres de SPSS peuvent vous aider choisir le meilleur format pour les tableaux pivotants crs dans les tches de production :
Aspects de tableaux. En modifiant et en enregistrant Aspects de tableaux (menu

Format dans un tableau pivotant actif) vous pouvez contrler de nombreux attributs de tableaux pivotants. Vous pouvez spcifier les tailles et styles de polices, les couleurs, et les bordures. Pour viter la division de tableaux larges sur plusieurs pages, slectionnez Redimensionner largeur de tableau pour lajuster la page dans longlet Gnral, option Proprits du tableau.

701 Systme de production

Etiquettes de rsultats. Les options Etiquettes de rsultats (Menu Edition, Options,

onglet Etiquettes Rsultats) contrlent laffichage des informations relatives aux variables et aux valeurs de donnes dans les tableaux pivotants. Vous pouvez afficher des noms de variables et/ou des tiquettes de variable dfinies, des valeurs de donnes relles et/ou des tiquettes de valeurs dfinies. Les tiquettes de variable et de valeur, plus descriptives, permettent souvent dinterprter plus facilement vos rsultats. Toutefois, de longues tiquettes peuvent parfois paratre tranges dans certains tableaux.
Largeur de colonne. Les options Tableaux pivotants (menu Edition, Options, onglet

Tableaux pivotants) contrlent les modles de tableaux par dfaut et lajustement automatique des largeurs de colonnes dans les tableaux pivotants.
Etiquettes seulement. Cette procdure permet dajuster la largeur de colonne par

rapport la largeur de ltiquette de colonne. Cela produit des tableaux plus compacts, mais les valeurs de donnes plus larges que ltiquette ne seront pas affichs (des astrisques indiquent les valeurs trop larges pour tre affiches).
Etiquettes et donnes. Cette procdure permet dajuster la largeur de colonne par

rapport la plus grande largeur, soit celle de ltiquette de colonne, soit celle de la valeur des donnes. Cela produit des tableaux plus larges, mais garantit que toutes les valeurs seront affiches. Les tches de production utilisent les paramtres en vigueur dfinis sous Modle de tableau et Options. Vous pouvez dfinir les paramtres dans Modles de tableaux et Options avant de lancer votre tche de production, mais vous pouvez galement utiliser les commandes SET dans vos fichiers de syntaxe pour les contrler. Le recours aux commandes SET dans les fichiers de syntaxe vous permet dutiliser plusieurs paramtres Modles de tableaux et Options dans la mme tche.

Cration dun modle de tableau par dfaut personnalis


E Activez le tableau pivotant (double-cliquez un endroit quelconque du tableau). E A partir des menus, slectionnez : Format Aspects de tableaux... E Slectionnez un modle de tableau dans la liste et cliquez sur Modifier modle. E Dfinissez les proprits du tableau selon les attributs voulus.

702 Chapitre 46 E Cliquez sur Enregistrer aspect ou Enregistrer sous pour enregistrer le modle de tableau et cliquez sur OK. E A partir des menus, slectionnez : Edition Options E Cliquez sur longlet Tableaux pivotants. E Slectionnez le modle de tableau dans la liste et cliquez sur OK.

Dfinition des options pour les tches de production


E A partir des menus, slectionnez : Edition Options E Slectionnez les options souhaites. E Cliquez sur OK.

Vous pouvez dfinir le modle de tableau par dfaut, les paramtres des tiquettes de rsultats, et lajustement automatique de la largeur des colonnes avec Options. Les paramtres dfinis sous Options sont enregistrs avec le programme. Lorsque vous excutez une tche de production, les paramtres des options en vigueur lors de la dernire excution du programme sont appliqus la tche de production.

Contrle du format des tableaux pivotants avec la syntaxe de commande


SET TLOOK. Contrle le modle de tableau par dfaut pour les nouveaux tableaux

pivotants, comme dans :


SET TLOOK = 'c:\prodjobs\montableau.tlo'.

SET TVARS. Contrle laffichage des noms et des tiquettes de variable dans les

nouveaux tableaux pivotants.


SET TVARS = LABELS fait apparatre les tiquettes de variable. SET TVARS = NAMES fait apparatre les noms de variable. SET TVARS = BOTH fait apparatre les noms et les tiquettes de variable.

703 Systme de production

SET ONUMBER. Contrle laffichage des valeurs de donnes ou des tiquettes de

valeurs dans les nouveaux tableaux pivotants.


SET ONUMBER = LABELS fait apparatre les tiquettes de valeurs. SET ONUMBER = VALUES fait apparatre les valeurs de donnes. SET ONUMBER = BOTH fait apparatre les valeurs de donnes et les tiquettes de

valeurs.
SET TFIT. Contrle lajustement automatique de la largeur des colonnes pour les

nouveaux tableaux pivotants.


SET TFIT = LABELS ajuste la largeur des colonnes en fonction de la largeur

des tiquettes de colonne.


SET TFIT = BOTH ajuste la largeur des colonnes la largeur des tiquettes ou

la plus grande valeur de donnes, le chiffre retenu tant le plus grand des deux.

Excution de tches de production partir dune ligne de commande


Les boutons de la ligne de commande vous permettent de programmer lheure dexcution des tches de production grce aux utilitaires de programmation comme celui disponible dans Microsoft Plus!. Vous pouvez excuter des tches de Production partir dune ligne de commande laide des boutons suivants :
-r. Excute la tche de production. Si la tche de production contient des invites

utilisateur, vous devez fournir linformation demande pour que la tche de production puisse sexcuter.
-s. Excute la tche de production, et supprime les ventuels messages ou invites utilisateur. Les valeurs par dfaut des invites utilisateur sont automatiquement utilises. Analyse distribue. Si vous disposez dun accs rseau la version serveur de SPSS,

vous pouvez galement utiliser les commutateurs suivants pour excuter le systme de production en mode danalyse distribue :
-x. Nom ou adresse IP du serveur distant. -n. Numro du port. -d. Nom de domaine.

704 Chapitre 46

-u. ID utilisateur pour laccs au serveur distant. -p. Mot de passe pour laccs au serveur distant.

Si vous spcifiez lun de ces paramtres de ligne de commande pour lanalyse distribue, vous devez tous les indiquer (-x, -n, -d, -u et -p). Vous devez indiquer le chemin complet aussi bien pour le systme de production (spssprod.exe) que pour la tche de production, et les deux doivent tre mis entre guillemets, comme dans lexemple suivant :
"c:\program files\spss\spssprod.exe" "c:\spss\datajobs\prodjob.spp" -s -r

Pour les commutateurs de ligne de commande ncessitant des spcifications supplmentaires, vous devez les faire suivre du signe gal (=) immdiatement avant la spcification. Si la spcification comporte des espaces (par exemple, dans un nom de serveur en deux mots), indiquez la valeur entre guillemets ou entre apostrophes, comme dans lexemple suivant :
-x="HAL 9000" -u="nom secret"

Serveur par dfaut. Si vous disposez dun accs rseau la version serveur de SPSS, le serveur par dfaut et les informations associes (si vous ne les avez pas spcifis dans les commutateurs de ligne de commande) correspondent au serveur par dfaut dfini dans la bote de dialogue de connexion au serveur de SPSS. Si aucun serveur par dfaut nest dfini dans cette bote de dialogue, la tche sexcute en mode local. Si vous souhaitez excuter une tche de production en mode local mais que votre ordinateur local nest pas votre serveur par dfaut, indiquez des chanes vides entre guillemets pour tous les commutateurs de ligne de commande de lanalyse distribue, comme dans lexemple suivant :
"c:\program files\spss\spssprod.exe" "c:\spss\datajobs\prodjob.spp" -x="" -n="" -d="" -u="" -p=""

705 Systme de production

Excution de plusieurs tches de production

Si vous employez un fichier de commandes (.bat) ou une fonctionnalit similaire pour excuter plusieurs tches de production, utilisez la commande Dmarrer de Windows et le paramtre /wait pour contrler lexcution de chaque tche, en empchant les tches suivantes de dmarrer avant la fin de la tche prcdente. Exemple :
cd \program files\spss start /wait spssprod.exe prodjob1.spp -s start /wait spssprod.exe prodjob2.spp -s

Publication sur le Web


La fonction Publier sur le Web exporte les rsultats publier vers le serveur Web SmartViewer. Les tableaux et rapports publis dans SmartViewer peuvent tre visualiss et manipuls via le Web, en temps rel et laide dun navigateur standard. Les tableaux pivotants sont publis comme des tableaux dynamiques pouvant tre manipuls via le Web afin dobtenir diffrents affichages des donnes. Les diagrammes sont publis sous forme de fichiers graphiques JPEG ou PNG. Les rsultats texte sont publis sous forme de HTML pr-format. (La plupart des navigateurs utilisent par dfaut une police espacement fixe pour le texte prformat.).
Publier. Permet de spcifier le rsultat publier : Document rsultat. Publie la totalit du document de rsultat, y compris les

lments masqus ou rduits.


Document rsultat (sans Notes). Publie tout sauf les tableaux Notes produits

automatiquement pour chaque procdure.


Tableaux uniquement. Exclut les graphiques. Tous les tableaux pivotants et

tableaux de texte sont publis.


Tableaux uniquement (sans Notes). Exclut les graphiques et les tableaux Notes. Graphiques uniquement. Publie uniquement les graphiques du document. Rien. Dsactive la publication sur le Web. Du fait que tous les paramtres sont

enregistrs avec la tche de production (fichier spp), les rsultats seront publis chaque fois vous que excuterez la tche de production, moins que vous ne

706 Chapitre 46

slectionniez loption Rien. Celle-ci dsactive la publication tout en gnrant dautres types de rsultats (fichiers du Viewer, fichiers HTML) spcifis dans la tche de production.
Publier tableaux en tant que. Contrle la manire dont les tableaux pivotants sont

publis :
Interactif. Les tableaux sont des objets dynamiques pouvant tre manipuls via le

Web afin dobtenir diffrents affichages des donnes.


Statique. Les tableaux sont statiques et ne peuvent pas tre manipuls aprs

publication.
Configurer. Ouvre la page Configurer la publication automatique du serveur Web

SmartViewer dans une fentre de navigateur. Cette procdure est requise pour la cration dune tche de production publier sur le Web. Une ID utilisateur et un mot de passe vous sont galement demands pour accder au serveur Web SmartViewer. Lorsque vous crez une tche de production publier sur le Web, vous devez entrer votre ID utilisateur et votre mot de passe. Ces informations sont stockes dans la tche de production dans un format cod. Remarque : La fonction Publier sur le Web est disponible uniquement avec les sites o le serveur Web SmartViewer est install et elle ncessite un plug-in pour activer la fonction de publication. Contactez votre administrateur systme ou Webmaster pour obtenir des instructions sur le tlchargement du plug-in. Si SmartViewer nest pas disponible sur votre site, utilisez loption Exporter le rsultat pour enregistrer le rsultat au format HTML.

Connexion au serveur Web SmartViewer


La publication sur le serveur Web SmartViewer ncessite un nom dutilisateur (ID utilisateur) et un mot de passe valides. Contactez votre administrateur systme ou Webmaster pour plus dinformations.

Utilitaire de script SPSS

47

Chapitre

Lutilitaire de script vous permet dautomatiser certaines tches, telles que : Ouverture et enregistrement de fichiers de donnes. Affichage et manipulation de botes de dialogue. Excution des transformations de donnes et des procdures statistiques laide de la syntaxe de commande. Exportation des diagrammes sous forme de fichiers graphiques dans de nombreux formats. Rorganisation des rsultats dans lEditeur de rsultats Un certain nombre de scripts figure dans le logiciel, notamment les scripts automatiques qui sexcutent automatiquement chaque fois quun type de rsultat est produit. Vous pouvez utiliser ces scripts comme ils se prsentent ou les adapter vos besoins. Si vous souhaitez crer vos propres scripts, vous pouvez dabord en choisir un parmi les nombreux Assistants script.

Excution dun script


E A partir des menus, slectionnez : Outils Excuter le script

707

708 Chapitre 47 Figure 47-1 Bote de dialogue Excuter le script

E Slectionnez le dossier Scripts. E Slectionnez le script de votre choix.

Pour plus d'informations, reportez-vous Personnalisation des menus et des barres doutils dans Chapitre 45 p. 681.

Scripts livrs avec SPSS


Les scripts suivants sont livrs avec le programme :
Analyser les observations restantes. Rpte une analyse factorielle ou une analyse

discriminante laide des observations qui nont pas t slectionnes dans une analyse prcdente. Un tableau de remarques produit par la prcdente excution de lanalyse factorielle ou discriminante doit tre slectionn avant dexcuter le script.
Modifier la signification de p. Changez Sig. en p= dans les tiquettes de colonnes de

nimporte quel tableau pivotant. Il faut choisir le tableau avant dexcuter le script.
Clean navigator.sbs (effacer le Navigateur). Supprime tous les tableaux de remarques dun document de rsultat. Le document doit tre ouvert dans la fentre correspondante du Viewer avant lexcution du script.

709 Utilitaire de script SPSS

Frquences en bas de page. Insre les statistiques affiches dans un tableau statistique

de frquences sous forme de notes de bas de page dans le tableau de frquences correspondant pour chaque variable. Le tableau de statistiques de frquences doit tre slectionn avant lexcution du script.
Make totals bold.sbs (totaux en gras). Applique lattribut Gras et la couleur Bleue

toutes les lignes, colonnes ou strates de donnes indiques comme tant un Total dans le tableau pivotant. Il faut choisir le tableau avant dexcuter le script.
Means report.sbs (tat des moyennes). Extrait les informations du tableau des

moyennes et crit les rsultats dans plusieurs fichiers de rsultat ASCII. Le tableau des moyennes doit tre slectionn avant dexcuter le script.
Remove labels.sbs (retirer les tiquettes). Supprime toutes les tiquettes de colonnes

ou de lignes dans un tableau pivotant slectionn. Il faut choisir le tableau avant dexcuter le script.
Rerun syntax from note.sbs (rexcuter la syntaxe partir des remarques). Excute

nouveau la commande trouve dans le tableau de remarques slectionn avec le fichier de donnes actif. Si aucun fichier nest ouvert, le script tente de lire le fichier de donnes utilis initialement. Le tableau des remarques doit tre slectionn avant lexcution du script.
R-deux max. Dans le tableau rcapitulatif des modles de rgression, appliquez le

format Gras et la couleur Bleue la ligne correspondant au modle qui maximise les R2 ajusts. Le tableau rcapitulatif des modles doit tre slectionn avant lexcution du script. Pour plus d'informations, reportez-vous Options dans Chapitre 44 p. 659. Remarque : cette liste nest pas exhaustive.

Autoscripts
Les scripts automatiques sexcutent automatiquement lorsquils sont dclenchs la cration dune partie de rsultat particulire par une procdure donne. Par exemple, SPSS contient un autoscript qui supprime automatiquement la diagonale suprieure et met en surbrillance les coefficients de corrlation ngligeables chaque fois quun tableau de corrlations est produit par la procdure Corrlation Bivarie....

710 Chapitre 47

Longlet Scripts de la bote de dialogue Options (menu Edition) affiche les scripts automatiques (Autoscripts) disponibles sur votre systme et vous permet dactiver ou de dsactiver diffrents scripts.
Figure 47-2 Onglet Scripts de la bote de dialogue Options

Les scripts automatiques sont spcifiques une procdure et un type de rsultat donns. Un autoscript qui formate les tableaux ANOVA produit par une analyse ANOVA un facteur nest pas dclench par des tableaux ANOVA produits par dautres types de procdure statistiques (mais vous pourriez utiliser des procdures gnrales pour crer des scripts automatiques distincts pour les tableaux ANOVA qui partagent un code trs similaire). Cependant, vous pouvez utiliser un autoscript distinct pour chaque type de rsultat produit par la mme procdure. Frquences, par exemple, produit la fois un tableau de frquences et un tableau de statistiques, chacune pouvant avoir son propre autoscript. Pour plus d'informations, reportez-vous Options dans Chapitre 44 p. 659.

711 Utilitaire de script SPSS

Cration et modification de scripts


Vous pouvez adapter vos besoins la plupart des scripts livrs avec le logiciel. Par exemple, lun des scripts permet de supprimer tous les tableaux de remarques dans le document de rsultat choisi. Vous pouvez facilement modifier ce script pour supprimer les lments de rsultat de nimporte quel type et dtiquette.
Figure 47-3 Modifier un script dans la fentre de script

Si vous prfrez crer vos propres scripts, vous pouvez dabord en choisir un parmi les nombreux Assistants scripts.

712 Chapitre 47

Modification dun script


E A partir des menus, slectionnez : Fichier Open Script Figure 47-4 Ouvrir un fichier de script

E Slectionnez le dossier Scripts. E Dans Type, slectionnez Script SPSS (*.sbs). E Slectionnez le script de votre choix.

Si vous ouvrez plusieurs scripts, chacun deux dispose de sa propre fentre.

Fentre de script
La fentre de script est un environnement de programmation complet qui utilise le langage Sax BASIC et inclut un diteur de bote de dialogue, un navigateur dobjets, des fonctions de mise au point et une aide contextuelle.

713 Utilitaire de script SPSS Figure 47-5 Fentre de script

Lorsque vous dplacez le curseur, le nom de la procdure saffiche en haut de la fentre. Les termes en bleu sont des mots rservs au BASIC (tels que Sub, End Sub et Dim). Pour accder lAide contextuelle relative ces termes, cliquez sur ces termes et appuyez sur F1. Les termes en magenta sont des objets SPSS, des proprits ou des mthodes. Vous pouvez galement cliquer sur ces termes et sur F1 pour accder lAide, mais uniquement lorsquils apparaissent en magenta et dans des instructions

714 Chapitre 47

correctes. (Il est inutile de cliquer sur le nom dun objet dans un commentaire : laide qui apparat concerne le langage Sax BASIC et non les objets SPSS.) Les commentaires sont affichs en vert. Cliquez sur F2 pour afficher le navigateur dobjets qui affiche les objets SPSS, les proprits et les mthodes.

Proprits de lditeur de script (fentre de script)


Les lments de code dans la fentre de script rpondent un code couleur qui permet de les distinguer plus facilement. Par dfaut, les commentaires sont en vert, les termes Sax BASIC sont en bleu et les noms des objets, proprits et mthodes valides, sont en magenta. Vous pouvez indiquer des couleurs diffrentes pour ces lments et changer la taille et la police de tout le texte.

Pour dfinir les proprits de lditeur de script


E A partir des menus, slectionnez : Script Proprits de lditeur Figure 47-6 Bote de dialogue Proprits Editeur

E Pour modifier la couleur dun type dlment de code, slectionner llment et une

couleur dans la palette droulante.

715 Utilitaire de script SPSS

LAssistant script
Lorsque vous crez un nouveau script, vous pouvez tout dabord choisir un certain nombre dAssistants script.
Figure 47-7 Bote de dialogue Utiliser lAssistant script

Chaque Assistant script fournit un code pour une ou plusieurs procdures classiques ainsi que certaines astuces sur la personnalisation du script.
Supprimer par tiquette. Supprime des lignes ou des colonnes dans un tableau pivotant en fonction du contenu de RowLabels ou ColumnLabels. Pour que ce script fonctionne, loption Masquer les lignes et colonnes vides doit tre slectionne dans la bote de dialogue Proprits de Tableau. Supprimer les items du Navigateur. Supprime les lments du Viewer en fonction

dun certain nombre de critres.


Note de bas de page. Reformate les notes de bas de page dun tableau pivotant,

modifie le texte dans une note de bas de page ou ajoute une note de bas de page.
Reformate par tiquettes. Reformate un tableau pivotant en fonction des tiquettes de lignes, de colonnes ou de strates. Reformate par valeur. Reformate un tableau pivotant en fonction de la valeur de

cellules de donnes ou dune combinaison de cellules et dtiquettes.

716 Chapitre 47

Reformate un tableau pivotant divers. Reformate ou modifie le texte dans un titre de tableau pivotant, un texte de coin ou une lgende.

Vous pouvez galement utiliser nimporte quel autre script disponible comme Assistant Script, mme sil est plus complexe personnaliser. Ouvrez simplement le script et enregistrez-le sous un nom diffrent.

Cration dun script


E A partir des menus, slectionnez : Nouveau Script E Slectionnez un Assistant script si vous souhaitez commencer par l. E Si vous ne souhaitez pas utiliser dassistant, cliquez sur Annuler.

Cration de scripts automatiques


Pour crer un autoscript, slectionnez un objet du rsultat qui servira de dclencheur. Par exemple, pour crer un autoscript qui sexcute chaque fois quun tableau de frquences est produit, crez un tableau de frquences selon la procdure habituelle et cliquez sur le tableau dans le Viewer pour le slectionner. Cliquez sur le bouton droit de la souris ou utilisez le menu Outils pour crer un nouveau autoscript dclench chaque fois que ce type de tableau est produit.

717 Utilitaire de script SPSS Figure 47-8 Crer un nouveau autoscript

Chaque autoscript que vous crez est ajout au fichier dautoscript actif (autscript.sbs, par dfaut) en tant que nouvelle procdure. Le nom de la procdure renvoie lvnement qui sert de dclencheur. Par exemple, si vous crez un autoscript dclench chaque fois que la procdure Explorer cre un tableau de caractristiques, le nom de la sous-routine dautoscript est Explore_Table_Descriptives_Create.
Figure 47-9 Procdure de Nouveau autoscript affich dans la fentre de script

718 Chapitre 47

Ceci facilite le dveloppement des scripts automatiques en vous vitant davoir rcrire le code permettant dobtenir lobjet que vous souhaitez traiter, mais il faut que les scripts automatiques soient spcifiques un lment de rsultat et une procdure statistique donns.

Cration dun autoscript


E Slectionnez lobjet que vous souhaitez utiliser en tant que dclencheur dans le

Viewer.
E A partir des menus, slectionnez : Outils Crer/modifier un script automatique

Sil nexiste pas dautoscript pour lobjet slectionn, un nouveau autoscript est cr. Si un autoscript existe dj, il est affich.
E Entrez le code. E Dans le menu Edition, slectionnez Options pour activer ou dsactiver lautoscript.

Evnements dclenchant les scripts automatiques


Le nom de la procdure de lautoscript renvoie lvnement qui le dclenche. Les vnements suivants peuvent dclencher des scripts automatiques :
Cration dun tableau pivotant. Le nom de cette procdure renvoie

la fois le type de tableau et la procdure qui la cr, par exemple, Correlations_Table_Correlations_Create.

719 Utilitaire de script SPSS Figure 47-10 Procdure dautoscript pour un tableau de corrlation

Cration du titre. Renvoie la procdure statistique qui la cr : Correlations_Title_Create. Cration de remarques. Renvoie la procdure qui la cr : Correlations_Notes_Create. Cration davertissements. Renvoy par la procdure qui la cr.

Vous pouvez galement utiliser un script pour dclencher indirectement un autoscript. Par exemple, vous pouvez crire un script qui invoque une procdure de corrlation, qui, son tour, dclenche lautoscript dclar pour le tableau de corrlation en rsultant.

720 Chapitre 47

Fichier dautoscript
Tous les scripts automatiques sont enregistrs dans un seul fichier ( la diffrence des autres scripts enregistrs dans des fichiers distincts). Tous les nouveaux scripts automatiques que vous crez sont ajouts ce fichier. Le nom du fichier dautoscript actif est affich dans longlet Scripts de la bote de dialogue Options (menu Edition).
Figure 47-11 Sous-routines dautoscript affiches dans la bote de dialogue Options

La bote de dialogue Options affiche galement tous les scripts automatiques dans le fichier actif, ce qui vous permet dactiver et de dsactiver les diffrents scripts. Le fichier dautoscript par dfaut est autscript.sbs. Vous pouvez spcifier un fichier dautoscript diffrent mais vous ne pouvez en activer quun seul la fois.

721 Utilitaire de script SPSS

Fonctionnement des scripts


Les scripts manipulent les objets laide des proprits et des mthodes. Par exemple, les tableaux pivotants constituent une classe dobjets. Les objets de cette classe vous permettent dutiliser la mthode SelectTable pour choisir tous les lments du tableau et la proprit TextColor pour changer la couleur du texte slectionn. Chaque classe dobjets possde des proprits et des mthodes qui lui sont propres. Le regroupement des classes (ou types) dobjets SPSS sappelle la bibliothque des types SPSS.
Figure 47-12 Arborescence de la hirarchie des objets.

Lutilisation des objets constitue une procdure en deux tapes. Crez tout dabord une rfrence pour lobjet (appele accs lobjet). Utilisez ensuite les proprits et les mthodes pour effectuer quelque chose. Pour atteindre les objets, naviguez dans la hirarchie des objets SPSS chaque tape partir des proprits et des mthodes

722 Chapitre 47

du niveau suprieur pour accder aux objets du niveau infrieur. Par exemple, pour atteindre un tableau pivotant, vous devez dabord accder au document de rsultat qui contient ce tableau puis aux lments de ce document. Chaque objet que vous atteignez est enregistr dans une variable. (Souvenez-vous que tout ce que vous enregistrez dans la variable est une rfrence lobjet.) Lune des premires tapes de la cration dun script est souvent la dclaration de variables pour les objets dont vous avez besoin. Astuces : il est difficile de comprendre le fonctionnement de scripts si vous ne comprenez pas le fonctionnement de SPSS. Avant dcrire un script, effectuez plusieurs fois les tches accomplir laide de la souris. A chaque tape, tenez compte des objets que vous manipulez et des proprits de chaque objet que vous modifiez.

Dclarations des variables (Script)


Mme si ce nest pas obligatoire, il est judicieux de dclarer toutes les variables avant de les utiliser. Pour cela, on utilise gnralement les instructions de dclaration Dim :
Dim objOutputDoc As ISpssOutputDoc Dim objPivotTable As PivotTable Dim intType As Integer Dim strLabel As String

Chaque dclaration indique le nom et le type de variable. Par exemple, la premire dclaration ci-dessus cre une variable dobjet appele objOutputDoc et affecte cette variable la classe dobjets ISpssOutputDoc. La variable na pas encore de valeur. En effet, elle na pas encore t dfinie pour un document de rsultat particulier. Linstruction se contente de dclarer que la variable existe (il a t fait rfrence ce processus comme une attribution dun nouveau nom aux objets que vous dsirez utiliser).
Conventions dappellation des variables. Par convention, le nom de chaque variable fait rfrence son type. Les noms des variables dobjet commencent par obj, ceux des variables numriques (entiers) par int et ceux des variables chane par str. Vous pouvez nommer vos variables de la faon qui vous convient mais nous vous conseillons dutiliser des appellations aidant leur comprhension lors de leur suivi.

723 Utilitaire de script SPSS

Classes dobjets SPSS. ISpssOutputDoc et PivotTable sont des noms de classes dobjet SPSS. Chaque classe reprsente un type dobjet que le programme peut crer, tel quun document de rsultat ou un tableau pivotant. Chaque classe dobjets possde des proprits et des mthodes qui lui sont propres. Le regroupement des classes (ou types) dobjets SPSS sappelle la bibliothque des types SPSS.

Table des classes dobjet et conventions dappellation


Les noms de variables suivants sont utiliss sans les scripts types livrs avec SPSS. Ils sont conseills pour tous les scripts. Notez que, lexception des tableaux pivotants, les noms de classes dobjets commencent toujours par ISpss.
Objet Application SPSS Options SPSS Type ou Classe
IspssApp

Nom de variable La variable objSpssApp est globale. Elle ne requiert aucune dclaration.
objSpssOptions objSpssInfo objDocuments objDataDoc objSyntaxDoc objOutputDoc objPrintOptions objOutputItems objOutputItem objSPSSChart objSPSSText objPivotTable objFootnotes objDataCells objLayerLabels objColumnLabels objRowLabels

ISpssOptions ISpssInfo

Informations sur les fichiers SPSS ISpssDocuments Documents Document de donnes Document de syntaxe Document du Viewer Options dimpression Regroupement des lments de rsultat Elment de rsultat Graphes Texte Tableau pivotant Notes de bas de page Cellules de donnes Etiquettes de strates Etiquettes de colonnes Etiquettes de lignes
ISpssDataDoc ISpssSyntaxDoc ISpssOutputDoc ISpssPrintOptions ISpssItems ISpssItem ISpssChart ISpssRtf PivotTable ISpssFootnotes ISpssDataCells ISpssLayerLabels ISpssLabels ISpssLabels

724 Chapitre 47

Objet

Type ou Classe Gestionnaire de tableau ISpssPivotMgr pivotant IspssDimension Dimension

Nom de variable
objPivotMgr objDimension

Accs aux objets dautomation SPSS (script)


Accder un objet signifie crer une rfrence lobjet de telle sorte que vous puissiez utiliser les proprits et les mthodes servant effectuer une action. Chaque rfrence un objet que vous obtenez est enregistre dans une variable. Pour obtenir un objet, dclarez dabord une variable dobjet de la classe approprie puis affectez cette variable un objet particulier. Par exemple, pour accder au document de rsultat mentionn :
Dim objOutputDoc As ISpssOutputDoc Set objOutputDoc = objSpssApp.GetDesignatedOutputDoc

Vous utilisez les proprits et les mthodes des objets suprieurs dans la hirarchie des objets pour obtenir les objets infrieurs. La seconde instruction ci-dessus permet daccder au document de rsultat mentionn laide de GetDesignatedOutputDoc, mthode apparente lobjet dapplication SPSS, qui est dun niveau suprieur. De la mme faon, pour accder un tableau pivotant, vous devez dabord atteindre le document de rsultat qui contient le tableau pivotant pour le regroupement des lments de ce document de rsultat et ainsi de suite.

Exemple : Accs un lment de rsultat


Ce script accde au troisime lment de rsultat dans le document de rsultat mentionn et lactive. Si cet lment nest pas un objet OLE, le script renvoie une erreur.
Sub Main Dim objOutputDoc As ISpssOutputDoc 'Dclarer les variables objet Dim objOutputItems As ISpssItems Dim objOutputItem As ISpssItem

725 Utilitaire de script SPSS Set objOutputDoc = objSpssApp.GetDesignatedOutputDoc 'obtenir la rfrence du document de sortie Set objOutputItems = objOutputDoc.Items() 'obtenir la collection des lments dans le document Set objOutputItem = objOutputItems.GetItem(2) 'obtenir le troisime lment de rsultat '(les numros d'lment commencent 0 pour que "2" corresponde au troisime lment) objOutputItem.Activate 'activer l'lment de rsultat End sub

Exemple : Accs au premier tableau pivotant


Ce script accde au premier tableau pivotant dans le document de rsultat mentionn et lactive.
Sub Main Dim objOutputDoc As ISpssOutputDoc 'dclarer les variables objet Dim objOutputItems As ISpssItems Dim objOutputItem As ISpssItem Dim objPivotTable As PivotTable Set objOutputDoc = objSpssApp.GetDesignatedOutputDoc'obtenir la rfrence du document de sortie Set objOutputItems = objOutputDoc.Items()'obtenir la collection des items du document Dim intItemCount As Integer'nombre d'lments de rsultat Dim intItemType As Integer'type d'lment (dfini par la proprit SpssType) intItemCount = objOutputItems.Count()'obtenir le nombre d'lments de rsultat For index = 0 To intItemCount'parcourir les lments de rsultat Set objOutputItem = objOutputItems.GetItem(index)'obtenir l'lment courant intItemType = objOutputItem.SPSSType()'obtenir le type de l'lment courant If intItemType = SPSSPivot Then Set objPivotTable = objOutputItem.Activate()'si l'lment est un tableau pivotant, l'activer Exit For End If Next index End sub

726 Chapitre 47

Ces exemples sont galement accessibles dans laide en ligne. Vous pouvez tester ces exemples vous-mme. Pour cela, copiez le code de la fentre daide et collez-le dans la fentre de script.

Proprits et mthodes (script)


Tout comme les objets rels, les objets dautomation OLE de SPSS ont des attributs et des utilisations. Dans le vocabulaire de programmation, les attributs sont appels des proprits et les utilisations des mthodes. Chaque classe dobjets dispose de proprits et de mthodes spcifiques qui dterminent ce que vous pouvez en faire.
Objet Crayon (ralit) Tableau pivotant (SPSS) Proprit Duret (couleur) TextFont DataCellWidths CaptionText Mthode Ecrire Ecraser SelectTable ClearSelection HideFootnotes

Exemple : Utilisation des proprits (Script)


Les proprits dfinissent ou renvoient aux attributs de lobjet, tels que la couleur ou la largeur de cellule. Lorsquune proprit apparat gauche du signe gal, vous crivez dessus. Par exemple, pour attribuer la lgende Rsultats d'Anita un tableau pivotant activ (objPivotTable) : objPivotTable.CaptionText = "Rsultats d'Anita" Lorsquune proprit apparat sur la droite, vous lisez depuis cette proprit. Par exemple, pour dfinir la lgende dun tableau pivotant et lenregistrer sous forme de variable :
strFontName = objPivotTable.CaptionText

Exemple : Utilisation des mthodes (Script)


Les mthodes oprent des actions sur les objets, telles que la slection de tous les lments dans un tableau : objPivotTable.SelectTable

727 Utilitaire de script SPSS

ou lannulation dune slection : objPivotTable.ClearSelection Certaines mthodes renvoient un autre objet. De telles mthodes sont extrmement importantes pour la navigation dans la hirarchie des objets. Par exemple, la mthode GetDesignatedOutputDoc renvoie le document de rsultat choisi, ce qui vous permet daccder aux lments de ce document de rsultat :
Set objOutputDoc = objSpssApp.GetDesignatedOutputDoc Set objItems = objOutputDoc.Items

Navigateur dobjets
Le navigateur dobjets affiche toutes les classes dobjets et les mthodes et proprits qui leur sont apparentes. Vous pouvez galement accder laide relative aux diffrentes proprits et mthodes, puis copier les proprits et mthodes slectionnes pour les coller dans votre script.
Figure 47-13 Navigateur dobjets

728 Chapitre 47

Utilisation du navigateur dobjets


E A partir du menu de la fentre de script, slectionnez : Mettre au point Parcourir les objets E Slectionnez une classe dobjets dans la liste Data Type (type de donnes) afin

dafficher les mthodes et proprits de cette classe.


E Slectionnez les Methods/Properties (proprits et mthodes) pour accder lAide

contextuelle ou les coller dans votre script.

Nouvelle procdure (Script)


Une procdure est une squence libelle dinstructions excutes comme un ensemble. Lorganisation des codes dans les procdures facilite la gestion et la rutilisation des diffrentes portions de code. Les scripts doivent contenir au moins une procdure (Sous-routine principale). Ils en contiennent souvent plusieurs. La procdure principale peut son tour contenir plusieurs instructions et des appels dautres sous-routines qui effectuent le plus gros de la tche.
Figure 47-14 Bote de dialogue Nouvelle procdure

Les procdures sont soit des sous-routines, soit des fonctions. Une procdure commence par une instruction qui spcifie le type de la procdure et son nom (par exemple, Sub Main ou Function DialogMonitor( )) et se termine par linstruction de fin approprie (End Sub ou End Function). Lorsque vous faites dfiler la fentre du script, le nom de la procdure active saffiche en haut de la fentre. Dans un script, vous pouvez appeler nimporte quelle procdure autant de fois que vous le souhaitez. Vous pouvez galement appeler

729 Utilitaire de script SPSS

nimporte quelle procdure dans le fichier gnral des scripts, ce qui permet de partager les procdures sur plusieurs scripts.

Ajout dune nouvelle procdure un script


E A partir des menus, slectionnez : Script Nouvelle procdure E Saisissez un nom pour la procdure. E Slectionnez Sous-routine ou Fonction.

Vous pouvez galement crer une nouvelle procdure. Pour cela, entrez les instructions qui dfinissent la procdure directement dans le script.

Procdures gnrales (script)


Si vous souhaitez utiliser une procdure ou une fonction dans plusieurs scripts, vous pouvez lajouter au fichier gnral des scripts. Les procdures du fichier gnral des scripts peuvent tre appeles par dautres scripts.

730 Chapitre 47 Figure 47-15 Fichier gnral des scripts

Le fichier gnral des scripts par dfaut est global.sbs. Vous pouvez ajouter librement des procdures ce fichier. Vous pouvez galement spcifier un autre fichier gnral des scripts dans longlet Scripts de la bote de dialogue Options (menu Edition), mais un seul fichier la fois peut tre actif en tant que fichier gnral. Cela signifie que si vous crez et activez un nouveau fichier gnral, les procdures et les fonctions de global.sbs ne sont plus disponibles. Vous pouvez consulter le fichier gnral dans nimporte quelle fentre de script (cliquez sur longlet n2 droite de la fentre, sous la barre doutils), mais vous ne pouvez effectuer de modifications que dans une seule fentre la fois.

731 Utilitaire de script SPSS

Les procdures gnrales doivent tre appeles par les autres procdures de script. Vous ne pouvez pas excuter un script gnral directement depuis le menu Outils ou une fentre de script.

Ajout dune description un script


Vous pouvez ajouter une description afficher dans les botes de dialogue Excuter le script et Utiliser lAssistant script. Ajoutez simplement un commentaire sur la premire ligne du script. Ce commentaire doit commencer par Begin Description, suivi du commentaire souhait (une ou plusieurs lignes), et sachever par End Description. Par exemple :
'Begin Description' Ce script change "Sig." en "p=" dans les tiquettes de colonne d'un tableau pivotant. 'Requirement: Le tableau pivotant modifier doit tre slectionn. 'End Description

La description doit tre mise en forme comme un commentaire (chaque ligne commenant par une apostrophe).

Botes de dialogue de script personnalises


La mise en oeuvre dune bote de dialogue personnalise se droule en deux tapes : Crez dabord la bote de dialogue laide de lditeur de bote de dialogue, puis crez une fonction de surveillance de la bote de dialogue (DialogFunc) qui surveille la bote de dialogue et dfinit son comportement. La bote de dialogue est dfinie par un bloc Begin Dialog...End Dialog. Il nest pas ncessaire dentrer le code directement. Lditeur de Bote de Dialogue fournit une interface graphique conviviale permettant de dfinir la bote de dialogue.

732 Chapitre 47 Figure 47-16 Crer une bote de dialogue laide de lditeur de Bote de Dialogue

Lditeur affiche au dpart une bote de dialogue vierge. Vous pouvez ajouter des commandes comme, par exemple, des boutons radio et des cases cocher. Il faut, pour cela, slectionner loutil appropri et le faire glisser avec la souris. (Placez la souris sur chaque outil pour obtenir une description.) Vous pouvez galement faire glisser les cts et les coins de la bote de dialogue afin de la redimensionner. Aprs avoir ajout un contrle, cliquez le bouton droit de la souris pour dfinir les proprits de ce contrle.
Fonction de surveillance de la bote de dialogue. Pour crer la fonction de surveillance de la bote de dialogue, cliquez avec le bouton droit de la souris sur la bote de dialogue (assurez-vous quaucun contrle nest slectionn) et entrez un nom pour la fonction dans le champ Dialog Function (fonction dialogue). Les instructions qui dfinissent la fonction sont ajoutes au script, mme si vous devez modifier manuellement la fonction pour dfinir le comportement de chaque action.

Une fois que vous avez fini, cliquez sur le bouton Enregistrer et quitter, situ lextrme droite de la barre doutils) pour insrer le code de la bote de dialogue dans votre script.

Cration dune bote de dialogue personnalise


E Dans la fentre de script, cliquez sur le curseur dans le script lendroit o vous

souhaitez insrer le code de la bote de dialogue.

733 Utilitaire de script SPSS E A partir des menus, slectionnez : Script Editeur de bote de dialogue E Slectionnez les outils dans la palette et faites-les glisser dans la nouvelle bote de

dialogue afin dajouter des contrles, tels que boutons ou cases cocher.
E Redimensionnez la bote de dialogue en faisant glisser les cts et les coins. E Cliquez avec le bouton droit de la souris sur la forme (aucun contrle slectionn)

et saisissez un nom pour la fonction de surveillance de la bote de dialogue dans le champ Dialog Function (fonction dialogue).
E Une fois que vous avez fini, cliquez sur le bouton Enregistrer et quitter situ

lextrme droite de la barre doutils. Vous devez modifier manuellement cette fonction pour dfinir le comportement de la bote de dialogue.

Fonctions de surveillance des botes de dialogue (Script)


Une fonction de surveillance de la bote de dialogue dfinit le comportement dune bote de dialogue pour chacun des cas spcifis. La fonction prend la forme (gnrale) suivante :

Function DialogFunc(strDlgItem as String, intAction as Integer, intSuppValue as Integer) Select Case intAction Case 1 ' initialisation de bote de dialogue ... 'instructions excuter lorsque la bote de dialogue est initialise Case 2 'changement de valeur ou slection de bouton ... 'instructions... Case 3 ' Texte de zone de texte ou de zone de liste droulante modifi... Case 4 ' focus modifi... Case 5 ' veille... End Select End Function

734 Chapitre 47

Paramtres. La fonction doit tre capable de supporter trois paramtres : une chane (strDlgItem) et deux entiers (intAction et intSuppValue). Les paramtres

sont des valeurs admises entre la fonction et la bote de dialogue, en fonction de laction entreprise. Par exemple, lorsquun utilisateur clique sur un contrle dans la bote de dialogue, le nom du contrle passe la fonction en tant que strDlgItem (le nom du champ est spcifi dans la dfinition de la bote de dialogue). Le second paramtre (intAction) est une valeur numrique qui indique laction entreprise dans la bote de dialogue. Le dernier paramtre est utilis pour fournir des informations complmentaires dans certains cas. Vous devez ajouter les trois paramtres dans la dfinition de la fonction, mme sils ne servent pas tous.
Slectionnez Case intAction. La valeur de intAction indique laction entreprise dans la bote de dialogue. Par exemple, linitialisation de la bote de dialogue correspond intAction = 1. Si lutilisateur clique sur un bouton, intAction prend la valeur 2, etc. Il y a cinq actions possibles, et vous pouvez spcifier les instructions qui sexcutent pour chaque action, comme illustr ci-dessous. Il nest pas ncessaire de spcifier les 5 cas possibles, mais uniquement ceux qui sappliquent. Par exemple, si vous ne souhaitez pas dinstructions excutant linitialisation, cartez le cas 1. Cas intAction = 1. Spcifie les instructions excuter lors de linitialisation de la

bote de dialogue. Par exemple, vous pouvez dsactiver un ou plusieurs contrles ou ajouter un son. La chane strDlgItem est une chane vide ; intSuppValue est gale 0.
Cas 2. Sexcute lorsquun bouton est enfonc ou lorsquune valeur change dans un contrle CheckBox, DropListBox, ListBox ou OptionGroup. Si un bouton est enfonc, strDlgItem reprsente le bouton, intSuppValue est sans valeur, et vous devez dfinir DialogFunc = Vrai pour empcher la fermeture de la bote de dialogue. Si une valeur change, strDlgItem est llment dont la valeur change, et intSuppValue reprsente la nouvelle valeur. Cas 3. Sexcute lorsquune valeur change dans un contrle TextBox ou ComboBox. La chane strDlgItem reprsente le contrle dont le texte a chang et qui perd le focus. intSuppValue reprsente le nombre de caractres.

735 Utilitaire de script SPSS

Cas 4. Sexcute lorsque le focus change dans la bote de dialogue. La chane strDlgItem reprsente llment qui reprend le focus et intSuppValue celui

qui le perd (le premier lment est 0, le second 1, etc.).


Cas 5. Traitement restant. La chane strDlgItem est une chane vide ; intSuppValueest gale 0. Dfinissez DialogFunc = Vrai afin de

continuer recevoir les actions restantes. Pour plus dinformations, reportez-vous aux exemples et au prototype DialogFunc dans le fichier daide du langage Sax BASIC.

Exemple : Script dune bote de dialogue simple


Ce script cre une bote de dialogue simple qui ouvre un fichier de donnes. Reportez-vous aux sections apparentes pour obtenir des explications sur la sous-routine BuildDialog et sur la fonction de surveillance de la bote de dialogue.
Figure 47-17 Bote de dialogue Ouvrir fichier, cre par un script

Sub Main Call BuildDialog End Sub 'dfinir bote de dialogue Sub BuildDialog Begin Dialog UserDialog 580,70,"Ouverture du fichier de donnes",.DialogFunc Text 40,7,280,21,"Fichier de donnes ouvrir :",.txtDialogTitle TextBox 40,28,340,21,.txtFilename OKButton 470,7,100,21,.cmdOK CancelButton 470,35,100,21,.cmdCancel End Dialog Dim dlg As UserDialog

736 Chapitre 47 Dialog dlg End Sub 'dfinir la fonction qui dtermine le comportement de la bote de dialogue Function DialogFunc(strDlgItem As String, intAction As Integer, intSuppValue As Integer) As Boolean Select Case intAction Case 1' son lors de l'initialisation de la bote de dialogue Beep Case 2' changement de valeur ou slection de bouton Select Case strDlgItem Case "cmdOK"'si l'utilisateur clique sur OK, ouvre le fichier de donnes correspondant au nom spcifi strFilename = DlgText("txtFilename") Call OpenDataFile(strFilename) DialogFunc = False Case "cmdCancel"'si l'utilisateur clique sur Annuler, ferme la bote de dialogue DialogFunc = False End Select End Select End Function Sub OpenDataFile(strFilename As Variant)'Ouvre le fichier de donnes correspondant au nom spcifi Dim objDataDoc As ISpssDataDoc Set objDataDoc = objSpssApp.OpenDataDoc(strFilename) End Sub

Ces exemples sont galement accessibles dans laide en ligne. Vous pouvez tester ces exemples vous-mme. Pour cela, copiez le code de la fentre daide et collez-le dans la fentre de script.

Mise au point des scripts


Le menu Mettre au point vous permet deffectuer une excution pas pas du code(Avancer dun pas), dexcuter une ligne ou une sous-routine la fois et de visualiser le rsultat. Vous pouvez galement insrer un point darrt dans le script afin de faire une pause dans lexcution la ligne qui contient ce point darrt. Pour mettre au point un autoscript, ouvrez-le dans une fentre de script, insrez des points darrt dans la procdure que vous souhaitez mettre au point puis excutez la procdure statistique qui dclenche lautoscript.

737 Utilitaire de script SPSS

Avancer dun pas. Excute la ligne active. Si la ligne active renvoie une sous-routine

ou une fonction, lexcution sarrte la premire ligne de cette sous-routine ou fonction.


Sauter un pas. Excute la ligne suivante. Si la ligne active renvoie une sous-routine ou une fonction, excute la sous-routine ou fonction dans la totalit. Revenir dun pas. Recule dun pas dans la sous-routine ou dans la fonction appele. Avancer jusquau curseur. Excute jusqu la ligne active. Activer/dsactiver Sparer. Insre ou retire un point darrt. Lexcution du script est

suspendue au point darrt et le volet de mise au point saffiche.


Espion Express. Affiche la valeur de lexpression active. Ajouter Espion. Ajoute lexpression active la fentre espion. Parcourir les objets.... Affiche le navigateur des objets. Dfinir relation suivante. Dfinit linstruction suivante excuter. Seules les

instructions de la sous-routine/fonction peuvent tre slectionnes.


Montrer relation suivante. Affiche linstruction suivante excuter.

Excution dun script pas pas


E Dans le menu Mettre au point, slectionnez lune des options pour excuter le code,

une ligne ou une sous-routine la fois. Les onglets Immediate (immdiat), Watch (espion), Stack (pile) et Loaded (charg) sont affichs dans la fentre de script, de mme que la barre doutils de mise au point.
E Utilisez la barre doutils (ou les touches de raccourci) pour continuer lexcution

pas pas du script.


E Vous pouvez galement slectionner Activer/dsactiver Sparer pour insrer un point

darrt dans la ligne active. Lexcution du script est suspendue au point darrt.

738 Chapitre 47

Volet de mise au point (Script)


Lorsque vous excutez le code pas pas (Avancer dun pas), les onglets Immediate (immdiat), Watch (espion), Stack (pile) et Loaded (charg) sont affichs.
Figure 47-18 Volet de mise au point affich dans la fentre de script

Onglet Immediate (immdiat). Cliquez sur le nom de nimporte quelle variable

puis sur le bouton Loupe pour afficher la valeur courante de la variable. Vous pouvez galement valuer une expression, attribuer une variable ou un appel une sous-routine. Entrez ?expr, puis appuyez sur Entre pour afficher la valeur de expr. Tapez var = expr, puis appuyez sur Entre pour modifier la valeur de var.

739 Utilitaire de script SPSS

Entrez subname args, puis appuyez sur Entre pour appeler une sous-routine ou une instruction intgre. Entrez Trace, puis appuyez sur Entre pour passer au mode trace. Le mode Trace permet dimprimer chaque instruction dans la fentre immdiate lorsque le script est excut.
Onglet Watch (espion). Pour afficher une variable, fonction ou expression, cliquez sur

cet lment et slectionnez Ajouter Espion dans le menu Mettre au point. Les valeurs affiches sont mises jour chaque fois que lexcution est suspendue. Vous pouvez modifier lexpression gauche de ->. Cliquez sur Entre pour mettre immdiatement jour toutes les valeurs. Cliquez sur Ctrl-Y pour supprimer la ligne.
Onglet Stack (pile). Affiche les lignes qui ont renvoy linstruction active. La premire ligne est linstruction active, la seconde ligne est celle appele en premier, etc. Cliquez sur nimporte quelle ligne pour mettre en surbrillance cette ligne dans la fentre de modification. Onglet Loaded (charg). Prsente la liste des scripts actifs. Cliquez sur une ligne pour

visualiser ce script.

Fichiers de script et de syntaxe


Les fichiers de syntaxe (*.sps) ne sont pas les mmes que les fichiers de script (*.sbs). Les fichiers de syntaxe possdent des commandes crites dans le langage de commande qui vous permet dexcuter les procdures statistiques et les transformations de donnes. Alors que les scripts vous permettent de manipuler le rsultat et dautomatiser les autres tches que vous effectueriez normalement laide de linterface graphique des menus et des botes de dialogue, le langage de commande propose une mthode de communication directe diffrente avec larrire-plan du programme, la partie du systme qui effectue les calculs statistiques et les transformations de donnes). Vous pouvez associer les fichiers de script et de syntaxe pour plus de flexibilit. Pour cela, excutez un script partir de la syntaxe de commande SPSS ou intgrez la syntaxe de commande dans un script.

740 Chapitre 47

Excution dune syntaxe de commande partir dun script


Vous pouvez excuter une syntaxe de commande partir dun script dautomation laide de la mthode ExecuteCommands. La syntaxe de commande vous permet dexcuter les transformations de donnes et les procdures statistiques et de produire des diagrammes. La majeure partie de cette fonctionnalit ne peut pas tre automatise directement partir des scripts de commande. La mthode la plus simple pour construire un fichier de syntaxe de commande consiste effectuer des slections dans les botes de dialogue et coller la syntaxe de ces slections dans la fentre de script.
Figure 47-19 Coller une syntaxe de commande dans un script

741 Utilitaire de script SPSS

Lorsque vous ouvrez une bote de dialogue laide du menu de la fentre de script, le bouton Coller permet de coller tous les codes ncessaires lexcution des commandes partir dun script. Remarque : vous devez utiliser les menus de la fentre de script pour ouvrir les botes de dialogue. Sinon, les commandes sont colles dans la fentre de syntaxe, et non pas dans celle des scripts.

Pour coller une syntaxe de commande dans un script


E A partir des menus de la fentre de script, slectionnez les commandes des menus

Statistiques, Diagrammes et Outils pour ouvrir les botes de dialogue.


E Effectuez des slections dans la bote de dialogue. E Cliquez sur Coller.

Remarque : vous devez utiliser les menus de la fentre de script pour ouvrir les botes de dialogue. Sinon, les commandes sont colles dans la fentre de syntaxe, et non pas dans celle des scripts.

Excution dun script depuis la syntaxe de commande


Vous pouvez utiliser la commande SCRIPT pour excuter un script partir dune syntaxe de commande. Indiquez le nom du script que vous souhaitez excuter, ce nom de fichier tant entre guillemets, comme dans lexemple suivant :
SCRIPT 'C:\PROGRAM FILES\SPSS\CLEAN NAVIGATOR.SBS'.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Systme de gestion des rsultats

48

Chapitre

Le systme de gestion des rsultats (OMS - Output Management System) permet dcrire automatiquement des modalits de rsultats donnes dans des fichiers de rsultats diffrents et de slectionner diffrents formats. Les diffrents formats sont les suivants :
Format des fichiers de donnes SPSS (.sav). Les rsultats qui sont affichs dans les

tableaux pivotants du Viewer peuvent tre crits dans un fichier de donnes SPSS. Ils peuvent ainsi tre utiliss en tant quentres pour les commandes suivantes.
XML. Vous pouvez crire des tableaux, des rsultats texte et de nombreux

graphiques au format XML.


HTML. Vous pouvez crire des tableaux et des rsultats texte au format HTML.

Les diagrammes standard (non interactifs) et les diagrammes de modle darbre (option Arbre de segmentation) peuvent tre inclus comme fichiers image. Les fichiers image sont enregistrs dans un sous-rpertoire (dossier) distinct.
Texte. Vous pouvez crire des tableaux et des rsultats texte sous forme de texte

spar par des tabulations ou des espaces.


Pour utiliser le panneau de configuration du systme de gestion des rsultats
E A partir des menus, slectionnez : Outils Panneau de configuration du systme de gestion des rsultats...

743

744 Chapitre 48 Figure 48-1 Panneau de configuration du systme de gestion des rsultats

Vous pouvez utiliser le panneau de configuration pour dmarrer et arrter lacheminement des rsultats vers diffrentes destinations. Chaque requte OMS reste active jusqu ce quelle soit interrompue explicitement ou jusqu la fin de la session. Un fichier de destination spcifi dans une requte OMS est indisponible pour les autres procdures SPSS et les autres applications jusqu la fin de la requte. Lorsquune requte OMS est active, les fichiers de destination spcifis sont stocks en mmoire (RAM). Les requtes OMS actives qui crivent une grande quantit de rsultats dans des fichiers externes risquent donc de consommer beaucoup de mmoire. Plusieurs requtes OMS sont indpendantes les unes des autres. Les mmes rsultats peuvent tre achemins vers diffrents emplacements dans plusieurs formats en fonction des spcifications des diffrentes requtes OMS.

745 Systme de gestion des rsultats

Lordre des objets de sortie dans une destination particulire est lordre dans lequel ils ont t crs, dtermin par lordre et lexcution des procdures lorigine des rsultats. Le systme OMS ne peut pas acheminer des diagrammes ou des objets Avertissements crs par des procdures de diagrammes interactifs (menu Graphes, sous-menu Interactif) ou des cartes cres par les procdures de cartographie (menu Graphes, sous-menu Cartes).
Pour ajouter de nouvelles requtes OMS
E Slectionnez les types de rsultat (tableaux, diagrammes, etc.) inclure. (Pour plus

d'informations, reportez-vous Types dobjet de sortie p. 747.)


E Slectionnez les commandes inclure. Si vous souhaitez inclure tous les rsultats,

slectionnez tous les lments de la liste. (Pour plus d'informations, reportez-vous Identificateurs de commande et sous-types de tableau p. 749.)
E Pour les commandes qui produisent des rsultats sous forme de tableaux pivotants,

slectionnez les types de tableau spcifiques inclure. La liste affiche uniquement les tableaux disponibles dans les commandes slectionnes ; tout type de tableau disponible dans une ou plusieurs des commandes slectionnes apparat dans la liste. Si aucune commande nest slectionne, tous les types de tableau sont affichs. (Pour plus d'informations, reportez-vous Identificateurs de commande et sous-types de tableau p. 749.)
E Pour slectionner des tableaux en fonction des tiquettes et non des sous-types, cliquez sur Etiquettes. (Pour plus d'informations, reportez-vous Etiquettes p. 751.) E Cliquez sur Options pour spcifier le format des rsultats (par exemple, fichier de

donnes SPSS, XML, HTML). (Par dfaut, le format XML de sortie est utilis. Pour plus d'informations, reportez-vous Options OMS p. 752.)
E Spcifiez une destination pour les rsultats :

Fichier. Tous les rsultats slectionns sont achemins dans un fichier unique.

746 Chapitre 48

Bass sur les noms des objets. Le rsultat est achemin vers plusieurs fichiers de

destination bass sur des noms dobjet. Un fichier spar est cr pour chaque objet de rsultat, avec un nom de fichier bas sur les noms des sous-type de tableau ou sur les tiquettes des tableaux. Entrez le nom du dossier de destination.
Nouvel ensemble de donnes. Pour les rsultats au format de fichier de donnes

SPSS, vous pouvez les acheminer vers un ensemble de donnes. Lensemble de donnes est disponible pour utilisation ultrieure dans la mme session mais nest pas enregistr en tant que fichier sauf si vous le faites explicitement avant la fin de la session. Cette option est disponible uniquement pour les rsultats au format de fichier de donnes SPSS. Les noms des ensembles de donnes doivent tre conformes aux rgles de dnomination de variables SPSS. Pour plus d'informations, reportez-vous Noms de variable dans Chapitre 5 p. 99.
E Eventuellement :

Exclure les rsultats slectionns du Viewer. Si vous slectionnez Exclure de lEditeur de rsultats, les types de rsultat de la requte OMS napparatront pas dans la fentre de lEditeur de rsultats. Si plusieurs requtes OMS actives comprennent les mmes types de rsultat, laffichage de ces types de rsultat dans le Viewer est dtermin par la requte OMS la plus rcente qui les contient. Pour plus d'informations, reportez-vous Exclusion de laffichage des rsultats du Viewer p. 758. Affecter une chane dID la requte. Toutes les requtes se voient automatiquement attribuer une valeur dID et vous pouvez remplacer la chane dID par dfaut par un ID descriptif. Cela peut tre utile si vous disposez de plusieurs requtes actives que vous souhaitez identifier facilement. Les valeurs dID que vous affectez ne peuvent pas commencer par le signe dollar ($). Voici quelques astuces pour slectionner plusieurs lments dans une liste : Pour slectionner tous les lments dune liste, appuyez sur les touches Ctrl-A du clavier. Pour slectionner plusieurs lments contigus, cliquez dessus tout en maintenant la touche Maj enfonce. Pour slectionner plusieurs lments non contigus, cliquez dessus tout en maintenant la touche Ctrl enfonce.

747 Systme de gestion des rsultats

Pour interrompre des requtes OMS ou pour les supprimer

Les nouvelles requtes OMS et les requtes OMS actives sont affiches dans la liste Requtes, la plus rcente apparaissant en premire position. Vous pouvez modifier la largeur des colonnes dinformation en faisant glisser les bordures et vous pouvez parcourir la liste horizontalement pour voir davantage dinformations sur une requte particulire. La prsence dun astrisque (*) aprs le terme Actif dans la colonne Etat signale une requte OMS cre avec une syntaxe de commande comprenant des fonctions non disponibles dans le panneau de configuration. Pour interrompre une requte OMS active spcifique :
E Dans la liste requtes, cliquez sur nimporte quelle cellule dans la ligne de la requte. E Cliquez sur Fin.

Pour interrompre toutes les requtes OMS actives :


E Cliquez sur Tout terminer.

Pour supprimer une nouvelle requte (une requte ajoute mais pas encore active) :
E Dans la liste requtes, cliquez sur la cellule dune ligne pour la requte. E Cliquez sur Supprimer.

Remarque : Les requtes OMS actives ne sont interrompues que lorsque vous cliquez sur OK.

Types dobjet de sortie


Il existe sept types dobjet de sortie :
Diagrammes. Diagrammes ( lexception des diagrammes interactifs et des cartes). Les objets Diagramme sont inclus uniquement avec les formats de destination XML et HTML. Pour le format HTML, les fichiers image sont enregistrs dans un sous-rpertoire (dossier) distinct. Journaux. Objets Texte Journal. Les objets Journal contiennent certains types de

message derreur et davertissement. Selon vos paramtres Options (menu Edition, Options, onglet Editeur de rsultats), les objets Journal peuvent galement contenir la

748 Chapitre 48

syntaxe de commande excute pendant la session. Les objets Journal sont intituls Journal dans le panneau de lgende du Viewer.
Tables. Objets Rsultats qui se prsentent sous forme de tableaux pivotants dans lEditeur de rsultats (y compris les tableaux Notes). Les tableaux sont les seuls objets de sortie qui peuvent tre achemins au format de fichier de donnes SPSS (sav). Texte. Objets Texte qui ne sont pas des journaux ou en-ttes (y compris les objets tiquets Rsultats texte dans le panneau de lgende de lEditeur de rsultats). Arbres. Diagrammes de modle darbre produits par loption Arbre de segmentation. Les objets Arbre sont inclus uniquement avec les formats de destination XML et HTML. En-ttes. Objets Texte intituls Titre dans le panneau de lgende de lEditeur de

rsultats. Pour le format XML de sortie, les objets Texte den-tte ne sont pas inclus.
Avertissements. Objets Avertissements. Les objets Avertissements contiennent

certains types de message derreur et davertissement.

749 Systme de gestion des rsultats Figure 48-2 Types dobjet de sortie

Identificateurs de commande et sous-types de tableau


Identificateurs de commande

Les identificateurs de commande sont disponibles pour toutes les procdures statistiques et de cration de diagrammes, et toute autre commande qui produit des blocs de rsultat dots de leur propre en-tte identifiable dans le panneau de lgende

750 Chapitre 48

du Viewer. Ces identificateurs sont gnralement (mais pas systmatiquement) identiques ou similaires aux noms de procdure figurant dans les menus et les titres de bote de dialogue, qui sont souvent (mais pas toujours) similaires aux noms de commandes SPSS sous-jacentes. Par exemple, lidentificateur de commande de la procdure Frquences est Frquences et cest aussi le nom de la commande sous-jacente. Toutefois, dans certains cas, le nom de la procdure, lidentificateur de commande et/ou le nom de la commande ne sont pas tous similaires. Par exemple, toutes les procdures dans le sous-menu Tests non paramtriques ( partir du menu Analyse) utilisent la mme commande sous-jacente et lidentificateur de commande est identique au nom de cette commande : Npar Tests.
Sous-types de tableau

Les sous-types sont les diffrents types de tableau pivotant qui peuvent tre gnrs. Certains sous-types sont produits par une seule commande, dautres peuvent tre produits par plusieurs commandes (bien que les tableaux risquent de ne pas se ressembler). Les noms des sous-types de tableau sont gnralement assez descriptifs. Toutefois, leur nombre peut tre assez lev (notamment si vous avez slectionn un grand nombre de commandes) et/ou deux sous-types peuvent avoir des noms trs proches.
Recherche didentificateurs de commande et de sous-types de tableau

Si vous avez un doute, vous pouvez rechercher des identificateurs de commande et des noms de sous-type de tableau dans la fentre du Viewer :
E Excutez la procdure pour gnrer des rsultats dans le Viewer. E Cliquez avec le bouton droit de la souris sur litem dans le panneau de lgende de

lEditeur de rsultats.
E Slectionnez Copier lidentificateur de commande OMS ou Copier le sous-type de table OMS. E Collez lidentificateur de commande ou le nom de sous-type de tableau copi dans un

diteur de texte (comme une fentre de syntaxe SPSS, par exemple).

751 Systme de gestion des rsultats

Etiquettes
Alternative aux noms de sous-type de tableau, vous pouvez slectionner des tableaux sur la base du texte affich dans le panneau de lgende de lEditeur de rsultats. Vous pouvez galement slectionner dautres types dobjets en fonction de leur tiquette. Vous pouvez utiliser des tiquettes pour diffrencier des tableaux de mme type dans lesquels le texte de la lgende reflte un attribut de lobjet de sortie particulier (par exemple, les noms de variable ou les tiquettes). Cependant, il existe un certain nombre de facteurs qui peuvent avoir une incidence sur le texte de ltiquette : Si le traitement du fichier scind est activ, lidentification des classes de fichiers scinds peut tre ajoute ltiquette. Les tiquettes qui comprennent des informations sur les variables ou les valeurs sont affectes par le paramtrage des options des tiquettes de rsultat (menu Edition, Options, onglet Etiquettes Rsultats). Les tiquettes sont affectes par le paramtre li la langue des rsultats (menu Modifier, Options, onglet Gnral).
Pour spcifier les tiquettes utiliser pour identifier les objets Rsultat
E Dans le panneau de configuration du systme de gestion de rsultats, slectionnez un

ou plusieurs types de rsultats, puis une ou plusieurs commandes.


E Cliquez sur Etiquettes.

752 Chapitre 48 Figure 48-3 Bote de dialogue Etiquettes OMS

E Entrez ltiquette exactement telle quelle apparat dans le panneau de lgende de la

fentre de lEditeur de rsultats. Vous pouvez galement cliquer avec le bouton droit de la souris sur litem dans la lgende, slectionner Copier ltiquette OMS et coller ltiquette copie dans le champ de texte Etiquette.
E Cliquez sur Ajouter. E Rptez lopration pour chaque tiquette inclure. E Cliquez sur Continuer.

Caractres gnriques

Vous pouvez utiliser lastrisque (*) comme dernier caractre de la chane dtiquette. Toutes les tiquettes qui commencent par la chane spcifie (astrisque exclu) seront slectionnes. Cette opration fonctionne uniquement lorsque lastrisque est le dernier caractre, car les astrisques peuvent apparatre comme des caractres valides dans une tiquette.

Options OMS
Vous pouvez utiliser la bote de dialogue Options OMS pour : Spcifier le format des rsultats.

753 Systme de gestion des rsultats

Inclure ou exclure les rsultats qui se prsentent sous la forme de diagrammes ou de diagrammes de modle darbre, et spcifier le format des diagrammes. Indiquer quels lments de dimension de tableau doivent aller dans la dimension de ligne. Pour le format de fichier de donnes SPSS, inclure une variable qui identifie le numro de tableau squentiel qui est la source de chaque observation.
Pour spcifier les options OMS
E Cliquez sur Options. dans le panneau de configuration du systme de gestion des

rsultats.
Figure 48-4 Bote de dialogue Options OMS

Format XML de sortie. Format XML conforme au schma de rsultat SPSS. Les diagrammes

standard sont inclus dans un format XML conforme au schma vizml. Vous pouvez galement exporter tous les diagrammes et toutes les cartes en tant que fichiers distincts au format de diagramme slectionn.

754 Chapitre 48

HTML. Les objets de sortie qui correspondraient des tableaux pivotants dans le

Viewer sont convertis en tableaux HTML simples. Aucun attribut Modle de tableaux (caractristiques de police, styles de bordure, couleurs, etc.) nest pris en charge. Les objets de sortie Texte portent la balise <PRE> dans le fichier HTML. Si vous choisissez dinclure des diagrammes, ils sont exports en tant que fichiers distincts au format de diagramme slectionn et sont intgrs par rfrence (<IMG SRC = 'nomfichier.ext'>) dans le document HTML. Les fichiers image sont enregistrs dans un sous-rpertoire (dossier) distinct.
Fichier de donnes SPSS. Il sagit dun format de fichier binaire. Tous les types dobjet de sortie autres que les tableaux sont exclus. Chaque colonne dun tableau devient une variable dans le fichier de donnes. Pour utiliser un fichier de donnes cr avec le systme OMS au cours de la mme session, vous devez interrompre la requte OMS active pour pouvoir ouvrir le fichier de donnes. Pour plus d'informations, reportez-vous Acheminement des rsultats vers des fichiers de donnes SPSS p. 759. XML SVWS. Format XML utilis par le serveur Web SmartViewer. Il sagit en fait dun fichier JAR/ZIP contenant des fichiers XML, CSV, etc. Le serveur Web SmartViewer est un serveur distinct. Texte. Texte spar par des espaces. Les rsultats sont crits au format texte, les rsultats en tableaux tant aligns avec des espaces pour les polices espacement fixe. Tous les diagrammes et toutes les cartes sont exclus. Texte onglets. Texte dlimit par des tabulations. Pour les rsultats affichs en tant que tableaux pivotants dans lEditeur de rsultats, des tabulations dlimitent les lments de colonne des tableaux. Les lignes de bloc de texte sont crites telles quelles ; le systme ne tente pas de les diviser avec des tabulations aux emplacements appropris. Tous les diagrammes et toutes les cartes sont exclus. Images graphiques

Pour le format HTML, vous pouvez inclure des diagrammes ( lexception des diagrammes interactifs) et des diagrammes de modle darbre en tant que fichiers image. Un fichier image distinct est cr pour chaque diagramme et/ou arbre, et des balises standard <IMG SRC='nomfichier' sont incluses au format HTML pour chaque fichier image.

755 Systme de gestion des rsultats

Les fichiers image sont enregistrs dans un sous-rpertoire (dossier) distinct. Le nom du sous-rpertoire est le nom du fichier HTML de destination sans extension et prsentant le suffixe _files. Par exemple, si le fichier de destination HTML est donnesjuillet.htm, le sous-rpertoire des images est intitul donnesjuillet_files.
Format. Les formats dimages disponibles sont PNG, JPG, EMF et BMP. Taille. Vous pouvez mettre lchelle la taille de limage (de 10 % 200 %). Pivots de tableau

Pour les rsultats Tableau pivotant, vous pouvez spcifier le ou les lments de dimension qui doivent apparatre dans les colonnes. Tous les autres lments de dimension apparaissent dans les lignes. Pour le format de fichier de donnes SPSS, les colonnes du tableau deviennent des variables et les lignes, des observations. Si vous spcifiez plusieurs lments de dimension pour les colonnes, ils sont embots dans les colonnes dans lordre dans lequel ils sont rpertoris. Pour le format de fichier de donnes SPSS, les noms de variable sont construits par les lments de colonne embots. Pour plus d'informations, reportez-vous Noms de variable dans les fichiers de donnes gnrs par le systme de gestion des rsultats p. 767. Si un tableau ne contient aucun des lments de dimension rpertoris, tous les lments de dimension de ce tableau apparaissent dans les lignes. Les pivots de tableau spcifis ici nont aucun effet sur les tableaux affichs dans lEditeur de rsultats. Chaque dimension dun tableau (ligne, colonne, strate) peut contenir aucun, un ou plusieurs lments. Par exemple, un tableau crois bidimensionnel simple contient un seul lment de dimension de ligne et un seul lment de dimension de colonne, chacun contenant lune des variables utilises dans le tableau. Vous pouvez utiliser des arguments de position ou des noms dlment de dimension pour spcifier les lments de dimension placer dans la dimension de colonne.
Toutes les dimensions en lignes. Cr une ligne unique pour chaque tableau. Pour les

fichiers de donnes au format SPSS, cela implique que chaque tableau correspond une observation unique et tous les lements du tableau des variables.

756 Chapitre 48

Liste des positions. La forme gnrale dun argument de position est une lettre indiquant la position par dfaut de llment (C pour colonne, L pour ligne ou S pour strate), suivie dun entier positif indiquant la position par dfaut au sein de cette dimension. Par exemple, L1 indique llment de dimension de ligne le plus externe.

Pour spcifier plusieurs lments partir de plusieurs dimensions, sparez les dimensions par un espace (par exemple, R1 C2). La lettre de dimension suivie par ALL indique tous les lments de cette dimension dans leur ordre par dfaut. Par exemple, CALL quivaut au comportement par dfaut (utilisation de tous les lments de colonne dans leur ordre par dfaut pour crer des colonnes). CALL LALL SALL (ou LALL CALL SALL, etc.) placent tous les lments de dimension dans les colonnes. Pour le format de fichier de donnes SPSS, cela cre une ligne/observation par tableau dans le fichier de donnes.
Figure 48-5 Arguments de position de ligne et de colonne

Liste des noms de dimension. Alternative aux arguments de position, vous pouvez

utiliser les noms dlment de dimension qui sont les tiquettes de texte apparaissant dans le tableau. Par exemple, un tableau crois bidimensionnel simple contient un seul lment de dimension de ligne et un seul lment de dimension de colonne, tous deux dots dtiquettes bases sur les variables de ces dimensions, plus un seul lment de dimension de strate intitul Statistiques (si le franais est la langue de sortie).

757 Systme de gestion des rsultats

Les noms dlment de dimension peuvent varier en fonction de la langue de sortie et/ou des paramtres qui affectent laffichage des noms de variable et/ou des tiquettes dans les tableaux. Chaque nom dlment de dimension doit apparatre entre apostrophes ou entre guillemets. Pour spcifier plusieurs noms dlment de dimension, sparez-les par un espace. Les tiquettes associes aux lments de dimension ne sont peut-tre pas toujours videntes.
Pour afficher tous les lments de dimension et leurs tiquettes pour un tableau pivotant
E Double-cliquez sur le tableau dans le Viewer pour lactiver. E A partir des menus, slectionnez : Affichage Montrer Tout

et/ou
E Si les structures pivotantes ne sont pas affiches, slectionnez les option suivantes

dans les menus :


Tableau pivotant Structure pivotante E Dplacez le pointeur de la souris au-dessus de chaque icne dans les structures

pivotantes pour afficher ltiquette.

758 Chapitre 48 Figure 48-6 Noms dlment de dimension affichs dans le tableau et les structures pivotantes

Journalisation
Vous pouvez enregistrer lactivit OMS dans un journal au format XML ou texte. Le journal effectue le suivi de toutes les nouvelles requtes OMS de la session ; il ninclut pas les requtes OMS dj actives avant que vous demandiez un journal. Le fichier journal en cours est interrompu si vous en indiquez un nouveau ou si vous dslectionnez loption Activit du log OMS. Pour spcifier la journalisation OMS :
E Cliquez sur Cration de logs en cours dans le panneau de configuration du systme

de gestion des rsultats.

Exclusion de laffichage des rsultats du Viewer


La case cocher Exclure de lEditeur de rsultats affecte lensemble des rsultats slectionns dans la requte OMS en supprimant laffichage de ces rsultats de la fentre de lEditeur de rsultats. Cette fonctionnalit est souvent utile pour les tches

759 Systme de gestion des rsultats

de production qui gnrent un grand nombre de rsultats et si vous navez pas besoin des rsultats sous la forme dun document de lEditeur de rsultats (fichier .spo). Vous pouvez galement lutiliser pour supprimer laffichage dobjets de rsultats particuliers que vous ne souhaitez jamais voir apparatre, sans acheminer les autres rsultats vers un fichier et un format externes. Pour supprimer laffichage de certains objets de sortie sans acheminer les autres rsultats vers un fichier externe :
E Crez une requte OMS identifiant les rsultats indsirables. E Slectionnez Exclure du Viewer. E Pour la destination des rsultats, slectionnez Fichier en prenant soin de laisser vide

le champ Fichier.
E Cliquez sur Ajouter.

Les rsultats slectionns sont exclus du Viewer, alors que tous les autres rsultats sont affichs normalement dans le Viewer.

Acheminement des rsultats vers des fichiers de donnes SPSS


Un fichier de donnes SPSS est compos de variables rparties dans les colonnes et dobservations rparties dans les lignes. Les tableaux pivotants sont convertis en fichiers de donnes de cette manire : Les colonnes du tableau sont les variables du fichier de donnes. Les noms de variable valides sont construits partir des tiquettes de colonne. Les tiquettes de ligne du tableau deviennent des variables portant des noms gnriques (Var1, Var2, Var3, etc.) dans le fichier de donnes. Les valeurs de ces variables sont les tiquettes de lignes du tableau. Trois variables didentificateur de tableau sont automatiquement incluses dans le fichier de donnes : Command_, Subtype_ et Label_. Toutes trois sont des variables chane. Les deux premires variables correspondent aux identificateurs de commande et de sous-type. Pour plus d'informations, reportez-vous

760 Chapitre 48

Identificateurs de commande et sous-types de tableau p. 749. Label_ contient le texte du titre de tableau. Les lignes du tableau deviennent des observations dans le fichier de donnes.

Exemple : Tableau bidimensionnel unique


Dans le cas le plus simple (un tableau bidimensionnel unique), les colonnes du tableau deviennent les variables et les lignes deviennent les observations du fichier de donnes.
Figure 48-7 Tableau bidimensionnel unique

Les trois premires variables identifient le tableau source par commande, sous-type et tiquette.

761 Systme de gestion des rsultats

Les deux lments qui dfinissent les lignes du tableau (valeurs de la variable Sexe et Mesures statistiques) se voient affecter les noms de variable gnriques Var1 et Var2. Dans les deux cas, il sagit de variables chane. Les tiquettes de colonne du tableau sont utilises pour crer des noms de variable valides. En loccurrence, ces noms de variables sont bass sur les tiquettes des trois variables dchelle reprises dans le tableau. Si les variables ne sont pas dotes dtiquettes ou si vous choisissez dafficher les noms de variables la place des tiquettes en tant qutiquettes de colonnes du tableau, les noms de variables du nouveau fichier de donnes sont identiques ceux du fichier de donnes source.

Exemple : Tableaux avec strates


Outre les lignes et les colonnes, un tableau peut galement contenir une troisime dimension : la dimension de strate.
Figure 48-8 Tableau avec strates

762 Chapitre 48

Dans le tableau, la variable intitule Classification des minorits dfinit les strates. Dans le fichier de donnes, deux variables supplmentaires sont cres : une qui identifie llment de strate et une autre qui identifie les modalits de cet lment. Comme pour les variables cres partir des lments de ligne, les variables cres partir des lments de strate sont des variables chane portant des noms gnriques (le prfixe Var suivi dun numro squentiel).

Fichiers de donnes crs partir de plusieurs tableaux


Lorsque plusieurs tableaux sont achemins vers le mme fichier de donnes, chacun dentre eux est ajout au fichier de donnes selon le mme principe que la fusion de fichiers de donnes qui consiste ajouter les observations dun fichier de donnes un autre (menu Donnes, Fusionner des fichiers, Ajouter des observations). Chaque tableau suivant ajoute des observations au fichier de donnes. Si les tiquettes de colonne des tableaux sont diffrentes, chaque tableau peut galement ajouter des variables au fichier de donnes, avec des valeurs manquantes pour les observations provenant des autres tableaux qui ne comportent pas de colonne dote dune tiquette identique.
Exemple : Plusieurs tableaux avec les mmes tiquettes de colonne

Plusieurs tableaux contenant les mmes tiquettes de colonnes produisent gnralement les fichiers de donnes les plus utiles (ils ne requirent aucune manipulation supplmentaire). Par exemple, au moins deux tableaux deffectifs de la procdure Effectifs auront des tiquettes de colonne identiques.

763 Systme de gestion des rsultats Figure 48-9 Deux tableaux avec tiquettes de colonne identiques

Le deuxime tableau apporte des observations supplmentaires (lignes) au fichier de donnes, mais aucune nouvelle variable car les tiquettes de colonnes sont exactement identiques ; les donnes manquantes sont ainsi beaucoup moins nombreuses. Bien que les valeurs de Command_ et Subtype_ soient identiques, la valeur Label_ identifie le tableau source de chaque groupe dobservations car les deux tableaux deffectifs ont des titres diffrents.

Exemple : Plusieurs tableaux avec diffrentes tiquettes de colonne

Une nouvelle variable est cre dans le fichier de donnes pour chaque tiquette de colonne unique des tableaux achemins vers le fichier de donnes. Cette opration gnre de nombreuses valeurs manquantes si les tableaux contiennent diffrentes tiquettes de colonne.

764 Chapitre 48 Figure 48-10 Deux tableaux avec tiquettes de colonne diffrentes

Le premier tableau comporte des colonnes intitules Salaire dembauche et Salaire actuel, qui ne sont pas prsentes dans le deuxime tableau, do labsence de valeurs pour ces variables concernant les observations issues du deuxime tableau. A linverse, le deuxime tableau comporte des colonnes intitules Niveau denseignement et Anciennet, qui ne sont pas prsentes dans le premier tableau, do labsence de valeurs pour ces variables concernant les observations issues du premier tableau. Il est possible dobtenir des variables non concordantes comme celles de cet exemple mme avec des tableaux du mme sous-type. En fait, dans cet exemple, les deux tableaux sont du mme sous-type.

765 Systme de gestion des rsultats

Exemple : Fichiers de donnes non crs partir de plusieurs tableaux

Si certains tableaux nont pas le mme nombre dlments de ligne que les autres, aucun fichier de donnes nest cr. Le nombre de lignes ne doit pas ncessairement tre identique, contrairement au nombre dlments de ligne qui deviennent des variables dans le fichier de donnes. Par exemple, un tableau crois deux variables et un tableau crois trois variables contiennent des numros de lignes diffrents, car la variable strate est en fait embote dans la variable de ligne dans laffichage par dfaut du tableau crois trois variables.
Figure 48-11 Tableaux avec nombres dlments de ligne diffrents

Contrle des lments de colonne pour contrler les variables du fichier de donnes
Dans la bote de dialogue Options du panneau de configuration OMS, vous pouvez dsigner les lments de dimension qui doivent apparatre dans les colonnes et qui sont donc utiliss pour crer des variables dans le fichier de donnes gnr. Cela revient faire pivoter le tableau dans lEditeur de rsultats.

766 Chapitre 48

Par exemple, la procdure Frquences produit un tableau de statistiques descriptives avec les statistiques sur les lignes, alors que la procdure Descriptives gnre le mme tableau avec les statistiques dans les colonnes. Pour inclure de faon significative les deux types de tableaux dans le mme fichier de donnes, vous devez modifier la dimension de colonne de lun des deux. Les deux types de tableaux utilisant le nom dlment Statistiques pour la dimension statistique, nous pouvons placer les statistiques du tableau de statistiques de frquences dans les colonnes en indiquant simplement Statistiques (entre guillemets) dans la liste des noms de dimension de la bote de dialogue Options OMS.
Figure 48-12 Bote de dialogue Options OMS

767 Systme de gestion des rsultats Figure 48-13 Combinaison de diffrents types de tableau dans un fichier de donnes par pivotement des lments de dimension

Des valeurs sont manquantes dans certaines variables, car les structures des tableaux ne sont toujours pas exactement identiques aux statistiques des colonnes.

Noms de variable dans les fichiers de donnes gnrs par le systme de gestion des rsultats
Le systme OMS construit des noms de variable uniques et valides partir des tiquettes de colonne : Des noms de variables gnriques sont attribus aux lments de ligne et de strate (le prfixe Var suivi par un numro squentiel).

768 Chapitre 48

Les caractres non autoriss dans les noms de variable (comme lespace ou les parenthses) sont supprims. Par exemple, le nom Cette tiquette (de colonne) devient la variable Cettetiquettedecolonne . Si ltiquette commence par un caractre autoris dans les noms de variable, mais pas comme premier caractre (par exemple, un chiffre), le symbole @ est insr comme prfixe. Par exemple, 2me devient la variable @2me . Les traits de soulignement et les virgules la fin des tiquettes sont supprims des noms de variable obtenus. (Les traits de soulignement situs la fin des variables Command_, Subtype_ et Label_ gnres automatiquement ne sont pas supprims.) Si plusieurs lments figurent dans la dimension de colonne, les noms de variable sont construits par la combinaison des tiquettes de modalit avec des traits de soulignement entre ces tiquettes. Les tiquettes de groupe ne sont pas incluses. Par exemple, si VarB est embot sous VarA dans les colonnes, vous obtenez des variables de type ModA1_ModB1, et non VarA_ModA1_VarB_ModB1.
Figure 48-14 Noms de variable construits partir dlments de tableau

769 Systme de gestion des rsultats

Structure de tableau OXML


Le format Output XML (OXML) est un format XML conforme au schma de rsultat spss. Pour obtenir une description dtaille du schma, reportez-vous au fichier SPSSOutputXML_schema.htm situ dans le dossier help\main du dossier dinstallation de SPSS. Les identificateurs de sous-type et de commande OMS sont utiliss comme valeurs des attributs command et subType au format OXML. Voir lexemple comme suit :
<command text="Effectifs" command="Effectifs"...> <pivotTable text="Sexe" label="Sexe" subType="Effectifs"...>

Les valeurs dattribut command et subType OMS ne sont pas affectes par la langue de sortie ni par les paramtres daffichage des tiquettes/noms de variable ou des valeurs/tiquettes de valeur. Le langage XML respecte la casse. La valeur dattribut subType effectifs nest pas identique la valeur dattribut subType Effectifs . Toutes les informations affiches dans un tableau sont contenues dans les valeurs dattribut en OXML. Au niveau de chaque cellule, OXML est compos dlments vides qui contiennent des attributs mais pas de contenu autre que celui des valeurs dattribut. En OXML, la structure de tableau est reprsente ligne par ligne ; les lments qui reprsentent les colonnes sont embots dans les lignes et les diffrentes cellules sont embotes dans les lments de colonne :
<pivotTable...> <dimension axis=ligne...> <dimension axis=colonne...> <category...> <cell text=... number=... decimals=.../> </category> <category...> <cell text=... number=... decimals=.../> </category> </dimension>

770 Chapitre 48 </dimension> ... </pivotTable>

Lexemple prcdant est une reprsentation simplifie de la structure qui prsente les relations descendant/anctre de ces lments. Cependant, lexemple ne prsente pas ncessairement les relations parent/enfant car il y a gnralement insertion dautres niveaux dlments embots. Le schma suivant illustre un simple tableau de frquences et la reprsentation OXML complte de ce tableau.
Figure 48-15 Tableau deffectifs simple

Figure 48-16 OXML pour tableau deffectifs simple

<?xml version="1.0" encoding="UTF-8" ?> <outputTreeoutputTree xmlns="http://xml.spss.com/spss/oms" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://xml.spss.com/spss/oms http://xml.spss.com/spss/oms/spss-output-1.0.xsd"> <command text="Effectifs" command="Effectifs" displayTableValues="tiquette" displayOutlineValues="tiquette" displayTableVariables="tiquette" displayOutlineVariables="tiquette"> <pivotTable text="Sexe" label="Sexe" subType="Effectifs" varName="sexe" variable="vrai"> <dimension axis="ligne" text="Sexe" label="Sexe" varName="sexe" variable="vrai"> <group text="Valide"> <group hide="vrai" text="Factice"> <category text="Femme" label="Femme" string="f" varName="sexe"> <dimension axis="colonne" text="Statistiques">

771 Systme de gestion des rsultats <category text="Effectif"> <cell text="216" number="216"/> </category> <category text="Pourcentage"> <cell text="45,6" number="45,569620253165" decimals="1"/> </category> <category text="Pourcentage valide"> <cell text="45,6" number="45,569620253165" decimals="1"/> </category> <category text="Pourcentage cumul"> <cell text="45,6" number="45,569620253165" decimals="1"/> </category> </dimension> </category> <category text="Homme" label="Homme" string="h" varName="sexe"> <dimension axis="colonne" text="Statistiques"> <category text="Effectif"> <cell text="258" number="258"/> </category> <category text="Pourcentage"> <cell text="54,4" number="54.430379746835" decimals="1"/> </category> <category text="Pourcentage valide"> <cell text="54,4" number="54,430379746835" decimals="1"/> </category> <category text="Pourcentage cumul"> <cell text="100,0" number="100" decimals="1"/> </category> </dimension> </category> </group> <category text="Total"> <dimension axis="colonne" text="Statistiques"> <category text="Effectif"> <cell text="474" number="474"/> </category> <category text="Pourcentage"> <cell text="100,0" number="100" decimals="1"/> </category> <category text="Pourcentage valide"> <cell text="100,0" number="100" decimals="1"/> </category>

772 Chapitre 48 </dimension> </category> </group> </dimension> </pivotTable> </command> </outputTree>

Comme vous pouvez le constater, un petit tableau simple produit une quantit importante de code XML. En effet, le code XML contient des informations non apparentes dans le tableau dorigine, des informations qui ne sont peut-tre mme pas disponibles dans le tableau dorigine et une certaine quantit de redondances. Le contenu du tableau tel quil apparatrait dans un tableau pivotant dans le Viewer est contenu dans les attributs de texte. Voir lexemple comme suit :
<command text="Effectifs" command="Effectifs"...>

Les attributs de texte peuvent tre affects par la langue de sortie et par les paramtres qui influencent laffichage des noms/tiquettes de variable et des valeurs/tiquettes de valeur. Dans cet exemple, la valeur dattribut texte diffre selon la langue de sortie, alors que la valeur dattribut commande reste identique, quelle que soit cette langue. Que les variables ou les valeurs des variables soient utilises dans des tiquettes de ligne ou de colonne, le code XML contiendra un attribut text et une ou plusieurs valeurs dattribut supplmentaires. Voir lexemple comme suit :
<dimension axis="ligne" text="Sexe" label="Sexe" varName="sexe"> ...<category text="Femme" label="Femme" string="f" varName="sexe">

773 Systme de gestion des rsultats

Dans le cas dune variable numrique, lattribut string est remplac par lattribut number. Lattribut label est prsent uniquement si la variable ou les valeurs disposent dtiquettes dfinies. Les lments <cell> qui contiennent des valeurs de cellule pour les chiffres contiendront lattribut text et une ou plusieurs valeurs dattribut supplmentaires. Voir lexemple comme suit :
<cell text="45,6" number="45,569620253165" decimals="1"/>

Lattribut nombre est la valeur numrique non arrondie relle et lattribut dcimales indique le nombre de dcimales affiches dans le tableau. Les colonnes tant embotes dans les lignes, llment de modalit qui identifie chaque colonne est rpt pour chaque ligne. Par exemple, comme les statistiques sont affiches dans les colonnes, llment <category text="Effectif"> apparat trois fois dans le code XML : une fois pour la ligne Homme, une fois pour la ligne Femme et une fois pour la ligne de total.

Identificateurs OMS
La bote de dialogue Identificateurs OMS vous aide crire la syntaxe de commande OMS. Vous pouvez lutiliser pour coller une commande et des identificateurs de sous-type slectionns dans une fentre de syntaxe de commande.

774 Chapitre 48 Figure 48-17 Bote de dialogue Identificateurs OMS

Pour utiliser la bote de dialogue Identificateurs OMS


E A partir des menus, slectionnez : Outils Identificateurs OMS... E Slectionnez les identificateurs de commande ou de sous-type souhaits. (Pour

slectionner plusieurs identificateurs dans chaque liste, utilisez la touche Ctrl.)


E Cliquez sur Coller commandes et/ou sur Coller sous-types.

La liste des sous-types disponibles dpend des commandes slectionnes. Si plusieurs commandes sont slectionnes, la liste des sous-types disponibles regroupe tous les sous-types disponibles pour les commandes slectionnes. Si aucune commande nest slectionne, tous les sous-types sont rpertoris. Les identificateurs sont colls dans la fentre de syntaxe de commande dsigne, lemplacement actuel du curseur. Si aucune fentre de syntaxe de commande nest ouverte, une nouvelle fentre de syntaxe est automatiquement ouverte.

775 Systme de gestion des rsultats

Lorsquun identificateur de commande et/ou de sous-type est coll, il est mis entre guillemets car la syntaxe de la commande OMS requiert des guillemets. Les listes didentificateurs des mots-cls COMMANDS et SUBTYPES doivent tre mises entre crochets. Par exemple :

/IF COMMANDS=['Tableaux croiss' 'Descriptives'] SUBTYPES=['Tableau crois' 'Statistiques descriptives']

Copie des identificateurs OMS partir de la lgende du Viewer


Vous pouvez copier et coller des identificateurs de sous-type et de commande OMS partir du panneau de lgende de lEditeur de rsultats.
E Dans le panneau de lgende, cliquez avec le bouton droit de la souris sur lentre

correspondant litem concern.


E Slectionnez Copier lidentificateur de commande OMS ou Copier le sous-type de table OMS.

Cette mthode est diffrente de celle lie la bote de dialogue Identificateurs OMS pour la raison suivante : Lidentificateur copi nest pas automatiquement coll dans une fentre de syntaxe de commande. Il est simplement copi dans le Presse-papiers ; vous pouvez le coller lemplacement de votre choix. Etant donn que les valeurs des identificateurs de commande et de sous-type sont identiques aux valeurs des attributs de commande et de sous-type correspondantes dans les rsultats au format XML (OXML), cette mthode de copier/coller peut vous tre utile lorsque vous crivez des transformations XSLT.
Copie dtiquettes OMS

Au lieu de copier des identificateurs, vous pouvez copier des tiquettes pour les utiliser avec le mot-cl LABELS. Vous pouvez utiliser des tiquettes pour diffrencier des diagrammes ou des tableaux de mme type dans lesquels le texte de la lgende reflte un attribut de lobjet de sortie particulier (par exemple, les noms de variables

776 Chapitre 48

ou les tiquettes). Cependant, il existe un certain nombre de facteurs qui peuvent avoir une incidence sur le texte de ltiquette : Si le traitement du fichier scind est activ, lidentification des classes de fichier scind peut tre ajoute ltiquette. Les tiquettes qui comprennent des informations sur les variables ou les valeurs sont affectes par les paramtres daffichage des noms de variables/tiquettes et des valeurs/tiquettes de valeurs dans le panneau de lgende (menu Modifier, Options, onglet Etiquettes Rsultats). Les tiquettes sont affectes par le paramtre li la langue des rsultats (menu Modifier, Options, onglet Gnral).
Pour copier des tiquettes OMS
E Dans le panneau de lgende, cliquez avec le bouton droit de la souris sur lentre

correspondant litem concern.


E Slectionnez Copier ltiquette OMS.

Comme pour les identificateurs de commande et de sous-type, les tiquettes doivent apparatre entre guillemets et la liste entre crochets. Par exemple :
/IF LABELS=['Catgorie d'emploi' 'Niveau d'enseignement']

Annexe

Administrateur daccs de base de donnes

LAdministrateur daccs de base de donnes est un utilitaire conu pour simplifier lutilisation de sources de donnes volumineuses ou complexes avec lassistant de base de donnes. LAdministrateur daccs de base de donnes permet aux utilisateurs et aux administrateurs de personnaliser leurs sources de donnes de diffrentes faons : Crer des alias pour des tableaux et des champs de bases de donnes Crer des noms de variables pour des champs. Masquer des tableaux et des champs accessoires. En fait, lAdministrateur daccs de base de donnes ne change pas votre base de donnes. En ralit, il gnre des fichiers qui contiennent toutes vos informations. Ces fichiers jouent le rle daffichages de base de donnes. Vous pouvez utiliser lAdministrateur daccs de base de donnes pour spcifier jusqu trois affichages diffrents par base de donnes : le niveau Entreprise, le niveau Dpartement, le niveau Personnel. LAdministrateur daccs de base de donnes et lassistant de base de donnes reconnaissent ces fichiers par les noms suivants : Niveau Entreprise : dba01.inf Niveau Dpartement : dba02.inf Niveau Personnel : dba03.inf Chaque fichier contient des informations spcifiques sur un nombre de sources de donnes quelconque correspondant au niveau. Par exemple, votre fichier dba03.inf pourrait contenir des informations daffichage Personnel pour une base de donnes de comptes socits, la base de donnes des relevs dheures de votre socit et une base de donnes que vous utilisez pour effectuer le suivi de votre collection de CD.

777

778 Annexe A

Lorsque vous ouvrez lAdministrateur daccs de base de donnes, il cherche le chemin de ces fichiers dans le systme et affiche automatiquement les informations pour lensemble des trois affichages de nimporte quelle source de donnes que vous avez configure.
Hritage et priorits. Chaque fois que vous utilisez lassistant de base de donnes, il

prsente laffichage du niveau le plus bas de votre source de donnes quil a pu trouver dans le chemin daccs de votre systme, les niveaux tant, du plus lev au plus bas, Entreprise, Dpartement et Personnel. Les fichiers de chaque niveau conservent les informations sur toutes vos sources de bases de donnes pour ce niveau. Par exemple, votre dpartement marketing aura un fichier, dba02.inf, contenant les informations dalias pour tous les affichages de bases de donnes tablis pour le dpartement marketing. Chaque personne du dpartement marketing aura un fichier, dba03.inf, contenant les affichages personnaliss de toutes les bases de donnes utilises. Dans lAdministrateur daccs de base de donnes, les alias, noms de variables, et commandes masques sont hrits du niveau suprieur. Exemples : Si le tableau des Rgions est masqu au niveau Entreprise, il est invisible aussi bien au niveau Dpartement quau niveau Personnel. Ce tableau ne sera pas affich dans lassistant de base de donnes. Le champ CATEMPL dans le tableau Ventes Employs na pas dalias au niveau Entreprise mais en a un au niveau Dpartement : son nom est Modalits Emplois. Il apparat comme Modalits Emplois au niveau Personnel De plus, si le tableau Ventes Employs possde lalias Information Employs au niveau Personnel, le champ dorigine (Ventes Employs.JOBCAT) apparatra dans lassistant de base de donnes comme Information Employs.Modalits Emplois. Pour dmarrer lAdministrateur daccs de base de donnes, excutez le fichier spssdbca.exe install dans votre rpertoire SPSS. Pour plus dinformations sur lAdministrateur daccs de base de donnes, consultez lAide en ligne.

Annexe

Personnalisation de documents HTML

Vous pouvez automatiquement ajouter le code HTML personnalis aux documents exports au format HTML, y compris : Titres de documents HTML Spcification du type de document Balises Meta et code du script (par exemple, JavaScript) Texte affich avant et aprs la sortie exporte

Pour ajouter du code HTML personnalis des documents de rsultat exports


E Ouvrez le fichier htmlfram.txt (situ dans le rpertoire dinstallation de SPSS) dans

un diteur de texte.
E Remplacez les commentaires dans les champs sur les lignes entre les doubles

chevrons ouverts (<<) par le texte ou le code HTML insrer dans vos documents HTML exports.
E Enregistrez le fichier en fichier texte.

Remarque : si vous modifiez le nom ou lemplacement du fichier texte, vous devez modifier le registre systme pour utiliser le fichier afin de personnaliser votre rsultat HTML export.

779

780 Annexe B

Contenu et format du fichier texte pour code HTML personnalis


Le code HTML ajouter automatiquement vos documents HTML doit tre spcifi dans un fichier texte simple contenant six champs, chacun dlimit par deux chevrons ouverts sur la ligne prcdente (<<) : << Texte ou code insrer en haut du document avant la spcification <HTML> (par exemple, des commentaires comprenant les spcifications du type de document) << Texte utilis comme titre du document (affich dans la barre de titre) << Balises Meta ou code du script (par exemple, code JavaScript) << Code HTML modifiant la balise <BODY> (par exemple, code indiquant la couleur darrire-plan) << Texte et/ou code HTML insr aprs les rsultats exports (par exemple, avis de copyright) << Texte et/ou code HTML insrs avant les rsultats exports (par exemple, nom de socit, logo, etc.)

Pour utiliser un autre fichier ou emplacement pour le code HTML personnalis


Si vous modifiez le nom ou lemplacement du fichier htmlfram.txt, vous devez modifier le registre du systme pour utiliser le fichier dans le rsultat HTML personnalis.
E Dans le menu Dmarrer de Windows, choisissez Excuter, tapez regedit et cliquez sur OK.

781 Personnalisation de documents HTML E Dans la fentre de gauche de lditeur de la base de registres, slectionnez : HHKEY_CURRENT_USER Logiciel SPSS SPSS pour Windows 14.0 Spsswin E Dans la fentre de droite, double-cliquez sur la chane HTMLFormatFile. E Dans la zone Donnes de la valeur, entrez le chemin complet et le nom du

fichier texte contenant les spcifications HTML personnalises (par exemple, c:\mesfichiers\html.txt).

Exemple de fichier texte pour code HTML personnalis


<< <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN"> << NVI, Inc. << <META NAME="keywords" CONTENT="trucs, gadgets, bidules"> << bgcolor="#FFFFFF" << <H4 align=center>Page ralise par... <br><br> <IMG SRC="spss2.gif" align=center></H4> << <h2 align=center>Dpartement Ventes de NVI</h2> <h3 align=center>Donnes rgionales</h3>

Exemple de source HTML pour code HTML personnalis


<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN"> <HTML> <HEAD> <TITLE> NVI, Inc.

782 Annexe B </TITLE> <META NAME="keywords" CONTENT="trucs, gadgets, bidules"> </HEAD> <BODY bgcolor="#FFFFFF"> <h2 align=center>Dpartement Ventes de NVI</h2> <h3 align=center>Donnes rgionales</h3> [Rsultat export] <H4 align=center>Page ralise par... <br><br> <IMG SRC="spss2.gif" align=center</H4> </BODY> </HTML>

Index
Access (Microsoft), 31 Affectation de mmoire Dans lanalyse TwoStep Cluster, 529 Affichage, 267, 322323, 683 Barres doutils, 683 Etiquettes de dimension, 322 Lgendes, 323 Lignes ou colonnes, 322 Notes de bas de page, 323 Rsultats, 267 Titres, 323 Affichage des donnes, 96 Affichage des variables, 97 affichages/panneaux multiples Editeur de donnes, 117 Agrgation de donnes, 227 Fonctions dagrgation, 230 Noms de variable et tiquettes, 231 Aide contextuelle, 316 Recherche de dfinitions dtiquette dans les tableaux pivotants, 316 Aide en ligne, 17 Assistant statistique, 14 Ajout dtiquettes de groupe, 314 Ajustement de fonctions, 487 Analyse de la variance, 487 Enregistrement dintervalles de prvision, 492 Enregistrement de prvisions, 492 Enregistrement de rsidus, 492 Inclusion de la constante, 487 Modles, 491 Prvision, 492 algorithmes, 17 Alignement, 107, 269, 337, 662 Dans les cellules, 337 diteur de donnes, 107 Rsultats, 269, 662 Alpha de Cronbach Dans lanalyse de fiabilit, 613, 616 Alpha-maximisation, 515 Analyse de donnes, 14 Etapes de base, 14 Analyse de fiabilit, 613 Caractristiques, 616 Coefficient de corrlation intra-classe, 616 Corrlations et covariances entre lments, 616 Exemple, 613 Fonctionnalits supplmentaires, 618 Kuder-Richardson 20, 616 statistiques, 613, 616 T2 de Hotelling, 616 Tableau ANOVA, 616 Test dadditivit de Tukey, 616 Analyse de la variance Ajustement de fonctions, 487 Dans ANOVA 1 facteur, 425 Dans la rgression linaire, 483 Dans Moyennes, 402 Analyse de sries chronologiques Prvision, 492 Prvision dobservations, 492 Analyse discriminante, 495 analyse des observations restantes, 708 Coefficients de la fonction, 500
783

784 Index

Critres, 501 Dfinition dintervalles, 499 Diagrammes, 503 Distance de Mahalanobis, 501 Enregistrement des variables du classement, 505 Exemple, 495 Exportation des informations du modle, 505 Fonctionnalits supplmentaires, 505 Lambda de Wilks, 501 Matrice de covariance, 503 Matrices, 500 Mthodes de lanalyse discriminante, 501 Mthodes pas pas, 495 Options daffichage, 501, 503 Probabilits a priori, 503 Slection dobservations, 499 statistiques, 495, 500 Statistiques descriptives, 500 V de Rao , 501 Valeurs manquantes, 503 Variables de regroupement, 495 Variables indpendantes, 495 Analyse en composantes principale, 507, 515 Analyse factorielle, 507 analyse des observations restantes, 708 Aperu, 507 Cartes factorielles, 517 Convergence, 515, 517 Descriptives, 514 Exemple, 507 Facteurs, 519 Fonctionnalits supplmentaires, 520 Format daffichage des projections, 520 Mthodes dextraction, 515 Mthodes de rotation, 517 Slection dobservations, 513

statistiques, 507, 514 Valeurs manquantes, 520 Analyse multirponses Tableau crois, 590 Tableaux croiss des rponses multiples, 590 tableaux de frquences, 588 Tableaux de frquences des rponses multiples, 588 Analyse TwoStep Cluster, 525 Diagrammes, 532 Enregistrer dans le fichier de travail, 533 Enregistrer dans le fichier externe, 533 Options, 529 statistiques, 533 Andrew Dans Explorer, 373 Annes, 676 valeurs deux chiffres, 676 ANOVA Dans ANOVA 1 facteur, 425 dans GLM - Univari, 435 Dans Moyennes, 402 Modle, 439 ANOVA 1 facteur, 425 Comparaisons multiples, 429 Contrastes, 428 Contrastes polynomiaux, 428 Fonctionnalits supplmentaires, 433 Options, 432 statistiques, 432 Tests post hoc, 429 Valeurs manquantes, 432 Variables actives, 425 Aperu, 777 Aplatissement Dans Effectifs, 358

785 Index

Dans Explorer, 373 Dans les cubes OLAP, 408 Dans les tableaux de bord en colonnes, 607 Dans les tableaux de bord en lignes, 600 Dans Moyennes, 402 Dans Rcapituler, 395 Descriptives, 365 Arbres hirarchiques Classification hirarchique, 541 Assistant script, 715 Assistant statistique, 14 Association de signets aux diffrents affichages dun tableau pivotant, 320 Association linaire par linaire Tableaux croiss, 383 Astuces de script, 707, 712, 715, 721722, 724, 726728, 731, 736 Ajout dune description, 731 Assistant script, 715 Botes de dialogue personnalises, 731 Dbogage, 736 Dclaration de variables, 722 Fentre de script, 712 Fonctionnement des scripts, 721 Navigateur dobjets, 727 Obtention dobjets dautomatisation, 724 Procdures, 728 Proprits et mthodes, 726 Asymtrie Dans Effectifs, 358 Dans Explorer, 373 Dans les cubes OLAP, 408 Dans les tableaux de bord en colonnes, 607 Dans les tableaux de bord en lignes, 600 Dans Moyennes, 402 Dans Rcapituler, 395

Descriptives, 365 attribution dun nouveau nom aux ensembles de donnes, 122 Attributs de variable, 107108 Copie et collage, 107108 Automatisation OLE, 707, 721, 723724, 726727 Aperu, 721, 723724, 727 conventions dappellation des variables, 723 Mthodes, 726 proprits, 726 Scripts, 707 Utilisation dobjets, 721, 724, 727 Autoscripts, 679, 716, 718 Cration, 716 Evnements dclenchants, 718 Fichier dautoscript, 720 B de Tukey Dans ANOVA 1 facteur, 429 GLM, 445 Barre dtat, 9 Affichage, 10 Masquage, 10 Barres doutils, 683687 Affichage dans des fentres diffrentes, 684 Affichage et masquage, 683 Cration, 683, 685 Cration doutils, 686 Modification des icnes bitmap, 687 Personnalisation, 683, 685 botes moustaches Comparaison des niveaux de facteur, 374 Comparaison des variables, 374 Dans Explorer, 374

786 Index

Botes de dialogue, 12, 653, 655, 660, 731, 733 Affichage des tiquettes de variable, 10, 660 Affichage des noms de variable, 10, 660 commandes, 11 Dfinition de groupes de variables, 653 icnes de variables, 13 Informations sur les variables, 13 Ordre daffichage des variables, 660 Rordonnance de listes cible, 656 Script, 731, 733 Slection de variables, 12 Sous-botes de dialogue, 12 Spcifications facultatives, 12 Utilisation de groupes de variables, 655 Variables, 10 Bonferroni Dans ANOVA 1 facteur, 429 GLM, 445 Bordures, 303, 331332 Affichage des bordures masques, 332 Viewer en mode brouillon, 303 Bordures de cellules, 303 Viewer en mode brouillon, 303 Bouton Aide, 11 Bouton Annuler, 11 Bouton Coller, 11 Bouton OK, 11 Bouton Restaurer, 11 Boutons, 687 Modification des icnes bitmap de la barre doutils, 687 C de Dunnett Dans ANOVA 1 facteur, 429 GLM, 445

Calcul de variables, 163 Calcul de nouvelles variables chane, 166 Carr de la distance euclidienne Distances, 467 Cartes factorielles Dans Analyse factorielle, 517 Cellules de tableaux pivotants, 323, 329, 333334, 336339, 341 Affichage, 321 Alignement, 337 Contours, 339 Formats, 329 Formats des valeurs, 336 Largeurs, 334 Marges, 338 Masquage, 321 Modification de texte, 341 Ombrage, 339 Polices, 333 Centiles Dans Effectifs, 358 Dans Explorer, 373 Centrage de rsultats, 269, 662 Chi-deux, 554 Association linaire par linaire, 383 Correction pour la continuit de Yates, 383 Indpendance, 383 Intervalle thorique, 557 Options, 557 Pearson :, 383 Rapport de vraisemblance, 383 statistiques, 557 Tableaux croiss, 383 Test un chantillon, 554 Test exact de Fisher, 383 Valeurs manquantes, 557

787 Index

Valeurs thoriques, 557 Chi-deux de Pearson Tableaux croiss, 383 Chi-deux du rapport de vraisemblance Tableaux croiss, 383 Classification Choix dune procdure, 523 Classification hirarchique, 535 Dans Courbe ROC, 647 Efficacit, 548 Nues dynamiques, 543 Classification hirarchique, 535 Arbres hirarchiques, 541 Chane des agrgations, 540 Classes daffectation, 540541 Classification dobservations, 535 Classification de variables, 535 Diagrammes en stalactite, 541 Enregistrement de nouvelles variables, 541 Exemple, 535 Fonctionnalits supplmentaires, 542 Matrices de distance, 540 Mesures de distance, 539 Mesures de similarit, 539 Mthodes de classification, 539 Orientation du diagramme, 541 statistiques, 535, 540 Transformation de mesures, 539 Transformation de valeurs, 539 Coefficient alpha Dans lanalyse de fiabilit, 613, 616 Coefficient dincertitude Tableaux croiss, 383 Coefficient de contingence Tableaux croiss, 383

Coefficient de corrlation de Spearman Corrlations bivaries, 453 Tableaux croiss, 383 Coefficient de corrlation intra-classe Dans lanalyse de fiabilit, 616 Coefficient de corrlation par rang Corrlations bivaries, 453 Coefficient de corrlation r Corrlations bivaries, 453 Tableaux croiss, 383 Coefficient de dispersion (COD) Dans les statistiques de ratio, 631 Coefficient de variation (COV) Dans les statistiques de ratio, 631 Coefficients bta Dans la rgression linaire, 483 Coefficients de rgression Dans la rgression linaire, 483 Collage, 276278 Collage spcial dobjets, 278 diagrammes, 276 Tableaux pivotants, 276277 Tableaux pivotants en tant que tableaux, 276 Colonne de total Dans les tableaux de bord, 608 colonnes., 334, 341 Modification de la largeur des tableaux pivotants, 334 Slection dans les tableaux pivotants, 341 Commande EXECUTE Colle depuis les botes de dialogue, 353 Comparaison des groupes Dans les cubes OLAP, 411 Comparaison des variables Dans les cubes OLAP, 411

788 Index

Comparaisons multiples Dans ANOVA 1 facteur, 429 Comparaisons multiples post hoc, 429 Comptage doccurrences, 169 Connexion un serveur, 85 Contrastes Dans ANOVA 1 facteur, 428 GLM, 442 Contrastes la prcdente GLM, 442 Contrastes de Helmert GLM, 442 Contrastes dviation GLM, 442 Contrastes diffrence GLM, 442 Contrastes polynomiaux Dans ANOVA 1 facteur, 428 GLM, 442 Contrastes simples GLM, 442 Convergence Analyse de classification des nues dynamiques, 549 Dans Analyse factorielle, 515, 517 Copie, 269, 274 diagrammes, 274 Rsultats, 269 Tableaux pivotants, 274 Correction pour la continuit de Yates Tableaux croiss, 383 Corrlation de Pearson Corrlations bivaries, 453 Tableaux croiss, 383 Corrlations Corrlations bivaries, 453

Dans Corrlations partielles, 459 Ordre zro, 462 Tableaux croiss, 383 Corrlations bivaries Coefficients de corrlation, 453 Fonctionnalits supplmentaires, 457 Options, 456 Seuil de signification, 453 statistiques, 456 Valeurs manquantes, 456 Corrlations partielles, 459 Corrlations simples, 462 Dans la rgression linaire, 483 Fonctionnalits supplmentaires, 463 Options, 462 statistiques, 462 Valeurs manquantes, 462 Corrlations simples Dans Corrlations partielles, 462 Couleurs de tableaux pivotants, 331, 333, 339 Arrire-plan des cellules, 339 Bordures, 331 Police, 333 Premier plan des cellules, 339 Courbe ROC, 647 Diagrammes et statistiques, 650 Critres dagrgation Dans Agrger les donnes, 227 Cubes OLAP, 405 statistiques, 408 Titres, 412 D Tableaux croiss, 383 D de Somers Tableaux croiss, 383

789 Index

Data Editor, 681 Envoi de donnes vers dautres applications, 681 plusieurs fichiers de donnes ouverts, 119 Data List, 77 et GET DATA, 77 Dbogage des scripts, 736, 738 Excution pas pas des scripts, 736 Points darrt, 736 Volet de dbogage, 738 dclaration de variables Conventions dappellation, 723 Dclaration de variables, 722723 Dans des scripts, 722723 Dcomposition hirarchique, 440 Dfinir les vecteurs multirponses, 586 Dfinition des tiquettes, 586 Dfinition des noms, 586 Dichotomies, 586 Modalits, 586 Dfinition de variables, 98, 101, 103105, 107108, 124 Application dun dictionnaire des donnes, 136 Copie et collage dattributs, 107108 Etiquettes de valeurs, 104, 124 Etiquettes de variable, 103 Modles, 107108 Types de donnes, 101 Valeurs manquantes, 105 Dplacement de lignes et de colonnes, 313 Dernier Dans les cubes OLAP, 408 Dans Moyennes, 402 Dans Rcapituler, 395 Descriptives, 363 Enregistrement des carts z, 363 Fonctionnalits supplmentaires, 366

Ordre daffichage, 365 statistiques, 365 Diagnostic des observations Dans la rgression linaire, 483 diagramme dimportance Dans lanalyse TwoStep Cluster, 532 Diagramme de rpartition gaussien Dans Explorer, 374 Dans la rgression linaire, 478 Diagramme de rpartition hors tendance Dans Explorer, 374 diagrammes, 267, 274276, 279, 667, 694 Aperu, 633 Collage dans dautres applications, 276 Copie, 274 Copie dans dautres applications, 275 Cration, 633 Dans Courbe ROC, 647 Etiquettes dobservations, 487 Exportation, 279, 694 Masquage, 267 Modles, 645, 667 Modification, 637 Notes de bas de page, 641 Rapport hauteur/largeur, 667 Sous-titres, 641 Titres, 641 Valeurs manquantes, 642 Diagrammes dimportance des variables Dans lanalyse TwoStep Cluster, 532 Diagrammes de dispersion Dans la rgression linaire, 478 Diagrammes de profils GLM, 443 Diagrammes des rsidus dans GLM - Univari, 449

790 Index

Diagrammes dispersion/niveau Dans Explorer, 374 dans GLM - Univari, 449 Diagrammes en btons Dans Effectifs, 360 diagrammes en secteurs Dans Effectifs, 360 Titres, 641 Diagrammes en stalactite Classification hirarchique, 541 Diagrammes interactifs, 275, 672 Copie dans dautres applications, 275 Enregistrement des donnes avec un diagramme, 672 Incorporation en tant quobjets ActiveX, 275 Options, 672 Diagrammes partiels Dans la rgression linaire, 478 Diagrammes tige et feuille Dans Explorer, 374 Dictionnaire, 6768 Dictionnaire des donnes Application partir dun autre fichier, 136 Diffrence de bta Dans la rgression linaire, 479 Diffrence de prvision Dans la rgression linaire, 479 Diffrence la moins significative Dans ANOVA 1 facteur, 429 GLM, 445 Diffrence significative de Tukey Dans ANOVA 1 facteur, 429 GLM, 445 Diffrences entre les groupes Dans les cubes OLAP, 411

Diffrences entre les variables Dans les cubes OLAP, 411 Diffrentiel li au prix (PRD) Dans les statistiques de ratio, 631 Dimensionnement des diagrammes exports, 286 Distance de Cook Dans la rgression linaire, 479 GLM, 447 Distance de Mahalanobis Analyse discriminante, 501 Dans la rgression linaire, 479 Distance de Manhattan Distances, 467 Distance de Minkowski Distances, 467 Distance de Tchebycheff Distances, 467 Distance du Chi-deux Distances, 467 Distance euclidienne Distances, 467 Distances, 465 Calcul des distances existant entre des observations, 465 Calcul des distances existant entre des variables, 465 Exemple, 465 Fonctionnalits supplmentaires, 469 Mesures de dissimilarit, 467 Mesures de similarit, 468 statistiques, 465 Transformation de mesures, 467468 Transformation de valeurs, 467468 Division Division dans les colonnes de tableaux, 608

791 Index

Division de tableaux, 343 Contrle des sauts de tableau, 343 Donnes au format CSV, 49 Donnes de dimension, 62 Donnes de sries chronologiques Cration de variables de sries chronologiques, 205 Dfinition de variables de date, 203 Fonctions de transformation, 207 Remplacement de valeurs manquantes, 208 Transformations de donnes, 203 Donnes pondres, 263 Et fichiers des donnes restructures, 263 Donnes qualitatives, 129 Conversion de donnes dintervalle en modalits discrtes, 150 Donnes spares par des espaces, 49 Donnes spares par des virgules, 49 Droits daccs, 92 Ecart absolu moyen (AAD) Dans les statistiques de ratio, 631 Ecart type Dans Effectifs, 358 Dans Explorer, 373 dans GLM - Univari, 449 Dans les cubes OLAP, 408 Dans les statistiques de ratio, 631 Dans les tableaux de bord en colonnes, 607 Dans les tableaux de bord en lignes, 600 Dans Moyennes, 402 Dans Rcapituler, 395 Descriptives, 365 Ecart z Descriptives, 363 Enregistrement sous forme de variables, 363

Ordonner les observations, 179 Echantillon alatoire, 39 Fichiers de base de donnes, 39 Gnration de nombres alatoires, 167 Slection, 237 Echantillonnage Echantillon alatoire, 237 Echantillons lis, 573, 581 Echelle, 99 Dans lanalyse de fiabilit, 613 Dans le positionnement multidimensionnel, 621 Niveau de mesure, 99, 129 Editeur de donnes, 95, 98, 107, 109118 Affichage des donnes, 96 Affichage des variables, 97 affichages/panneaux multiples, 117 Alignement, 107 Dfinition de variables, 98 Dplacement de variables, 115 Impression, 118 Insertion de nouvelles observations, 113 Insertion de nouvelles variables, 114 Largeur de colonne, 107 Modification de donnes, 111112 Modification du type de donnes, 115 Observations filtres, 116 Options daffichage, 117 Recherche dobservations, 115116 Restrictions concernant la valeur de donnes, 111 Saisie de donnes, 109 Saisie de donnes non numriques, 110 Saisie de donnes numriques, 110 Effectif observ Tableaux croiss, 387

792 Index

Effectif thorique Tableaux croiss, 387 Effectifs, 355 diagrammes, 360 Formats, 361 Ordre daffichage, 361 statistiques, 358 Suppression de tableaux, 361 Elimination descendante Dans la rgression linaire, 476 En-ttes, 294, 296 Enregistrement de diagrammes, 279, 286289, 291, 672, 694 Enregistrement de diagrammes interactifs avec des donnes, 672 Fichiers BMP, 279, 286287, 694 Fichiers EPS, 279, 286, 289, 694 Fichiers JPEG, 279, 286, 694 Fichiers PICT, 279, 286287, 694 Fichiers PNG, 288 Fichiers PostScript, 289 Fichiers TIFF, 288 Fichiers WMF, 279, 286, 291 Format WMF, 694 Mtafichiers, 279, 286, 694 Enregistrement de fichiers, 68, 73, 89 Fichiers de donnes, 73, 89 Fichiers de donnes SPSS, 68 Requtes de fichiers de base de donnes, 47 Enregistrement des diffrents affichages dun tableau pivotant, 320 Enregistrement des rsultats, 279, 283284, 299, 310, 694, 706 Enregistrement dun rsultat en mode brouillon en tant que texte, 310 Format Excel, 279, 282

Format PowerPoint, 279, 283 Format texte, 279, 284, 694 Format Word, 279, 282 HTML, 279, 282, 694 Protection par mot de passe, 299 Publication sur le Web, 706 Rsultat en mode brouillon, 310 ensembles de donnes renommer, 122 Erreur standard Dans Courbe ROC, 650 Dans Effectifs, 358 Dans Explorer, 373 Descriptives, 365 GLM, 447, 449 Erreur standard daplatissement Dans les cubes OLAP, 408 Dans Moyennes, 402 Dans Rcapituler, 395 Erreur standard dasymtrie Dans les cubes OLAP, 408 Dans Moyennes, 402 Dans Rcapituler, 395 Erreur standard de la moyenne Dans les cubes OLAP, 408 Dans Moyennes, 402 Dans Rcapituler, 395 Espace disque, 77, 79 Temporaire, 77, 79 Espace disque temporaire, 77, 79 Estimation de lintensit des effets dans GLM - Univari, 449 Estimations de Blom, 179 Estimations de la proportion Ordonner les observations, 179

793 Index

Estimations de puissance dans GLM - Univari, 449 Estimations de Rankit, 179 Estimations de Tukey, 179 Estimations de Van der Waerden, 179 Estimations des paramtres dans GLM - Univari, 449 eta Tableaux croiss, 383 ta Dans Moyennes, 402 Eta carr dans GLM - Univari, 449 Dans Moyennes, 402 Etiquettes, 314 et noms de sous-type dans le systme OMS, 751 Insertion dtiquettes de groupe, 314 Suppression, 314 Etiquettes de groupe, 314 Etiquettes de valeurs, 104, 111, 117, 124, 665 Application plusieurs variables, 130 Copie, 130 Dans des fichiers de donnes fusionns, 224 diteur de donnes, 117 Insertion de sauts de ligne, 105 Panneau de lgendes, 665 Tableaux pivotants, 665 Utilisation pour la saisie de donnes, 111 Etiquettes de variable, 103, 660, 665 Botes de dialogue, 10, 660 Dans des fichiers de donnes fusionns, 224 Insertion de sauts de ligne, 105 Panneau de lgendes, 665 Tableaux pivotants, 665 Etude apparie Test T pour chantillons apparis, 418

Etude de contrle dobservation Test T pour chantillons apparis, 418 Evnements dclenchants, 718 Autoscripts, 718 exclusion de rsultats du Viewer avec OMS, 758 Explorer, 369 Diagrammes, 374 Fonctionnalits supplmentaires, 376 Options, 376 statistiques, 373 Transformations de lexposant, 375 Valeurs manquantes, 376 Exportation de diagrammes, 279, 286289, 291, 691, 694 Production automatise, 691 Taille des diagrammes, 286 Exportation de donnes, 681 Ajout dlments de menu pour lexportation de donnes, 681 Exportation de rsultats, 279, 283284, 694, 706 Format Excel, 279, 282 Format PowerPoint, 279 Format Word, 279, 282 HTML, 282 OMS, 743 Publication sur le Web, 706 F de R-E-G-W (Ryan-Einot-Gabriel-Welsch) Dans ANOVA 1 facteur, 429 GLM, 445 F multiple de Ryan-Einot-Gabriel-Welsch Dans ANOVA 1 facteur, 429 GLM, 445 Facteur dinflation de la variance Dans la rgression linaire, 483 Facteurs, 519

794 Index

Facteurs dAnderson-Rubin, 519 Facteurs de Bartlett, 519 Factorisation en axes principaux, 515 Factorisation en projections, 515 Fentre active, 8 Fentre de script, 712, 714, 727 Menu Mettre au point, 736 Navigateur dobjets, 727 Onglet Charg, 738 Onglet Espion, 738 Onglet Immdiat, 738 Onglet Pile, 738 proprits, 714 Fentre dsigne, 8 Fentres, 7 Fentre active, 8 Fentre dsigne, 8 Fentres daide, 17 Fiabilit de Spearman-Brown Dans lanalyse de fiabilit, 616 Fiabilit Split-half Dans lanalyse de fiabilit, 613, 616 Fichier actif, 77, 79 Cration dun fichier actif temporaire, 79 Fichier actif virtuel, 77 Mise en mmoire cache, 79 Fichier actif temporaire, 79 fichier de modle chargement de modles enregistrs pour noter des donnes, 212 fichier-journal, 660 fichiers, 273 Ajout dun fichier texte dans le Rsultats, 273 Ouverture, 25 Fichiers BMP, 279, 286287, 694 Exportation de diagrammes, 279, 286287, 694

Fichiers dBASE, 25, 28, 73 Enregistrement, 73 Ouverture, 25, 28 Fichiers de base de donnes, 3031, 3435, 3739, 42, 45, 47 Clause Where, 39 connexion une base de donnes, 34 Conversion des chanes en valeurs numriques, 45 Cration de relations, 37 Dfinition de variables, 45 Demande de valeur, 42 Echantillonnage alatoire, 39 Enregistrement de requtes, 47 Expressions conditionnelles, 39 Jointures de tables, 3738 Lecture, 3031, 35 Microsoft Access, 31 Proprits des relations, 38 Requtes de paramtres, 39, 42 scurit de base de donnes, 34 Slection dune source de donnes, 31 slection de fichiers de donnes, 35 Spcification de critres, 39 Syntaxe SQL, 47 Vrification des rsultats, 47 Fichiers de donnes, 2526, 49, 6768, 73, 76, 79, 8890, 241 ajout de commentaires, 652 Amlioration des performances pour des fichiers volumineux, 79 Dimensions, 62 Enregistrement, 68, 73 Enregistrement de sous-ensembles de variables, 76

795 Index

enregistrement des rsultats sous forme de fichiers de donnes au format SPSS, 743 informations sur les dictionnaires, 6768 Informations sur les fichiers, 6768 mrInterview, 62 Ouverture, 2526 plusieurs fichiers de donnes ouverts, 119 protection, 77 Quancept, 62 Quanvert, 62 Restructuration, 241 Retournement, 219 Serveurs distants, 8890 Texte, 49 Transposition, 219 Fichiers de feuille de calcul, 25, 2728, 77 Ecriture de noms de variable, 77 Lecture des noms de variable, 27 Lecture des plages, 27 Ouverture, 28 Fichiers dlimits par des tabulations, 25, 27, 49, 73, 77 Ecriture de noms de variable, 77 Enregistrement, 73 Lecture des noms de variable, 27 Ouverture, 25 Fichiers EPS, 279, 286, 289, 694 Exportation de diagrammes, 279, 286, 289, 694 Fichiers Excel, 25, 27, 73, 681 Ajout dlments de menu pour lenvoi de donnes vers Excel, 681 Enregistrement, 73 Ouverture, 25, 27 Fichiers JPEG, 279, 286, 694 Exportation de diagrammes, 279, 286, 694

Fichiers Lotus 1-2-3, 25, 73, 681 Ajout dlments de menu pour lenvoi de donnes vers Lotus, 681 Enregistrement, 73 Ouverture, 25 Fichiers PICT, 279, 286287, 694 Exportation de diagrammes, 279, 286287, 694 Fichiers PNG, 279, 288 Exportation de diagrammes, 279, 288 fichiers portables Noms de variable, 73 Fichiers PostScript (encapsuls), 279, 289, 694 Exportation de diagrammes, 279, 289, 694 Fichiers SAS Enregistrement, 73 Ouverture, 25 Fichiers Stata, 29 Enregistrement, 73 Lecture, 25 Ouverture, 29 Fichiers SYSTAT, 25 Ouverture, 25 Fichiers TIFF, 288 Exportation de diagrammes, 279, 286, 288, 694 Fichiers WMF, 279, 286, 291, 694 Exportation de diagrammes, 279, 286, 291, 694 Fonction Dcalage ngatif, 207 Fonction Diffrence, 207 Fonction Diffrence saisonnire, 207 Fonction Lissage, 207 Fonction Mdiane mobile, 207 Fonction Moyenne mobile centre, 207 Fonction Moyenne mobile prcdente, 207 Fonction Somme cumule, 207 fonctions, 166 Traitement des valeurs manquantes, 167

796 Index

Format chane, 101 Format de colonne, 336 Modification dans les tableaux pivotants, 336 format de fichier SAV acheminement des rsultats dans un fichier de donnes SPSS, 752, 759 Format des fichiers de donnes SPSS acheminement des rsultats dans un fichier de donnes, 752, 759 Format dollar, 101, 103 Format Excel Exportation de rsultats, 279, 282 Format fixe, 49 Format libre, 49 Format numrique, 101, 103 Format point, 101, 103 Format PowerPoint Exportation de rsultats, 279 Format virgule, 101, 103 Format Word Exportation de rsultats, 279, 282 Formatage, 303 Colonnes dans les tableaux de bord, 598 Rsultat en mode brouillon, 303 Formats daffichage, 103 Formats dentre, 103 Formats de date, 101, 103, 676 annes deux chiffres, 676 Formats montaires, 677 Formats montaires personnaliss, 101, 677 Frquences de classe Dans lanalyse TwoStep Cluster, 533 fusion de modalits, 150 Fusion des fichiers de donnes Affectation dun nouveau nom aux variables, 223

Fichiers avec observations diffrentes, 220 Fichiers avec variables diffrentes, 224 informations sur les dictionnaires, 224 Gamma Tableaux croiss, 383 Gamma de Goodman et Kruskal Tableaux croiss, 383 Gnration de nombres alatoires, 167 Gestion des pages Dans les tableaux de bord en colonnes, 610 Dans les tableaux de bord en lignes, 601 Gestion du bruit Dans lanalyse TwoStep Cluster, 529 GET DATA, 77 et Data List, 77 et Get Capture, 77 GLM Diagrammes de profils, 443 Enregistrement de matrices, 447 Enregistrement de variables, 447 Modle, 439 Somme des carrs, 439 Tests post hoc, 445 GLM - Univari, 435, 451 Affichage, 449 Contrastes, 442 Diagnostics, 449 Moyennes marginales estimes, 449 Options, 449 Groupement de lignes ou de colonnes, 314 Groupes de variables, 653, 655 Dfinition, 653 Utilisation, 655 GT2 de Hochberg Dans ANOVA 1 facteur, 429

797 Index

GLM, 445 H de Kruskal-Wallis Tests pour deux chantillons indpendants, 577 Histogrammes Dans Effectifs, 360 Dans Explorer, 374 Dans la rgression linaire, 478 HTML, 279, 282, 694, 779 Ajout de code personnalis, 779 Exportation de rsultats, 279, 282, 694 ICC. Voir Coefficient de corrlation intra-classe, 616 Icnes, 687 Botes de dialogue, 13 Modification des icnes bitmap de la barre doutils, 687 identificateurs de commande, 749 Impression, 118, 291292, 294, 296297, 308309, 327, 332, 343 Aperu avant impression, 292 Contrle des sauts de tableau, 343 diagrammes, 291 Donnes, 118 En-ttes et pieds de page, 294, 296 Espace entre les lments de rsultat, 297 Mise en page, 294 Numros de page, 297 Redimensionnement de tableaux, 327, 332 Rsultat en mode brouillon, 308309 Rsultats texte, 291 Strates, 291, 327, 332 Tableaux pivotants, 291 Taille des diagrammes, 297

incorporation Diagrammes interactifs, 275 Tableaux pivotants, 275 Index de concentration Dans les statistiques de ratio, 631 Informations sur les fichiers, 6768 Informations sur les variables, 651 Insertion dtiquettes de groupe, 314 Intervalle multiple de Ryan-Einot-Gabriel-Welsch Dans ANOVA 1 facteur, 429 GLM, 445 Intervalles de confiance Dans ANOVA 1 facteur, 432 Dans Courbe ROC, 650 Dans Explorer, 373 Dans la rgression linaire, 483 Enregistrement dans la rgression linaire, 479 GLM, 442, 449 Test T pour chantillon unique, 422 Test T pour chantillons apparis, 420 Test T pour chantillons indpendants, 417 Intervalles de prvision Enregistrement dans lajustement de fonctions, 492 Enregistrement dans la rgression linaire, 479 Itrations Analyse de classification des nues dynamiques, 549 Dans Analyse factorielle, 515, 517 Journal de session, 660 Justification, 269, 662 Rsultats, 269, 662

Kappa Tableaux croiss, 383

798 Index

Kappa de Cohen Tableaux croiss, 383 KR20 Dans lanalyse de fiabilit, 616 Kuder-Richardson 20 (KR20) Dans lanalyse de fiabilit, 616 LAG (fonction), 207 Lambda Tableaux croiss, 383 Lambda de Goodman et Kruskal Tableaux croiss, 383 Lambda de Wilks Analyse discriminante, 501 Langage Modification du langage des rsultats, 660 langage de commande, 345 Largeur de colonne, 107, 327, 334, 673 Contrle de la largeur maximale, 327 Contrle de la largeur par dfaut, 673 Contrle de la largeur pour texte avec retour automatique la ligne, 327 diteur de donnes, 107 Tableaux pivotants, 334 Lecteurs partags, 92 Lgende, 270272 Dans le Rsultats, 270 Dveloppement, 271 Modification des niveaux, 272 Rduction, 271 Lgendes, 342 Ajout un tableau, 342 Lignes, 341 Slection dans les tableaux pivotants, 341 Lissage T4253H, 207 Liste des observations, 391

Listes cible, 656 Listes de variables, 656 Rordonnance de listes cible, 656 LSD de Fisher GLM, 445 M-estimateur de Huber Dans Explorer, 373 M-estimateur redescendant de Hampel Dans Explorer, 373 M-estimateurs Dans Explorer, 373 Marges, 294, 338 Dans les cellules, 338 Marges de page, 294 Masquage, 267268, 322323, 683 Barres doutils, 683 Etiquettes de dimension, 322 Lgendes, 323 Lignes et colonnes, 322 Notes de bas de page, 323 Rsultats dune procdure, 268 Titres, 323 masquage (exclusion) de rsultats du Viewer avec OMS, 758 Matrice de corrlation Analyse discriminante, 500 Dans Analyse factorielle, 507, 514 Matrice de covariance Analyse discriminante, 500, 503 Dans la rgression linaire, 483 GLM, 447 Matrice de transformation Dans Analyse factorielle, 507 Matrice des projections factorielles Dans Analyse factorielle, 507

799 Index

Maximum Comparaison des colonnes de tableaux, 608 Dans Effectifs, 358 Dans Explorer, 373 Dans les cubes OLAP, 408 Dans les statistiques de ratio, 631 Dans Moyennes, 402 Dans Rcapituler, 395 Descriptives, 365 Maximum de vraisemblance Dans Analyse factorielle, 515 Mdiane Dans Effectifs, 358 Dans Explorer, 373 Dans les cubes OLAP, 408 Dans les statistiques de ratio, 631 Dans Moyennes, 402 Dans Rcapituler, 395 Mdiane de groupes Dans les cubes OLAP, 408 Dans Moyennes, 402 Dans Rcapituler, 395 Mmoire, 660 menus, 9, 681 Personnalisation, 681 Mesure dcart de la taille Distances, 467 Mesure dcart de structures Distances, 467 Mesure de dissimilarit de Lance et Williams, 467 Distances, 467 Mesure de distance du Phi-deux Distances, 467 Mesures de distance Classification hirarchique, 539 Distances, 467

Mesures de la dispersion Dans Effectifs, 358 Dans Explorer, 373 Dans les statistiques de ratio, 631 Descriptives, 365 Mesures de la distribution Dans Effectifs, 358 Descriptives, 365 Mesures de la tendance centrale Dans Effectifs, 358 Dans Explorer, 373 Dans les statistiques de ratio, 631 Mesures de similarit Classification hirarchique, 539 Distances, 468 Mtafichiers, 279, 286, 694 Exportation de diagrammes, 279, 286, 694 Mthodes, 726 Objets dautomatisation OLE, 726 Mthodes de slection, 341 Slection de lignes et de colonnes dans des tableaux pivotants, 341 Microsoft Access, 31 Minimum Comparaison des colonnes de tableaux, 608 Dans Effectifs, 358 Dans Explorer, 373 Dans les cubes OLAP, 408 Dans les statistiques de ratio, 631 Dans Moyennes, 402 Dans Rcapituler, 395 Descriptives, 365 Mise lchelle des diagrammes exports, 286 Mise en mmoire cache, 79 Fichier actif, 79

800 Index

Mise en page, 294, 296297 En-ttes et pieds de page, 296 Taille des diagrammes, 297 Modalit de rfrence GLM, 442 Mode Dans Effectifs, 358 Mode distribu, 83, 85, 8890, 9293, 699 Accs aux fichiers de donnes, 88, 90 Chemins UNC, 93 Enregistrement de fichiers de donnes, 89 Procdures disponibles, 92 Systme de production, 699 Modle compos Ajustement de fonctions, 491 Modle cubique Ajustement de fonctions, 491 Modle de croissance Ajustement de fonctions, 491 Modle de Guttman Dans lanalyse de fiabilit, 613, 616 Modle de puissance Ajustement de fonctions, 491 Modle en S Ajustement de fonctions, 491 Modle exponentiel Ajustement de fonctions, 491 Modle inverse Ajustement de fonctions, 491 Modle linaire Ajustement de fonctions, 491 Modle logarithmique Ajustement de fonctions, 491 Modle logistique Ajustement de fonctions, 491

Modle parallle Dans lanalyse de fiabilit, 613, 616 Modle parallle strict Dans lanalyse de fiabilit, 613, 616 Modle quadratique Ajustement de fonctions, 491 Modles, 107108, 667 Dfinition de variable, 107108 Diagrammes, 645, 667 Utilisation dun fichier de donnes externe comme modle, 136 Modles de tableaux, 324325 Application, 324 Cration, 325 Modles factoriels complets GLM, 439 Modles personnaliss GLM, 439 Modification de donnes, 111112 Modification de lordre des lignes et des colonnes, 313 Moindres carrs gnraliss Dans Analyse factorielle, 515 Moindres carrs non pondrs Dans Analyse factorielle, 515 moindres carrs pondrs Dans la rgression linaire, 471 Moyenne Dans ANOVA 1 facteur, 432 Dans Effectifs, 358 Dans Explorer, 373 Dans les cubes OLAP, 408 Dans les statistiques de ratio, 631 Dans les tableaux de bord en colonnes, 607 Dans les tableaux de bord en lignes, 600 Dans Moyennes, 402

801 Index

Dans Rcapituler, 395 Des colonnes de tableaux multiples, 608 Descriptives, 365 Sous-groupe, 399, 405 Moyenne gomtrique Dans les cubes OLAP, 408 Dans Moyennes, 402 Dans Rcapituler, 395 Moyenne harmonique Dans les cubes OLAP, 408 Dans Moyennes, 402 Dans Rcapituler, 395 Moyenne pondre Dans les statistiques de ratio, 631 Moyenne tronque Dans Explorer, 373 Moyennes, 399, 708 Options, 402 Rsultats au format ASCII, 708 statistiques, 402 Moyennes des groupes, 399, 405 Moyennes des sous-groupes, 399, 405 Moyennes marginales estimes dans GLM - Univari, 449 Moyennes observes dans GLM - Univari, 449 mrInterview, 62 Multiplication Multiplication dans les colonnes de tableaux, 608 Navigateur dobjets, 727 Newman-Keuls GLM, 445 Niveau de mesure, 99, 129 Dfinition, 99

icnes des botes de dialogue, 13 Nombre dobservations Dans les cubes OLAP, 408 Dans Moyennes, 402 Dans Rcapituler, 395 Nombre maximal de branches Dans lanalyse TwoStep Cluster, 529 Nominal, 99 Niveau de mesure, 99, 129 Noms de variable, 99, 660 affichage des noms de variables longs dans les rsultats, 99 Botes de dialogue, 10, 660 fichiers portables, 73 gnr par le systme de gestion des rsultats, 767 noms de variables dobservation mixtes, 99 Rgles, 99 troncation des noms de variable longs dans les versions prcdentes, 73 notation, 211 affichage de modles chargs, 215 chargement de modles enregistrs, 212 Notation scientifique, 101, 336, 660 Suppression dans le rsultat, 660 Tableaux pivotants, 336 Notes de bas de page, 328, 340, 342 Ajout un tableau, 342 Diagrammes, 641 Marques, 328, 340 Renumrotation, 340 Nouvelles fonctionnalits SPSS 14.0, 2 Nues dynamiques, 543 Aperu, 543 Classes daffectation, 550

802 Index

Critres de convergence, 549 Distances entre les classes, 550 Efficacit, 548 Enregistrement des informations sur les classes, 550 Exemples, 543 Fonctionnalits supplmentaires, 552 Itrations, 549 Mthodes, 543 statistiques, 543, 551 Valeurs manquantes, 551 Numros de port, 85 Numrotation des pages, 294, 297 Dans les tableaux de bord en colonnes, 611 Dans les tableaux de bord en lignes, 601 Objets, 721, 723724, 727 Aperu, 721, 723 conventions dappellation des variables, 723 Utilisation dans les scripts, 721, 724, 727 Objets ActiveX, 275 Objets dautomatisation, 721, 723724, 726727 conventions dappellation des variables, 723 Mthodes, 726 Navigateur dobjets, 727 proprits, 726 Types, 723 Utilisation dans les scripts, 721, 724, 727 Observations, 113, 115116, 241 Insertion de nouvelles observations, 113 Pondration, 239 Recherche dans lditeur de donnes, 115116 recherche des observations dupliques, 147 Restructuration en variables, 241 Slection de sous-groupes, 234, 236, 238 Tri, 218

observations dupliques (enregistrements) recherche et filtrage, 147 Observations filtres, 116 diteur de donnes, 116 observations restantes, 708 Analyse, 708 Ombrage, 339 Dans les cellules, 339 OMS, 743, 773 contrle des pivots de tableau, 752, 765 exclusion des rsultats du Viewer, 758 format de fichier SAV, 752, 759 Format des fichiers de donnes SPSS, 752, 759 Format texte, 752 identificateurs de commande, 749 noms de variable dans les fichiers SAV, 767 sous-types de tableau, 749 types dobjet de sortie, 747 utilisation de XSLT avec OXML, 775 XML, 752, 769 Onglet Charg, 738 Fentre de script, 738 Onglet Espion, 738 Fentre de script, 738 Onglet Immdiat, 738 Fentre de script, 738 Onglet Pile, 738 Fentre de script, 738 Options, 660, 662663, 665, 667, 672673, 676677, 679 annes deux chiffres, 676 diagrammes, 667 Diagrammes interactifs, 672 Donnes, 676 Etiquettes rsultats, 665 Gnrales, 660

803 Index

Modle de tableau pivotant, 673 Monnaie, 677 Rpertoire temporaire, 660 Scripts, 679 Viewer, 662 Viewer en mode brouillon, 663 Options de diagramme, 667 Ordinal, 99 Niveau de mesure, 99, 129 Ordonnancement des observations, 178 Centiles, 179 Rangs fractionnaires, 179 Scores de Savage, 179 Valeurs ex aequo, 180 Ordre daffichage, 313 Ouverture de fichiers, 2530, 49 Fichiers dBASE, 25, 28 Fichiers de donnes, 2526 Fichiers de donnes texte, 49 Fichiers de feuille de calcul, 25, 28 Fichiers dlimits par des tabulations, 25 Fichiers Excel, 25, 27 Fichiers Lotus 1-2-3, 25 Fichiers Stata, 29 Fichiers SYSTAT, 25 OXML, 775 Paires de variables, 241 Cration, 241 Paramtres de ligne de commande, 703 Systme de production, 703 Performances, 79 Mise en mmoire cache des donnes, 79 Phi Tableaux croiss, 383 Pieds de page, 294, 296

Pivotement contrle avec OMS pour les rsultats exports, 765 plage Dans Effectifs, 358 Dans les cubes OLAP, 408 Dans les statistiques de ratio, 631 Dans Moyennes, 402 Dans Rcapituler, 395 Descriptives, 365 plusieurs fichiers de donnes ouverts, 119 Points darrt, 736 Dans des scripts, 736 Polices, 117, 273, 308, 333 Couleurs, 333 Dans les cellules, 333 diteur de donnes, 117 Panneau de lgendes, 273 Viewer en mode brouillon, 308 Pondration dobservations, 239 Pondrations fractionnelles dans des tableaux croiss, 239 Positionnement multidimensionnel, 621 Conditionnalit, 625 Cration de matrices de distance, 624 Critres, 626 Dfinition de la forme des donnes, 623 Dimensions, 625 Exemple, 621 Fonctionnalits supplmentaires, 627 Mesures de distance, 624 Modles de positionnement, 625 Niveaux de mesure, 625 Options daffichage, 626 statistiques, 621 Transformation de valeurs, 624

804 Index

pourcentages Tableaux croiss, 387 Pourcentages en colonne Tableaux croiss, 387 Pourcentages en ligne Tableaux croiss, 387 Pourcentages totaux Tableaux croiss, 387 PowerPoint, 283 exportation du rsultat au format PowerPoint, 283 Premier Dans les cubes OLAP, 408 Dans Moyennes, 402 Dans Rcapituler, 395 Prvision Ajustement de fonctions, 492 Prvisions Enregistrement dans lajustement de fonctions, 492 Enregistrement dans la rgression linaire, 479 Prvisions pondres GLM, 447 Procdures, 728 Scripts, 728 Procdures fonctions, 728 Procdures globales, 679, 729 Procdures sous-routines, 728 Production automatise, 691 Profondeur darborescence Dans lanalyse TwoStep Cluster, 529 programmation avec le langage de commande, 345 proprits, 326327, 726 Objets dautomatisation OLE, 726 Tableaux, 327 Tableaux pivotants, 326

Protection par mot de passe, 299 Proximits Classification hirarchique, 535 Publication de rsultat, 706 Avec le systme de production, 705

Q de Cochran Dans les tests pour plusieurs chantillons lis, 582 Q de R-E-G-W (Ryan-Einot-Gabriel-Welsch) Dans ANOVA 1 facteur, 429 GLM, 445 quadrillage, 332 Tableaux pivotants, 332 Quancept, 62 Quanvert, 62 Quartiles Dans Frquences, 358

R multiple Dans la rgression linaire, 483 R2 Dans la rgression linaire, 483 Dans Moyennes, 402 modification R2, 483 R2 ajust Dans la rgression linaire, 483 Rapport de covariance Dans la rgression linaire, 479 Rapport hauteur/largeur, 667 Rcapituler, 391 Options, 394 statistiques, 395 Recodage de valeurs, 150, 172174, 176, 181 Redimensionnement de tableaux pivotants, 327, 332

805 Index

Rgression Diagrammes, 478 Rgression linaire, 471 Rgression multiple, 471 Rgression linaire, 471 Blocs, 471 Diagrammes, 478 Enregistrement de nouvelles variables, 479 Exportation des informations du modle, 479 Fonctionnalits supplmentaires, 486 Mthodes de slection des variables, 476, 485 Pondrations, 471 Rsidus, 479 statistiques, 483 Valeurs manquantes, 485 Variable de slection, 477 Rgression multiple Dans la rgression linaire, 471 regroupement en bandes des valeurs de donnes, 150 Remplacement de valeurs manquantes Interpolation linaire, 210 Mdiane des points voisins, 210 Moyenne de la srie, 210 Moyenne des points voisins, 210 Tendance linaire, 210 Rpertoire temporaire, 660 Dfinition de la position en mode local, 660 Variable denvironnement SPSSTMPDIR, 660 Rponses multiples Fonctionnalits supplmentaires, 594 Rsidu non standardis GLM, 447 Rsidus Enregistrement dans lajustement de fonctions, 492

Enregistrement dans la rgression linaire, 479 Tableaux croiss, 387 Rsidus de Student Dans la rgression linaire, 479 Rsidus standardiss Dans la rgression linaire, 479 GLM, 447 Rsidus supprims Dans la rgression linaire, 479 GLM, 447 Restructuration des donnes, 240241, 244247, 250, 252253, 255256, 258259, 261, 263 Aperu, 240 Cration dune variable dindex pour la restructuration des variables en observations, 253 Cration de plusieurs variables dindex pour la restructuration des variables en Observations, 255 Cration de variables dindex pour la restructuration des variables en observations, 250 Et donnes pondres, 263 Exemple dindex unique lors de la restructuration de variables en observations, 252 Exemple de deux index lors de la restructuration de variables en observations, 252 Exemple de restructuration dobservations en variables, 245 Exemple de restructuration de variables en observations, 244 Groupes de variables pour la restructuration de variables en observations, 246 Options de restructuration dobservations en variables, 261

806 Index

Options de restructuration des variables en observations, 256 Slection de donnes pour la restructuration dobservations en variables, 258 Slection de donnes pour la restructuration de variables en observations, 247 Tri de donnes pour la restructuration dobservations en variables, 259 Types de restructuration, 241 Rsultats, 265, 267275, 277279, 297298, 301, 341, 662, 694 Affichage, 267 Alignement, 269, 662 Brouillon, 301 Centrage, 269, 662 Collage dans dautres applications, 274 Collage spcial dobjets, 278 Copie, 268269 Copie dans dautres applications, 275 Copie de rsultats, 269 Copie et collage de plusieurs lments, 277 dplacement, 268 Dplacement du rsultat, 268 Dveloppement de la ligne de lgende, 271 Enregistrement, 298 Enregistrement du document, 298 Espace entre les lments de rsultat, 297 Exportation, 279, 694 Lgende, 270 Masquage, 267 Masquage de rsultats, 267 Modification, 341 modification de la police de la lgende, 273 Modification des niveaux de la ligne de lgende, 272 Modification des tailles de la lgende, 272

Modification du langage des rsultats, 660 Panneau de lgende, 265 Panneau de rsultats, 265 Rduction de la ligne de lgende, 271 Rsultats, 265 Suppression, 268269 Suppression de rsultats, 269 Retour la ligne automatique, 327 Contrle de la largeur de colonne pour texte avec retour automatique la ligne, 327 tiquettes de variable et de valeur, 105 Rho Corrlations bivaries, 453 Tableaux croiss, 383 Risque Tableaux croiss, 383 risque relatif Tableaux croiss, 383 Rotation dtiquettes, 315 Rotation equamax Dans Analyse factorielle, 517 Rotation oblimin directe Dans Analyse factorielle, 517 Rotation quartimax Dans Analyse factorielle, 517 Rotation Varimax Dans Analyse factorielle, 517 Saisie de donnes, 109111 Non numrique, 110 numrique, 110 Utilisation dtiquettes de valeurs, 111 Sauts de ligne tiquettes de variable et de valeur, 105 Sauts de tableau, 343 Scores de Savage, 179

807 Index

Scores normaux Ordonner les observations, 179 Scripts, 679, 681, 686, 707709, 712, 715716, 731, 736 Ajout aux menus, 681 Ajout dune description, 731 Aperu, 707 Assistant script, 715 Autoscripts, 709, 716, 720 Avec syntaxe de commande, 739741 Botes de dialogue, 731, 733 Cration, 712, 716 Dbogage, 736, 738 Dclaration de variables, 722723 Excution, 707 Excution avec les boutons de la barre doutils, 686 Fentre de script, 712, 714 Fichier dautoscript, 679, 720 Fichier de procdures globales, 679, 729 Utilisation dobjets dautomatisation, 721, 723724, 727 Scripts de procdures globales, 729 Slection ascendante Dans la rgression linaire, 476 Slection dobservations, 234 Echantillon alatoire, 237 En fonction de critres de slection, 236 Intervalle de temps, 238 Plage dobservations, 238 Plage de dates, 238 Slection progressive Dans la rgression linaire, 476 sparation de fentre Editeur de donnes, 117

sparation de panneau Editeur de donnes, 117 Serveurs, 85 Ajout, 85 Connexion, 85 Modification, 85 Noms, 85 Numros de port, 85 Serveurs distants, 83, 85, 8890, 9293, 699 Accs aux fichiers de donnes, 88, 90 Ajout, 85 Chemins UNC, 93 Connexion, 85 Enregistrement de fichiers de donnes, 89 Modification, 85 Procdures disponibles, 92 Systme de production, 699 Seuil initial Dans lanalyse TwoStep Cluster, 529 Signets, 320 Somme Dans Effectifs, 358 Dans les cubes OLAP, 408 Dans Moyennes, 402 Dans Rcapituler, 395 Descriptives, 365 Somme des carrs, 440 GLM, 439 Sous-groupes dobservations Echantillon alatoire, 237 Slection, 234, 236, 238 Sous-titres Diagrammes, 641 Sous-totaux Dans les tableaux de bord en colonnes, 610

808 Index

sous-types, 749 et tiquettes, 751 sous-types de tableau, 749 et tiquettes, 751 SPSS Etapes de base, 14 Standardisation Dans lanalyse TwoStep Cluster, 529 Statistique de Brown-Forsythe Dans ANOVA 1 facteur, 432 Statistique de Cochran Tableaux croiss, 383 Statistique de Durbin-Watson Dans la rgression linaire, 483 Statistique de Mantel-Haenszel Tableaux croiss, 383 Statistique de Welch Dans ANOVA 1 facteur, 432 Statistique R Dans la rgression linaire, 483 Dans Moyennes, 402 Statistiques de ratio, 629 statistiques, 631 Statistiques descriptives Dans Effectifs, 358 Dans Explorer, 373 dans GLM - Univari, 449 Dans lanalyse TwoStep Cluster, 533 Dans les statistiques de ratio, 631 Dans Rcapituler, 395 Descriptives, 363 Strates, 291, 316, 318, 327, 332 Affichage, 316, 318 Cration, 316 Impression, 291, 327, 332 Modification, 318

Tableaux croiss, 382 Tableaux pivotants, 316 Stress Dans le positionnement multidimensionnel, 621 Stress S Dans le positionnement multidimensionnel, 621 Student-Newman-Keuls Dans ANOVA 1 facteur, 429 GLM, 445 Suites de Wald-Wolfowitz Tests pour deux chantillons indpendants, 570 Suites en squences, 561 Csures, 561, 563 Fonctionnalits supplmentaires, 564 Options, 564 statistiques, 564 Valeurs manquantes, 564 Suppression dtiquettes de groupe, 314 Suppression de plusieurs commandes EXECUTE dans les fichiers de syntaxe, 353 Suppression de rsultats, 269 Symbole dollar, 336 Tableaux pivotants, 336 Symbole pourcentage, 336 Tableaux pivotants, 336 Syntaxe, 345, 353, 660, 662663, 685, 691, 739, 741 accs SPSS Command Syntax Reference, 17 Avec scripts, 739741 Collage, 348 Collage dans des scripts, 741 Excution, 353 Excution de la syntaxe de commande avec les boutons de la barre doutils, 685 Fichier de rsultat, 349 fichier-journal, 351, 353, 660

809 Index

Journal, 662663 Rgles de syntaxe, 346 Rgles du systme de production, 691 Syntaxe de commande, 345, 353, 660, 662663, 681, 686, 691 accs SPSS Command Syntax Reference, 17 Ajout aux menus, 681 Collage, 348 Excution, 353 Excution avec les boutons de la barre doutils, 686 Fichier de rsultat, 349 fichier-journal, 351, 353, 660 Formatage du systme de production, 702 Journal, 662663 Rgles de syntaxe, 346 Rgles du systme de production, 691 Systme de gestion des rsultats (OMS), 743, 773 Systme de mesure, 660 Systme de production, 660, 662663, 691, 694, 696, 698700, 703, 705 Contrle du format avec la syntaxe de commande, 702 Contrle du format des tableaux pivotants, 700 excution de plusieurs tches de production, 703 Exportation de diagrammes, 691, 694 Exportation de rsultats, 694 Fichiers de rsultat, 691 Options, 699 Paramtres de ligne de commande, 703 Programmation des tches de production, 703 Publication de rsultat, 705 Publication sur le Web, 705 Rgles de syntaxe, 691 Remplacement de valeurs dans des fichiers de syntaxe, 696

Sollicitation de macros, 698 Spcification dun serveur distant, 699 Utilisation de la syntaxe de commande partir dun fichier-journal, 660 Utilisation de la syntaxe de commande partir du journal, 662663 T2 de Hotelling Dans lanalyse de fiabilit, 613, 616 T2 de Tamhane Dans ANOVA 1 facteur, 429 GLM, 445 T3 de Dunnett Dans ANOVA 1 facteur, 429 GLM, 445 Tableau crois Multirponses, 590 Tableaux croiss, 379 Tableaux, 343 Contrle des sauts de tableau, 343 Tableaux croiss, 379 Affichage de cellules, 387 Diagrammes en btons juxtaposs, 383 Formats, 389 Pondrations fractionnelles, 239 statistiques, 383 Strates, 382 Suppression de tableaux, 379 Variables de contrle, 382 Tableaux croiss des rponses multiples, 590 Appariement des variables entre les vecteurs, 593 Dfinition des plages de valeurs, 592 Pourcentages bass sur les observations, 593 Pourcentages bass sur les rponses, 593 Pourcentages dans les cellules, 593

810 Index

Valeurs manquantes, 593 Tableaux de bord Colonne de total, 608 Comparaison des colonnes, 608 Division des valeurs de colonnes, 608 Multiplication des valeurs de colonnes, 608 Tableaux de bord en colonnes, 604 Tableaux de bord en lignes, 595 Totaux composites, 608 Tableaux de bord en colonnes, 604 Colonne de total, 608 Fonctionnalits supplmentaires, 611 Format de colonne, 598 Gestion des pages, 610 Mise en page, 602 Numrotation des pages, 611 Sous-totaux, 610 Total gnral, 611 Valeurs manquantes, 611 Tableaux de bord en lignes, 595 Critres dagrgation, 595 Espacement de ventilation, 600 Fonctionnalits supplmentaires, 611 Format de colonne, 598 Gestion des pages, 600 Mise en page, 602 Numrotation des pages, 601 Pieds de page, 603 Squences de tri, 595 Titres, 603 Valeurs manquantes, 601 Variables dans les titres, 603 Variables en colonnes, 595 Tableaux de contingence, 379 tableaux de effectifs Dans Effectifs, 355

tableaux de frquences Dans Explorer, 373 Tableaux de frquences des rponses multiples, 588 Valeurs manquantes, 588 Tableaux pivotants, 267, 274277, 279, 291, 311316, 321, 324, 326329, 331332, 334, 341343, 673, 694, 700 Affichage des bordures masques, 332 Affichage et masquage des cellules, 321 Ajout de lgendes, 342 Ajustement de la largeur de colonne par dfaut, 673 Bordures, 331 Collage dans dautres applications, 274 Collage en tant que mtafichiers, 276 Collage en tant que texte, 277 Collage sous forme de tableaux, 274, 276 Contrle des sauts de tableau, 343 Contrle du format des tches de production, 700 Copie, 274 Copie dans dautres applications, 275 Copie et collage de plusieurs tableaux, 277 Dplacement de lignes et de colonnes, 313 Dissociation de lignes ou de colonnes, 314 Exportation au format HTML, 279, 694 Formats de cellule, 329 Groupement de lignes ou de colonnes, 314 Identification des dimensions, 313 Impression de grands tableaux, 343 Impression de strates, 291 Incorporation en tant quobjets ActiveX, 275 Insertion dtiquettes de groupe, 314 Largeur des cellules, 334 Manipulation, 311 Masquage, 267

811 Index

Modle de tableau par dfaut des nouveaux tableaux, 673 Modification, 311 Modification de laspect, 324 Modification de lordre daffichage, 313 Modification de plusieurs tableaux, 311 Pivotement, 311312 proprits, 326 Proprits des notes de bas de page, 328 Proprits gnrales, 327 quadrillage, 332 Recherche de dfinitions dtiquette, 316 Redimensionnement des fins dajustement la page, 327, 332 Rtablissement des valeurs par dfaut, 316 Rotation dtiquettes, 315 Slection de lignes et de colonnes, 341 Strates, 316 Suppression dtiquettes de groupe, 314 Texte de suite, 332 Transposition de lignes et de colonnes, 313 Utilisation dicnes, 312 Tailles, 272 Dans la lgende, 272 Tau de Goodman et Kruskal Tableaux croiss, 383 Tau de Kruskal Tableaux croiss, 383 Tau-b Tableaux croiss, 383 Tau-b de Kendall Corrlations bivaries, 453 Tableaux croiss, 383 Tau-c Tableaux croiss, 383

Tau-c de Kendall , 383 Tableaux croiss, 383 Termes construits, 440 Termes dinteraction, 440 Test binomial, 558 Dichotomies, 558 Fonctionnalits supplmentaires, 561 Options, 560 statistiques, 560 Valeurs manquantes, 560 Test dadditivit de Tukey Dans lanalyse de fiabilit, 613, 616 Test dintervalle multiple de Duncan Dans ANOVA 1 facteur, 429 GLM, 445 Test de comparaison par paire de Gabriel Dans ANOVA 1 facteur, 429 GLM, 445 Test de comparaison par paire de Games et Howell Dans ANOVA 1 facteur, 429 GLM, 445 Test de Friedman Dans les tests pour plusieurs chantillons lis, 582 Test de la mdiane Tests pour deux chantillons indpendants, 577 Test de Levene Dans ANOVA 1 facteur, 432 Dans Explorer, 374 dans GLM - Univari, 449 Test de Lilliefors Dans Explorer, 374 Test de McNemar Tableaux croiss, 383 Tests pour deux chantillons lis, 573

812 Index

test de Scheff Dans ANOVA 1 facteur, 429 GLM, 445 Test de Shapiro-Wilks Dans Explorer, 374 Test de sphricit de Bartlett Dans Analyse factorielle, 514 Test de Wilcoxon Tests pour deux chantillons lis, 573 Test des ractions extrmes de Moses Tests pour deux chantillons indpendants, 570 Test des signes Tests pour deux chantillons lis, 573 Test exact de Fisher Tableaux croiss, 383 Test Kolmogorov-Smirnov pour un chantillon, 565 Distribution tester, 565 Fonctionnalits supplmentaires, 568 Options, 567 statistiques, 567 Valeurs manquantes, 567 Test M de Box Analyse discriminante, 500 Test T dans GLM - Univari, 449 Test T pour chantillon unique, 421 Test T pour chantillons apparis, 418 Test T pour chantillons indpendants, 413 Test t de Dunnett Dans ANOVA 1 facteur, 429 GLM, 445 Test t de Sidak Dans ANOVA 1 facteur, 429 GLM, 445 test t de Student, 413

Test t de Waller-Duncan Dans ANOVA 1 facteur, 429 GLM, 445 Test t dpendant Test T pour chantillons apparis, 418 test t pour deux chantillons Test T pour chantillons indpendants, 413 Test T pour chantillon unique, 421 Fonctionnalits supplmentaires, 423 Intervalles de confiance, 422 Options, 422 Valeurs manquantes, 422 Test T pour chantillons apparis, 418 Options, 420 Slection de variables apparies, 418 Valeurs manquantes, 420 Test T pour chantillons indpendants, 413 Dfinition de groupes, 416 Intervalles de confiance, 417 Options, 417 Valeurs manquantes, 417 Variables chane, 416 Variables de regroupement, 416 Tests dhomognit de la variance Dans ANOVA 1 facteur, 432 dans GLM - Univari, 449 Tests de colinarit Dans la rgression linaire, 483 Tests de lindpendance Chi-deux, 383 Tests de linarit Dans Moyennes, 402 Tests de normalit Dans Explorer, 374 Tests non paramtriques Chi-deux, 554

813 Index

Suites en squences, 561 Test Kolmogorov-Smirnov pour un chantillon, 565 Tests pour deux chantillons indpendants, 568 Tests pour deux chantillons lis, 573 Tests pour plusieurs chantillons indpendants, 577 Tests pour plusieurs chantillons lis, 581 Tests pour deux chantillons indpendants, 568 Dfinition de groupes, 571 Fonctionnalits supplmentaires, 572 Options, 572 statistiques, 572 Types de test, 570 Valeurs manquantes, 572 Variables de regroupement, 571 Tests pour deux chantillons lis, 573 Fonctionnalits supplmentaires, 576 Options, 576 statistiques, 576 Types de test, 575 Valeurs manquantes, 576 Tests pour plusieurs chantillons indpendants, 577 Dfinition de lintervalle, 579 Fonctionnalits supplmentaires, 580 Options, 580 statistiques, 580 Types de test, 578 Valeurs manquantes, 580 Variables de regroupement, 579 Tests pour plusieurs chantillons lis, 581 Fonctionnalits supplmentaires, 583 statistiques, 583 Types de test, 582 Texte, 49, 273, 279, 284, 301, 310, 341, 694 Ajout au Rsultats, 273

Ajout dun fichier texte dans le Rsultats, 273 Cration de rsultats texte, 301 Dans les cellules, 341 Exportation dun rsultat en mode brouillon en tant que texte, 310 Exportation de rsultat en tant que texte, 279, 284, 694 Fichiers de donnes, 49 Texte dtiquette vertical, 315 Texte de suite, 332 Pour les tableaux pivotants, 332 Titres, 273 Ajout au Rsultats, 273 Dans les cubes OLAP, 412 Diagrammes, 641 Tolrance Dans la rgression linaire, 483 Totaux, 708 Graissage automatique dans le rsultat, 708 Totaux gnraux Dans les tableaux de bord en colonnes, 611 traitement dun fichier scind, 232 Transformations conditionnelles, 165 Transformations de donnes, 676 Calcul de variables, 163 fonctions, 166 Ordonnancement des observations, 178 Recodage de valeurs, 172174, 176, 181 Retardement de lexcution, 676 Sries chronologiques, 203, 205 Transformations conditionnelles, 165 Variables chane, 166 Transformations de fichiers, 240241 Agrgation de donnes, 227 Fusion des fichiers de donnes, 220, 224 Pondration dobservations, 239

814 Index

Restructuration des donnes, 240241 traitement dun fichier scind, 232 Transposition des variables et des observations, 219 Tri dobservations, 218 Transposition de lignes et de colonnes, 313 Transposition des variables et des observations, 219 Tri dobservations, 218 Tukey Dans Explorer, 373 types dobjet de sortie dans OMS, 747 Types de donnes, 101, 103, 115, 677 Dfinition, 101 Devise personnalise, 101, 677 Formats daffichage, 103 Formats dentre, 103 Modification, 115

U de Mann-Whitney Tests pour deux chantillons indpendants, 570

V Tableaux croiss, 383 V de Cramer Tableaux croiss, 383 V de Rao Analyse discriminante, 501 Valeurs, 336 Format daffichage des tableaux pivotants, 336 Valeurs loignes Dans Explorer, 373 Dans lanalyse TwoStep Cluster, 529 Dans la rgression linaire, 478 valeurs extrmes Dans Explorer, 373

Valeurs influentes Dans la rgression linaire, 479 GLM, 447 Valeurs manquantes, 105 Corrlations bivaries, 456 Dans Analyse factorielle, 520 Dans ANOVA 1 facteur, 432 Dans Corrlations partielles, 462 Dans Courbe ROC, 650 Dans Explorer, 376 Dans la rgression linaire, 485 Dans les suites en squences, 564 Dans les tableaux croiss des rponses multiples, 593 Dans les tableaux de bord en colonnes, 611 Dans les tableaux de bord en lignes, 601 Dans les tableaux de frquences des rponses multiples, 588 Dans Test Kolmogorov-Smirnov pour un chantillon, 567 Dfinition, 105 Diagrammes, 642 Fonctions, 167 Remplacement dans des donnes de sries chronologiques, 208 Test binomial, 560 Test du Chi-deux, 557 Test T pour chantillon unique, 422 Test T pour chantillons apparis, 420 Test T pour chantillons indpendants, 417 Tests pour deux chantillons indpendants, 572 Tests pour deux chantillons lis, 576 Tests pour plusieurs chantillons indpendants, 580 Variables chane, 105 Valeurs manquantes spcifies par lutilisateur, 105

815 Index

Valeurs propres Dans Analyse factorielle, 514515 Dans la rgression linaire, 483 Valeurs standardises Descriptives, 363 Variable denvironnement SPSSTMPDIR, 660 Variable de slection Dans la rgression linaire, 477 Variables, 12, 98, 114115, 241, 651, 653, 660 Affectation dun nouveau nom aux fichiers de donnes fusionns, 223 Botes de dialogue, 10 Dfinition, 98 Dfinition de groupes de variables, 653 dplacement, 115 Informations sur la dfinition, 651 Informations sur les variables dans les botes de dialogue, 13 Insertion de nouvelles variables, 114 Ordre daffichage dans les botes de dialogue, 660 Recodage, 172174, 176, 181 Restructuration en observations, 241 Slection dans des botes de dialogue, 12 Variables chane, 105, 110 Botes de dialogue, 10 Calcul de nouvelles variables chane, 166 Recodage en nombres entiers conscutifs, 181 Saisie de donnes, 110 segmentation des chanes longues dans les versions prcdentes, 73 Valeurs manquantes, 105 Variables dchelle regroupement en bandes pour crer des variables qualitatives, 150

Variables denvironnement, 660 SPSSTMPDIR, 660 Variables de contrle Tableaux croiss, 382 Variables de date ajouter ou soustraire des variables date/heure, 185 crer une variable date/heure partir dun ensemble de variables, 185 crer une variable date/heure partir dune variable chane, 185 Dfinition pour des donnes de sries chronologiques, 203 extraire une partie de la variable date/heure, 185 Variables de regroupement, 241 Cration, 241 Variance Dans Effectifs, 358 Dans Explorer, 373 Dans les cubes OLAP, 408 Dans les tableaux de bord en colonnes, 607 Dans les tableaux de bord en lignes, 600 Dans Moyennes, 402 Dans Rcapituler, 395 Descriptives, 365 vecteurs multirponses Dfinition, 132 Dichotomies multiples, 132 Modalits multiples, 132 Viewer, 662, 665 Affichage des tiquettes de valeurs, 665 Affichage des tiquettes de variable, 665 Affichage des noms de variable, 665 Affichage des valeurs de donnes, 665 exclusion de types de rsultat avec OMS, 758 Options daffichage, 662

816 Index

Viewer en mode brouillon, 301303, 308310, 660, 663 Bordures de cellules, 303 Bordures de colonnes, 303 Bordures de lignes, 303 Caractres de la bote, 303 Contrle de laffichage par dfaut des rsultats, 660 Dfinition du type de Viewer par dfaut, 302 Enregistrement des rsultats, 310 Format de rsultat, 303 Impression, 308309 Modification des polices, 308 Options daffichage, 663 Vitesse, 79 Mise en mmoire cache des donnes, 79 W de Kendall Dans les tests pour plusieurs chantillons lis, 582 Web, 706 Publication de rsultat, 706 XML acheminement des rsultats au format XML, 752 enregistrement des rsultats sous forme de fichiers XML, 743 rsultat OXML depuis OMS, 775 structure de tableau au format OXML, 769 XSLT utilisation avec OXML, 775 Z de Kolmogorov-Smirnov Dans Test Kolmogorov-Smirnov pour un chantillon, 565 Tests pour deux chantillons indpendants, 570

You might also like