You are on page 1of 22

BTSA Gestion Forestire

Module D42

V.1.1. Janvier 1997

Lapproche typologique et son utilit en foresterie

Axe 1

Type 1

Type 2

Type 3

Axe 2

Type 4
Relev

Sylvain Gaudin
CFPPA/CFAA de Chteaufarine

E10 rue Franois Villon, BP 65809 - 25058 Besanon Cdex v03 81 41 96 40 $03 81 41 96 50 }s-gaudin@foret.edu

I. Principe et intrt de lapproche typologique


I.1. Quelques exemples de typologie
I.1.1. Les stades de futaie rgulire I.1.2. La typologie des peuplements de futaie jardine de Herbert et Rbeirot
(1981)

1
1 2 3

I.1.3. Le catalogue des types de stations de la Plaine de la Sane (Bailly, 1995) 3 I.1.4. Synthse concernant ces exemples

I.2. Les principes typologiques


I.2.1. La simplification dune ralit complexe I.2.2. Principes dlaboration des typologies I.2.3. Les lments dune typologie I.2.4. Les limites de loutil typologique

4
4 4 6 6

i a

II. Les mthodes de cration des typologies


II.1. Les mthodes anciennes
II.1.1. Mthodes manuelles II.1.2. Mthodes utilisant des indices
II.1.2.1. Le cfficient de communaut floristique (distance de Jaccard) II.1.2.2. Lanalyse diffrentielle de Czekanowski

7
7 9
9

II.2. Les mthodes informatiques modernes


II.2.1. Les analyses factorielles
II.2.1.1. Fondements thoriques des techniques utilises
II.2.1.1.1. Approche des techniques danalyses factorielles laide dun problme en deux dimensions II.2.1.1.2. Gnralisation plusieurs dimensions

10
10
10
10 12 13

II.2.1.1.3. Dune lecture simple une lecture labore...

II.2.1.2. Quelques exemples danalyses factorielles


II.2.1.2.1. Lanalyse en composantes principales (ACP) II.2.1.2.2. Lanalyse factorielle des correspondances (AFC)

14
14 14

II.2.2. Les classifications automatiques


II.2.2.1. Principe et intrt II.2.2.2. Les classifications non-hirarchiques II.2.2.3. Les classifications hirarchiques

14
14 15 15

II.2.3. Mthodologie gnrale en analyse des donnes


II.2.3.1. Les dix points chauds de lanalyse des donnes (daprs Fnelon, 1981) II.2.3.2. Les limites de lanalyse des donnes

16
16 19

Conclusion Bibliographie

20 20

Lapproche typologique et son utilit en foresterie

Objectif : Etre capable dapprhender une dmarche de typologie.

e nos jours, les forestiers utilisent couramment des outils typologiques que ce soit pour les tudes de stations ou pour la gestion des peuplements. Mme si lon ne cherche pas ce que chaque titulaire dun BTSA Gestion Forestire sache raliser une typologie en sortant de formation, il est bon de connatre quelques rudiments concernant llaboration des typologies pour utiliser au mieux ces outils et bien connatre leurs intrts et leurs limites.

I. Principe et intrt de lapproche typologique


On se propose ici de chercher connatre les principaux traits communs des typologies laide de ltude de quelques exemples intressant les forestiers.

I.1. Quelques exemples de typologie


I.1.1. Les stades de futaie rgulire
Un exemple de typologie trs simple peut tre donn par les stades de futaie rgulire. En effet, un peuplement de futaie volue de faon continue dans le temps et on a cherch diviser cette volution en stades afin davoir des repres et un langage de description commun. On trouve gnralement pour dfinir les stades de la futaie rgulire des descriptions voisines de celles qui suivent : Semis : les arbres ont de 0 1 m ; Fourr : les arbres ont de 1 3 m ; Gaulis : les arbres ont de 3 8 m et un diamtre dominant infrieur 10 cm, les tiges y sont encore flexibles ; Bas-perchis : les arbres ont de 8 15 m de hauteur et un diamtre dominant compris entre 10 et 20 centimtres ;

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

Haut-perchis : les arbres ont de 15 25 m et un diamtre dominant compris entre 20 et 30 cm ; Jeune futaie : la croissance des arbres en hauteur est beaucoup plus lente quau stade perchis, ils ont un diamtre dominant suprieur 30 cm ; Futaie adulte : le diamtre dominant est suprieur 45 cm, ce stade correspond pour certaines essences laptitude fructifier ; Vieille futaie : ce stade est caractris par ltat vgtatif des arbres qui commencent dprir.

I.1.2. La typologie des peuplements de futaie jardine de Herbert et Rbeirot (1981)


Des typologies de peuplements ont t prsentes dans le cadre des cours de sylviculture et damnagement. La plus ancienne de ces typologies a t construite par Herbert et Rbeirot (1981) et concerne les peuplements rsineux jardins de la Haute-Chane du Jura. Une prsentation simplifie de cette typologie (Allgrini, 1981) a t ralise par le CRPF de Franche-Comt et a t distribue lors dune sortie en futaie jardine. On constate que : Les peuplements dallure jardine ont t classs en divers types : - A, B et C pour les peuplements jardins, - D, E et F pour les peuplements rgulariss, - G pour les peuplements capital rsineux trs faible et envahis de feuillus. Pour chaque type de peuplement, il existe une fiche descriptive rsumant les principales caractristiques sylvicoles et dendromtriques. Une clef de dtermination permet la suite dune visite de terrain ou dun inventaire de dterminer les types de peuplements prsents. Un diagramme dvolution naturelle entre types prsente les volutions possibles entre types de peuplements en cas de non-gestion. Des conseils concernant la sylviculture et la gestion sont galement fournis par type de peuplement (rgles concernant les travaux, prlvements...). La typologie prsente est un outil de gestion intgr. Elle permet en effet de nommer efficacement les peuplements grce un langage commun de description, de les dcrire et de donner leurs principales caractristiques. Elle permet aussi de planifier la gestion en donnant les grandes orientations sylvicoles possibles et en anticipant les volutions potentielles.
Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

I.1.3. Le catalogue des types de stations de la Plaine de la Sane (Bailly, 1995)


Outre des donnes gnrales (cadre gographique, climat, gologie, types de sols...), ce document prsente les types de stations forestires de la rgion naturelle de la Plaine de la Sane. Les types de stations sont construits en fonction : de donnes gologiques et gomorphologiques, de donnes pdologiques, de donnes floristiques. Ainsi, une station est une tendue relativement homogne en fonction des donnes cites ci-dessus. Le catalogue des types de stations prsente toutes les stations potentielles de la rgion naturelle choisie. Pour chaque type, on rsume les lments caractristiques du type (groupes floristiques rencontrs, types de sols, forme dhumus, position topographique...) et on donne les facteurs favorables et les contraintes pour la vgtation forestire. Cela permet de donner la liste des essences favoriser dans le cadre de la gestion, ou introduire lors dun reboisement. Une clef de dtermination fournie dans ce document permet, sur le terrain, de dterminer le type de station sur lequel on se trouve.

I.1.4. Synthse concernant ces exemples


Ces quelques exemples permettent de dgager quelques ides gnrales concernant les typologies : Crer une typologie revient faire des groupes homognes pour clarifier ou simplifier une ralit complexe. La typologie permet une approche plus facile de cette ralit complexe en donnant notamment un langage de description commun. Ainsi, on ne dit plus je suis en prsence dun peuplement plus ou moins jardin dans lequel on a majoritairement des bois moyens , mais je suis en prsence dun type E . On en sait plus en parlant dun type E quen faisant de longues phrases car celui-ci est clairement dfini. De plus, si la typologie est bien construite, toutes les personnes ayant affaire ces peuplements les appelleront des peuplements de type E. Sans typologie, il est difficile de comparer plusieurs peuplements entre eux. Dans certains cas, des clefs de dtermination sont fournies avec les typologies. Elles permettent de classer de nouveaux individus. Les typologies sont utilises dans de trs nombreux domaines. On en trouve par exemple en sciences humaines, dans des traitements denqutes, en conomie... Elles sont galement utilises dans le cadre de la gestion forestire, notamment en phytosociologie, en amnagement forestier (typologie de peuplements) ou bien pour construire des catalogues de stations.

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

I.2. Les principes typologiques


I.2.1. La simplification dune ralit complexe Dans la majorit des cas, les typologies correspondent la simplification et linterprtation dune ralit complexe. Le schma ci-dessous illustre ceci.

2
Cration de la typologie

3 4 2

Ensemble possdant une ralit complexe

Simplification de cette ralit par la typologie

La typologie permet ainsi de se reprer plus facilement. Elle fait souvent la synthse de nombreuses variables (par exemple volume, surface terrire, densit, rpartition en PB, BM et GB, composition en essences... dans le cas dune typologie de peuplements). Elle transforme une ralit dans laquelle les variations sont continues en variables synthtiques discrtes que sont les types. Ren Doussot (1990) explique cela en prenant lexemple des typologies de peuplements : Crer une typologie de peuplements, cest runir dans un effort de synthse, sous une mme appellation, des peuplements ayant en commun certaines caractristiques juges dterminantes en ce qui concerne la fois les objectifs leur assigner long terme et les rgles sylvicoles leur appliquer dans le prsent .

I.2.2. Principes dlaboration des typologies Les mthodes dlaboration des typologies sont assez nombreuses. On distingue des mthodes manuelles et des mthodes statistiques utilisant lordinateur. Les progrs en efficacit et en convivialit de linformatique font que les mthodes utilisant lordinateur sont de plus en plus accessibles.
On distingue galement deux grands types de typologies : Les typologies a priori, construites en essayant lavance de prvoir tous les types possibles et en vrifiant lexistence de ces types potentiels sur le terrain.

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

Cration de tous les types possibles

Vrification sur le terrain de l'existence des types (les types existant rellement sont griss)

Ces typologies sont assez rares et utilises surtout pour la typologie des peuplements. On procde le plus souvent ainsi, quand il nest pas possible matriellement ou financirement de procder un chantillonnage de la zone tudier. Les typologies construites partir dun chantillonnage. Dans ce cas, on sonde un grand nombre de points dchantillonnage et on construit la typologie partir de groupes de placettes ayant suffisamment de points communs. Le schma suivant rsume cette dmarche, dans le cas de la construction dune typologie de peuplements.
Forts du domaine dtude

Prise dinformations par parcelles ou placettes (Densit, Volume, Surface terrire PB, BM, GB, essences...)

Traitement informatique : cration des types


Type A Type B Type C Type D

Traitement informatique : cration dune clef de dtermination

Fiche didentit type B


Volume : 250 m3/ha Densit : 367 tiges/ha PB=43 %, BM=34 %, GB=23 %

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

I.2.3. Les lments dune typologie


Une typologie prsente au minimum une fiche de description pour chaque type. Elle permet de connatre les principales caractristiques du type et de comparer les types entre eux. Trs souvent, on trouve galement une clef de dtermination des types. Cette dernire permet dassocier un type un relev effectu en fort. Cest elle qui permet de rendre oprationnelle la typologie. Parfois, des lments concernant la dynamique des types sont galement fournis. Ils permettent de savoir quelles sont les volutions possibles entre types. On trouve ce genre de donnes dans certaines typologies de peuplements.

I.2.4. Les limites de loutil typologique


Une premire limite concerne la zone de validit gographique de la typologie employe. Les rgions naturelles forestires sont trs nombreuses et la majorit des typologies utilises en fort (typologies de peuplements ou de stations) sont construites lchelle dune ou de quelques rgions naturelles. On peut parfois utiliser avec prudence une typologie construite pour une rgion donne dans une rgion semblable et voisine, mais le plus souvent la prcision des rsultats est alors moins bonne. Ainsi, une typologie est construite pour une zone gographique donne et cela constitue une premire limite pour ce genre doutil. Une seconde limite est lie la dfinition mme des typologies. En tant quoutils qui simplifient une ralit complexe, elles entranent une perte dinformation et de prcision. Cela dit, il vaut mieux pouvoir apprhender une ralit complexe, mme en la simplifiant un peu que de chercher tout percevoir dans les moindres dtails et naboutir rien. Une troisime limite de loutil typologique est lie la qualit de sa construction. En effet, il nexiste jamais pour un problme donn une seule typologie, mais plusieurs possibles. Il faut savoir choisir correctement les types pour que la typologie soit correcte et efficace. Il faut faire un dcoupage le plus juste possible avec les critres les plus pertinents. De plus, mme avec un bon choix des types, il peut toujours exister une confusion entre les types proches do des incertitudes lies la dtermination des types sur le terrain. Cette incertitude est augmente quand les clefs de dtermination ne sont pas bien construites ou nutilisent pas les bonnes variables. La quatrime et dernire limite concerne lutilisateur de la typologie. Plus ce dernier est comptent, plus la typologie sera efficace. Il apparait vident quune personne nayant pas reu un enseignement de base en pdologie et en botanique aura du mal utiliser bon escient un catalogue de stations.
Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

Ainsi plus lutilisateur est entran et comptent, plus les rsultats quon peut attendre de la typologie seront bons. Un utilisateur chevronn devra mme tre capable de dfinir les limites de loutil quil utilise afin de mettre en place une stratgie optimale dutilisation.

II. Les mthodes de cration des typologies


II.1. Les mthodes anciennes
Depuis longtemps, les cologues ont cherch construire des typologies et cela bien avant la possibilit dutiliser loutil informatique. Par exemple, toute personne qui sintresse la botanique finit par constater que certaines plantes se trouvent souvent ensemble et sur certains milieux. On a ainsi cherch dcrire et classifier les associations vgtales ; cest le domaine de la phytosociologie. On verra donc dans ce chapitre quelles sont les mthodes qui ont t utilises avant loutil informatique, notamment par les phytosociologues.

II.1.1. Mthodes manuelles Imaginons que lon ait effectu plusieurs relevs de vgtation dans des endroits diffrents. Si lon nomme R1, R2, R3... les diffrents relevs, on peut obtenir un tableau synthtisant les diffrentes informations. Sur ce tableau, un point dans une case indique que la plante est prsente dans le relev concern.
R1 Anemone nemorosa Clematis vitalba Cytisus scoparius Dicranum scoparium Fissidens taxifolius Glechoma hederacea Lathyrus vernus Lonicera xylosteum Luzula sylvatica Sambucus nigra Stachys sylvatica Teucrium scorodonia R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12

Mme si ce tableau nest quune simplification de ce que peut tre un tableau phytosociologique, on constate quil est difficile de dire quels sont les relevs qui se ressemblent et quelles sont les plantes que lon trouve souvent ensemble. Pour mieux visualiser cela, on peut permuter lignes et colonnes pour rapprocher les plantes qui vont ensemble (en travaillant sur les lignes) et les relevs qui se ressemblent (en travaillant sur les colonnes). Si lon prend soin de bien manipuler une ligne entire ou une

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

colonne entire, on ne change rien aux donnes initiales. On ne fait que les prsenter dune autre faon. Une telle manipulation sur les colonnes donne les rsultats suivants :
R1 Anemone nemorosa Clematis vitalba Cytisus scoparius Dicranum scoparium Fissidens taxifolius Glechoma hederacea Lathyrus vernus Lonicera xylosteum Luzula sylvatica Sambucus nigra Stachys sylvatica Teucrium scorodonia R6 R11 R4 R5 R12 R7 R3 R9 R10 R2 R8

Si lon dplace ensuite les lignes, on obtient :


R1 Cytisus scoparius Dicranum scoparium Luzula sylvatica Teucrium scorodonia Anemone nemorosa Fissidens taxifolius Glechoma hederacea Sambucus nigra Stachys sylvatica Clematis vitalba Lathyrus vernus Lonicera xylosteum R6 R11 R4 R5 R12 R7 R3 R9 R10 R2 R8

Sur cet exemple simplifi, on constate que certaines cases ont t grises. Cela signifie quil sagit de zones homognes. On peut ainsi dire que les relevs R1, R4, R6 et R11 se ressemblent car ils possdent des plantes communes quon ne trouve pas dans les autres relevs. De mme, on peut dire que Cytisus scoparius, Dicranum scoparium, Luzula sylvatica et Teucrium scorodonia sont des plantes que lon trouve souvent ensemble. Lopration qui a t faite sappelle une diagonalisation. Sur des cas concrets, elle est plus difficile effectuer et lon nobtient pas de blocs parfaits. Autrefois, on diagonalisait la main (en dcoupant le tableau en bandelettes de papier). Maintenant, on peut utiliser un tableur pour faciliter cette opration.

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

II.1.2. Mthodes utilisant des indices


II.1.2.1. Le cfficient de communaut floristique (distance de Jaccard)

On peut utiliser des indices pour voir si deux relevs se ressemblent. Par exemple, on dfinit le cfficient de communaut floristique (ou distance de Jaccard) de la faon suivante : I AB = Card (A B) Card (A B)

o card (A B) est le nombre de plantes communes aux relevs A et B et card (A B) est le nombre despces prsentes dans le relev A ou dans le relev B. Ce cfficient varie entre 0 et 1 (ou entre 0 et 100 %). Plus il est lev, plus les deux relevs ont de ressemblances.
II.1.2.2. Lanalyse diffrentielle de Czekanowski

Lutilisation de la distance de Jaccard peut permettre de faire une analyse diffrentielle de Czekanowski. On rpartit dabord les cfficients en classes. Ensuite, on trace un tableau dans lequel on reprsente les relevs en ligne et en colonne. A chaque intersection, on fait figurer la convention graphique correspondant la classe. Enfin, on fait permuter lignes et colonnes pour diagonaliser le tableau et faire apparatre des groupes de relevs homognes.

4
51 % et + 41 % 50 % 31 % 40 % 21 % 30 % 11 % 20 %

10

11

4 3 5 1 2 6 10 11 9 7 8

Dans lexemple ci-dessus (daprs Guinochet et Casal, in Lacoste et Salanon, 1969), on distingue deux groupes de relevs. Cette mthode, mme si elle prsente lavantage dtre accessible tous, est longue et fastidieuse. Elle nest quasiment plus utilise de nos jours.

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

II.2. Les mthodes informatiques modernes


II.2.1. Les analyses factorielles
II.2.1.1. Fondements thoriques des techniques utilises
II.2.1.1.1. Approche des techniques danalyses factorielles laide dun problme en deux dimensions
Taille 1,75 m 1,73 m 1,81 m 1,54 m 1,82 m 1,72 m 1,73 m 1,60 m 1,58 m 1,69 m 1,68 m 1,70 m 1,77 m 1,71 m 1,79 m 1,70 m 1,57 m 1,85 m 1,80 m 1,74 m 1,88 m 1,76 m 1,62 m 1,66 m Poids 72 kg 58 kg 76 kg 48 kg 83 kg 66 kg 64 kg 48 kg 46 kg 66 kg 57 kg 58 kg 78 kg 64 kg 82 kg 59 kg 48 kg 84 kg 74 kg 66 kg 90 kg 71 kg 52 kg 55 kg

Si les plans factoriels peuvent sembler assez simples au premier abord, les mthodes qui permettent de les laborer ne le sont pas toujours. Pour essayer daborder ces mthodes de manire progressive, un exemple simple va dabord tre trait. Dfinition de lexemple trait On sintresse au poids et la taille relevs sur un certain nombre dindividus. Les rsultats peuvent tre prsents sous la forme dun tableau de donnes (communiqu ci-contre). Une colonne correspond au poids, lautre la taille. Chaque ligne correspond un individu. Prsentation matricielle des donnes Supposons que lon veuille reprsenter graphiquement ces rsultats. On va dfinir un axe qui correspondra la taille (par exemple laxe des abscisses) et un autre au poids (laxe des ordonnes). Un individu donn sera reprsent par un couple (taille, poids) : ce sont ses coordonnes. Ainsi, le tableau des donnes peut tre peru comme lensemble des coordonnes des individus dans un plan (espace deux dimensions). On a ici deux coordonnes, donc il faut deux dimensions pour reprsenter le nuage de points. Reprsentation graphique des donnes On peut construire le graphique reprsentant les couples (taille, poids). On constate quil existe une certaine relation linaire entre la taille
90 kg 85 kg 80 kg 75 kg 70 kg

Poids

65 kg 60 kg 55 kg 50 kg 45 kg 40 kg 1,50 m

1,55 m

1,60 m

1,65 m

1,70 m

1,75 m

1,80 m

1,85 m

1,90 m

Taille

Sylvain Gaudin - BTSA Gestion Forestire - 1997

10

D42 Lapproche typologique et son utilit en foresterie

et le poids. On pourrait construire une droite de rgression qui aurait une bonne fiabilit. Cration et interprtation des axes factoriels On peut construire un axe passant par le centre dinertie G du nuage de points qui suit du mieux possible lalignement des points. Cest cet axe qui dcrirait le mieux le nuage, si lon ne pouvait disposer que dun seul axe pour le dcrire. On dit que cest lui qui traduit le mieux linertie du nuage (par exemple ici, 83 % de linertie). Ainsi, si lon ne considre que les coordonnes des points sur cet axe (une seule dimension), on simplifie la ralit et lon garde 83 % de linformation contenue dans les donnes de dpart.
90 kg 85 kg 80 kg 75 kg 70 kg

Poids

G
65 kg 60 kg 55 kg 50 kg 45 kg 40 kg 1,50 m

1,55 m

1,60 m

1,65 m

1,70 m

1,75 m

1,80 m

1,85 m

1,90 m

Taille

On peut ensuite tracer un second axe orthogonal au premier et passant toujours par le barycentre du nuage de points. Cet axe, comme il est perpendiculaire au premier, traduit le reste de linertie du nuage (17 %). On vient donc en crant ces deux axes de construire un nouveau repre (on dit galement faire un changement de base). Lavantage de ce nouveau repre est quil traduit mieux la forme du nuage. Son premier axe est orient dans le sens de llongation maximale du nuage, le second traduit linertie restante. Pour rsumer... On vient dassocier un tableau de donnes contenant deux colonnes, un plan (espace deux dimensions) o sont reprsents graphiquement les individus. Dans ce plan, on a cr un nouveau repre dont le but est de mieux traduire la forme du nuage de points.

11

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie


II.2.1.1.2. Gnralisation plusieurs dimensions

Quand les choses se compliquent un peu... Supposons que le tableau prsent page 10 ne soit pas complet et quil manque des colonnes. Le nouveau tableau plus complet est donn cicontre. Deux nouvelles variables sont prsentes, la pointure des chaussures et le tour de tte donnant la pointure pour les chapeaux. On ne peut plus ici reprsenter graphiquement le nuage de points car il faudrait 4 dimensions ! Il nest donc pas facile de visualiser les diffrents individus en fonction des quatre critres choisis et on peut dire quen gnral, plus le nombre de critres choisis est grand, plus la visualisation est difficile... Toutefois, on peut quand mme calculer les coordonnes de lindividu moyen dans un espace 4 dimensions. Cela donne (1, 72 m ; 65 kg ; pointure 41 ; 55 cm). Des outils mathmatiques permettent de faire le mme changement de repre que lorsquil y avait deux dimensions. Ainsi, on peut crer quatre axes passant par le centre dinertie du nuage, le premier traduisant la plus grande longation du nuage. Le second est orthogonal au premier et traduit le maximum dinertie restant. Le troisime est orthogonal aux deux premiers et traduit le maximum dinertie laiss par les deux premiers... Les plans factoriels Construire des axes dans des espaces n dimensions ne sert pas grand chose si lon ne peut toujours pas visualiser de rsultats concrets. Cest pour cela quon projette orthogonalement les points sur les plans forms par les axes principaux. Ainsi, si lon projette nos donnes sur le plan factoriel form par laxe 1 et laxe 2, on peut obtenir une figure voisine de la suivante :
Axe 2 (27 %)
Taille 1,75 m 1,73 m 1,81 m 1,54 m 1,82 m 1,72 m 1,73 m 1,60 m 1,58 m 1,69 m 1,68 m 1,70 m 1,77 m 1,71 m 1,79 m 1,70 m 1,57 m 1,85 m 1,80 m 1,74 m 1,88 m 1,76 m 1,62 m 1,66 m Poids 72 kg 58 kg 76 kg 48 kg 83 kg 66 kg 64 kg 48 kg 46 kg 66 kg 57 kg 58 kg 78 kg 64 kg 82 kg 59 kg 48 kg 84 kg 74 kg 66 kg 90 kg 71 kg 52 kg 55 kg Pointure Pointure chaussure chapeau 38 42 45 42 46 36 39 39 36 39 40 38 44 42 44 41 38 44 44 43 44 46 40 39 55 57 57 54 61 55 56 52 52 54 53 52 57 60 55 54 54 54 60 57 57 55 56 51

Axe 1 (39 %)

Sylvain Gaudin - BTSA Gestion Forestire - 1997

12

D42 Lapproche typologique et son utilit en foresterie

Le plan factoriel 1-2 est le plan qui donne la vision la moins dforme de la ralit. En effet, laxe 1 et laxe 2 sont les axes qui traduisent le mieux linertie du nuage. La projection sur ces deux axes est donc la meilleure. On peut extraire des projections sur dautres axes (plan 1-3, plan 2-3...), mais elles donnent une vision plus dforme du nuage de points. On a au plus autant daxes factoriels quil y a de variables au dpart. Etant donn que les axes factoriels sont orthogonaux entre eux, linertie du plan factoriel correspond la somme des inerties des axes. Par exemple, ici linertie du plan 1-2 vaut 66 % (39+27). Plus linertie du plan factoriel est forte, moins ce plan dforme le nuage de points dans la reprsentation quil en donne.
II.2.1.1.3. Dune lecture simple une lecture labore...

Cest une chose de construire un plan factoriel, cen est une autre de linterprter. Si lon sintresse au plan factoriel donn ci-contre, une vision intuitive peut nous donner un certain nombre dinformations. Par exemple, si lon cherche tablir une typologie, les trois points entours en pointill au sud-ouest du plan factoriel sont trs proches, on peut alors en dduire que les individus que ces points reprsentent ont des caractristiques physiques (taille, poids, pointure...) voisines. Autrement dit, la distance qui les spare est faible. Cette approche intuitive doit tre parfois fortement nuance. Il ne faut pas en effet oublier quon ne visualise pas la ralit sur un plan factoriel, mais une projection de la ralit. Il peut exister des erreurs de perspective. En effet, comme lillustre la figure ci-dessous, les projets de deux points peuvent tre proches sans que les deux points le soient.
Sur laxe 1, on peut penser que les trois points A, B et C sont proches car leurs projets le sont. Or, on constate que seuls A et B sont proches alors que C est distant de ces deux points. Ainsi, il faut se mfier dinterprtations dangereuses quand on lit un plan factoriel.

A B

Projection orthogonale sur l'axe 1

Axe 1

Fort heureusement, les logiciels permettent de juger de la qualit de la projection sur les plans factoriels ce qui vite les erreurs. Un autre problme rside dans la notion de distance. Jusqu prsent, on a sous-entendu quil nexistait quune distance, la distance euclidienne

13

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

usuelle. Or les mathmaticiens peuvent dfinir dautres distances ! Ainsi, suivant les mthodes danalyse, on aura affaire une distance ou une autre.
II.2.1.2. Quelques exemples danalyses factorielles

Lobjectif nest pas de passer ici en revue toutes les techniques danalyses multivaries, mais de seulement prsenter les plus communes utilises en sciences et techniques forestires.
II.2.1.2.1. Lanalyse en composantes principales (ACP)

Lanalyse en composantes principales traite les tableaux de rels comme celui prsent page 12. On peut dune part reprsenter le nuage des individus sur divers plans factoriels et dautre part le cercle des corrlation concernant les variables. Normalement, on na pas de reprsentation simultane des individus et des variables sur le mme graphique. Certains logiciels le font, mais il faut alors connatre les conventions utilises. LACP dtecte des relations linaires entre les individus ou les variables. Souvent, on procde une ACP norme pour que les variables exprimes par de grands nombres (par exemple 35 mtres pour une hauteur) ntouffent pas celles exprimes par de petits nombres (par exemple 0,35 m de diamtre ou 1,204 m3...). Pour cela, on remplace chaque donne par sa valeur centre rduite :

x-x

II.2.1.2.2. Lanalyse factorielle des correspondances (AFC)

Lanalyse factorielle des correspondances traite les tableaux de contingence ou les tableaux disjonctifs complets (comme celui prsent page 7). Les variables et les individus sont reprsents sur le mme plan factoriel. On peut donc avoir diffrentes lectures en ne regardant que les individus ou que les variables ou bien les deux en mme temps. Lorsquon fait des interprtations entre individus et variables, il faut bien avoir lesprit quun individu est positionn en fonction de toutes les variables et quune variable est positionne en fonction de tous les individus.

II.2.2. Les classifications automatiques


II.2.2.1. Principe et intrt

Si les analyses factorielles peuvent contribuer llaboration de typologies en montrant quels sont les facteurs premiers de variation et comment se rpartissent les individus dans lespace, elles ne peuvent que rarement elles seules permettre de construire une typologie. Des outils de classification automatique peuvent servir aider crer la typologie. Gnralement, ils sont utiliss conjointement avec les analyses factorielles. Il est difficile, pour construire une typologie de ne se
Sylvain Gaudin - BTSA Gestion Forestire - 1997

14

D42 Lapproche typologique et son utilit en foresterie

servir que des analyses factorielles ou que des mthodes de classification automatique. Les outils de classification automatique proposent des groupes les plus homognes possibles. Ils visent maximiser la variance inter-classe et minimiser la variance intra-classe. Diverses mthodes existent pour cela.
II.2.2.2. Les classifications non-hirarchiques

Dans le cadre de ces mthodes (mthode des centres mobiles ou des nues dynamiques, par exemple), on fixe un nombre de classes (plus ou moins arbitrairement) et le logiciel regroupe les individus en fonction de leur proximit. La notion de choix dune distance apparat donc aussi ici, comme pour les analyses factorielles. Le problme de ces classifications tient au fait que le nombre de classes est impos au dpart et cela parfois arbitrairement.
II.2.2.3. Les classifications hirarchiques

Les classifications hirarchiques ne donnent pas a priori un nombre dtermin de classes, mais une srie de partitions qui permet de partir des individus isols jusqu un groupe regroupant tous les individus, en proposant de nombreuses partitions intermdiaires.
Indice d'agrgation

Ainsi, on peut reprsenter une classification hirarchique sous la forme dun arbre. Lindice dagrgation sert mesurer la pertinence des groupes forms. En effet, il correspond linertie intra-classe. Ainsi, plus il est lev, plus les groupes forms sont htrognes. Lutilisateur est libre de fixer avec ce genre danalyse le niveau de rupture qui donnera les groupes (deux exemples de rupture ont t figurs en pointills sur le dendrogramme fourni ici). Il doit trouver un compromis entre le nombre de groupes forms et la validit statistique des groupes (variance intra-groupe la plus faible possible).

15

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

Les classifications hirarchiques prsentent lavantage dtre moins arbitraires que les classifications non-hirarchiques. On est toutefois dpendant du choix dune distance et rien ninterdit de confronter les rsultats de ces deux familles de mthodes pour se donner tous les moyens daboutir une typologie fiable.

II.2.3. Mthodologie gnrale en analyse des donnes


II.2.3.1. Les dix points chauds de lanalyse des donnes (daprs Fnelon, 1981)

Le schma suivant prsente les 10 points chauds (ou 10 tapes) dune dmarche danalyse de donnes.

reprsentant le tableau

Rduction

Rtro-action sur le dossier

Choix dune distance adapte la nature du tableau

Tableau

homogne pertinent exhaustif

Extraction et gestion

Recodage

Les dix points chauds de lanalyse de donnes, daprs Fenelon, (1981).

Dossier

Rtro-action sur le tableau

Sortie de synthse

Nuage

Sylvain Gaudin - BTSA Gestion Forestire - 1997

16

D42 Lapproche typologique et son utilit en foresterie

Le dossier dtude Le dossier dtude correspond lensemble des donnes recueillies pour tre analyses. Il peut sagir des rsultats dune enqute, de lensemble de relevs effectus en fort... Ce dossier dtude correspond des objectifs bien prcis comme par exemple tablir une typologie des peuplements ou montrer les relations entre structure des peuplements et flore du sous-bois. Extraction des donnes Dans cette tape, on prpare les donnes au traitement. On peut mettre un identificateur pour chaque individu (chaque placette porte un numro qui la diffrencie des autres) et on choisit, parmi celles prsentes dans le dossier, les donnes que lon soumettra au traitement. Codage des donnes La plupart du temps, les variables rcoltes ncessitent un recodage. On distingue en effet un grand nombre de familles de variables diffrentes : - les variables amorphes. Ce sont par exemple les variables qui servent numroter les individus. Lindividu 8 nest pas deux fois plus petit que lindividu 16 ni quatre fois plus que lindividu 32 ! - les variables ordinales. Elles informent sur une relation dordre. On peut par exemple coder 1 les individus ayant eu une mention bien au BTS, 2 ceux ayant eu une mention assez bien, 3 ceux ayant eu une mention passable... - les variables de prsence-absence. On peut mettre 1 quand une plante est prsente dans un relev et 0 quand elle est absente. - les variables continues. Elles rsultent de mesures effectues et prennent des valeurs relles, par exemple 35 % de PB, V = 205 m3/ha... La faon dont sont codes ou recodes les variables est particulirement importante pour les analyses multivaries. En effet, du bon codage dpend la qualit des rsultats obtenus et certains codages ne permettent de faire que certaines analyses. Le codage des donnes peut prendre beaucoup de temps. Une trs grande partie de larbitraire des rsultats tient du codage. Le tableau de donnes Le tableau de donnes est un extrait du dossier initial o certaines variables ont t recodes. Cest ce tableau qui va tre soumis aux analyses. Il existe de nombreuses varits de tableaux (tableaux de contingences, tableaux de mesures, tableaux de notes, tableaux de prsence-absence...).

17

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

Ces tableaux peuvent tre soumis des analyses diverses, ils possdent leurs particularits et leurs traitements potentiels. Un tableau doit tre : - homogne, - pertinent, - exhaustif. Lhomognit semble aller de soi, on ne doit pas mlanger des donnes qui nont aucun rapport entre elles. Il faut aussi vrifier ce que signifie laddition des lignes et des colonnes ou bien imaginer ce que reprsente lensemble des termes dune ligne. On doit porter une attention particulire au fait que les relations entre les nombres prsents dans le tableau traduisent bien les relations qui existent dans la ralit. La pertinence signifie que lobjet du relev est bien dfini et que le problme a un sens. Lexhaustivit signifie que les diffrentes zones du domaine dinvestigation sont bien recouvertes par les relevs. Choix dune distance Le choix dune distance (au sens mathmatique, tel quil a t abord page 13) est conditionn par la nature du tableau et le type danalyse quon veut effectuer. Souvent les logiciels passent cet aspect sous silence et la distance est choisie en fonction du type danalyse effectu. Nuage de points Une distance ayant t choisie, on peut construire un nuage de points o les individus sont placs en fonction de leurs coordonnes. Sauf dans quelques cas rares et simplistes ce nuage de points ne peut tre visualis car il se situe dans un espace possdant bien plus de dimensions que le ntre. La rduction des donnes Le nuage de points ntant pas visualisable, il nest pas intressant sous sa forme originelle. Les techniques danalyses multivaries procdent donc une rduction du nuage. Cela peut correspondre la cration des axes factoriels et un changement de base dans le cadre dune analyse factorielle, lagglomration en diffrentes classes dans celui dune classification automatique. Sorties de synthse La rduction des donnes permet de simplifier un tableau souvent assez complexe. Des sorties de synthse peuvent donc tre ralises aprs la rduction des donnes. Cela peut consister en des tableaux quon pourra analyser, ou bien en des sorties graphiques (plans factoriels, arbres de classification...). Cest partir de ces rsultats quon peut construire une
Sylvain Gaudin - BTSA Gestion Forestire - 1997

18

D42 Lapproche typologique et son utilit en foresterie

typologie, mais les tapes prcdentes ne doivent en aucun cas tre ngliges. Rtroaction sur le tableau Il se peut quarriv au stade des sorties de synthse, on constate que certains individus ont un rle aberrant ou trivial. On peut alors traiter nouveau le tableau initial en supprimant ces individus, ou en leur donnant un poids nul. Ils sont alors prsents sur les plans factoriels, mais nont pas contribu leur laboration. On parle ainsi de variables ou dindividus supplmentaires. Malheureusement, tous les logiciels ne grent pas les variables ou les individus supplmentaires. Rtroaction sur le dossier Tout comme on peut rtro-agir sur le tableau, on peut rtro-agir sur le dossier. On peut par exemple faire nouveau une analyse factorielle avec des individus ou des variables supplmentaires qui ntaient pas dans le tableau originel. On peut galement utiliser les outils classiques de statistique (comparaison de moyenne, intervalle de confiance, rgression) sur les rsultats obtenus, pour par exemple valider les types obtenus lors de llaboration dune typologie. Cette tape de lanalyse nest en rien superflue. Elle permet souvent de mieux interprter les rsultats et les enrichit considrablement.
II.2.3.2. Les limites de lanalyse des donnes

Comme on peut le constater la lecture de ce qui prcde, les analyses multivaries font partie dun domaine des statistiques dans lequel les erreurs peuvent facilement et rapidement se commettre. En effet, lobtention de rsultats cohrents et refltant la vrit passe par de nombreuses tapes dans lesquelles la rigueur est de mise. Le codage, le choix des distances, la forme des tableaux traits sont des tapes cruciales si lon veut obtenir de bons rsultats. Il faut de plus savoir relativiser les rsultats, ne pas hsiter faire plusieurs analyses contradictoires avant de dcrter le travail achev. Lintervention humaine en analyse de donnes importe beaucoup plus que ce quon pourrait penser au dpart. Il faut savoir faire des choix et tre prudent dans ses interprtations, savoir relativiser. Ce nest pas lordinateur qui dcide de tout. Les 10 points chauds prsents au paragraphe prcdent permettent de ne rien laisser au hasard et de raisonner correctement sa pratique. Si lon ny prend garde, on peut obtenir des rsultats sans rels fondements. On na trait ici quune simple approche des analyses multivaries. Sachant que les mthodes employes sont assez complexes, on aura intrt consulter des ouvrages traitant de ce thme si lon veut se spcialiser.

19

Sylvain Gaudin - BTSA Gestion Forestire - 1997

D42 Lapproche typologique et son utilit en foresterie

Il ne faut pas quune utilisation informatique rendue accessible conduise des rsultats aberrants.

Conclusion
Diverses mthodes sont utiles pour construire des typologies fiables et efficaces. Quelques exemples ont t rapidement passs en revue ici, mais dautres mthodes, notamment en analyses multivaries, existent. Il faut concevoir quun travail de cration de typologie nest pas simple ds quon se trouve en conditions relles. Des soins quon apportera sa ralisation dpendra sa qualit. Il ne faut pas en effet oublier quon se trouve, lors dun travail typologique, dans des domaines o rien nest tranch et il est impossible dappliquer une simple mthode rigide sans discernement.

Bibliographie
ALLEGRINI C. 1981 - Les futaies jardines prives du Haut-Jura, Besanon, CRPF, 9 p. (rsum des travaux de Herbert et Rbeirot) AUBRY S., DRUELLE P. 1988 Vers une meilleure connaissance des peuplements feuillus. Typologie en rgion centre, Mmoire de troisime anne ENITEF, Les Barres, 87 p.et annexes. BAILLY G. 1995 Catalogue des types de stations forestires de la Plaine de la Sane, CETEF de Cte dOr, Dijon, 311 p. BECKER M. 1979 Influence du traitement sylvicole sur la flore forestire : cas de la futaie et du taillis-sous-futaie, Vegetatio, vol. 40, n3, pp. 155-161. BOUROCHE J.M., SAPORTA G. 1980 Lanalyse des donnes, quatrime dition (juin 1989), Que sais-je ? (n1854) PUF, 124 p. BRUCIAMACCHIE M. 1989 Typologie des Peuplements, R.F.F., n6, pp. 507-512. BRUCIAMACCHIE M. 1991 Cours sur lanalyse des donnes, document interne ENITEF, Les Barres, 12 p. et annexes. DOUSSOT R. 1990 Cours damnagement, document interne ENITEF, Les Barres, 50 p. et annexes. FENELON J.P. 1981 Quest-ce que lanalyse des donnes ? Paris, ditions Lefonen, 311 p. GUINOCHET M. 1973 Phytosociologie, Masson, Paris, 227 p. + carte HERBERT I., REBEIROT F. 1981 Les futaies jardines prives des hautes chanes du Jura, Mmoire de troisime anne ENITEF, Les Barres, 125 p. et annexes. IDF 1985 Typologie des stations forestires - Vocabulaire IDF, Paris, 243 p. LACOSTE A., SALANON R. 1969 Elments de biogographie et dcologie, Fernand Nathan, Paris, 189 p. OZENDA P. 1982 Les vgtaux dans la biosphre, Douin, Paris, 431 p. Sylvain Gaudin - BTSA Gestion Forestire - 1997

20

You might also like