You are on page 1of 126

BADJI MOKHTAR-ANNABA UNIVERSITY

UNIVERSITE BADJI MOKHTAR-ANNABA


-

Facult des sciences de lingnieur Anne : 2010

Dpartement dinformatique

MEMOIRE

Prsent en vue de lobtention du diplme de MAGISTER

Reconnaissance de lEcriture Arabe par Systmes Flous

Option

Texte, parole et Images

Par
NEMOUCHI Soulef

DIRECTEUR DE MEMOIRE : FARAH Nadir MC Universit dAnnaba

DEVANT LE JURY

PRESIDENT : Mme BAHI Halima MC Universit dAnnaba

EXAMINATEURS: M me SOUICI Labiba MC Universit dAnnaba

Mr KHADIR Mohamed Tarek MC Universit dAnnaba




. .

.

.

.
.

. .
.

.
.

: , , ,
, .

i
ABSTRACT
The main goal of our study is to address the problem of automatic recognition of
Arabic handwritten by statistic methods. We have found that the major problem of the
automatic reading of cursive manuscript characters is the segmentation in elements. In
this case we are interested by the global approach with avoiding the problem of
segmentation.

The chosen classical methods, said statistical are efficient. But they cant be applied
just for writing with limited vocabulary, in the case of a system with training phase.
We include that the performance of system for the recognition of Arabic handwritten
words depends of all recognition phases; from acquisition to classification. We have
oriented our research to approaches based fuzzy logic concepts: implementation of
FCM algorithm for automatic classification of Arabic handwritten words, trying to
find solutions to disadvantage of K-means algorithm, and to obtain more preferment
results. We have implemented a KNN algorithm, this one necessitate no hypotheses
in the form of training classes. However it necessitates a great number of
observations. In addition, it has been greatly used in handwritten recognition. The last
classifier chosen is the PNN network; this type of network is generally used for
classification problems. Their results are combined then using two methods of
combination.

Keywords: Recognition of Arabic handwritten words, Fuzzy C-Means algorithm, K-


means algorithm, KNN algorithm, PNN network.

ii
RESUME
Lobjectif de notre travail de recherche est dadresser la problmatique de la
reconnaissance automatique de lcriture arabe manuscrite par les mthodes
statistiques. Nous avons trouv que le problme majeur de la lecture automatique de
caractres manuscrits cursifs tant la segmentation d'un trac en lments
constituants, dans ce cadre, nous nous sommes intresss lapproche globale en
vitant le problme de segmentation.

Les mthodes classiques choisies, dites statistiques, sont efficaces mais ne peuvent
sappliquer qu des critures vocabulaire restreint dans le cadre dun systme avec
une phase dapprentissage. Nous constatons que la performance dun systme de
reconnaissance optique de lcriture arabe manuscrite dpend de toutes les phases du
processus de reconnaissance depuis lacquisition jusqu la classification. Nous avons
mis laccent sur deux phases les plus tudies dans les travaux existants : lextraction
des primitives et la classification. Nous avons orient notre recherche vers les
approches bases sur les concepts de la logique floue : application de lalgorithme
FCM pour la classification automatique des mots arabe manuscrit, en essayant ainsi
de trouver des solutions aux inconvnients de lalgorithme classique K-Means, et
dobtenir des rsultats plus performants. Nous avons implment aussi lalgorithme
KPPV, ce dernier ne ncessite aucune hypothse sur la forme des classes
dapprentissage par contre, il ncessite un grand nombre dobservations pour tre
prcis. De plus il a t beaucoup utilis en reconnaissance de lcriture manuscrite. Et
le dernier classifieur choisi, cest le rseau PNN ; ce type de rseaux est gnralement
utilis pour des problmes de classification. Leurs rsultats sont ensuite combins
en utilisant deux mthodes de combinaison sans apprentissage : la mthode de vote
simple et celle de la somme pondre.

Mots cls : Reconnaissance de mots arabes manuscrits, algorithme Fuzzy C-Means,


algorithme K-Means, algorithme KPPV, Rseau de neurone PNN.

iii
Ddicace

A ceux qui me sont chers

iv
REMERCIEMENTS

Au terme de ce travail je voudrais tout dabord exprimer mes remerciements


DIEU de me donner le courage et la volont pour finir ce mmoire.

Aprs Dieu, je tiens exprimer toute ma reconnaissance et mon profond respect


mon encadreur Mr. FARAH Nadir, matre de confrences luniversit dAnnaba,
davoir accept de diriger mon travail, de mavoir fait confiance et de mavoir
laisse mexprimer.

Je souhaite adresser mes sincres remerciements madame BAHI Halima, matre


de confrences luniversit dAnnaba, pour mavoir fait lhonneur de prsider le
jury de ma soutenance.

Je tiens aussi remercier particulirement les personnes qui ont accept


dexaminer et de juger mon travail et qui sont : monsieur KHADIR Mohamed Tarek
et madame SOUICI Labiba, matres de confrences luniversit dAnnaba. Je les
remercie pour leurs conseils, pour leurs disponibilits tout moment, pour leurs
gentillesses, et pour leurs aides illimites.

Enfin, mes remerciements vont tous les membres de ma famille qui mont tant
soutenue, particulirement mes parents pour leur soutien moral et pour leur
encouragement durant ma priode de scolarit. A mes surs surtout Fatiha et
Nadia pour leur aide, mes petites Lina et Aya. Merci tous ceux qui ont contribu
de prs ou de loin llaboration de ce travail.

v
Liste des Tableaux
Tableau Titre Page
Tableau 1.1 Avantages et inconvnients des lapproches globale et analytique 13
Tableau 3.1 Alphabet Arabe 41
Tableau 3.2 Hamza et Madda et les positions quelles occupent en association 41
avec Alif, Waw et Ya
Tableau 3.3 Diffrents formes dun caractre arabe 42
Tableau 3.4 Exemple de mots composs de la droite vers la gauche de 1, 2, 3,4 et 43
5 PAWs respectivement
Tableau 3.5 Le PAW dans diffrents mots et diffrentes positions 43
Tableau 3.6 Tableau rcapitulatif prcisant les caractristiques et les performances 50
de certains systmes AOCR (approche globale
Tableau 4.1 Taxonomie des mthodes dextraction de caractristiques selon la 64
reprsentation de limage
Tableau 4.2 Taxonomie des caractristiques selon la mthode de classification 65
Tableau 4.3 Les Diffrents Type Des Points Diacritiques 71
Tableau 4.4 Description globale des noms de wilayas en mots 77
Tableau 4.5 Taux de reconnaissance obtenue en faisant varier le coefficient flou 82
m et en utilisant les caractristiques de zonage
Tableau 4.6 Taux de reconnaissance obtenue en faisant varier le coefficient flou 82
m et en utilisant les caractristiques de freeman.
Tableau 4.7 Taux de reconnaissance obtenue en faisant varier le coefficient flou 82
m et en utilisant les caractristiques de moment de Zernike
Tableau 4.8 Rsultats de classification simple (a,, d) 87
Tableau 4.9 Rsultats de combinaison des classifieurs 88
Tableau 4.11 . Linfluence de paramtre K sur le rsultat de la classification KPPV 89
Tableau 4.12 Rsultats de K-means sans dcoupage de vocabulaire 89

vi
Liste des Figures
Figure Titre Page
Figure 1.1 Rand Tablet ou Grafacon 9
Figure 1.2 Diffrents types dcritures 14
Figure 1.3 Styles dcritures selon TAPPERT 15
Figure 1.4 Graphe de complexit des systmes de RAED daprs BELAID 16
Figure 1.5 systmes, reprsentations et approches de reconnaissance 22
Figure 2.1 Schma gnral d'un systme de reconnaissance de lcriture hors- 26
ligne
Figure 2.2 Effets de certaines oprations de prtraitement 27
Figure 2.3 Le voisinage en carreau et carr 28
Figure 2.4 Exemples de Redressement de mots manuscrits 29
Figure 2.5 Dtection de ligne de base 29
Figure 2.6 Les diffrents types de segmentation 31
Figure 3.1 Racine trilre KTB en arabe 42
Figure 3.2 Exemple de formes de boucles dans des styles diffrents 43
Figure 3.3 Le ddoublement de lettre chadda 44
Figure 3.4 Les voyelles de la langue arabe 44
Figure 3.5 La composition des mots en langue arabe 45
Figure 3.6 Diffrentes combinaisons verticales possibles de caractres 46
Figure 3.7 Ecriture voyelle 47
Figure 3.8 Exemples dcritures arabes refltant ses caractristiques 48
morphologiques
Figure 4.1 Schma gnral du systme de reconnaissance de mot manuscrit 53
Figure 4.2 Prtraitement de limage 54
Figure 4.3 Positionnement de notre travail par rapport la dichotomie des types 55
dcriture
Figure 4.4 Dtermination du seuil de binarisation 56
Figure 4.5 Rsultat dune binarisation 56
Figure 4.6 Rsultat de lissage 57
Figure 4.7 Traitement dimage dhaut niveau 58
Figure 4.8 Ligne de base du mot Tamenraset . 59
Figure 4.9 Zone mdiane du mot Oum-el-bouaghi . 59
Figure 4.10 Illustration de la hauteur de la zone mdiane en pixels dans un mot 60
chantillon
Figure 4.11 Zone suprieure du mot Oum-el-bouaghi . 60
Figure 4.12 Zone infrieure du mot Oum-el-bouaghi . 61
Figure 4.13 Les 11 composantes connexes qui forment le mot Oum-el- 62
bouaghi .
Figure 4.14 Illustration du rsultat de lextraction des composantes connexes 62

vii
Figure 4.15 Rsultat de squelettisation 63
Figure 4.16 Extraction de contour 63
Figure 4.17 Extraction morphologique de contour externe, (a) image originale, (b) 67
image dilate, (c)contour externe
Figure 4.18 Illustrations des diffrentes informations ncessaires pou lanalyse 69
dune composante connexe
Figure 4.19 Topologie De Lcriture Arabe Illustre Dans Le Mot Oum-El- 70
Bouaghi .
Figure 4.20 Organigramme de dtection des diacritiques (Catgorie 1) 71

Figure 4.21 Types de points diacritiques (catgorie2 et catgorie3) 72


Figure 4.22 Organigramme de dtection des diacritiques (les 3 catgories) 73
Figure 4.23 Trois Fonds Correspondent Aux Trois Boucles 74
Figure 4.24 Illustration du niveau de projection verticale pour obtenir le nombre 76
de hampes
Figure 4.25 Algorithme de classification par C-moyenne flou 81
Figure 4.26 L'algorithme de rsolution pour la mthode K-Means 83
Figure 4.27 Architecture du rseau PNN 84
Figure 4.28 Structure dun rseau PNN 85

viii
Liste des Symboles
AOCR: Arabic Optical Character Recognition.

ASCII: American Standard code for information interchange

ASMO: Arabic Standard Metrology Organization

CC: composante connexe

COROC: Cognitive Optical Recognition Old Characters

FCM: Fuzzy C-Means Clustering.

KPPV: K Plus Proche Voisins

LAD: Lecture Automatique des Documents

MMC: Modles de Markov Cachs

OCR: Optical Character Recognition.

PAW: Peace of Arabic Word.

PNN: Probabilistic Neural Network

RAED : Reconnaissance Automatique de lEcriture et du Document

REAM : Reconnaissance de l'Ecriture Arabe Manuscrite.

RBF: Radial Basic Functions.

RdF: Reconnaissance de Forme

RECAM: Reconnaissance de lEcriture Cursive Arabe Manuscrite

REM: Reconnaissance de l'Ecriture Manuscrite

SBR : Systmes Base de Rgles

SREM : Systme de Reconnaissance de lEcriture Manuscrite

ix
Table des matires
................................................................................................................................ i
ABSTRACT ...................................................................................................................ii
RESUME ..................................................................................................................... iii
Liste des Tableaux ........................................................................................................ vi
Liste des Figures ..........................................................................................................vii
Liste des Symboles ....................................................................................................... ix
Table des matires.......................................................................................................... x

INTRODUCTION GENERALE ................................................................................ 1


Problmatique et objectifs.............................................................................................. 3
Prsentation du mmoire................................................................................................ 5

Chapitre1.Reconnaissance Automatique De Lcriture Manuscrite .................... 7

I.1. Introduction ........................................................................................................... 7


I.2. Historique de LAD (Lecture Automatique des Documents) ............................. 8
I.3. Diffrents aspects de la Reconnaissance Automatique de lEcriture et du
Document ou RAED .................................................................................................... 8
I.3.1. Mode dacquisition (En-ligne / Hors-ligne) ................................................................. 9
I.3.1.1. Reconnaissance en-ligne ....................................................................................... 9
I.3.1.2. Reconnaissance hors-ligne .................................................................................. 10
I.3.1.2.1. Reconnaissance de texte ou analyse de documents ...................................... 11
I.3.1.2.2. Reconnaissance de limprim ou du manuscrit ............................................ 11
I.3.2. Approches de la Reconnaissance ............................................................................... 11
I.3.2.1. Approche globale ................................................................................................ 12
I.3.2.2. Approche analytique ........................................................................................... 12
I.3.2.3. Approche base sur la lecture humaine ............................................................... 13
I.3.2.4. Avantages et Inconvnients de lapproche globale et lanalytique ......................... 13
I.4. Complexit dun systme de RAED ................................................................... 14
I.4.1. Disposition spatiale du texte ...................................................................................... 14
I.4.1.1. Types dcriture .................................................................................................. 14
1.4.1.2. Styles dcriture .................................................................................................. 14
I.4.2. Nombre de scripteurs ................................................................................................. 15
I.4.3. Taille du vocabulaire .................................................................................................. 15
I.5. Mthodes de classification de la reconnaissance .............................................. 16
I.5.1. Mthodes statistiques ................................................................................................ 16
I.5.1.1. Mthode baysienne ............................................................................................ 17
I.5.1.2. Mthode du plus proche voisin ........................................................................... 18
I.5.1.3. Mthode connexionniste ..................................................................................... 18
I.5.1.3.1. Rseaux non boucls .................................................................................... 19
I.5.1.3.2. Rseaux boucls ........................................................................................... 19
I.5.2. Mthodes stochastiques .............................................................................................. 19
I.5.3. Mthodes linguistiques............................................................................................... 20
I.5.3.1. Mthode structurelle............................................................................................ 20
I.5.3.1.1. Mthodes de tests ......................................................................................... 21
I.5.3.1.2. Comparaison de chanes ............................................................................... 21
I.5.3.2. Mthode syntaxique ............................................................................................ 21
I.5.4. Mthodes hybrides ..................................................................................................... 22
I.6. Conclusion ............................................................................................................ 23

x
Chapitre2. Processus De Reconnaissance Dcriture Manuscrite ......................... 25

II.1. Introduction........................................................................................................ 25
II.2. Organisation gnrale dun SREM .................................................................. 25
I.2.1. Phase dAcquisition d'image ...................................................................................... 26
II.2.2. Phase de Prtraitement .............................................................................................. 27
II.2.2.1. Rduction du bruit ............................................................................................. 27
II.2.2.1.1. Seuillage...................................................................................................... 28
II.2.2.1.2. Lissage ........................................................................................................ 28
II.2.2.2. Redressement de lcriture................................................................................. 29
II.2.2.3. Homognisation des donnes ........................................................................... 29
II.2.2.4. Normalisation..................................................................................................... 30
II.2.3. Squelettisation........................................................................................................... 30
II.2.4. Phase de Segmentation ............................................................................................. 31
II.2.5. Phase dAnalyse ou Extraction des Caractristiques ............................................... 32
II.2.5.1. Niveaux des caractristiques .............................................................................. 32
II.2.5.2. Reprsentation des caractristiques ................................................................... 32
II.2.5.3. Types de caractristiques ................................................................................. 33
II.2.5.3.1. Caractristiques topologiques ou mtriques .............................................. 33
II.2.5.3.2. Caractristiques locales ou structurelles ..................................................... 34
II.2.5.3.3. Caractristiques statistiques ........................................................................ 34
II.2.5.3.4. Transformations globales ............................................................................ 34
II.2.5.3.5. Superposition des modles (template matching) et corrlation .................. 35
II.2.6. Phase de Classification ............................................................................................. 35
II.2.6.1. Apprentissage..................................................................................................... 35
II.2.6.1.1. Apprentissage supervis ............................................................................. 35
II.2.6.1.2. Apprentissage non supervis....................................................................... 36
II.2.6.2. Reconnaissance .................................................................................................. 36
II.2.6.2.1. Les systmes base de rgles SBR (y compris les systmes experts) ........ 36
II.2.6.2.2. Les arbres de dcision ................................................................................. 36
II.2.6.2.3. Les techniques agglomratives ................................................................... 37
II.2.7. Poste-traitement ........................................................................................................ 37
II.3. Conclusion .......................................................................................................... 38

Chapitre 3. Ecriture Arabe Et LOCR .................................................................... 40

III.1. Origine de lcriture arabe .............................................................................. 40


III.2. Rforme de lcriture arabe ............................................................................ 40
III.3. Caractristiques de lcriture arabe ............................................................... 40
III.4. Vocalisation de lcriture arabe ...................................................................... 43
III.5. Problmes poss par lcriture arabe ............................................................. 45
III.5.1. Multitude de graphismes ......................................................................................... 45
III.5.2. Ligatures .................................................................................................................. 45
III.5.3. Vocalisation ............................................................................................................. 46
III.5.4. Normalisation des caractres ................................................................................... 47
III.6. Difficults de la reconnaissance de lcriture arabe ...................................... 48
III.7. Application de la reconnaissance hors-ligne de lcriture ............................ 48
III.8. Conclusion ......................................................................................................... 50

Chapitre 4. Approche globale pour la reconnaissance de mots arabes manuscrits


...................................................................................................................................... 52

xi
IV.1. Introduction ...................................................................................................... 52
IV.2. Architecture du systme................................................................................... 52
IV.3. Acquisition et Prtraitement ........................................................................... 54
IV.3.1. Binarisation ............................................................................................................. 56
IV.3.2. Lissage..................................................................................................................... 57
IV.3.2.1. Bouchage .......................................................................................................... 57
IV.3.2.2. Nettoyage ......................................................................................................... 57
IV.4. Segmentation de textes (Traitement dimages de haut niveau) ................... 58
IV.4.1. Localisation de la ligne de base et la zone mdiane ................................................ 58
IV.4.1.1. Localisation de la ligne de base ........................................................................ 58
IV.4.1.2. Localisation de la zone mdiane ..................................................................... 59
IV.4.2. Localisation de la zone suprieure et la zone infrieure......................................... 60
IV.4.2.1. Localisation de la zone suprieure .................................................................. 60
IV.4.2.2. Localisation de la zone infrieure ................................................................... 61
IV.4.3. Dtection des composantes connexes...................................................................... 61
IV.5. Squelettisation ................................................................................................... 62
IV.6. Traage de contours ......................................................................................... 63
IV.7. Extraction des caractristiques globales et description du mot .................. 63
IV.7.1. Choix des caractristiques ....................................................................................... 65
IV.7.2. Descripteurs globaux ............................................................................................... 65
IV.7.3. Descripteurs externes .............................................................................................. 66
IV.7.3.1. Extraction de contour ....................................................................................... 66
IV.7.3.2. Dtermination des contours des mots ............................................................... 67
IV.7.4. Zonage ..................................................................................................................... 67
IV.7.5. Caractristiques structurelles dun mot arabes ........................................................ 67
IV.7.5.1. Dtection des diffrents types des points diacritiques ...................................... 70
IV.7.5.2. Dtection des boucles (occlusions) .................................................................. 74
IV.7.5.3. Dtecter le nombre dascendants (hampes) et de descendants (jambages) ...... 74
IV.7.5.3.1. Dtection des jambages ............................................................................. 75
IV.7.5.3.2. Dtection des hampes ................................................................................ 75
IV.8. dcomposition du vocabulaire considr ........................................................ 76
IV.9. Reconnaissance ................................................................................................ 77
IV.9.1. Slection des attributs............................................................................................. 78
IV.9.2. Classification par les mthodes implmentes ........................................................ 79
IV.9.2.1. Classification par la mthode KPPV ................................................................ 79
IV.9.2.2. Classification par la mthode C-Moyenne Floue ............................................. 80
IV.9.2.3. Classification par mthode K-Means ............................................................... 82
IV.9.2.4. Classification par rseaux de neurones probabilistes (PNN) ........................... 84
III.9.2.4.1. Proprits gnrales dun PNN.................................................................. 84
IV.9.2.4.1. Avantages et inconvnients de PNN ......................................................... 85
IV.9.3. Rsultats et discussion............................................................................................. 85
IV.9.3.1. Classication simple ........................................................................................ 86
IV.9.3.2. Combinaison de classifieurs ............................................................................. 88
IV.9.3.3. Influence de paramtre K sur les rsultats de la classification KPPV .............. 89
IV.9.3.4. Utilit de dcomposition du vocabulaire .......................................................... 89
IV.10. Conclusion ....................................................................................................... 90

CONCLUSION GENERALE ................................................................................... 91

BIBLIOGRAPHIE ..................................................................................................... 93
ANNEXE A ............................................................................................................... 104
ANNEXE B ............................................................................................................... 108

xii
Introduction gnrale
Comment ltre humain fait-il pour raisonner, parler, calculer, apprendre? Comment
sy prendre pour provoquer: la rflexion, la pense, le jugement, le dcernement et
lintellect?

Ces interrogations ont menes des recherches sur le lien entre l'esprit humain, son
cerveau et la machine. Ces recherches ont donnes naissance des fondations de ce
que nous appelons aujourd'hui l'intelligence artificielle. Parmi les domaines de cette
dernire nous trouvons la reconnaissance des formes RdF qui consiste identifier des
formes ou des objets tout en se basant sur certaines informations reprsentatives de la
forme.

La reconnaissance optique de caractres Optical Character Recognition OCR, au


sens large du terme, est une discipline aussi vieille que lordinateur. Elle pose la
question de lintelligence humaine et des possibilits de lintelligence artificielle.
Pourquoi nous semble-t-il si facile de dchiffrer un texte manuscrit (mme
relativement mal crit) alors que cette tche devient si complexe automatiser ?
[ARR 02].

Alors o se situe la difficult ? Daprs SIMON [SIM 84], il y a deux niveaux de


difficult. La premire difficult rside dans la complexit calculatoire. En effet la
construction dun espace de reprsentation pour une application donne, et plus
particulirement pour la reconnaissance de caractres manuscrits, se heurte hier,
comme aujourdhui, des problmes informatiques de temps de calcul, de temps
daccs ou de stockage. La seconde difficult se situe dans la smantique mme du
problme :

Existe-t-il une technique gnrale pour construire un oprateur de RdF ?


Peut-on construire un systme auto-apprenant et auto-organisateur capable de
reconnatre nimporte quelle forme pour peu quelle ait t apprise ? [SIM 84].

Les techniques lies au traitement de l'information connaissent actuellement un


dveloppement trs actif en liaison avec l'informatique et prsentent un potentiel de
plus en plus important dans le domaine de l'interaction Homme-machine. L'Homme
veut communiquer avec l'ordinateur de la faon la plus simple, la plus naturelle pour
faciliter et acclrer l'interaction et l'change d'informations. Il cherche rendre ces
machines accessibles par la voix, capables de lire, de voir, de se dplacer...et de traiter
et d'analyser rapidement l'information reue.

Ecrire pour communiquer a t de tous les temps une proccupation premire de


l'Homme. L'crit a t, et restera, l'un des grands fondements des civilisations et le
mode par excellence de conservation et de transmission du savoir. Malgr les
avances d'autres moyens de communication tel que l'audio visuel, nombreuses sont
les applications dont l'existence commence sur le papier, plus particulirement dans la
bureautique (saisie, indexation et archivage automatique de documents), en

1
publication assiste par ordinateur (pour faciliter la composition partir d'une
slection de plusieurs documents), dans la poste (lecture des adresses et tri
automatique), dans les banques (traitement des chques, des factures).... Cependant
malgr les progrs technologiques, le clavier reste encore un moyen oblig de
communication avec l'ordinateur.

Quelques systmes de reconnaissance de l'criture manuscrite SREM ont t raliss


et sont oprationnels ce jour. Cependant, ils sont spcifiques un domaine prcis et
sont encore limits. Par exemple, en ce qui concerne la poste, la reconnaissance de
l'criture manuscrite REM, contrairement celle des caractres imprims, se limite au
code postal en chiffres ainsi qu' la ville en caractres majuscules [IMP 97, KAU 00,
KB 00, GAA 01]etc.
Contrairement au latin, la reconnaissance de l'criture arabe manuscrite REAM ou
imprime reste encore aujourd'hui au niveau de la recherche et de l'exprimentation,
le problme n'est pas encore rsolu bien que l'on sache atteindre des taux assez levs
dans certaines applications pour lesquelles soit le vocabulaire est limit [ALE 90], soit
la fonte est unique [ALB 95a]. Ce retard est d principalement la complexit de la
morphologie de lcriture arabe, le manque dchange entre les chercheurs du
domaine et celui dinfrastructures adquates dans le sens budgtaire, de bases de
donnes, de dictionnaires et doutils de test et de validation. Mais dernirement
plusieurs travaux ont rcemment vu le jour.

La reconnaissance de l'criture arabe date des annes 80 [AMI 85, SAA 85]. Depuis,
les recherches se sont multiplis dans ce domaine. Certains chercheurs se sont
intresss la reconnaissance en temps rel en utilisant des tablettes graphiques, ce
qui simplifie en partie le problme en restituant le sens du trac, d'autres se sont
penchs sur l'imprim et/ou le manuscrit en "Off-line" en utilisant un scanner ou une
camra pour la saisie des documents. Depuis, plusieurs outils de prtraitement ont t
dvelopps pour la squelettisation de l'image, de son lissage, pour la dtermination du
contour et l'extraction de primitives...et diffrentes techniques de reconnaissance ont
t labores, parmi lesquelles figurent des mthodes statistiques, structurelles ou
gomtriques, avec ou sans segmentation en caractres [ELD 90, ROM 95].
Gnralement toutes ces mthodes et bien d'autres, tendent extraire, chacune sa
faon, une catgorie de caractristiques et d'valuer par la suite la vraisemblance entre
les primitives extraites et celles de formes prototypes dj apprises par le systme de
reconnaissance.

La reconnaissance des chiffres a bnfici de trs nombreux travaux ces dernires


annes, notamment dans le cadre de la reconnaissance de montants numriques de
chques, de champs numriques dans les formulaires, ou encore de reconnaissance de
codes postaux dans les adresses postales et la reconnaissance des 10 chiffres
manuscrits crits par nimporte quel usager. Lobjectif principal de toute recherche
est daboutir de bons rsultats, ce qui conduit des systmes performants, mais en
focalisant sur le choix de la mthode celle qui donne au mieux que possible la bonne
dcision, telles que les mthodes statistiques, structurelles, les rseaux de
neurones,, avec possibilit de les combines.

Depuis les annes 90, la combinaison de classiffieurs a donc t une des directions de
recherche les plus soutenues dans le domaine de la RdF. Les mthodes de
combinaison ont ainsi t appliques avec succs dans les domaines de la

2
reconnaissance de l'crit. L'amlioration des performances des systmes de
reconnaissance est finalement le principal enjeu des recherches menes ces dernires
annes sur les systmes de combinaison.

Un systme de reconnaissance de lcriture doit idalement, localiser, reconnatre et


interprter nimporte quel texte ou nombre crit sur un support de qualit
arbitrairement variable tel que des formulaires ou des vieux manuscrits pour tre
enregistr dans des bases de donnes que tout le monde peut linterroger.

En effet, il existe dans le domaine de la reconnaissance de lcriture arabe, et


particulirement lcriture manuscrite, beaucoup de problmes intressants tudier
aussi bien du point de vue scientifique (valuation des mthodes de reconnaissance)
que du point de vue conomique (objectifs applicatifs ralistes et rentables). Le
travail prsent dans ce mmoire se droule dans le cadre du dveloppement dun
systme complet de reconnaissance des mots arabes manuscrits qui sont les 48 mots
de wilayas algriennes arabes manuscrits hors ligne avec une approche
multiclassifieurs.

Problmatique et objectifs

Jusqu prsent, ltablissement dun systme universel pour la REM reste un sujet
irrel. Puisque les tres humains sont les meilleurs lecteurs, il semble naturel dtudier
leur manire de lire avant dessayer dautomatiser le processus de lecture. Par ailleurs,
les diffrents travaux labors en AOCR, montrent que la cursivit de l'criture arabe,
la complexit de la morphologie des caractres, les longations des ligatures
horizontales ainsi que les combinaisons verticales de certains caractres, constituent
les problmes majeurs lis au traitement de cette criture. En effet, ces problmes
engendrent une forte inertie diffrents niveaux notamment dans :

Le choix de primitives pertinentes dcrivant la variabilit de la morphologie


des caractres, sachant que certaines caractristiques topologiques sont sensibles la
dgradation, notamment les points diacritiques et les boucles.
La mthode de segmentation en caractres ou mme en pseudo-mots (qui
peuvent se chevaucher surtout dans le cas du manuscrit).

Tous ces problmes et bien d'autres, se trouvent accentus dans le cas du manuscrit o
d'autres facteurs interviennent (variabilit intra et inter-scripteurs, conditions de
l'criture, fusion de points diacritiques, chevauchement de pseudo-mots, graphismes
ingalement proportionns...).

Tous les types de caractristiques (statistiques, structurelles, gomtriques,


transformations globales) et des mthodes de classification (statistique, structurelle,
stochastique, connexioniste, logique flou,..) qui existent dans la littrature sont
pratiquement utilises dans la reconnaissance de lcriture arabe.

Il y a trois faons daborder cette problmatique. Soit le systme reconnat le mot


comme une entit entire et indivisible, il sagit dune approche globale ou holistique.
Soit il reconnat le mot partir de ses caractres pralablement segments, il sagit
dune approche analytique. Soit il nutilise que certaines proprits et raffine sa

3
description du mot par rebouclage, nous parlerons alors de systmes bass sur la
lecture humaine.

A partir ce que nous avons vue dans le paragraphe ci-dessus, nous focalisons notre
travail la premire approche (globale), nous allons aborder la reconnaissance de
mots arabes en appliquant des mthodes statistiques : FCM, K-MEANS, KPPV et un
rseau de neurone probabiliste PNN. Nous obtenons un systme qui combine
paralllement les sorties de ces classifieurs.

Afin de simplifier la problmatique, et donc, denvisager des solutions plus ou moins


convenables, il est important de spcifier le cadre de reconnaissance puis de
construire lapproche qui va de paire avec ce cadre. Les critres qui influencent le
processus de reconnaissance sont le mode dacquisition dcriture, la taille et le type
du vocabulaire considr, le nombre de scripteurs, le style et le type dcriture.

De nombreux travaux montrent que la combinaison de classifieurs (squentielle,


parallle ou hybride) amliore nettement les performances du systme de
reconnaissance par rapport chacun des classifieurs pris isolement. Cependant
l'architecture parallle est celle qui a donn lieu aux travaux les plus importants.

En rsume que tout systme de reconnaissance de lcriture ncessite gnralement


une tape trs importante qui est ltape dextraction de caractristiques. Dans la
littrature, plusieurs travaux ont port sur llaboration de nouvelles caractristiques
qui ont un pouvoir discriminant inter-classes accru tout en minimisant la variabilit
intra-classes. Ces caractristiques sont gnralement classes en deux familles : les
caractristiques structurelles (boucles, concavits, dpassements, points extrmes du
trac, intersections, etc) et les caractristiques statistiques qui drivent des mesures
de distribution spatiale des pixels (zonage, moments invariants, descripteurs de
Fourrier...etc).

La variabilit de lcriture manuscrite permet de configurer les algorithmes de


classification et dapprentissage des problmes difficiles. Les rseaux de neurones
ont montr des rsultats remarquables dans ce domaine, mais la ncessite de
performances leves dans des applications relles ont pouss la recherche vers
dautres modles de classification de plus en plus complexes.

Nous avons comme objectif principal de raliser un systme de reconnaissance de


mots arabe manuscrits. Nous nous sommes focalis dans notre travail sur la
combinaison parallle car cette dernire a prouv son efficacit dans de nombreux
problmes de classification, ce succs est d sa simplicit de mise en uvre, sa
capacit exploiter les rponses des diffrent classifieurs combiner, en prenant en
compte ou non le comportement de chacun des classifieurs.

Dans ce travail nous avons centralis notre but ltape de lextraction des
caractristiques car elle est la plus intressante dans le processus de reconnaissance
surtout dans le cas de lcriture non-contrainte manuscrite.

Le systme ralis cest un systme statistique qui ncessite un apprentissage et est


donc relativement ddi. Il a t test avec une base multi-scripteurs et nest, en
ltat, applicable quaux critures vocabulaire rduit et ddi notre base. Nous

4
prsentons dans ce manuscrit les apports dun tel systme par rapport dautres
approches.

Prsentation du mmoire

Ce mmoire est structur en quatre chapitres comme suit :

Chapitre1. Reconnaissance automatique de lcriture manuscrite

Nous dcrivons en premier lieu notre domaine dapplication travers une prsentation
de lhistorique de LAD et les diffrents aspects de la reconnaissance de lcriture.
Nous avons mis laccent sur la reconnaissance de lcriture manuscrite en se basant
lapproche globale, que nous avons adopte dans notre travail. Suivi par une
description gnrale des principales mthodes de reconnaissance.

Chapitre 2. Processus de reconnaissance dcriture manuscrite

Dans ce chapitre, nous abordons en dtaille les tapes ncessaires au processus de


dveloppement dun systme de reconnaissance hors-ligne de lcriture manuscrite.

Chapitre 3. Ecriture arabe et lOCR

Ce chapitre prsente des gnralits sur lcriture arabe, son origine ; ces
caractristiques, et les principales difficults rencontres dans le domaine de
reconnaissance de mots arabe manuscrits. Nous prsentons par la suite quelques
travaux concernant la reconnaissance globale de mots dans des vocabulaires limits.

Chapitre 4. Approche globale pour la reconnaissance de mots arabes manuscrits

Dans le dernier chapitre, nous reprsentons plus clairement notre travail, nous
discutons en dtaille des diffrentes mthodes appliques dans notre processus de
reconnaissance, par la reprsentation des concepts de base. Nous prsentons aussi les
rsultats obtenus sur notre base de mots utilise dans le cadre de ce projet, nous
montrons galement par tude comparative entre les trois types de caractristiques
choisisses ainsi que les classifieurs implments, en amliorant ces rsultats
indpendants par une combinaison entre eux.

Enfin, cette thse est clture par une conclusion dans laquelle nous dressons un bilan
et une synthse de travail effectu, et nous discutons un ensemble de perspectives que
nous jugeons ncessaire lachvement de notre travail.

5
CHAPITRE 1

Reconnaissance
automatique de
Lcriture
Manuscrite

6
Chapitre1. Reconnaissance Automatique De Lcriture Manuscrite

I.1. Introduction

De nos jours, lcriture reste le moyen de communication visuelle le plus utilis par
lhomme. Il nest donc pas surprenant de voir que de nombreux travaux scientifiques
portent sur sa reconnaissance automatique. Lcriture est en fait la ralisation dun
message transmettre, cest--dire la reprsentation physique dun contenu
smantique. Le but de la reconnaissance de lcriture est de prendre une dcision
quant au contenu smantique du message transmis partir de sa reprsentation
physique. Les applications de systmes capables de remplir cette tche sont
nombreuses, nous pouvons citer entre autres, la lecture automatique de bons de
commande, le traitement automatique des chques, la vrification de signatures ou
encore le tri automatique du courrier.

La reconnaissance de lcriture est rattache au vaste domaine de la reconnaissance de


formes RdF. Sa spcificit vient bien sr des donnes analyser et de leurs diverses
sources de variation. En effet, un mme mot crit par plusieurs personnes peut avoir
des formes assez diffrentes. Pour cette raison, les caractristiques extraites de
lcriture sont trs importantes pour la suite du processus de reconnaissance. Ce
dernier quant lui, peut tre mis en uvre laide de presque toutes les techniques
dveloppes en RdF.

La LAD (Lecture Automatique des Documents) et plus gnralement la RdF sont des
domaines de recherche actifs depuis la fin des annes soixante. Des systmes ont vu le
jour pour des applications trs spcifiques, mais compares aux fantastiques progrs
raliss en mdecine par exemple, et malgr une recrudescence des travaux de
recherche depuis les annes 80, les avances restent lentes et encore dcevantes.
Pourtant le champ de la RdF est considrable et les publications scientifiques dans ce
domaine sont nombreuses. Elles atteignaient dj le millier par an au dbut des annes
80 [SIM 84] et sont en explosion depuis. De plus, dun point de vue mathmatique, le
problme pos par la RdF est trivial, comme le soulignait SIMON en 1984 [SIM 84] ;
[ARR 02]: Soit X un espace de reprsentation - de prfrence un bon espace
topologique - et un ensemble fini de noms -lespace dinterprtation-. Une
reconnaissance - une identification - est une application E : X , que lon va
pourvoir de proprits ; on en dduira de jolis thormes... .

LOCR (Optical Character Recognition) est une opration informatique rapide


permettant de raliser la transformation dun texte crit sur papier en un texte sous
forme dun fichier informatique en reprsentation symbolique (par exemple pour les
critures latines, le codage opr est le code ASCII (American Standard Code for
Information Interchange), tandis que pour larabe on utilise gnralement le code
ASMO (Arabic Standard Metrology Organization). Il existe lheure actuelle un
certain nombre dOCR qui fonctionnent de faon tout fait satisfaisante sur les
documents imprims. Mais le traitement des documents manuscrits pose toujours des
problmes. Cette difficult lie la modalit elle-mme est encore accrue par les
problmes rsultants de la qualit du support.

7
Dans ce chapitre, nous allons prsenter lhistorique de LAD, puis nous expliquons les
diffrents aspects de la reconnaissance de lcriture, nous poursuivrons par une
description du modle gnral de la REM. Nous terminerons en exposant nos
conclusions et la direction choisie pour notre travail.

I.2. Historique de LAD (Lecture Automatique des


Documents)
Commenons par survoler lhistorique de la LAD et plus spcifiquement de la
reconnaissance dcriture. Nous ne reviendrons pas sur les dbuts de linformatique
dont les capacits de stockage et de reprsentation ne permettent pas de vrais
traitements optiques des textes. Tout commence vritablement vers le milieu des
annes 60 avec la cration de lExtended ASCII en 1965 qui permet la reprsentation
de 256 caractres [ARR 02]. Pendant cette priode, les premiers systmes de lecture
automatique du texte imprim ont vu le jour. Toutefois, des systmes fiables taient
restreints quelques fontes seulement [AYA 04]. Ensuite il y a, grossirement, trois
priodes distinctes dans le dveloppement de lOCR dcrite dans [ARR 02].
La reconnaissance de l'criture arabe remonte aux annes 70, depuis plusieurs
solutions ont t proposes. Elles sont aussi varies que celles utilises pour le latin
[BEN 01b].

Entre les annes 1980 et 1990, Les rseaux de neurones ont montr des rsultats
remarquables dans ce domaine. Jusqu trs rcemment, le perceptron multicouche a
t rapidement reconnu comme le classifieur par excellence dans beaucoup de
problmes de reconnaissance de caractres. Par la suite, le besoin dautomatisation
massive a donn lieu toute une multitude dapplications dont la lecture de chques
bancaires, des adresses postales, des documents imprims, etc. [AYA 04].
Quelques annes plus tard, des systmes de REM ont t raliss et sont oprationnels
ce jour. Cependant, ils sont spcifiques un domaine prcis et sont encore limits
[DAR 94], parmi ces systmes ceux qui sont orients vers lcriture pour la
reconnaissance dadresses manuscrites ou de montants de chques, on trouve [GAA
01, KB 00, KHP 05, LLG 95]. Parmi eux qui sont orients vers lcriture arabe
manuscrite citant titre dexemple le systme Reconnaissance de lEcriture Cursive
Arabe Manuscrite RECAM.
On a dautres travaux qui sont focaliss dvelopper un logiciel auto-apprenant
de reconnaissance de caractres manuscrits cursifs (documents anciens notamment).
Ce systme OCR veut saffranchir des bibliothques de langues et de la forme des
caractres. Il doit reconnatre aprs une phase dapprentissage automatique la plupart
des caractres. Plusieurs langues ont t traites parmi eux la langue arabe ; chinoise,
etc. En explorant les mthodes de reconnaissance gnrique. Ils ont orients donc vers
les approches structurelles. Et cela dans le cadre du projet Cognitive Optical
Recognition Old Characters COROC [ARR 02].

I.3. Diffrents aspects de la Reconnaissance Automatique de


lEcriture et du Document ou RAED
Devant la difficult dtablir un systme universel traitant tous les cas dcriture, la
solution court terme consiste particulariser le cadre puis construire lapproche la
plus adapte pour ce cadre. On peut rpartir les systmes de reconnaissance de

8
lcriture dans plusieurs catgories diffrentes : mode dacquisition En-ligne ou
Hors-ligne , Approche de reconnaissance Globale ou Analytique et enfin
Mthode de reconnaissance Statistiques ou Structurelle [SAO 98].

I.3.1. Mode dacquisition (En-ligne / Hors-ligne)


Il est dusage de distinguer deux activits en RAED, les reconnaissances en-ligne et
hors-ligne. Dans le cas de la REM, il existe deux champs dapplications suivant le
mode de saisie. Si le mode de saisie est dynamique, on parle de reconnaissance en
temps rel appele en-ligne ou on-line. Dans le cas de la saisie statique on parle alors
de reconnaissance en temps diffr appele hors-ligne ou off-line [AYA 04].

I.3.1.1. Reconnaissance en-ligne

La reconnaissance en-ligne seffectue partir dune acquisition spatio-temporelle des


caractres ou mots cursifs sur une tablette lectronique (version moderne de la Rand
Tablet prsente sur la figure I.1).

Lcriture en ligne est obtenue lors de sa ralisation par une saisie en continu du trac.
Les donnes se prsentent alors sous la forme dune squence de points ordonns dans
le temps. Dans ce cas, le signal est de type 1D (Unidimensionnel) et le systme de
reconnaissance peut bnficier de la reprsentation temporelle. De ce fait il existe une
analogie avec la reconnaissance de la parole. Il nest donc pas surprenant de voir des
chercheurs appliquer les techniques dveloppes pour la parole lcriture [SAO 98].
Les applications concernes par ces systmes de reconnaissance sont principalement
les interfaces orientes stylo qui cherchent intgrer lcriture manuscrite comme une
nouvelle modalit dinteraction entre lhomme et la machine.

Figure I.1. Rand Tablet ou Grafacon.

Dans les applications de REM en-ligne, l'utilisateur crit sur une table spciale, le
systme va reconnatre l'criture et envoyer le rsultat l'ordinateur. Ces systmes
sont utiliss dans plusieurs quipements lectroniques comme PDA, Pocket PC ou
Tablet PC. Il y a pas mal d'avantages de REM en-ligne, par rapport celle hors-ligne.
Par exemple, car l'utilisateur crit sur une table spciale, il y a moins de bruit. De
plus, on peut dterminer comment un caractre est crit, c'est dire, l'ordre de traits
constituants ce caractre. D'ailleurs, la contrainte du temps de reconnaissance n'est pas
stricte, on peut utiliser des algorithmes complexes. C'est pour quoi le taux de
reconnaissance de ces systmes est assez lev [ALA 05].

9
I.3.1.2. Reconnaissance hors-ligne

La reconnaissance hors-ligne, celle qui nous intresse particulirement prive de


linformation spatio-temporelle, est plus dlicate par rapport la reconnaissance en-
ligne. Elle sapplique une fois que lcriture est sur un support papier qui est
numris puis enregistre sur un format dimage. Cette image contient des pixels soit
de type binaire (pixels noirs et blancs) soit de type entier (image niveaux de gris),
linformation est alors bidimensionnelle (2D). Lobjectif nest plus ici dtablir une
interaction directe entre un scripteur et la machine, mais de traiter des documents de
manire automatique.
Cette reconnaissance hors-ligne regroupe deux thmes : la reconnaissance de
caractres manuscrits isols (numriques ou alphanumriques) et la reconnaissance de
mots. Les applications actuelles visent de plus en plus la lecture automatique de
documents manuscrits de type chques bancaires, courrier postal, des formulaires,...
Dans les applications de REM hors-ligne, l'criture de l'utilisateur est acquise par un
scanneur. L'entre de ces systmes est une image. Alors, le problme devient plus
difficile. Par exemple, comment on peut enlever le bruit comme des lments du fond
d'image, comment on peut traiter le manque des traits etc. De plus, il n'y a pas
d'information supplmentaire comme le cas d'en-ligne. Les applications typiques sont
la classification automatique des lettres, la lecture des chques de banque etc. [ALA
05].

En rsume la difficult de la reconnaissance hors-ligne en trois points suivants :

La dtection de tracs : un systme hors-ligne doit chercher dans limage les


tracs dcrivant le message crit. Par contre, dans les systmes en-ligne le
trac est dj reprsent comme une suite ordonne de point.
Labsence dordre et dinformation temporelle : dans le systme en-ligne, les
informations temporelles fournissent des connaissances prcieuses sur la
dynamique, la vlocit et la morphologie de lcriture et aident enlever en
grande partie lambigut de la reconnaissance de certaines lettres.
La variabilit de lpaisseur du trac : ce problme devient une contrainte
supplmentaire prendre en compte dans les systmes hors-ligne alors quil ne
se prsente pas dans les systmes en-ligne car, dans ce cas, les tracs sont
filiformes.

Rcemment sont apparus des systmes mixtes capables de prendre en compte les
caractristiques statistiques et dynamiques de lcriture. On peut classer ces systmes
en deux types [OLL 99, SOU 06] :

Un systme de reconnaissance en-ligne auquel on adjoint un systme de


reconnaissance hors-ligne, travaillant en parallle sur limage reconstitue du
trac.
Un systme de reconnaissance hors-ligne auquel on adjoint un systme de
reconnaissance en-ligne, travaillant en parallle sur des caractristiques
extraites du trac. La difficult du problme rside dans ce cas dans la
reconstitution de la temporalit du trac.

La reconnaissance hors-ligne peut tre classe en plusieurs types :

10
I.3.1.2.1. Reconnaissance de texte ou analyse de documents

Dans le premier cas il sagit de reconnatre un texte de structure limite quelques


lignes ou mots. La recherche consiste en un simple reprage des mots dans les lignes,
puis un dcoupage de chaque mot en caractres [BEN 99], cest le cas trait dans
notre tude.
Dans le second cas (analyse de document), il sagit de donnes bien structurs dont la
lecture ncessite la connaissance de la typographie et de la mise en page du document.
Ici la dmarche nest plus un simple prtraitement, mais une dmarche experte
danalyse de document il ya localisation des rgions, sparation des rgions
graphiques et photographique, tiquetage smantique des zones textuelles partir de
modles, dtermination de lordre de lecture et de la structure du document [TRE 97].

Ltre humain arrive avec aisance reconnatre n'importe quel document. Cette
facult est assez basique pour un tre humain ; en revanche elle pose jusqu ce jour
encore des problmes pour lordinateur. L'analyse et la reconnaissance d'images de
documents englobent un ensemble de techniques informatiques avec comme but la
reconstitution du contenu du document sous la forme de documents structurs, selon
une forme dfinie par l'application en question. Les documents structurs couvrent
deux catgories de documents : les documents imprims et les documents manuscrits.
Parmi les documents imprims nous distinguons les documents structures simples et
les documents structures complexes [KAR 06].
La reconnaissance de documents sapplique plusieurs langues crites. La langue
latine a reu la plus grande attention de la part de chercheurs. En revanche, malgr le
nombre de personnes qui parlent la langue arabe, peu de travaux de recherche sur la
reconnaissance de documents ont t consacrs cette langue [KAR 06].

I.3.1.2.2. Reconnaissance de limprim ou du manuscrit

Les approches diffrent selon quil sagisse de reconnaissance de caractres imprims


ou manuscrits. Lcriture imprime prsente des caractres bien aligns
horizontalement et spars verticalement, ce qui simplifie la phase de lecture [BEN
01b, BEN 99]. La forme des caractres est dfinie par un style calligraphique (fonte)
qui constitue un modle pour lidentification, par consquent, le problme de la
reconnaissance peut ce concevoir au dpart comme un problme de reconnaissance de
caractres.

En revanche, pour le cas du manuscrit, les caractres sont souvent ligaturs et leur
graphisme est ingalement proportionn provenant de la variabilit intra et inter
scripteurs. Cela ncessite gnralement lemploi de techniques de dlimitation
spcifiques et souvent des connaissances contextuelles pour guider la lecture [FAH
01]. Dans ce cas, le problme de REM sera donc plus un problme de reconnaissance
de mots ou fraction de mots quun problme de reconnaissance de caractres [BEL
92].

I.3.2. Approches de la Reconnaissance


Il y a trois faons daborder la reconnaissance hors-ligne de mots manuscrits [VIN
02]. Soit le systme reconnat le mot comme une entit entire et indivisible, il sagit
dune approche globale ou holistique. Soit il reconnat le mot partir de ses caractres

11
pralablement segments, il sagit dune approche analytique. Soit il nutilise que
certaines proprits et raffine sa description du mot par rebouclage, nous parlerons
alors de systmes bass sur la lecture humaine.

I.3.2.1. Approche globale

Les approches globales reposent sur une description du mot du mme type que celles
utilises en reconnaissance de caractres. Comme le mot est une forme plus complexe
que le caractre, la description contiendra plus dinformations et sera ainsi moins
sensible aux changements de scripteurs. Lapproche globale considre le mot comme
une seule entit et le dcrit indpendamment des caractres qui le constituent. Elle
contourne le problme dlicat de la segmentation en se basant sur une description
globale de toute limage du mot manuscrit. Cette approche prsente lavantage de
garder le caractre dans son contexte avoisinant, ce qui permet une modlisation plus
efficace des variations de lcriture et des dgradations quelle peut subir.

Lapproche globale est gnralement utilise pour la reconnaissance de vocabulaires


statiques rduits tels que celui des montants littraux de chques bancaires [GUI 95,
IMP 97, PAQ 92, SIM 92]. Elle est souvent utilise pour dautres tches. Elles
servent, par exemple, rduire la taille du lexique [MAD 97] ou valider une
reconnaissance analytique [COH 94].

I.3.2.2. Approche analytique

Contrairement lapproche globale, le mot est segment en caractres ou en


fragments morphologiques significatifs infrieurs au caractre appels graphmes. La
reconnaissance du mot consiste reconnatre les entits segments puis tendre vers
une reconnaissance du mot, ce qui constitue une tche dlicate pouvant gnrer
diffrents types derreurs [AMI 96] ; [LEC 93]. Un processus de reconnaissance selon
cette approche est bas sur une alternance entre deux phases : la phase de
segmentation et la phase didentification des segments.

Deux solutions sont alors possibles : la segmentation explicite (externe) ou la


segmentation implicite (interne) (voir section II.2.4). Par ailleurs, les mthodes
analytiques par opposition aux mthodes globales, prsentent lavantage de pouvoir se
gnraliser la reconnaissance dun vocabulaire sans limite priori, car le nombre de
caractres est naturellement fini. De plus lextraction des primitives est plus aise sur
un caractre que sur une chane de caractres [AlB 94a].

Les approches analytiques reposent sur lidentification de parties de limage du mot


comme tant des parties de lensemble des modles prdfinis et connus du
classifieur. La difficult de cette approche a t explicite par SAYRE [SAY 73] :
pour reconnatre les lettres, il faut segmenter le trac et pour segmenter le trac, il faut
reconnatre les lettres . Il convient donc dadopter une mthode itrative qui raffine
la segmentation en fonction des hypothses de classification. Il y a deux faons de
rsoudre ce problme. La premire consiste dissquer [CAS 96] le mot en
graphmes et utiliser la reconnaissance de ces graphmes pour corriger les erreurs de
segmentation. La seconde consiste scanner limage du mot pour y reconnatre des
lettres puis utiliser un dictionnaire afin de valider la reconnaissance.

12
I.3.2.3. Approche base sur la lecture humaine

Les systmes bass sur la lecture humaine reposent sur le principe de la supriorit du
mot (word superiority effect) [REI 69]. Ce principe veut quune lettre soit plus facile
reconnatre dans un mot que seule. Un effet secondaire de ce principe, est la capacit
humaine de reconnatre un mot alors mme que quelques unes de ses lettres sont
inverses. Il apparat donc que la perception de formes particulires dans un mot suffit
sa lecture.

I.3.2.4. Avantages et Inconvnients de lapproche globale et lanalytique

Le tableau I.1 rsume les principaux avantages et inconvnients de lapproche globale et


analytique.
Approche globale Approche analytique
La prise en compte dans le mme modle des C'est la seule approche envisageable pour
variations au niveau de l'criture du mot, dues une reconnaissance dans des vocabulaires
par exemple des erreurs d'orthographe ayant ouverts.
comme rsultat des insertions, des dltions ou Une fois les modles de lettres appris, elle
des substitutions locales. De mme, certaines peut s'adapter facilement un changement de
abrviations qui ne sont pas trop loignes de la vocabulaire.
forme globale du mot peuvent tre prises en Au niveau pratique, peut disposer de
compte. beaucoup plus d'chantillons pour un mme
Le contexte des caractres avoisinants est corpus, ce qui amliore la qualit de
Avantages

mieux modlis. Ainsi, le modle sera sensible l'apprentissage.


aux diffrentes ligatures inter-lettres qui La complexit en mmoire ne dpend pas
dpendent de la nature des caractres qui se de la taille du vocabulaire, celle du calcul
succdent dans le mot. crot avec le logarithme de cette taille si le
Aucune dcision partielle n'est prise avant la dictionnaire est organis sous forme
reconnaissance finale au sens o aucune arborescente.
hypothse n'est mise quant la nature d'une Permet thoriquement une discrimination
partie du mot. plus fine des mots car elle se base sur la
Pour un lexique rduit, le calcul est reconnaissance des lettres qui les composent.
gnralement rapide. Il est possible de rcuprer l'orthographe du
Elle ne ncessite pas, de par sa nature, de mot reconnu.
post-traitement lexical tel qu'une recherche
dans un dictionnaire pour dterminer la validit
de la chane de caractres reconnue.
La discrimination de mots Les phnomnes contextuels inter-lettres ne
orthographiquement ou visuellement proches sont pas pris en compte.
est trs difficile. L'approche est limite des La reconnaissance finale du mot se base sur
vocabulaires rduits allant jusqu' quelques la reconnaissance des lettres individuelles; si
centaines de mots, au del, plusieurs mots plusieurs
peuvent se retrouver avec une description lettres ne sont pas prsentes ou trop
Inconvnients

proche ou la limite identique. dgrades, le mot risque d'tre mal reconnu.


Elle est coteuse en place et temps de Ncessite une tape de segmentation
calcul car chaque mot a un modle qui lui est (explicite, externe ou implicite, interne) avec
propre; la complexit crot linairement avec la les problmes de sous- ou de
taille du lexique. sursegmentation que cela implique.
L'apprentissage des modles ncessite Pour un lexique de taille rduite, l'approche
gnralement une grande quantit analytique requiert plus de calculs.
d'chantillons de mots. Il est en pratique plus
difficile de runir une grande quantit de
mots qu'une grande quantit de lettres.
Un changement de vocabulaire ncessite
l'apprentissage de tous les mots nouveaux.
Tableau I.1 : Avantages et inconvnients des lapproches globale et analytique.

13
I.4. Complexit dun systme de RAED
Dune manire gnrale la complexit dun systme de RAED svalue suivant trois
critres orthogonaux [BEL 01] :

I.4.1. Disposition spatiale du texte


La prsentation dun texte varie globalement entre deux formats : lcriture contrainte
correspondant une criture guide par des cadres (les formulaires par exemple) et
lcriture non-contrainte correspondant une criture guide exclusivement par le
scripteur donc extrmement variable. Les critures externes ou internes dtaches
(criture en btons) sont, bien entendu, les plus aises traiter du fait de la sparation
plus ou moins immdiate des lettres (figure I.2, extraits de la Base CEDAR5).

(a) (b) (c)

Figure I.2. Diffrents types dcritures : (a) criture en btons, (b) criture majuscule, (c)
criture attache.

Les types de contraintes peuvent caractriser lcriture : externes correspondant aux


types dcriture et internes correspondant aux styles dcriture propres chaque
personne. Dans ce qui suit nous exposons les diffrents types et styles dcriture dans
lordre croissant de difficult de traitement :

I.4.1.1. Types dcriture

Prcase : criture dans des cases prdfinies (exemple : cas de bordereaux et


formulaires).
Zone : criture dans des zones bien dlimites (exemple : montant numrique
dans un chque).
Guide : criture sur une ligne support (exemple : montant littral dun
chque).
Libre : criture demplacement quelconque (exemple : notes manuscrites).

1.4.1.2. Styles dcriture

Selon la classification de Tappert en 1984 des styles dcriture (voir figure I.3), on
trouve :

Boxed discrete characters : des caractres majuscules compltement


disjoints, le plus souvent dans des formulaires prcass, vitant ainsi
lopration de segmentation.
Spaced discrete characters : des caractres majuscules ou minuscules
disjoints (script- spar).
Runon discrete characters : le plus souvent des caractres minuscules, mais
majuscules aussi qui peuvent tre jointes ou disjointes rendant la
reconnaissance plus complexe grce aux liaisons frquentes entre les lettres.

14
Pure cursive script : criture purement cursive avec des lettres compltement
connectes, rendant ainsi la localisation des lettres difficilement dissociable de
la tche de reconnaissance.
Mixed cursive and discrete : combinaison des styles prcits, cest le style
dcriture le plus utilis vu sa simplicit et rapidit de trac, cependant cest le
style dcriture le plus difficile reconnatre vue les diffrents variations
permises aux scripteurs.

Figure I.3. Styles dcritures selon TAPPERT.

Il est vident que la reconnaissance dune criture mixte naturelle est un problme
beaucoup plus complexe, du fait de lambigut des limites entre les lettres, que la
reconnaissance dune criture dtache, o la sparation des lettres est quasi
immdiate.

I.4.2. Nombre de scripteurs


La difficult de traitement crot avec le nombre de scripteurs. Trois catgories
dcritures se distinguent : les critures monoscripteurs, multiscripteurs et
omniscripteurs. En mode multiscripteurs, le systme doit tre capable de reconnatre
lcriture de plusieurs personnes prdfinies, alors quen omniscripteur il doit
sadapter nimporte qui.

I.4.3. Taille du vocabulaire

On distingue essentiellement deux types dapplications : celles qui sont vocabulaire


limit (<100 mots) et celles qui sont vocabulaire trs tendu (> 10 000 mots). La
reconnaissance sera bien plus aise dans le premier cas puisquil sera possible de
comparer un mot inconnu avec la totalit des mots du dictionnaire. Dans le second cas
il faudra bien souvent mettre en uvre des dcisions hirarchiques pour rduire le
temps de calcul et lencombrement mmoire.

La figure I.4 prsente un schma synthtique de la complexit des systmes RAED


[BEL 01]. Plus lapplication sloigne du centre du repre, plus la reconnaissance ne
devient difficile.

15
Figure I.4. Graphe de complexit des systmes de RAED daprs BELAID [BEL 01].

Aujourdhui les systmes dOCR contraints et vocabulaire restreint donnent des


rsultats tonnants. Les taux de reconnaissance affichs par ce genre de logiciel
avoisinent les 100% pour les documents imprims ou mono-scripteurs de bonne
qualit [ARR 02].
En attendant, davoir les mmes performances pour les documents manuscrits non
contraints crits par nimporte quels scripteurs. Ainsi, pas mal de recherches sont
faites pour traiter lcriture manuscrites que se soient latines ou arabes bien que la
dernire est rarement traite [SEN 98, PAR 89, ZAD 00] etc.

I.5. Mthodes de classification de la reconnaissance

Toutes les mthodes de la reconnaissance de formes ont t appliques la


reconnaissance de lcriture [BEL 92].
Cependant, les capacits de lhomme reconnatre des objets, des personnes ou
lcriture dune personne inconnue par exemple, quel que soit le contexte (on peut
reconnatre une personne que lon connat de dos, ou encore lire lcriture de tierces
personnes), ce qui a conduit les chercheurs trouver des mthodes et des techniques
de reconnaissance souples et intelligentes. Parmi ces mthodes de classification on
trouve :

Les mthodes statistiques.


Les mthodes stochastiques.
Les mthodes linguistiques.
Les mthodes hybrides.

I.5.1. Mthodes statistiques

Dites aussi mthodes gomtriques, se fondent sur une caractrisation des paramtres
des formes tudies (caractres, mots,). Ces mthodes permettent de prendre une
dcision de classification d'une forme inconnue.

Elle repose sur une description extensive, plutt que comprhensive , des classes
[MER 04]. Bien entendu, il est assez rare que lon puisse prvoir a priori toutes les

16
occurrences possibles de formes observes pour les diffrentes classes. On considre
plus prcisment quune classe est dcrite par un ensemble reprsentatif
dexemplaires de formes appartenant cette classe.

Le concept de classification peut tre exprim en termes de partitionnement despace


de traits, o la forme est transforme en vecteur de caractristiques. Ce dernier
prsente les caractristiques mesures. Elle est fonde sur ltude statistique des
mesures que lon effectue sur les formes reconnatre. Ltude de leur rpartition
dans un espace mtrique et la caractrisation statistique des classes, permettent de
prendre une dcision de reconnaissance du type plus forte probabilit
dappartenance une classe [BEN 99].

Les mthodes statistiques bnficient des mthodes dapprentissage automatique qui


sappuient sur des bases thoriques fondes, telles que la thorie de la dcision
baysienne, les mthodes de classification non supervises etc.

Dans le cas dune description statistique de la forme, le problme est ramen un


exercice danalyse de donnes classique. La classification est base sur une distance
(arbres de dcisions, k plus proches voisins...) [JAI 00] et peut tre de nature
probabiliste ou neuronale [ARR 02].
La mthode statistique comprend les tapes suivantes [MER 04] :

Choix des paramtres,


Construction dune description statistique des classes partir dun ensemble
dapprentissage,
Calcul de la distance dune forme chacune des classes partir de la
description statistique prcdemment labore,
Choix de la classe la plus proche.

Parmi ces nombreuses thories et mthodes on peut citer titre d'exemple:

I.5.1.1. Mthode baysienne

La mthode baysienne consiste choisir parmi un ensemble de caractres, celui pour


lequel la suite de primitives extraites a la plus forte probabilit posteriori par rapport
aux caractres pralablement appris [ANI 92]. Elle a t labore dans le cadre des
statistiques mathmatiques, son application la RdF a t formalise par CHOWEN
1970 [SOU 97]. Cette technique est une mthode de base pour la RdF dans un cadre
probabiliste. Qui sert de rfrence pour les autres mthodes. En particulier pour
l'valuation du taux d'erreur. Elle peut tre formule de la faon suivante :
Soit un problme caractriser par un ensemble de N observations: X ={X1, X2, X3,
...Xn} rparties C classes {C1, C2, C3, Cc}.
On cherche estimer la probabilit d'appartenance posteriori de X chacune des C
classes. Le thorme de Bayes fournit un cadre thorique pour la problmatique de la
classification. Si lon considre un problme de classes C1, . . ., Ck, le thorme de
Bayes permet de calculer les probabilits a posteriori, connaissant les distributions des
observations a priori (1.1) :

17
p( x / Ci ) P(Ci )
p(Ci / x) 1.1
Pi ( x)

p(Ci / x) est la probabilit a posteriori dappartenir la classe Ci connaissant le


vecteur des descripteurs x , p( x / Ci ) est la densit de probabilit du vecteur
dexemples x ( x = [ x 1, x 2, . . . x n]) dans la classe Ci , P(Ci ) est la probabilit a
priori de la classe Ci et Pi (x) est la densit de probabilit non conditionnelle dfinie
par (1.2 ):

k
pi ( x) p( x / Ci ) P(Ci ) 1.2
i 1

Dans le cas dun problme de classification, la formule (1.2) dfinit une rgle de
dcision. La probabilit de mauvaise classification est minimise en slectionnant la
classe qui a la plus grande probabilit a posteriori.

I.5.1.2. Mthode du plus proche voisin

Lalgorithme K Plus Proche Voisins KPPV affecte une forme inconnue la classe de
son plus proche voisin en le comparant aux formes stockes dans une classe de
rfrences nomme prototypes. Il renvoie les K formes les plus proches de la forme
reconnatre suivant un critre de similarit. Une stratgie de dcision permet
daffecter des valeurs de confiance chacune des classes en comptition et dattribuer
la classe la plus vraisemblable (au sens de la mtrique choisie) la forme inconnue
[BEN 99, BUR 04].
Cette mthode prsente lavantage dtre facile mettre en uvre et fournit de bons
rsultats. Son principal inconvnient est li la faible vitesse de classification due au
nombre important de distances calculer.

I.5.1.3. Mthode connexionniste

Dans un modle statistique, la connaissance, c'est--dire la distribution des classes, est


reprsente par un modle mathmatique dont les paramtres doivent tre estims.
Ces modles constituent une limitation puisquils ne seront jamais qu'une
approximation de la forme des classes. Le modle connexionniste surmonte ce
problme en reprsentant la connaissance sous la forme d'un rseau d'units
lmentaires relies par des arcs pondrs. C'est dans ces connexions que rside la
connaissance, et celle-ci peut prendre une forme plus varie qu'avec un modle
mathmatique prdfini. Et Les nuds de ce graphe sont des automates simples
appels neurones formels. Les neurones sont dots dun tat interne, lactivation, par
lequel ils influencent les autres neurones du rseau. Cette activit se propage dans le
graphe le long darcs pondrs appels liens synaptiques [AMA 96].
En OCR, les primitives extraites sur une image dun caractre (ou de lentit choisie)
constituent les entres du rseau. La sortie active du rseau correspond au caractre
reconnu.
Le choix de larchitecture du rseau est un compromis entre la complexit des calculs
et le taux de reconnaissance [SOU 97].

18
Par ailleurs, le point fort des rseaux de neurones rside dans leur capacit de gnrer
une rgion de dcision de forme quelconque, requise par un algorithme de
classification, au prix de lintgration de couches de cellules supplmentaires dans le
rseau [LIP 87].

Il existe de nombreuses topologies de rseaux de neurones, signalons que suivant la


topologie et l'algorithme d'apprentissage utilis. Les connexions entre les neurones qui
composent le rseau dcrivent la topologie du modle. Elles peuvent tre
quelconques, mais le plus souvent il est possible de distinguer une certaine rgularit.
Ce qui donne deux structures de rseaux de neurones :

I.5.1.3.1. Rseaux non boucls

Les neurones sont rangs en couches distinctes o linformation se propage de couche


en couche depuis la couche dentre jusqu la couche de sortie. De plus lintrieure
dune mme couche les neurones ne sont pas connects entre eux. Lapprentissage
utilis est supervis. Ils sont utiliss en classification, modlisation de processus, RdF
(caractres, parole,...), en prdiction,,.
Les rseaux de ce type sont parfois appels rseaux de type perceptron. Le perceptron
monocouche, multicouches et le rseau Radial Basic Functions RBF en font partie.
Ils sont des rseaux de type feedforward cest--dire propagation avant et ils
sont diviss en deux familles Rseaux multicouches et Rseaux connexions locales.

I.5.1.3.2. Rseaux boucls

Ce type de rseaux permet un retour en arrire de linformation. Ils sont caractriss


principalement par les reboucles des sorties en entres. Lapprentissage utilis est
non supervis. Ils sont utiliss couramment pour des taches de traitement de signal,
de modlisation, de commande . Ils sont diviss en deux familles : Rseaux
connexions rcurrentes, Rseaux connexion complte.

I.5.2. Mthodes stochastiques


Contrairement aux mthodes prcdemment dcrites, lapproche stochastique utilise
un modle pour la reconnaissance, prenant en compte la grande variabilit de la
forme. La distance communment utilise dans les techniques de comparaison
dynamique est remplace par des probabilits calcules de manire plus fine par
apprentissage. La forme est considre comme un signal continu observable dans le
temps diffrents endroits constituant des tats dobservations . Le modle dcrit
ces tats laide de probabilits de transitions dtats et de probabilits dobservation
par tat. La comparaison consiste chercher dans ce graphe dtats, le chemin de
probabilit forte correspondant une suite dlments observs dans la chane
dentre. [BEN 99]. Ces mthodes sont robustes et fiables du fait de lexistence
dalgorithmes dapprentissage efficaces [SEY 99]. Si lapprentissage est lent, la
reconnaissance est par contre trs rapide car les modles comprennent gnralement
peu dtats et le calcul est relativement immdiat. Les mthodes les plus rpondues
dans cette approche sont les mthodes utilisant les Modles de Markov cachs
(MMC).

19
Les MMC sont aujourdhui couramment employs en RdF, dans certaines de ces
approches pour la reconnaissance de lcriture, les images des mots sont transformes
en squences de segments dimage au moyen dune procdure de segmentation. Ces
segments sont ensuite transmis un module charg destimer la probabilit selon
laquelle chaque segment apparat lorsque ltat correspondant de la chaine de Markov
est un certain tat.
Par ailleurs, lcriture arabe semi-cursive, aussi bien dans sa forme imprime que
manuscrite, se prte naturellement une modlisation stochastique, en occurrence
markovienne, tous les niveaux de reconnaissance. Ces modles peuvent prendre en
charge le bruit et la variabilit inhrente lcriture manuscrite et dviter le problme
de segmentation explicite des mots.
Cependant, lutilisation des MMCs en reconnaissance de larabe est relativement
limite [BEN 01b].

On peut dfinir un modle stochastique comme un processus alatoire qui change


dtat si, i=1,, N au hasard aux instants t = 1, 2,, T. A chaque tat, il possde une
variable alatoire x (t)=Si, t [1T] qui prend ses valeurs dans lensemble des
observations que lon fait dans le temps du phnomne analys [RAB 89], [BEL 92].
Une volution du systme est donc une suite de transitions dtats partir dun tat de
dpart X (1)=S1 : S1 S2 S3 ST
La loi dvolution du systme consiste avoir les chaines S1, S2,.. Sm, n<=T
avec la probabilit P (S1, S2,ST).Cette probabilit est dfinie de proche en
proche ainsi, pour calculer P, il suffit de se donner la probabilit initiale P (S1) et
celles ou la loi de probabilit des tats un certain instant dpend de la totalit du
systme. On dira que celle ci garde la mmoire de son pass [BEL 92].

I.5.3. Mthodes linguistiques

Ces mthodes consistent mettre en relation la structure des formes analyses et la


syntaxe dun langage formel. La description des formes est ralise par
lintermdiaire de phrases et le problme de classification est ramen un problme
danalyse de grammaire (parsing). De manire gnrale, les mthodes linguistiques
(syntaxiques ou structurelles) permettent la description de formes complexes partir
de formes lmentaires. Ces dernires, encore appeles caractristiques, sont extraites
directement des donnes prsentes en entre du systme. La diffrence principale
entre ces mthodes et les mthodes statistiques est que ces caractristiques sont des
formes lmentaires et non pas des mesures. Une autre diffrence est quelles
introduisent la notion dordre dans la description dune forme. Les mthodes les plus
rpandues utilisent le calcul de distance ddition entre deux chanes et la
programmation dynamique [GRA 03].
Nous allons prsenter dans ce qui suit deux variantes de la mthode linguistique, la
mthode structurelle et la mthode syntaxique.

I.5.3.1. Mthode structurelle

Dans le cas dune description structurelle, il faudra utiliser des formalismes plus
complexes. Les formes sont dcomposes en primitives simples qui peuvent tre des
graphmes ou mme les pixels de limage. Elles sont ensuite reprsentes par un objet
complexe, compos des primitives, comme une chane ou un graphe. Le processus de

20
reconnaissance (grammatical [GON 78], stochastique [BEL 97] ou graphique [BUN
01]) est propre la reprsentation utilise.
Les mthodes structurelles reposent sur la structure physique des caractres. Elles
cherchent trouver des lments simples ou primitifs, et dcrire leurs relations. Les
primitives sont de type topologiques telles que : une boucle, un arc et une relation
peut tre la position relative dune primitive par rapport une autre [ANI 92, HA 96].
Parmi les mthodes structurelles nous pouvons citer :

I.5.3.1.1. Mthodes de tests

Elles consistent appliquer sur chaque caractre trait des tests de plus en plus fins
sur la prsence ou labsence de primitives (dcomposer limage en primitives), de
manire rpartir les chantillons en classes. Le processus le plus habituel consiste
diviser chaque test lensemble des choix en deux jusqu nobtenir quune seule
forme correspondant au caractre entr. Ce choix dichotomique est trs rapide et trs
simple mettre en uvre, mais il est trs sensible aux variations du trac [BEN 99].

I.5.3.1.2. Comparaison de chanes

Les caractres sont reprsents par des chanes de primitives. La comparaison du


caractre trait avec le modle de rfrence, consiste mesurer la ressemblance entre
les deux chanes et se prononcer sur celui-ci. La mesure de ressemblance peut se
faire par calcul de distance ou par examen de linclusion de toute ou une partie dune
chane dans lautre [BEN 99].

Les algorithmes mettre en uvre pour effectuer une classification partir des
primitives structurelles relvent le plus souvent de lalgorithmique gomtrique. On
trouve ainsi typiquement [MER 04]:

Exploration darbres de dcision : cest la forme la plus gnrale (la moins


structure) de vrification de prdicats.
Mise en correspondance de graphes ou sous-graphes, ou encore recherche de
cliques maximales dans des graphes : laccent est ici mis non seulement sur la
prsence de primitives, mais sur les relations qui les lient. Une forme est
dcrite par un graphe encodant ces relations, et la reconnaissance seffectue en
cherchant un appariement entre le graphe dcrivant une classe et celui
construit partir des primitives dcrivant une forme reconnatre.

I.5.3.2. Mthode syntaxique

Une forme apparat comme lassemblage dun certain nombre dlments de base
(primitives ou traits pertinents). La mthode syntaxique est base sur la recherche de
lois dassemblage dlments de base pour former un ensemble construit qui
reprsente la forme. Chaque caractre est reprsent par une phrase dans un langage
o le vocabulaire est constitu de primitives. Les caractres dune mme famille sont
reprsents par une grammaire.
La reconnaissance dune forme inconnue se fait alors par une analyse syntaxique de la
phrase qui la dcrit. Elle consiste dterminer si la phrase de description du caractre
peut tre gnre par la grammaire. Linconvnient de cette mthode est labsence
dalgorithmes efficaces pour linfrence grammaticale directe [BEN 99].

21
I.5.4. Mthodes hybrides
Il existe aussi des mthodes dites hybrides, les modle de Markov cachs en font
partie car ils emploient une approche statistique tout en ayant la possibilit dutiliser
des descriptions structurelles [GRA 03, SOU 06]. Depuis le milieu des annes 90,
lutilisation des MMC pour la reconnaissance de mots latins sest intensifie [AVI 96,
BEL 97, CHE 94, MOR 03], particulirement dans des applications comme la lecture
de chques ou dadresses postales pour lesquelles on dispose de bases de donnes
importantes. Lapproche par modle discriminant en cas de petits vocabulaires; un
modle pour chaque mot, et lapproche par chemin discriminant en cas de grands
vocabulaires ; un modle pour plusieurs mots et cest le dcoupage de Viterbi qui
effectue la reconnaissance, en cherchant le chemin optimal dans un treillis de mots
[SOU 06].
La figure 1.5 illustre les diffrents systmes de reconnaissance, leurs reprsentations
et les diffrentes approches de reconnaissance quon a cite dans le paragraphe ci-
dessus.

Figure I.5. Diffrents systmes, reprsentations et approches de reconnaissance [ARR 02].

22
I.6. Conclusion
Ce chapitre a permis de prsenter notre domaine dintrt : la REM. Aprs avoir pass
en revue un certain nombre de techniques utilises pour la mise en uvre dun
systme de reconnaissance de lcriture, nous avons prsent celui sujet de notre
tude. Dans un premier temps nous avons parl un peu sur lhistorique de LAD et
dterminer leur complexit puis nous avons prsent les diffrents aspects de la
RAED. Nous avons prsent aussi certains concepts gnraux lis lOCR, en
prcisant les principales mthodes de reconnaissance.
Ce domaine de recherche est devenu lintrt des chercheurs durant la dcennie.
Larriver concevoir un systme idal capable dapprocher les performances
humaines reste jusqu aujourdhui un rve pour les chercheurs.

23
CHAPITRE 2

PROCESSUS DE
RECONNAISSANCE
Decriture
MANUSCRITE

24
Chapitre2. Processus De Reconnaissance Dcriture Manuscrite

II.1. Introduction

La reconnaissance de lcriture arabe sintgre dans le domaine de la reconnaissance


de lcriture semi cursive, avec bien sur, des spcificits et de nouveaux problmes
qui lui sont propres. Les premires recherches dans se domaine remontent aux annes
60, mais compte tenu des performances matrielles et logicielles limites cette
poque, elles nont pas abouti des rsultats satisfaisantes.

En gnral, lobjectif de la REM est de dvelopper un systme qui se rapproche le


plus de ltre humain dans sa capacit de lire. Cependant, cette reconnaissance de
lcriture consiste extraire dune forme inconnue (mot, lettres, chiffres) une
description plus simple et tablir sur celle-ci une dcision. Cette dcision est
effectue gnralement en mesurant la ressemblance d'une forme inconnue avec un
ensemble de rfrences stockes en mmoire et dcrites dans une reprsentation
analogue. Les rfrences sont obtenues lors dune phase antrieure qualifie
dapprentissage. Cette phase est trs importante dans tout systme de reconnaissance
de lcriture. Autrement dit cest un passage de lespace observable vers un espace de
dcision dappartenance une classe [BEN 02].

II.2. Organisation gnrale dun SREM


La RdF se considre comme une science dlaboration dalgorithmes permettant de
classer des objets dans laspect varie par rapport un objet type. Elle sintresse la
conception et la ralisation des systmes (Matriels ou logiciels) capable de
percevoir une certaines mesure dinterprter des informations captes dans le
monde physique [BEL 92].

Depuis plusieurs annes, de nombreux travaux de recherche ont port sur les systmes
de reconnaissances hors-ligne ont vue une progression remarquable. Ainsi plusieurs
mthodes ont t dvelopp en sorte daider atteindre des systmes satisfaisants qui
sont exists dans des domaines dapplications varis tels que la lecture automatique
des adresses postales, les chques bancaires et le traitement des documents ; etc.
Il faut distinguer deux types d'criture manuscrite hors-ligne. Dans le premier cas,
chaque caractre est spar par l'utilisateur. Dans le deuxime cas, les caractres sont
crits normalement, c'est dire, les caractres se sont touchs. C'est le systme qui
doit sparer ces caractres. Le problme devient plus difficile. Dornavant, quand on
parle d'criture manuscrite, on aborde le deuxime cas.

On s'appuie sur le schma classique d'un processus de reconnaissance de lcriture


hors-ligne pour dcrire les principaux traitements effectuer. La construction dun
SREM comprend plusieurs tapes distinctes. Les tapes sont reprsentes par la figure
suivante [SOU 06]. Dans un premier temps une phase dacquisition est ralise afin
de numriser linformation manuscrite reconnaitre, suivi dun ensemble de
prtraitements permettant de rduire au maximum la variabilit intrinsque lcriture
ainsi que les bruits introduits lors de lacquisition. Une seconde tape optionnelle, est
celle de la segmentation. Ensuite une tape dextraction des caractristiques sera

25
ralise ; son but est la rduction de la quantit dinformation et dextraction des
caractristiques les plus pertinentes pour la reconnaissance. Nous passons la phase
dapprentissage. Elle permet destimer les diffrents paramtres de la modlisation
choisie, partir du corpus de donnes dapprentissage. Cette tape permet dobtenir
un dictionnaire dhypothses possibles. Un module de post-traitement peut-tre
ajout, en introduisant des informations supplmentaires et : ou complmentaires,
pouvant tre de diffrentes nature : contextuelles, lexicale, syntaxique, smantique.
Elle a pour but damliorer le taux de la reconnaissance.

Figure II.1. Schma gnral d'un systme de reconnaissance de lcriture hors-ligne.

Pour arriver concevoir un bon SREM, il faut bien saisir et comprendre le rle de
chacune des composants qui sont illustrs dans la figure II.1. Il est bon de noter :

qu'il n'y a pas ncessairement de composants fonctionnels dans tous les SREM. Un
SREM peut prendre charge de la fonction de classification sans avoir auparavant
explicitement extrait les caractristiques au moyen, par exemple, d'une certaine forme
quelconque d'appariement par rfrence.
que des composants fonctionnels ne sont pas toujours mis en place titre de
composants incompatibles. Ainsi, un objet logiciel peut extraire des caractristiques et
les classifier simultanment.
que des composants fonctionnels n'interviennent pas ncessairement en squence.
De fait, dans de nombreuses applications, un nombre important d'extractions de
caractristiques sont effectues avant la segmentation.

I.2.1. Phase dAcquisition d'image


Lopration dacquisition constitue linterface entre le systme et le monde rel. Cette
tape consiste capter limage dun texte au moyen des capteurs physiques (scanner,

26
camra,) et de la convertir en grandeurs numriques adapts au systme de
traitement, avec un minimum de dgradation possible.
Cette tape est assez simple mais trs importante car elle influence srieusement les
tapes suivantes. Il y a deux paramtres important :

Rsolution: la rsolution normale est 300 dpi. Pourtant, quand la taille de l'criture
est petite, il faut augmenter la rsolution. La rsolution du scanner (nombre de
points par pouce : ppp ou dots per inch: dpi) dsigne sa capacit digitaliser les
traits fins.
Niveau d'clairage : si on ajuste le scanneur pour que l'image soit plus claire, le
bruit est rduit mais des traits minces disparaissent aussi.

II.2.2. Phase de Prtraitement


Ltape de prtraitement prsente un niveau de complexit plus important en mode
dacquisition hors-ligne que pour le mode en-ligne. Elle a pour but de rduire au
maximum les bruits dans limage et dliminer autant que possible les variabilits
lies au style dcriture [BEL 92], qui peuvent provenir de diffrentes sources : le
matriel, le scripteur ou encore le contexte [BRO 83]. En ce qui concerne le matriel,
certains sont d, dune part au positionnement du papier sur le scanner, crant des
inclinaisons, des bombages et des pliures du papier, et dautre part son contenu
htrogne, le processus de vieillissement fait apparatre des tches dhumidit, la
transparence de lencre sur les rectos, la fragmentation des contours fins, ... etc. Pour
toutes ces raisons la phase de prtraitement est indispensable dans un SREM.
Cette phase consiste prparer les donnes issues du capteur la phase suivante. Il
inclut toutes les fonctions effectues avant l'extraction des caractristiques pour
produire une version nettoye de l'image d'origine. Il sagit essentiellement de
rduire le bruit superpos aux donnes et essayer de ne garder que linformation
significative de la forme reprsente, de corriger les erreurs, dhomogniser,
normaliser et rduire les donnes [BEL 92].

Figure II.2. Effets de certaines oprations de prtraitement.

II.2.2.1. Rduction du bruit

Le bruit se manifeste par la prsence dinformations rsiduelles qui perturbent les


donnes appartenant la forme. Il est souvent d aux capteurs (appareils de mesure
). Lattnuation du bruit est un traitement prliminaire souvent difficile effectuer
car il nest pas forcment bien localis.

27
Dans le cas des images, parmi les mthodes de suppression de bruit les plus courantes,
on retrouve le seuillage et le lissage.

II.2.2.1.1. Seuillage

L'image entre est une image en couleur et les algorithmes de reconnaissance courants
travaillent souvent sur des images binaires. Donc, il faut faire le seuillage.
Larrire-plan tant gnralement plus clair que le trac, la sparation la plus implicite
consiste considrer tous les pixels dont le niveau de gris est infrieur un certain
seuil comme faisant partie du trac et vice-versa. La dtermination du seuil peut tre
globale, c'est--dire que le seuil a la mme valeur pour tous les pixels du document,
ou locale [BEL 92], pour laquelle le seuil varie dune position une autre. Les
mthodes de seuillage global ne sont pas trop consommatrices en terme de temps de
calcul, par contre, elles ne donnent de bons rsultats que si le document est
uniformment clair. Les mthodes de seuillage local sont plus robustes de telles
dgradations mais leur temps de calcul est plus important. La mthode de seuillage
local de base est celle de Niblack, elle fut ensuite amliore par Sauvola [SAU 97].
Ces mthodes calculent le seuil de chaque pixel en fonction de la moyenne et de la
variance des niveaux de gris de ces pixels voisins.

II.2.2.1.2. Lissage

Il permet de rduire au maximum les discontinuits introduites dans limage au cours


des diffrentes transformations et ainsi de rtablir la rgularit et la continuit du
contour du mot. Le lissage consiste examiner le voisinage dun pixel et de lui
attribuer la valeur 1 si le nombre de pixel noir dans cette zone est suprieur un seuil
[GRA 03]. La figure ci- dessous reprsente deux voisinages du pixel p :

Le voisinage en carreau Le voisinage carr


(Quatre voisins pairs) (Huit voisins)

Figure II.3. Le voisinage en carreau et carr.

Limage des caractres peut tre entache de bruits dus aux artefacts de lacquisition
et la qualit du document, conduisant soit une absence de points ou une
surcharge de points. Les techniques de lissage permettent de rsoudre ces problmes
par des oprations locales quon appelle oprations de bouchage et de nettoyage
[BUR 04].
Lopration de nettoyage permet de supprimer les petites tches et les excroissances
de la forme. Pour le bouchage il sagit dgaliser les contours et de boucher les trous
internes la forme du caractre en lui ajoutant des points noirs.

28
II.2.2.2. Redressement de lcriture

Lun des problmes rencontrs en OCR est linclinaison des lignes du texte, qui
introduit des difficults pour la segmentation. Le redressement de lcriture comprend
gnralement deux tapes : la premire vise le redressement de la ligne de base du
mot, la seconde le redressement des caractres. Il convient alors de le redresser afin de
retrouver la structure de lignes horizontales dune image texte.
Cette ligne de base est dfinie comme la ligne sur laquelle reposent les lettres ne
possdant pas de dpassement bas. L'ide est de rendre horizontaux les mots l'aide
d'une transformation gomtrique de type rotation isomtrique des points de l'image
(voir Figure II.4.a) [BEL 01]. Et cela se fait comme suit :
Si est langle dinclinaison, pour redresser limage, une rotation isomtrique dangle
est opre grce la transformation linaire suivante [STE 99]:

Le redressement des critures penches : Cette technique facilite la segmentation


pralable des mots en caractres. L'ide est de trouver l'angle moyen d'inclinaison
puis de faire une transformation gomtrique de type cisaillement de l'image (voir
Figure II.4.b) [BEL 01].

Figure II.4. Exemples de Redressement de mots manuscrits.

Pour dtecter la ligne de base dune image, on peut utiliser la mthode de la projection
horizontale o la ligne de base correspondra la ligne horizontale ayant la plus grande densit
de pixels noirs.

Figure II.5. Dtection de ligne de base.

Les deux oprations de redressements (ligne de base et de caractres) pouvaient tre


faites dans lordre inverse [HEU 03, SOU 06].

II.2.2.3. Homognisation des donnes

Cette opration consiste dbarrasser la forme dinformations redondantes, superflues


et inutiles pour lapplication. Il existe deux principaux types de techniques :

29
Amlioration de la qualit des donnes pour faire ressortir les dtails significatifs
et liminer le reste, laugmentation du contraste dune image en est un exemple.
Slection directe dinformations pertinente appel filtrage. Un filtre passe-bas,
par exemple, laisse passer les basses frquences et attnue les hautes pour craser les
contours.

II.2.2.4. Normalisation

Etant donn que la taille des caractres arabes est trs variable, la normalisation de la
taille est souvent utilise pour chelonner les caractres une taille fixe et pour
centrer les caractres avant dentamer toute extraction car le classificateur va effectuer
plus efficacement sur les images de taille homogne. Cette opration est trs utile
dans les mthodes de reconnaissances qui sont sensibles aux petites variations dans la
taille et la position. Mais si la taille fixe est trs petite, on peut perdre d'information,
si elle est trs grande, l'tape de reconnaissance va oprer lentement [ALA 05].

Dans certains travaux sur la reconnaissance de lcriture, cette opration se fait par le
calcul du rectangle englobant (i.e., Bounding Box : le plus petit rectangle contenant le
caractre) de chaque caractre, en appliquant des fonctions dexpansion
(indpendantes) dans les directions x et y pour rendre le caractre encastr dans un
rectangle de certaine taille. Pour reconnatre les diffrentes tailles ou estimer la
largeur moyenne dun caractre ncessaire sa segmentation, les chercheurs mesurent
la hauteur moyenne dun caractre partir de sa projection horizontale [AlB 95b].
Aprs la normalisation de la taille, les images de tous les caractres se retrouvent
dfinies dans une matrice de mme taille, Pour faciliter les traitements ultrieurs.
Cette opration introduit gnralement de lgres dformations sur les images.
Cependant certains traits caractristiques tels que la hampe dans les caractres (
)par exemple peuvent tre limins la suite de la normalisation, ce qui peut
entraner des confusions entre certains caractres [STE 99].

II.2.3. Squelettisation
La squelettisation sert obtenir une paisseur gale 1 du trait d'criture et de se
ramener ainsi une criture linaire. Le squelette doit prserver la forme, connexit,
topologie et extrmits du trac, et ne doit pas introduire d'lments parasites [BEL
01].
La squelettisation du trac dcriture peut tre utilise pour : simplifier lextraction de
caractristiques ou pour attnuer la variabilit inhrente aux styles dcriture [ALM
87, ZAH 90, GOR 92, ABU 94, ABU 95, AMI 96, ABU 98, ALM 02, ALM 04, ALO
02, KHO 00, AMI 03, ALM 06, ALR 06] ; la localisation de la ligne de base et la
normalisation [PEC 03, PEC 06] ; la segmentation du texte en lignes et les lignes en
mots [ABU 94], [ABU 96] et la segmentation de mots en graphmes [ALM 87, KHO
00, KHO 03] ; et la restauration des informations dynamiques dans lcriture hors-
ligne [ABU 93].

Il existe deux types dalgorithmes de squelettisation: les algorithmes squentiels [YU


90, LAR 98, STE 99] qui sappuient sur un ordre de balayage (les pixels sont
parcourus lun la suite de lautre) pour effectuer la squelettisation ; et les
algorithmes parallles [PAV 81, GUO 92, JAN 92] o le calcul effectu en un pixel

30
est indpendant de celui effectu sur les autres pixels, ce qui permet dexaminer en
mme temps tous les pixels pour gnrer le squelette.

II.2.4. Phase de Segmentation


Dans cette phase les diffrentes parties logiques dune image sont extraites. A partir
dune image acquise il ya dabord sparation des blocs de texte et des blocs
graphiques, puis partir dun bloc de texte il ya extraction des lignes, ensuite partir
de ces lignes sont extraits les mots puis les caractres (ou parties du caractre).

La segmentation permet disoler les lments textuels, mots et caractres, pour la


reconnaissance. Elle se base sur des mesures de plages blanches (interlignes et inter
caractres) pour faire la sparation. La multiplicit des polices et la variation des
justifications empchent de stabiliser les seuils de sparation, conduisant la
gnration de blancs inexistants ou au contraire lignorance de blancs sparateurs de
mots. Ce type derreur est trs frquent, daprs une rcente tude ralise par Nagy &
al dcrite dans [BEL 01].
Il existe deux techniques permettant la mise en uvre de la segmentation :
segmentations explicite et implicite.

Segmentation explicite : segmentation sur des critres topologiques, elle consiste


utiliser des points caractristiques dans le mot [BOZ 89], tels que les minima
locaux du contour suprieur, les espaces ou encore les points dintersection. Cette
approche est antrieure la reconnaissance et nest pas remise en cause pendant la
phase de reconnaissance. Elle doit dtre dune grande fiabilit car la moindre
erreur remet en cause la totalit des traitements ultrieurs.
Segmentation implicite : segmentation d'aprs les modles de lettres, elle consiste
effectuer un dcoupage a priori de limage en intervalles de grandeur rgulire
[MOH 96]. Cette technique est similaire celle utilise en reconnaissance de la
parole, o le signal est divis en intervalle de temps rgulier. Contrairement la
segmentation explicite, il nya pas de pr-segmentation du mot. La segmentation
seffectue pendant la reconnaissance et est guide par cette dernire. Le systme
cherche dans limage, des composantes ou des groupements de graphmes qui
correspondent ses classes de lettres [SOU 06].
Sans segmentation : dtection de la prsence d'une lettre, certains systmes se
basent sur la forme globale des mots. Elles savrent cependant indispensable
lorsque la taille du vocabulaire est importante.

Figure II.6. Les diffrents types de segmentation.

31
II.2.5. Phase dAnalyse ou Extraction des Caractristiques
En REM, les donnes traiter sont des images. Cette reprsentation de linformation
nest pas adapte pour les systmes de reconnaissance. Une tape dextraction de
caractristiques est ralise de manire extraire linformation la plus discriminante
pour la tche de reconnaissance et galement pour rduire le volume dinformations
qui sera fourni au systme. Daprs Jain et al. [JAI 00], la performance dun systme
de classification dpend fortement des relations entre le nombre dchantillons
utiliss, le nombre de caractristiques considres et la complexit du systme.

Pour un problme de classification donn, la principale qualit recherche pour un


ensemble de caractristiques est sa facult de rassembler les objets appartenant une
mme classe dans une partition de lespace de reprsentation, tout en loignant autant
que possible les autres. Cette qualit est souvent appele pouvoir discriminant de
lensemble de caractristiques [SOU 06]. Cette phase est une phase critique lors de la
construction dun systme de reconnaissance. Lune des raisons pour laquelle cette
tape pose un problme est quune grande majorit des techniques dextraction
saccompagne dune perte dinformation irrmdiable. De ce fait, il faut effectuer un
compromis entre quantit et qualit de linformation.

II.2.5.1. Niveaux des caractristiques

Les caractristiques peuvent tre extraites partir des mots, des lettres ou des sous-
lettres, donnant ainsi lieu aux trois niveaux de caractristiques :

Caractristiques de bas niveaux : extraites partir des sous- lettres, ayant des
formes lmentaires tel que les petites lignes, les courbes, les traits, les barres,,
et des particularits gomtriques simples, ce qui fait quelles soient trs
apprcies.
Caractristiques de niveaux moyen : extraites partir des lettres, gnralement
utilises dans les systmes de reconnaissance des caractres cursifs bass sur la
segmentation explicite, citons, titre dexemple de caractristiques de niveau
moyen, les distributions de transitions entre le fond et lcriture.
Caractristiques de haut niveau : ce sont les caractristiques perceptuelles,
facilement visibles, consistant en la dtection dlments structurels, elles sont
indpendantes des styles dcritures vitant ainsi le problme de la variabilit des
formes. Parmi les caractristiques de haut niveau on peut citer : les boucles, les
ascendants, les descendants, en plus des jonctions, les points finaux et traits et les
points diacritiques pouvant tre utiliss pour trouver une reprsentation
approximative du mot, ceci permet de se dbarrasser dune partie du lexique ou de
rejeter un rsultat du processus de reconnaissance dont la reprsentation nest pas
compatible avec celle dtecte.

II.2.5.2. Reprsentation des caractristiques

Le schma de reprsentation des caractristiques varie en fonction des contraintes


dimplmentation et des ventuelles stratgies utilises.

Vecteur et matrice : ce schma est gnralement utilis pour reprsenter les


caractristiques de niveau bas et intermdiaire. Limage du mot est segmente en

32
portions dont les caractristiques sont extraites et reprsents par des valeurs
boolennes, entires ou relles dans une matrice ou un vecteur, cette
reprsentation est moins convenable pour reprsenter les caractristiques de haut
niveau.
Comptage : gnralement utilis pour reprsenter les caractristiques de haut
niveau en calculant le nombre de caractristiques existantes (nombre des
ascendants, nombre des descendants, nombre des boucles,.).
Squence : utilis pour reprsenter les caractristiques de niveau haut et
intermdiaire qui permettent dapproximer le mot par une squence de symboles
reprsentant un ensemble de primitives structurelles.
Structure de graphe : limage est reprsente par un graphe o les nuds
correspondent aux diffrentes caractristiques, et les relations entre elles sont
illustres par des arcs, cette reprsentation graphique est trs puissante car elle
montre la position des caractristiques et leurs relations.

II.2.5.3. Types de caractristiques

Il existe une grande diversit des caractristiques utilises en reconnaissance de mots.


Le choix dun type particulier de caractristiques se rvle toujours difficile pour le
concepteur dun systme de reconnaissance de mots manuscrits car les performances
du systme dpendent avant tout dune bonne dfinition des caractristiques. Les
caractristiques retenues doivent permettre de dcrire de faon non quivoque toutes
les formes appartenant une mme classe tout en les diffrenciant des autres classes.
La difficult du choix de ces caractristiques rside dans le compromis tablir entre
des contraintes telles que la rapidit de dtection des caractristiques, leur facilit de
mise en uvre et leur insensibilit aux distorsions (styles dcriture diffrents, bruits
dans limage,).
Dans la littrature, il existe un grand nombre de travaux concernant lextraction de
caractristiques pour la reconnaissance de lcriture. Afin de les prsenter il est
prfrable de les regrouper en catgories.
Les types de caractristiques peuvent tre classs en cinq groupes principaux :
caractristiques structurelles, caractristiques statistiques, transformations globales, et
superposition des modles et corrlation [KER 00, AlB 95b], et Les caractristiques
topologiques ou mtriques

II.2.5.3.1. Caractristiques topologiques ou mtriques

Le terme mtrique dsigne la mesure d'une distance. La topologie est : ltude des
proprits de l'espace (et des ensembles) du seul point de vue qualitatif [DAR 94].
Concrtement, la topologie consiste, l'aide de sondes appliques directement sur
l'image "brute", effectuer par exemple sur l'chantillon les mesures et les tests
suivants :

Compter dans une forme le nombre de trous,


Evaluer les concavits,
Mesurer des pentes et autres paramtres de courbures et valuer les orientations
principales,
Mesurer la longueur et l'paisseur des traits,
Dtecter les croisements et les jonctions des traits,
Mesurer les surfaces, les primtres,

33
Dterminer le rectangle dlimitant l'chantillon, ou le polygone convexe,
Evaluer le rapport d'longation (ou allongement) longueur/largeur, ...
Rendre compte de la disposition relative de ces caractristiques.

II.2.5.3.2. Caractristiques locales ou structurelles

A la diffrence des caractristiques topologiques, les caractristiques structurelles sont


gnralement extraites non pas de l'image brute, mais partir d'une reprsentation de
la forme par le squelette ou par le contour [DAR 94]. Ainsi, on ne parle plus de trous,
mais de boucles ou de cycles dans une reprsentation filiforme du caractre.
Cependant, pour le reste, les caractristiques structurelles correspondent peu prs
aux caractristiques topologiques.
Parmi ces caractristiques on peut citer [KER 00]:

Les traits et les anses dans les diffrentes directions ainsi que leurs tailles.
Les points terminaux, jonctions et croisements.
Les points dintersections.
Les boucles.
Le nombre de points diacritiques et leur position par rapport la ligne de base.
Les voyellations et les zigzags (hamza).
La hauteur et la largeur du caractre.
La catgorie de la forme (partie primaire ou point diacritique, etc).

Linconvnient de ces primitives est que leur extraction ncessite une squelettisation
pralable du caractre, puisque lpaisseur du trait ne contient pas dinformation.

II.2.5.3.3. Caractristiques statistiques

Ces caractristiques sont drives de la distribution des pixels. [Huette et al]


suggrent 3 familles de caractristiques telles que : les moments invariants, les
projections, et les profils. Elles sont extraites en considrant la distribution des pixels
noirs de lobjet (caractre, mot, chiffres). Le processus didentification de la meilleure
mthode dextraction de caractristiques nest pas vident. Par exemple, Trier et al
rapportent que les moments de Zernike sappliquent bien sur des images niveaux de
gris et que la projection sapplique souvent sur des caractres segments pour
rsoudre leur problme de REM. Cependant, il est ncessaire deffectuer pour chaque
problme de reconnaissance une valuation exprimentale de quelques mthodes
dextraction de primitives les plus prometteuses. Ces expriences permettront de faire
un choix judicieux des primitives extraire car souvent, lutilisation dune seule
mthode dextraction de caractristiques nest pas suffisante pour obtenir de bonne
performance du systme de reconnaissance [BEN 04].

II.2.5.3.4. Transformations globales

Il est intressant pour le domaine de la reconnaissance de forme dessayer dextraire


partir des images, des informations non visible.
Elles sont naturellement bases sur une transformation globale de l'image. Le principe
d'une caractristique globale est de dpendre de la totalit des pixels d'une image. Elle
sert changer despace de reprsentation et ainsi faciliter lextraction de

34
caractristiques pertinentes [SOU 06]. La transformation consiste convertir la
reprsentation en pixels en une reprsentation plus abstraite pour rduire la dimension
des caractres, tout en conservant le maximum dinformations sur la forme
reconnatre.

La transforme de Fourier est certainement une des plus utilise en reconnaissance de


forme et de caractres. Les caractristiques extraites sont en fait les descripteurs de
Fourier bass sur les coefficients complexes des sries de Fourier. Elles sont
invariantes aux rotations et aux changements dchelles.
Une des transformations les plus simples est celle qui reprsente le squelette ou le
contour dun caractre sous forme dune chane de codes de directions [AlB 95b]. La
chane de code obtenue est souvent simplifie pour rduire les redondances et les
changements brusques de direction [HAI 07].

II.2.5.3.5. Superposition des modles (template matching) et corrlation

La mthode de template matching applique une image binaire (en niveaux de gris
ou squelettes), consiste utiliser limage de la forme comme vecteur de
caractristiques pour tre compar un modle (template) pixel par pixel dans la
phase de reconnaissance, et une mesure de similarit est calcule [KER 00].

II.2.6. Phase de Classification


Le choix du classifieur est trs important. Il constitue llment de dcision dans un
systme de RdF. Le but des traitements antrieurs tait dextraire linformation
essentielle caractrisant les objets et de la prsenter sous la forme la plus condense
possible au classifieur.
La classification dans un SREM hors-ligne consiste dterminer la classe
dappartenance de lobjet en entre, elle regroupe deux tches : lapprentissage et la
reconnaissance et dcision. A cette tape les caractristiques de ltape prcdente
sont utilises pour identifier un segment de texte et lattribuer un modle de
rfrence.

II.2.6.1. Apprentissage

Cette tape permet de construire un dictionnaire de prototype. Il sagit de regrouper en


classes plusieurs prototypes dont les caractristiques se rapprochent. Il existe 2 types
dapprentissages : supervis et non supervis.

II.2.6.1.1. Apprentissage supervis

Lapprentissage est dit supervis si les diffrentes familles des formes sont connues
priori et si la tche dapprentissage est guide par un superviseur ou professeur. On
choisit un sous-ensemble de formes, chacune est analyse puis le professeur indique
la classe dans laquelle il souhaite la voir range. Lapprentissage consiste alors
analyser les ressemblances entre formes de la mme famille et les dissemblances entre
formes de familles diffrentes pour en dduire les classes avec les meilleures
sparatrices possibles. Les paramtres dcrivant cette partition sont stocks dans une
base dapprentissage.

35
II.2.6.1.2. Apprentissage non supervis

Il sagit de construire automatiquement les classes, sans intervention de professeur,


partir dchantillons de rfrence et de rgles de regroupement. Ce mode ncessite un
nombre lev dchantillons et des rgles de construction prcises et non
contradictoire, mais nassure pas toujours une classification correspondant la ralit
de lutilisateur.
En fait le rle du module dapprentissage consiste ajuster ses paramtres afin de
donner une rponse lors de la phase de dcision.

II.2.6.2. Reconnaissance

Cette tape consiste dterminer les classes dappartenance des diffrents fragments
extraits de limage originale par ltape de segmentation, cette classification sappuie
sur un certains nombre de connaissances priori comme le type des images
reconnatre (chiffre, mot, lettre, caractre, graphme), le nombre de classes possibles.
La dcision de reconnaissance suppose gnralement un apprentissage pralable et
peut tre effectue en utilisant une multitude de mthodes de classification (Voir
section I.5). Nous citons quelques techniques de classification :

Systmes base de rgles.


Arbres de dcision
Techniques agglomratives
Rseaux de neurones artificiels
Modles de Markov cachs

II.2.6.2.1. Les systmes base de rgles SBR (y compris les systmes experts)

Utilisent habituellement les rgles SI ALORS pour tablir jusqu' quel point les
conditions dans la partie SI sont conformes au modle. Dans les SBRs, il est possible
que deux rgles ou plus (comportant des recommandations de classification
diffrentes) soient applicables la mme forme d'entre. Il en dcoule des conflits et
il faut alors avoir recours des mcanismes de rsolution de conflits. L encore, dans
un systme de reconnaissance de caractres comportant un alphabet 0/1 , on peut
s'attendre avoir une rgle telle que : SI (la forme grande boucle), ALORS (la
classe = 0 ).

II.2.6.2.2. Les arbres de dcision

Les arbres de dcision sont composs dune structure hirarchique en forme d'arbre.
Cette structure est construite grce des mthodes dapprentissage par induction
partir dexemples. Larbre ainsi obtenu reprsente une fonction qui fait la
classification dexemples, en sappuyant sur les connaissances induites partir dune
base dapprentissage. En raison de cela, ils sont aussi appels arbre dinduction
(Induction Decision Trees). Une dfinition un peu plus formelle des arbres de
dcision est la suivante : un arbre de dcision est un graphe orient, sans cycles, dont
les nuds portent une question, les arcs des rponses, et les feuilles des conclusions,
ou des classes terminales [OSO 98].

36
II.2.6.2.3. Les techniques agglomratives

Tentent essentiellement de chercher des points dans l'espace de caractristiques qui


sont prs les uns des autres et de les placer dans la mme classe. Un moyen de le faire
consiste attribuer arbitrairement une classe chaque point dans un ensemble de
points non classs, puis de trouver le centre (ou la moyenne) de chaque groupe de
points similaires classs. De l, chaque point est rattribu la classe du point-centre
qui s'en rapproche le plus. S'ensuit une prnumrisation des points-centres des
diffrentes classes, et le processus est rpt jusqu' ce qu'il n'y ait plus d'attributions
faire [KHA 99].
Les RNA et les MMC sont dcrites en dtails dans le chapitre prcdent (section
I.5.1.3 et section I.5.2).

La reconnaissance peut conduire un succs si la rponse est unique (un seul modle
rpond la description de la forme du caractre). Elle peut conduire une confusion
si la rponse est multiple (plusieurs modles correspondent la description). Enfin
elle peut conduire un rejet de la forme si aucun modle ne correspond sa
description. Dans les deux premiers cas, la dcision peut tre accompagne dune
mesure de vraisemblance, appele aussi score ou taux de reconnaissance.
La validation de mthodes de reconnaissance se fait par comparaison des rsultats de
la reconnaissance automatique aux tiquettes donnes par le professeur. On en tire
donc :

Les taux de reconnaissance qui reprsentent le pourcentage de mots reconnus


parmi les mots prsents
Les taux d'erreurs qui reprsentent le pourcentage de mots accepts par le
systme mais classs de faon incorrecte.
Les taux de rejet qui correspondent la dcision de ne pas classer la forme.

Le systme valuant un critre de dcision peut assigner une forme une classe mais
il peut aussi dterminer avec quelle confiance il effectue cette dcision. Si le critre de
dcision prend des valeurs trs proches pour plusieurs classes, la confiance dans la
dcision est faible.
Le rejet est trs important dans les applications, il va tre modul en fonction
d'impratifs de risque et de cot. Par exemple, il est trs coteux de faire des erreurs
sur la lecture des adresses postales et encore plus sur les montants des chques, on
prfrera donc augmenter les taux de rejet quitte baisser les taux de reconnaissance.

II.2.7. Poste-traitement
Cette tape aide rduire considrablement des erreurs. Cependant, ce n'est pas une
tape compltement spare des tapes prcdentes. Comme le processus de
reconnaissance l'criture de l'humain, l'tape de poste-traitement est intgre
strictement en ces tapes.
Le post-traitement comprend la vrification, l'excution de l'action et l'adaptation.
Cette tape peut tre rajout un systme de reconnaissance de lcriture pour but
damliorer le taux de la reconnaissance, en introduisant des informations
contextuelles permettant de lever lambigut dans la reconnaissance de certains mots
ou caractres, parmi ces informations en citant :

37
Les connaissances pragmatiques sur la longueur moyenne de chacune des lettres,
ou sur le nombre de lettres constituant un mot.
Les algorithmes de correction orthographiques ou morphologiques l'aide de
dictionnaires de digrammes, tri-grammes ou n-grammes.
Les connaissances linguistiques quand il s'agit de la reconnaissance de phrases
entires, on fait intervenir des contraintes de niveaux successifs : lexical,
syntaxique ou smantique.
Lexical : pour valider la reconnaissance effectue en ne retenant que des mots du
dictionnaire, et en rejetant les listes de lettres inconsistantes.
Syntaxique et smantique : pour rduire la liste des mots candidates et valider
ceux qui ont t retenus ltape prcdente. [BEL 01, SAO 98].

Il peut tre aussi envisag si la reconnaissance ne donne pas les rsultats escompt, et
sachant que le problme nest en fait pas rsultant de la reconnaissance elle-mme
mais dun autre module, de lacquisition, du prtraitement ou mme de lextraction
des caractristiques, ou a peut bien tre engendr par une base dapprentissage pas
assez complte.

II.3. Conclusion
La problmatique de la reconnaissance des caractres constitue un sous ensemble de
la RdF, la reconnaissance des caractres tant limite aux formes base de texte.
L'objectif de tout systme de reconnaissance de caractres est de tirer
automatiquement un sens d'une image deux dimensions (ou d'une trace) d'une entre
de texte. On peut dire, cependant, que tous les systmes de reconnaissance de
caractres comportent quatre parties fonctionnelles : le prtraitement, l'extraction des
caractristiques, la classification des formes et le post-traitement.

Selon les auteurs, quelles que soient les techniques utilises, toutes les mthodes de
reconnaissance de caractres doivent relever deux importants dfis : la segmentation
et l'adaptation. La segmentation, ou le manque de segmentation, constitue le plus
grand problme auquel sont confronts les concepteurs qui tentent de monter un
systme de reconnaissance de caractres libre de toute restriction.
L'autre problme important dans la reconnaissance de caractres est l'adaptation,
particulirement en l'absence de la rtroaction directe (d'un tre humain) pour
redresser les erreurs. C'est dire que l'apprentissage ne serait pas surveill et que
l'incertitude persisterait. C'est que la machine aurait dcider elle-mme de l'erreur et
de l'emplacement de l'erreur, une tche qui dans les meilleures circonstances peut tre
ardue.

Dans ce chapitre nous avons abord les diffrentes tapes ncessaires la REM ainsi
que leurs objectifs savoir : les prtraitements, lextraction des primitives etc., qui
doivent tre choisis dune manire rigoureuse par le concepteur, avant de dvelopper
son systme de reconnaissance. Chacune des tapes abordes a ces propres avantages
et inconvnients, certaines tapes engendrent des pertes dinformations. Toutes ces
difficults font que la RdF ne soit pas un processus simple, linaire et vident. Ces
tapes doivent tre bien menes pour ensuite compter sur une classification efficace.

38
CHAPITRE 3

ECRITURE
ARABE
ET
LOcr

39
Chapitre 3. Ecriture Arabe Et LOCR

III.1. Origine de lcriture arabe


Dans ce chapitre, nous prsentons les caractristiques morphologiques de lcriture
arabe. Ensuite nous exposons les principaux travaux dvelopps en OCR arabe, tout
en soulevant les problmes majeurs rencontrs dans ce domaine.
La langue arabe est ne dans la pninsule Arabique aux environs du VIe sicle. Elle
est de la famille des langues smitiques () . La thorie la plus communment
admise reli celle-ci de lcriture nabatenne, lascendante directe de lcriture
aramenne ancienne qui elle est mme issue de lalphabet phnicien. Larrive de
lIslam a profondment marqu lhistoire de la langue et de lcriture arabe [ZGH
02].
Cette langue sest tale trs rapidement et a reli un immense empire, allant du
Proche-Orient, jusquau lEspagne et la Sicile, en passant par toute lAfrique du Nord.
Elle ne sest pas limite au texte coranique, mais elle est devenue une langue de
culture, de philosophie, de sciences et de techniques. La langue Arabe est une langue
officielle de 19 pays. Elle a deux types dcritures possibles :
lcriture classique, pour le Coran et la littrature classique,
lcriture universelle du monde arabe actuel.

III.2. Rforme de lcriture arabe


Durant la retranscription du Coran sur un support scripturaire, il sest avre :

Les 22 consonnes nabatennes taient insuffisantes pour crire les 28 phonmes


arabes.
En plus labsence de points diacritiques et des signes vocaliques qui rduisait la
graphie un simple schma consonantique.

Ainsi la rforme de cette criture est devenue une affaire imprative et trs urgente.
Cest durant califat Abbasside1 que les pionniers de la rforme, dbutrent leurs
travaux. Les plus importantes modifications apportes aux nombres de deux sont
[ZGH 02]:

Ajout des six nouvelles lettres ( ,, , , ,) .


Ajout des points diacritiques, afin de diffrencis les lettres qui partageaient une
forme identique. Des petits points noirs ont t utiliss comme marques de
diffrenciation. Les points taient placs au dessus et au-dessous du contour de la
lettre, individuellement ou par groupes de deux ou trois. Exemple : , , .

III.3. Caractristiques de lcriture arabe


Lalphabet arabe (Tableau III.1) comprend vingt-neuf lettres fondamentales (vingt-
huit si lon exclut la hamza, qui se comporte, soit comme une lettre part entire, soit
comme un diacritique). La hamza une orthographe spciale qui dpend de

40
rgles grammaticales, ce qui multiplie les formes ncessaires sa reprsentation,
puisquelle peut scrire seule ou sur le support de trois voyelles (alif, waw et ya).
De plus lalphabet arabe comprend dautres caractres additionnels tels que et
, de ce fait, certains auteurs considrent que lalphabet arabe comprend plutt 31
lettres que 29.
La considration du symbole ~ qui scrit uniquement sur le support du caractre
, fait apparatre dautres graphismes (Tableaux III.2 et III.3). Lcriture arabe a ainsi
plusieurs spcificits nous nous citons ci-dessous.

Tableau III.1. Alphabet Arabe.

Tableau III.2 Tableau III.3

Tableaux III.2. et III.3. Hamza et Madda et les positions quelles occupent en association
avec Alif, Waw et Ya.

Le sens dcriture va de droite gauche. Il ny a pas de diffrence entre les lettres


manuscrites et les lettres imprimes ; les notions de lettre capitale et lettre minuscule
nexistent pas. En revanche, la plupart des lettres sattachent entre elles, mme en
imprimerie, et leur graphie diffre selon quelles sont prcdes et/ou suivies dautres

41
lettres ou quelles sont isoles (variantes contextuelles). Certaines lettres, cependant,
ne sattachent jamais la lettre suivante : de fait, un mot unique peut tre entrecoup
dun ou plusieurs espaces, lesquels sont aussi utiliss pour sparer les mots. La
longueur de cet espace inter-mot est gnralement suprieure lespace intra-mot
entre caractres non attachs.
Lalphabet arabe est un abjad, le lecteur doit connatre la structure de la langue pour
restituer les voyelles. Cela se traduit par le fait que toutes ces lettres, lexception de
lAlef, sont des consonnes. Le Waw et le Ya sont, elles, des demi-voyelles, dans la
mesure o elles reprsentent la fois une consonne et une voyelle : le Waw se
prononce w ou ou alors que le Ya se prononce y ou i. Ainsi, la racine trilitre
KTB (figure III.1) peut, selon le vocalisme, tre lue kutub (les livres), kataba (il
crivit) ou encore kutiba (qui a t crit).

Figure III.1. Racine trilre KTB en arabe.

La lettre arabe change de forme selon sa position dans le mot. Elle ne s'crit donc pas
de la mme manire au dbut, au milieu ou en fin de mot. Le Tableau III.3 illustre les
diffrentes lettres arabes ainsi que leurs formes au dbut, au milieu ou en fin de mot.
Il est noter la prsence des points diacritiques rattachs aux lettres dont le nombre
varie de un trois points ; Ces points peuvent se situer au-dessus ou au-dessous du
caractre, mais jamais en haut et en bas simultanment. Un nombre important de mots
en arabes sont composs uniquement de consonnes. Nanmoins, nous notons la
prsence de voyelles au sein des mots. Les voyelles se subdivisent en deux catgories
: voyelles longues et brves ; quon va les expliquer par la suite.
Les formes correspondantes un mme caractre, souvent appeles formes internes
, prsentent parfois de sensibles diffrences ; dans certains cas, il est mme difficile
den dduire sil sagit dune mme lettre. Cependant le codage ASMO attribue un
seul code pour les diffrentes formes dun mme caractre, contrairement au latin o
le code ASCII prvoit deux codes diffrents pour la mme lettre dans sa forme
majuscule et minuscule [BEN 99].

Lettre Isol For.F/M/I Lettre Isol For.F/M/I


Alif Dhad
Ba Tad
Ta Thad
Tha Ayn
Jim Gyn
Ha Fa
Kha Qaf
Dal Kaf
Dhal Lam
Ra Mim
Zay Nun
Sin Ha
Shin Waw
Sad Ya

Tableau III.3. Diffrents formes dun caractre arabe.

42
F : forme Finale du caractre.
M : forme Mdiane du caractre
I : forme Initial du caractre.

Certains caractres arabes incluent une boucle qui peut avoir diffrentes formes
(Figure III.2).

Figure III.2. Exemple de formes de boucles dans des styles diffrents.

Certains caractres ne peuvent tre rattachs leur gauche et de ce fait ne peuvent se


trouver quen position isole ou finale, ce qui donnent quand ils existent, des mots
composs dune ou de plusieurs parties quil est convenu dappeler gnralement
PAW (peace of arabic word) ou encore pseudo-mot. Un PAW correspond donc une
chane dun ou de plusieurs caractres (voir Tableau III.4). Lcriture arabe est ainsi
semi-cursive plutt que totalement cursive.

5 PAWs /mot 4 PAWs /mot 3 PAWs /mot 2 PAWs /mot 1 PAWs /mot

, , , , ,

Tableau III.4. Exemple de mots composs de la droite vers la gauche de 1, 2, 3,4 et 5 PAWs
respectivement.

Comme le caractre, le PAW peut se trouver dans des mots diffrents des positions
diffrentes, mais contrairement au caractre, le PAW prsente une structure
morphologique stable, il garde la mme calligraphie dans les diffrentes positions
quil occupe (Tableau III.5).

Initiale Mdiane Finale Isol

Tableau III.5. Le PAW dans diffrents mots et diffrentes positions.

III.4. Vocalisation de lcriture arabe


tant donn que lcriture arabe est une criture purement consonantique, pour
prciser la prononciation, dix signes ont t invents. Les voyelles se subdivisent en
deux catgories : voyelles longues et brves. Il sagit de trois voyelles brves et de
sept signes orthographiques qui sajoutent au-dessus et au-dessous des consonnes
[ZGH 02]; de plus les trois voyelles longues.

43
Les voyelles longues sont composes de trois lettres alif ( ), waaw ( ) et yaa ( ).
Les trois voyelles brves sont :
- fatha ( ) : elle surmonte la consonne et se prononce comme un a en
franais;
- damma ( ) : elle surmonte la consonne et se prononce comme un u en
franais ;
- kasra ( ) : elle se note au-dessous de la consonne et se prononce comme un
i en franais.

Les sept signes orthographiques sont les suivants :


sukun ( ): ce signe indique quune consonne nest pas suivie (ou mue) par
une voyelle. Il est not toujours au-dessus de la consonne ;
les trois signes de tanwin : Nous distinguons une forme particulire dune
voyelle brve savoir la double voyelle. Lorsque les trois voyelles brves
(fatha, kasra et damma) sont doubles, elles prennent un son nasal, comme si
elles taient suivies de n et on les prononce respectivement : an ( ) pour la
fathatan ; in (, ) pour la kasratan ; un ( ) pour la dammatan.

linstar des voyelles brves, la fathatan et la dammatan se positionnent toujours au-


dessus de la consonne contrairement la kasratan qui ne se place quau-dessous de la
consonne ;
chadda ( ) : larabe peut renforcer une consonne quelconque. Ce
renforcement est indiqu laide dun signe nomm chadda ou tachdid
(intensit); La figure III.3 montre le ddoublement de lettre : chadda .

Figure III.3. Le ddoublement de lettre chadda .

wasla ( ): quand la voyelle dun alif au commencement dun mot doit tre
absorbe par la dernire voyelle du mot qui prcde, on en indique llision
par le signe wasla plac au-dessus de lalif ;
madda (): le madda (prolongation) se place sur lalif pour indiquer que cette
lettre tient lieu de deux alifs conscutifs ou quelle ne doit pas porter le hamza.
Ce signe de contraction a la forme dun alif horizontal. Le madda surmonte
aussi les groupes de lettres exprimant une abrviation.

La figure III.4 illustre les types de voyelles de la langue arabe.

Figure III.4. Les voyelles de la langue arabe.

44
Les voyelles sont utilises dans le but dassurer quun texte est lu haute voix sans
erreurs de prononciation. Certains livres tels que le coran, la posie et les livres
dapprentissage de la langue arabe utilisent les voyelles de manire systmatique.
Si en franais 5 signes orthographiques (les accents grave, aigu et circonflexe, le
trma et la cdille) modifient certaines lettres, en arabe toutes les formes de consonnes
sont susceptible de porter chacune des huit signes de voyellation et souvent deux
dentre eux superposs (par exemple chaddah+voyelle et chaddah+tanwin). Outre ; les
caractres arabes voyells ncessitent des matrices de dimensions importantes
notamment en hauteur [BEN 99].
Lcriture arabe est curviligne, compose de consonnes, dans la grande majorit et de
voyelles longues, lies entre elles par des ligatures. Les mots sont constitus d'un
regroupement de lettres. Chaque lettre possde une reprsentation selon la position
dans laquelle elle se trouve : initiale, mdiane ou isole (voir Tableau III.3). La
composition du mot "bienvenue" en arabe repose sur le regroupement de cinq lettres ;
la figure ci-dessous illustre ce mot.

Figure III.5. La composition des mots en langue arabe.

Le mot "bienvenue" en arabe figurant dans la figure III.5 est compos de deux
pseudo-mots, dits aussi fraction d'un mot. En effet, un mot en arabe peut comprendre
un ou plusieurs pseudo-mots composs d'un certain nombre de caractres diffrents.

III.5. Problmes poss par lcriture arabe


Parmi les caractristiques qui distinguent le style dcriture arabe par rapport au style
lapidaire dcriture latine et qui, par consquent, ont engendr des difficults lors de
son introduction aux nouvelles technologies, savoir limprimerie dabord et
linformatique ensuite, nous retiendrons les caractristiques suivantes :

III.5.1. Multitude de graphismes


En scrivant, les lettres arabes se lient les unes aux autres. Cet usage entrane quatre
morphologies diffrentes dune mme lettre en fonction de son emplacement dans le
mot : initiale, mdiane, finale et isole lexception des six lettres qui ne possdent
que deux formes seulement : , , , , , (voir le Tableau III.3).

III.5.2. Ligatures
Lcriture arabe connat trois types de ligatures : les ligatures contextuelles, les
ligatures linguistiques et les ligatures esthtiques. Une ligature contextuelle est une
chane de caractres prenant des formes spciales suivant leur position dans le mot en
obissant des rgles grammaticales strictes et lies uniquement lcriture. Les
ligatures linguistiques sont indispensables pour lcriture dune langue donne et
obissant des rgles grammaticales. Souvent elles ont un statut de lettre et parfois
mme une place part dans le dictionnaire, ce qui les rapproche des digraphes. Les
ligatures esthtiques sont des graphies optionnelles qui existent pour des raisons

45
esthtiques, de lisibilit et/ou de tradition. On peut les remplacer par leurs
composantes sans changer la validit grammaticale, ou le sens du texte.

En arabe, les ligatures contextuelles et linguistiques sont obligatoires et


indispensables pour composer un texte manuscrit, typographique ou
dactylographique. Comme ligature linguistique, larabe ne connat que la ligature lm-
alif. Bien quil sagisse de la lettre lm sous forme initiale suivie de la lettre alif sous
forme finale ; : + =. Comme ligatures contextuelles on aura titre dexemple :
++ + = .
Contrairement aux ligatures contextuelles et linguistiques, les ligatures esthtiques
sont optionnelles. Elles sont utilises dans la palographie et la typographie de qualit.
Les caractres d'une mme chane (ou pseudo-mot) sont ligaturs verticalement (dans
certaines fontes deux, trois et mme quatre caractres peuvent tre ligaturs
verticalement), occultant ainsi toute tentative de segmentation en caractres.
Exemples des ligatures esthtiques au dbut des mots :
: Ligature esthtique entre les 2 premires lettres.
: Ligature esthtique entre les 3 premires lettres.

Figure III.6. Diffrentes combinaisons verticales possibles de caractres [BEN & al 01].

En informatique, les ligatures rendent difficile la reconnaissance optique, laffichage


et limpression des caractres. De plus, Ce chevauchement modifie les dimensions des
PAW et souvent la morphologie de certains caractres ; la ligne de base dans ce cas,
nest plus horizontale [BEN 99].

III.5.3. Vocalisation

Pour prciser la prononciation du texte purement consonantique, les voyelles brves


et les signes orthographiques sont ajouts au-dessus et au-dessous des consonnes (voir
section III.4). Chaque forme de consonne est susceptible de porter chacun des dix
signes et souvent deux dentre eux superposs. Du point de vue technique, les
ligatures esthtiques rendent pratiquement impossible la position exacte de signes de
vocalisation surtout lorsquil sagit dune superposition de trois ou quatre lettres.

46
Figure III.7. Ecriture voyelle.

III.5.4. Normalisation des caractres

En scrivant, certaines lettres arabes montent trs haut comme le alif surmont du
hamza ( ) , le kf ( ) et le lm () , dautres descendent trs bas comme le mm final (
), le h final ( )ainsi que le gm final ( ) et enfin on trouve des lettres trs petites
comme le b ( ), le mm ( ), et le t ( ) mdianes. En typographie, pour que les
petites lettres soient lisibles et distinguables, on est oblig de bien espacer les lignes.
Par consquent, on met beaucoup de mots dans une ligne mais beaucoup moins de
lignes dans une page quavec les caractres latins. En plus lusage des signes de
vocalisation oblige despacer encore plus les lignes.

ces problmes sajoutent :

lcriture et la lecture de larabe seffectuent de droite gauche ;


les formes minuscules et majuscules des lettres sont inexistantes ;
les pays arabes font usage de deux types de graphies pour reprsenter les chiffres :
les chiffres arabes et les chiffres hindous.
D'autre part, le caractre arabe prsente une forme cursive voyelle ncessitant,
pour la majorit des lettres, des matrices de dimensions importantes. Ceci laisse
jusqu' prsent les formes informatises des caractres arabes non encore
normalises.

(a) Ecriture manuscrite.

47
(b) Exemple d'longations horizontales.

Figure III.8. Exemples dcritures arabes refltant ses caractristiques morphologiques.

III.6. Difficults de la reconnaissance de lcriture arabe


Il existe principalement deux types de difficults dans le domaine de la
reconnaissance de lcriture arabe, le premier est li au manque doutils de test et de
validation, alors que le second est li la morphologie de lcriture arabe comme dj
mentionn au dessus (section III.5) :

les outils de test et de validation tels que les bases de donnes dimages servent
valider les rsultats obtenus et valuer de manire unifie les divers travaux
raliss dans des environnements diffrents.
Dautres, tels que les lexiques et les dictionnaires de validation sont
indispensables pour amliorer les performances des systmes de reconnaissance,
suite leur absence, le post- traitement (lexical, syntaxique ou smantique) est trs
peu utilis dans les systmes de reconnaissance de lcriture arabe.
Lcriture arabe a un certain nombre de particularits telles que la forte
dpendance de la calligraphie du caractre de son contexte, la complexit et la
multiplicit des graphies des lettres, la variabilit des liaisons inter-caractres ou
des ligatures horizontales et verticales ainsi que la prsence de chevauchements.
Ces particularits compliquent les tches de choix des procdures de
prtraitement, de la segmentation de textes arabes, de la slection et de
lextraction des primitives.

III.7. Application de la reconnaissance hors-ligne de


lcriture
La REM est le vieux rve de tous ceux qui ont eu besoin d'entrer des donnes dans un
ordinateur. Aujourd'hui, il existe plusieurs domaines dans lesquels la REM est
attendue avec impatience, par exemple dans le tri automatique du courrier, le
traitement automatique de dossiers administratifs, des formulaires d'enqutes, ou
encore l'enregistrement des chques bancaires et postaux.
Nous prsentons dans cette partie de ce chapitre quelques travaux qui ont t raliss
dans le domaine de la reconnaissance de lcriture arabe. Nous constatons que la
majorit des premiers travaux sur la reconnaissance de lcriture arabe hors-ligne
taient consacrs aux caractres imprims puis manuscrits [SOU 06]. Durant la
dernire dcennie ; plusieurs systmes arabes ont t conu pour reconnaitre le mot en
entier sans le segmenter. Dautres ont t conus pour reconnaitre les caractres

48
constituant le mot. En effet, une reconnaissance au niveau des caractres ncessite
gnralement une segmentation au pralable, un processus souvent assez dlicat pour
une reconnaissance fiable. Plusieurs travaux ont t raliss dans ce domaine, nous
citons quelques uns dans le tableau suivant :

Rfrence Systme primitives classification performances

Syntaxique, Comparaison de
[ALM 87] Mots hors-ligne structurelles 91 %
chanes

Mots manuscrit
[GOR 92] hors-ligne Structurelles Syntaxique 90 %

Hors-ligne, manuscrit Dictionnaire (suivi de


[AME 94] Structurelles -
contour)

Appariement de
[ABU 94] Caractres hors-ligne Structurelles 73.6-99.4 %
graphes flous

Hors-ligne, imprim Mise en correspondance


[ALB 95a] Structurelles spatiale de modle de 73.13
primitives
Rseaux de
[AMI 96] Caractres hors-ligne Structurelles 92 %
neurones MLP
Hors-ligne, imprim,
[AMI 97] multifontes Structurelles Rseaux de neurones 98%

Mots hors-ligne Structurelles, descripteurs de HMMs combins de faon 67.8-


[MIL 98] Fourier hirarchique 89.4 %
Hors-ligne, manuscrit
[SOU 99] Structurelles Dictionnaire 83.55%

Hors-ligne, manuscrit
[MAS 00a] Structurelles MMC 96%
Hors-ligne, imprim,
[AMI 00] multifontes Structurelles Arbre de dcision 92%
Hors-ligne, imprim, Rseaux de neurones Fuzzy
[AMI 00b] multifontes Structurelles 95.25%
ARTMAP
Transformation polaire
Hors-ligne, manuscrit
[KHO 00] suivie par transformation de Modlisation par templates 93.2%
Fourier

[ALM 02] Mots hors-ligne Zoning HMMs discrets 45%

Pseudo-Mots Rseaux de
[ALO 02] Zoning, Structurelles neurones et 69.85-73.53 %
HMMs discrets
Statistiques, structurelles, Rseaux de neurones (3
[AZI 02] Hors-ligne, manuscrit -
gomtriques types combins en parallle)

Syntaxique base
[AMI 03] Caractres hors-ligne structurelles sur la logique 86.65 %
inductive
HMMs discrets 72-87
[KHO 03] Mots hors-ligne Structurelles
%
Transformation Loeve HMMs semi- continus
Mots hors-ligne 89 %
[PEC 03] Karhunen
[BUR 04] Hors-ligne, manuscrit KNN, moments - 94%

49
Mots hors-ligne Structurelles, zoning Syntaxique et HMMs
[ALM 04a] 60 %
discrets

[ELH 05] Mots hors-ligne Zoning, concavits


HMMs continus 74.40- 87.20 %

[FAR 05] Hors-ligne, manuscrit structurelles RN ; KPPV ; KPPVFlou 94%

Mots hors-ligne Structurelles, zoning


[SAR 05] Rseaux de neurones MLP 84%
Rseaux de neurones
[SOU 06a] Mots hors-ligne Structurelles transparent, et RN neuro- 84-92%
symbolique

Tableau III.6. Tableau rcapitulatif prcisant les caractristiques et les performances de


certains systmes AOCR.

III.8. Conclusion
Nous avons prsent dans ce chapitre, lorigine de lcriture arabe et leurs principales
proprits morphologiques et typographiques.
Nous constatons que malgr, les difficults de l'criture arabe, on peut avoir des
points de similitude avec l'criture latine, c'est--dire lors de construction d'un
systme de reconnaissance avec une base des images de mots arabe manuscrite ou
imprime, on suit les mme tapes que celle latine, sauf qu'il existe des certaines
diffrences capitales entre eux aux niveaux de l'extraction des caractristiques surtout.
Nous avons aussi pass en revue dans la dernire partie de ce chapitre certains travaux
qui ont t raliss dans le domaine de la reconnaissance hors-ligne de lcriture
arabe. Daprs ce chapitre ; nous dduisons que les problmes majeurs dans ce
domaine se ramnent la cursivit de l criture et la sensibilit de certaines
caractristiques topologiques de larabe ; la variabilit des liaisons inter-caractres
ou des ligatures horizontales et verticales ainsi que la prsence des chevauchements.
Ces difficults rendent le choix des procdures de prtraitement, de segmentation et
dextraction des caractristiques plus dlicate.

50
CHAPITRE 4

Approche globale
pour la
reconnaissance
de mots arabes
manuscrits

51
Chapitre 4. Approche globale pour la reconnaissance de mots arabes manuscrits

IV.1. Introduction
Dans les chapitres prcdents nous avons prsent entre autres les diffrents aspects et
les diffrentes approches dun systme de reconnaissance de forme, nous avons aussi
discut quelques approches et architectures concernant la reconnaissance de mots.
Nous avons consacr ce chapitre pour dcrire larchitecture et les approches
proposes pour mettre en uvre un systme de reconnaissance de mots arabe
manuscrits dans un vocabulaire limit. Nous nous sommes bases sur ltude des
spcificits de lcriture arabe et celles du vocabulaire considr, notamment celui des
48 mots des willayas algriennes.
Ce chapitre est structur en plusieurs sections, en premier lieu, nous dcrivons
larchitecture gnrale du systme, qui est bas sur une combinaison parallle entre
deux approches distinctes exposes dans le prsent chapitre.
Dans la deuxime section nous prsentons les choix effectus et les procdures
utilises pour les tapes de prtraitement et dextraction de caractristiques. Ces
tapes sont communes aux propositions prsentes dans ce chapitre : lapproche
statistique et lapproche neuronale.
La troisime section sera consacre la description des diffrentes mthodes choisies
dans ltape dextraction de caractristique en expliquant en dtail ces mthodes, cette
tape est considre comme le noyau de notre proposition.
La dernire section, sera ddie pour dcrire les approches choisies, en expliquant le
principe de fonctionnement et les oprateurs des algorithmes KPPV ; K-MEANS et
FCM ainsi que lapproche neuronale PNN.

IV.2. Architecture du systme


Lobjectif principal de ce travail est de concevoir et raliser une combinaison de
quatre classifieurs diffrents [3 statistiques et un neuronal] pour la reconnaissance
hors ligne des 48 mots des willayas algrienne arabes manuscrits, multi scripteur
vocabulaire limite. Le systme propos peut sintgrer dans le cadre de tri
automatique du courrier ou lecture d un montant de cheque littral algrien.
Les images sont dabord binarises, lisses, segmentes en mots (voir section II.2.2),
puis les contours de ces mots sont extraits ainsi que leurs squelettes.
Les caractristiques (voir section II.5) reprsentatives de ces mots sont extraites
(daprs une image binaire, contour ou squelette) pour servir dentre aux classifieurs
proposs.
De nombreux travaux montrent que la combinaison de classifieurs (squentielle,
parallle ou hybride) amliore nettement les performances du systme de
reconnaissance par rapport chacun des classifieurs pris sparment. Cependant
l'architecture parallle est celle qui a donn lieu aux travaux les plus importants.
Nous nous sommes focalis dans notre travail sur la combinaison parallle car cette
dernire a prouv son efficacit dans de nombreux problmes de classification [ZOU
04, FAR 05, AZI 02b, NEM 09], ce succs est du sa simplicit de mise en uvre, sa
capacit exploiter les rponses des diffrent classifieurs combiner, en prenant en
compte ou non le comportement de chacun des classifieurs. Dans cette combinaison

52
parallle, chacun des ces classifieurs est responsable de connaitre le mot entier ; Il
doit apprendre les caractristiques globales du mot. La diffrence entre eux cest la
faon de traiter les caractristiques du mot selon le principe de fonctionnement de
chacun des ces classifieurs choisis.
Cette fusion est faite soit de manire dmocratique, dans le sens o elle ne favorise
aucun classifieur par rapport un autre, o bien de manire dirige et, dans ce cas, on
attribue la rponse de chaque classifieur un poids en fonction de ses performances et
ceci est en fonction gnralement du taux obtenu lors de la phase d apprentissage ;
Dans ce chapitre, nous allons dtailler le travail ralis, en donnant dans un premier
temps le schma gnral du systme propos avant de dcrire chaque tape ralise.

Acquisition de limage

Prtraitement

Extraction des caractristiques globale du mot

Classifieur KPPV Classifieur K-MEANS Classifieur FC M Classifieur PNN

Combinaison des classifieurs

Dcision finale

Mot reconnu

Figure IV.1. Schma gnral du systme de reconnaissance de mot manuscrit.

Nous avons fait le choix dutiliser ces quatre types de classifieurs pour plusieurs
raisons. Tout dabord, chacun des classifieurs est diffrent de lautre : la mthode
FCM ne ncessite aucune information priori sur les donnes traiter, elle a t dj
employe avec succs dans la segmentation dimage. De plus, elle permet une
donne dappartenir deux classes o plus (une donne un degr dappartenance
chaque classe). Contrairement la mthode K-MEANS o une donne doit appartenir
ou non une classe. Nous avons pens dimplmenter ces deux mthodes pour

53
comparer les performances entre les rsultats obtenus en dduisant limportance de la
logique floue dans le domaine de la classification des images (dans notre cas les
images reprsentent des mots arabe manuscrits). La troisime mthode implmente
cest la mthode KPPV. lopposition de la mthode FCM, il ncessite une base de
rfrence (des images des mots dj classes). De plus, ce dernier entre dans la
famille des algorithmes dits paresseux : linverse de beaucoup dautres mthodes
dapprentissage automatique (tels que la rgression logistique, les rseaux de
neurones artificiels, les mthodes noyaux, etc.) aucun apprentissage ne prend
rellement place, cest--dire quil ny a pas de phase de dtermination de paramtres
dune fonction par le biais dune optimisation mathmatique [BEL 01]. La dernire
mthode choisie est la PNN qui est incluse dans la famille des rseaux de neurones,
qui ont de grandes capacits de classification et qui ont montr leurs aptitudes en
reconnaissance dcriture [HAI 07, AZI 02b].
Dans la section suivante, nous allons prsenter les prtraitements effectus et la phase
dextraction de caractristiques dcrite dans la section IV.7.

IV.3. Acquisition et Prtraitement


Nous avons commenc notre travail par lacquisition des images des mots arabes par
un scanner, elles sont stockes sous lextension .bmp ; Avant lanalyse de limage
quelques prtraitements sont effectus. Ces dernires comportes la binarisation des
images numriques suivie par un lissage pour rduire le bruit issu lors de ltape
dacquisition. La figure IV.2 illustre ces tapes.

Image brute Niveau De


gris

Ngatif

Seuillage

Lissage

Squelette Contour de limage

Image prtraite

Figure IV.2. Prtraitement de limage.

54
Concernant le prtraitement, un grand problme se pose ; cest celui des boucles qui
risquent dtre bouches ou ouvertes, et aux points diacritiques qui peuvent tre limines
la suite de certaines oprations de prtraitement, ou encore confondues avec le bruit.
En effet, le prtraitement risque daltrer surtout la forme des points diacritiques de manire
les confondre avec le bruit sils sont trop amincis.
Nous avons effectu nos exprimentations sur des 48 mots de willayas algriennes
crits de manire contrainte pour pouvoir appliquer des prtraitements assez
classiques. Les principales contraintes sont :
Ecriture du mot sur une seule ligne (criture guide) avec peu ou pas
dinclinaison.
Absence de fond (utilisation de fond blanc sans texture).
Sparation claire entre les mots.
[AYA 04] prsente une dichotomie des diffrents types dcriture ainsi les classes de
lcriture manuscrite. Sur laquelle nous positionnons nos travaux. Il sagit de
lcriture arabe manuscrite non contraintes (figure IV.3)

Ecriture brute

Imprim MANUSCRIT

En Hors
ligne ligne

Caractre isol Texte continu

Mono- Multi- Script Script


fonte fonte non cursif

cursif

Texte contraint Texte non


contraint

Figure IV.3. Positionnement de notre travail par rapport la dichotomie des types dcriture.

55
Daprs la figure ci-dessus : Le type dcriture trait dans notre travail.

IV.3.1. Binarisation

Initialement, les images sont en niveau de gris, elles sont dabord transformes en
images bimodal (blanc et noir). Cette mthode consiste comparer le niveau de gris
des pixels composant limage avec un seuil partir de lhistogramme. Dans notre cas
nous avons choisi dutiliser un seuil dynamique spcifi pour chaque image dduit
partir de son histogramme [BEN 00, OTS 79, PAV 82].

Figure IV.4. Dtermination du seuil de binarisation.

Figure IV.5. Rsultat dune binarisation.

56
IV.3.2. Lissage

Limage de mots peut contenir du bruit d aux conditions dacquisition, par exemple.
Ce bruit peut se manifester soit par les absences de points (trous), soit par des
excroissances ou des emptements. Le lissage est une transformation locale qui ne
tient pas compte que du voisinage de chaque point de limage. La transformation la
plus frquemment utilise pour le lissage des textes hors-ligne, consiste parcourir
limage pixel par pixel, au moyen dun masque de dimensions 3*3 et modifier
ventuellement la valeur du pixel examin en fonction des ses 8 pixels voisins (nord,
nord est, est, etc.). Ce masque peut tre appliqu, par exemple, pour le bouchage des
trous et llimination des pixels isols. Les techniques de lissage permettent de
rsoudre ces problmes par deux oprations :

IV.3.2.1. Bouchage

Cette opration consiste en un paississement du trac du mot pour mieux extraire les
caractristiques .Il sagit dgaliser les contours et de boucher les trous internes la
forme du mot en lui ajoutant des points noirs [BEL 92, SAR 00].

IV.3.2.2. Nettoyage

A pour but dliminer les petites taches qui na pas pu tre limin par lopration de
lissage et les excroissances de la forme. Elle est ralise de diffrentes manires
suivant le type de bruit enlever. Lalgorithme quon a utilis pour cette tape est le
suivant :

Algorithme Lissage_Image ;
// Soit couleur_P la couleur de P (pixel) de limage avant lissage ;
Pour tout Pixel P de limage Faire
Nbre_Voisins_Noirsle nombre de d-voisins noirs du P ;
Si ( Nbre_Voisins_Noirs < 2) Alors couleur_Pblanc ;
Sinon Si ( Nbre_Voisins_Noirs > 2) Alors couleur_Pnoir ;
Sinon couleur_P ne change pas ;
FinPour ;
Fin.

La Figure IV.6 montre le rsultat de lapplication de cet algorithme.

Figure IV.6 : Rsultat de lissage.

57
IV.4. Segmentation de textes (Traitement dimages de haut
niveau)
Image de texte prtraite

Dtection de la ligne de base Dtection de la ligne haute et Segmentation de texte en


et zone mdiane. basse. lignes

Ligne Zone Ligne Ligne Segmentation de ligne


base mdiane haute basse en mots

Segmentation de mot
en lettres

Figure IV.7. Traitement dimage dhaut niveau.

IV.4.1. Localisation de la ligne de base et la zone mdiane

Dans notre systme, nous supposons que lcriture des mots prsente peu ou pas
dinclinaison (nous navons pas trait le problme de linclinaison).

IV.4.1.1. Localisation de la ligne de base

Dans lcriture arabe, la ligne de base porte une information assez importante qui
nous permet dextraire facilement les diffrentes caractristiques structurelles des
mots. Lune des raisons pour laquelle cette tape pose un problme est quune
localisation errone de la ligne de base saccompagne dune perte dinformation
irrmdiable [BEN 00, SOU 06].

Il y a de nombreux mthodes pour la localisation de la ligne de base et certaine de ces


mthodes sont spcifiques la dtection des inclinaisons et aux redressements des
mots. La mthode que nous avons choisie pour dtecter la ligne de base est celle de la
ligne horizontale ayant la plus grande densit de pixels noirs dans le mot [GOW 90,
TOL 90], cette mthode donne de bons rsultats dans le cas o les mots sont
parfaitement horizontaux ou quils ont une inclinaison lgre. Lalgorithme de la
localisation de la ligne de base de cette mthode ncessite le calcul de lhistogramme
horizontal de limage du mot binaire et lisse. Le calcul de lhistogramme horizontal
se fait par une projection horizontale du mot de la manire suivante:

58
Algorithme Calcul_ Histo_Horz ;
Initialiser un tableau Histo_Horz 0, a comme dimension le nombre de ligne dans
limage ;
Pour i Allant de 1 nombre ligne de limage Faire
Pour j Allant de 1 nombre colonne de limage Faire
Si ( couleur_pixel(i,j) = noir ) Alors
incrmenter Histo_Horz[j] de 1;
FinPour;
FinPour;
Fin.

La ligne de base correspond lindice k du Histo_Horz tel que Histo_Horz[k] a la


plus grande valeur.

Ligne base

Figure IV.8. Ligne de base du mot Tamenraset .

IV.4.1.2. Localisation de la zone mdiane

La zone mdiane peut tre dfinie comme le corps principal du mot qui englobe les
lettres qui nont ni ascendant, ni descendant, voir Figure (IV.9). La localisation de la
zone mdiane nous a permet la dtection des extensions (hautes et basses) dans
lcriture.
Lide quon a utilis pour localiser cette zone est destimer sa hauteur (en pixels) par
rapport la ligne de base. Nous avons ralis une analyse statistique de sa hauteur par
rapport la ligne de base sur un ensemble dchantillons qui contient 100 mots crits
par diffrents scripteurs, et qui sont homognes, cest--dire que lensemble des
images a t scann avec la mme rsolution. Les rsultats quon a obtenus montrent
quil existe une certaine stabilit pour lensemble des chantillons.

Ligne base haute

Zone mdiane

Ligne base

Figure IV.9. Zone mdiane du mot Oum-el-bouaghi .

59
En effet, pour la plupart des chantillons la hauteur de la zone mdiane est comprise
entre 12 et 16 pixels, bien sr quil nexiste pas une estimation parfaite, cause de la
grande variabilit de lcriture et lpaisseur du trait de lcriture.

LBH
Zone mdiane

LB Hauteur=14 pixels

Figure IV.10. Illustration de la hauteur de la zone mdiane en pixels dans un mot


chantillon.

Donc aprs avoir localiser la ligne de base, la zone mdiane peut tre cerne de la
manire suivante :
Soit LB : Ligne de base,
Et soit LBH : Ligne base haute, voir Figure (IV.10),
LBH=LB seuil ; o seuil [12,16].
Enfin, le corps du mot ou la zone mdiane est localise entre LB et LBH.

IV.4.2. Localisation de la zone suprieure et la zone infrieure

IV.4.2.1. Localisation de la zone suprieure

La zone suprieure est la zone qui contient les dpassements hauts dans un mot. Elle
nous permet de dtecter les hampes et les points diacritiques hauts.

Zone suprieure Ligne haute


Zone mdiane Ligne base haute
Ligne de base

Figure IV.11. Zone suprieure du mot Oum-el-bouaghi .

60
Pour localiser cette zone il suffit de dtecter la ligne haute, voir Figure (IV.11). Etant
donn que limage est binaire et lisse et qui ne contient pas des bruits (pixels noirs
qui nappartiennent pas la forme (le mot traiter). Nous balayons limage ligne par
ligne, colonne par colonne et de haut en bas, ds que nous trouvons le premier pixel
noir nous considrons sa ligne comme une ligne haute.
Enfin la zone suprieure est cerne entre la ligne haute et la ligne base haute.

IV.4.2.2. Localisation de la zone infrieure

La zone infrieure est la zone qui contient les dpassements bas dans un mot. Elle
nous permet de dtecter les jambages et les points diacritiques bas.

Ligne base haute


Zone mdiane
Ligne de base
Zone infrieur
Ligne basse

Figure IV.12. Zone infrieure du mot Oum-el-bouaghi .

Le principe de localisation de la zone infrieure que nous avons utilis, est le mme
que pour la localisation de la zone suprieure, il suffit de dtecter la ligne basse, voir
Figure (IV.12). Nous supposons que limage est binaire et lisse et qui ne contient pas
des bruits (pixels noirs qui nappartiennent pas la forme).nous balayons limage
ligne par ligne, colonne par colonne mais cette fois ci de bas en haut, ds que nous
trouvons le premier pixel noir nous considrons sa ligne comme une ligne basse.
Nous obtenons alors la zone infrieure qui est cerne entre la ligne de base et la ligne
basse.
Il se peut quil existe des mots qui ne possdent pas des zones suprieures et/ou des
zones infrieures, ce sont les mots qui nayant pas des ascendants et des points
diacritiques hauts et/ou des descendants et des points diacritiques bas.

IV.4.3. Dtection des composantes connexes


La segmentation consiste dtecter les diffrentes composantes connexes CCs
(groupe de pixels noirs lis) dune image et reprsenter chacune avec une couleur
diffrente.
Un mot arabe se compose gnralement dune ou plusieurs CCs, chacune contient un
ou plusieurs caractres. Par exemple dans le mot de Oum-el-bouaghi nous
trouvons six CCs. Mais, pour un premier temps nous considrons chaque point
diacritique dans le mot comme une CC, puisquil constitue un ensemble de pixels qui
forment une connexit. Cest dans ltape danalyse que nous allons les dterminer
comme des points diacritiques appartenant une CC. La figure suivante montre les
diffrentes CCs dans le mot de Oum-el-bouaghi . Dans notre cas nous nutilisons
pas les CCs, nous traitons le mot entier.

61
Figure IV.13. Les 11 composantes connexes qui forment le mot Oum-el-bouaghi .

Lide que nous avons utilise est ltiquetage de chaque CC dans le mot.
L'tiquetage consiste attribuer un label, tiquette ou numro diffrent pour chaque
CC et identique pour tous les pixels d'une mme composante. Il existe de nombreux
algorithmes ralisant cette fonction. Ils dpendent de la connexit considre et se
diffrencient aussi par leurs approches squentielles ou parallles [DAR 94].
Une CC peut alors tre extrait par l'intermdiaire de son tiquette pour faire un
traitement spcifique. La figure illustre le rsultat de ltiquetage, chaque CC
correspond une couleur (non noire) dans l'image de droite.

Figure IV.14. Illustration du rsultat de lextraction des composantes connexes.

IV.5. Squelettisation
Un algorithme de squelettisation efficace doit permettre la rduction de la quantit de
donnes et la prservation uniquement des caractristiques essentielles de la forme, de
plus, il doit avoir les proprits suivantes :
1) Prservation de la connexit de la forme.
2) Convergence vers des squelettes dpaisseur unitaire.
3) Approximation de laxe mdian de la forme.
4) Rduction maximale de donnes.
La conception des algorithmes de squelettisation ddis certains types dcriture
comme le latin, chinois, etc. tait un domaine de recherche trs actif, et la littrature
en est trs abondante [LAM 92]. En revanche, les algorithmes destins
spcifiquement la squelettisation de lcriture arabe restent relativement peu
nombreux [MAH 91, ALT 95, ALP 97]. Notons que lapplication directe des
algorithmes de squelettisation conus notamment pour lcriture latine ou chinoise sur
lcriture arabe ne permet pas dobtenir des squelettes adapts, du fait de la prsence
de marques diacritiques, et la squelettisation de ces marques par ces algorithmes peut
les faire disparatre ou les dformer totalement. Par exemple, un point diacritique
comme dans la lettre " "peut se transformer aprs squelettisation en un petit trait, ce
qui nest plus adapt pour lcriture arabe manuscrite, car il est trs frquent que
certains scripteurs utilisent un petit trait la place de deux points comme dans la lettre

62
" ". A cause de ces problmes, les marques diacritiques sont parfois extraites de
limage dcriture avant la squelettisation puis sont classifies sparment [ZAH 90],
[BEN 07]
Dans notre cas, La mthode utilise consiste appliquer des amincissements
successifs sur limage binarise jusqu' ce que le mot rsultant ne contienne que des
lignes d'paisseur 1 pixel. La mthode ncessite l'emploi successif de 8 masques.

Figure IV.15. Rsultat de squelettisation.

IV.6. Traage de contours

Le contour, bordure ou i-contour, dun ensemble connect de pixels R est dfini


comment tant lensemble de tous les pixels de R qui possdent au moi un d-
Neighbors nappartenant pas R.
Le d-contour de R est lensemble de pixels de R qui possdent au moins un voisin
nappartenant pas R [PAV 82].

Figure IV.16. Extraction de contour.

IV.7. Extraction des caractristiques globales et description


du mot

Cette phase doit assurer un maximum de fiabilit, car les traitements ultrieurs ne
vont plus manipuler limage dorigine mais plutt les rsultats fournis par ce module,
donc le choix des primitives extraites est primordial pour garantir le succs dune
mthode de reconnaissance de forme, pour cette raison cette phase prsente lobjet de
notre travail.
La reconnaissance dune forme est base sur une description de celle-ci. La
description peut ainsi tre vue comme une modlisation mathmatique de lobjet
permettant un calcul de distance entre deux ou plusieurs modles. Il existe un trs
grand nombre de descriptions possibles pour une forme suivant linformation

63
modliser [TRI 96] et les invariances exprimer. LONCARIC [LON 98] distingue
trois classifications possibles pour les descripteurs de forme :

La premire, la plus courante, vient de PAVLIDIS [PAV 78] qui considre dune
part les descripteurs bass sur la frontire (descripteurs externes) et dautre part
ceux bass sur la forme elle-mme (descripteurs globaux ou internes).
La seconde consiste diffrencier les descripteurs numriques (scalaires ou
vectoriels), des descripteurs qui ne le sont pas, galement dsigns comme
techniques appartenant au domaine spatial.
Enfin la troisime classe les descripteurs selon quils prservent entirement ou
seulement partiellement linformation contenue dans la forme.

Nous exposons, ici, diffrentes approches utilises en description de formes. Le


tableau IV.1 montre quatre formats de reprsentation dimage arrangs en colonnes
qui sont : image de gris, image binaire, le contour et le squelette. Pour chaque format,
des mthodes dextraction de caractristiques raisonnables sont indiques. Notons que
le choix des caractristiques et du format de reprsentation ne sont pas totalement
dpendants ni tout fait indpendants. Les mthodes dextraction peuvent tre
distingues selon deux classifications diffrentes dcrites dans le tableau IV.2. Cette
taxonomie sappuie sur la relation entre les caractristiques et la mthode de
classification utilises. Ainsi, deux catgories de classifieurs sont considres :
structurelles et statistique. Les caractristiques sont organises en lignes selon deux
classes : heuristique et systmatique.

Caractristiques Image de gris Image binaire Contour Squelette


Appariement X X X
Motif dformables X X
Transformation unitaire X X
Transformation log-polaire X X
Moments gomtriques X X
Moments Zernik X X
Ondelettes X X
Algbriques X X
Histogrammes de projection X
Masques X X
Profil du contour X
Code de Freeman X
Spline X
Descripteurs de Fourrier X X
Description graphique X
Discrets X
zonage X X X X

Tableau IV.1. Taxonomie des mthodes dextraction de caractristiques selon la


reprsentation de limage, daprs [LAA 97].

64
Structurel Statistique
Heuristique Caractristiques discrites zonage
Code de Freeman Volumtrique
Systmatique Spline Profil du contour
graphe Descripteurs de Fourrier

Tableau IV.2. Taxonomie des caractristiques selon la mthode de classification.

IV.7.1. Choix des caractristiques

Le concepteur dun nouveau systme de reconnaissance se trouve toujours confront


ce choix dlicat lors de la dfinition de son ensemble de caractristiques. Les
caractristiques utilises dans ce travail sont prsentes par la suite, notant que ces
caractristiques sont implmentes en MATLAB.
Daprs le tableau IV.1, Nous pouvons reprsente limage sous forme binaire,
contour ou squelette ; et les caractristiques peuvent tres extraites partir de chacun
deux. Notre but dans ce travail est davoir une bonne reprsentation de limage.
Trois ensembles de caractristique sont proposs, le premier ensemble bas sur
limage binaire ; le deuxime bas sur le contour et le troisime bas sur le squelette
de limage.
Les descriptions numriques rsument linformation contenue dans la forme entire
par un vecteur dattributs. Il existe une multitude de descripteurs dans la littrature
nous prsentons dans ce qui suit les trois descripteurs utiliss dans notre travail : les
moments de Zernike et le contour et le zonage.

IV.7.2. Descripteurs globaux


Limage I dune forme peut tre dcrite par une application f : (x, y) {0, 1} o (x,
y) I sont les coordonnes des pixels de limage. Si le pixel (x, y) est en dehors de la
forme f(x, y) = 0 et f(x, y) = 1 sil appartient la forme. lensemble des points de la
forme est not F = {(x, y) I|f(x, y) = 1} et I(n m) est le support de limage avec m
le nombre de lignes et n le nombre de colonnes. Parmi les descripteurs globaux on
trouve les moments de Zernike. Daprs les tudes rcentes nous avons trouv que ce
descripteur est le meilleur dans le cas dune image binaire :

Les moments de Zernike

Les moments sont utiliss en physique pour dcrire la rpartition des masses dans un
corps. En analyse dimage, on peut envisager la mme dmarche en associant le
niveau de gris dun point de limage la mme lmentaire en un point. Donc les
moments fournissent des informations concernant larrangement spatial de limage.
Les polynmes de Zernike ont t dfinis en 1934 dans le cadre de la thorie de la
diffraction optique [ZER 34]. Drivs de ces polynmes, les moments ont t utiliss
par de nombreux auteurs en reconnaissance de caractres [TEA 80, KHO 90a, KHO
90b, BEL 91b]. Plusieurs tudes montrent galement la supriorit de ces descriptions
par rapport dautres approches [TEH 88, KIM 00]. Ils sont dfinis par les quations
suivantes :

4.1

65
Avec

4.2

n : un entier positif ou nul


m : un entier tel que que |m| n
p : la longueur du vecteur entre lorigine et le pixel (x,y)
: Langle entre le vecteur p et x
Rnm : un polynme radial

4.3

Les moments de Zernike est donc la projection dune fonction f(x,y) dcrivant une
image sur un espace de polynmes orthogonaux engendr par [ZHE 00].
On dsigne par moments de Zernike une srie de calculs utilise pour transformer une
image en un vecteur de composantes relles reprsentant les moments Zij.
Les moments sont invariants par rotation, translation et changement dchelle (aprs
normalisation de la taille de la forme). De plus, grce lexploitation dune base de
fonctions orthogonales, ces moments sont peu corrls. Ces caractristiques sont trs
importantes pour dcrire les mots arabes cause de ses grandes variations dcritures
comme nous avons prsents dans le chapitre 1 section III.3)
Lordre des moments possde une grande influence sur la conservation de
linformation angulaire. Plus lordre est lev et plus les variations angulaires dcrites
sont fines. Dans notre systme ; nous avons utilis les 100 premiers moments de
Zernike.

IV.7.3. Descripteurs externes

Comme pour une forme, limage I dun contour peut tre vue comme une application
g(x, y) {0, 1} o (x, y) I sont les coordonnes des pixels de limage. Si le pixel
(x, y) est en dehors du contour g(x, y) = 0 et g(x, y) = 1 sil appartient au contour.

IV.7.3.1. Extraction de contour

Il y a plusieurs mthodes pour obtenir le contour dune forme binaire. Les plus
simples sont les mthodes morphologiques (rosion, dilatation,etc) [ARR 02].
Le contour interne dun objet sobtient par une rosion dun objet A (suivant
llment B) suivie dune diffrence :

A (A B) 4.4

Le contour externe sobtient par une dilatation la forme partir dun masque 3 3
plein puis en lui soustrayant limage de dpart (figure III.17):

A (A B) 4.5

66
Figure IV.17. Extraction morphologique de contour externe, (a) image originale, (b) image
dilate, (c)contour externe.

IV.7.3.2. Dtermination des contours des mots

Lopration de traage des contours de limage sert dcrire limage dun mot sous
forme dune liste de contours pouvant contenir des contours externes correspondant
soit aux composantes connexes primaires du mot (corps principal) ou ses
composantes secondaires (points diacritiques), soit des contours internes (occlusions).
Cette oprations nous a permettre de dterminer la chane de code de Freeman de
chaque trac du mot, qui va nous donner par son alphabet un critre de similarit nous
permettant de mettre en correspondance les contours de deux images stroscopiques.
Son principe est de dcrire les arcs formant un contour par une suite de vecteurs de
taille lmentaire et de direction choisie dans un ensemble fini. La direction d'un arc
est code par une valeur comprise entre 0 et 7 dans le sens trigonomtrique.

IV.7.4. Zonage
Le principe de cette mthode est rsum en trois tapes suivantes :

1) calculer le nombre total de pixels blancs dans limage.


2) diviser limage en p x q zones de mme taille.
3) Pour chaque zone, on calcule la valeur moyenne de pixels blancs de tous les
pixels blancs de limage, en appliquant cette formule :

C j Rj N 4.6
O

Cj : concentration des points blancs dans la zone j.


Rj : nombre de points blancs dans la zone j.
N : nombre total de points blancs du mot.

Le rsultat obtenu sera utilis comme un lment du vecteur de caractristiques.

IV.7.5. Caractristiques structurelles dun mot arabes


Dans notre systme, nous avons retenu aussi les caractristiques globales structurelles
suivantes qui sont en totalit 9 :

Le nombre de hampes dans chaque composante connexe.


Le nombre de jambages dans chaque composante connexe.
Le nombre de boucles dans chaque composante connexe.

67
Et les points diacritiques qui sont :

Le nombre de un point unique haut dans chaque composante connexe.


Le nombre de deux points lis hauts dans chaque composante connexe.
Le nombre de trois points lis hauts dans chaque composante connexe.
Le nombre de un point unique bas dans chaque composante connexe.
Le nombre de deux points lis bas dans chaque composante connexe.
Et une caractristique statistique qui reprsente le pourcentage de chaque
composante connexe dans le mot (Le nombre des composantes connexes).

Lcriture arabe sous sa forme imprime ou manuscrite est semi-cursive par nature,
elle impose donc la notion de sous-mot et prsente une certaine richesse en
diacritiques, permettant de diffrencier des lettres ayant la mme forme de base.

Pour dcrire les diffrentes caractristiques cites ci-dessus nous avons besoin de
certaines informations lmentaires qui sont:

la hauteur de la zone suprieure du mot en pixels. On la dsigne par HS.


la hauteur de la zone infrieure du mot en pixels. On la dsigne par HI.
la hauteur de la zone mdiane du mot en pixels. On la dsigne par HM.
Laire dune composante connexe est le nombre total des pixels noirs qui
forment cette connexit. On la dsigne par AC.
laire suprieure dune composante connexe qui reprsente le nombre des
pixels noirs de la composante connexe dans la zone suprieure du mot. On la
dsigne par ACS.
Laire infrieure dune composante connexe qui reprsente le nombre des
pixels noirs de la composante connexe dans la zone infrieure du mot. On la
dsigne par ACI.
La hauteur du composante : Cest la hauteur en pixels entre la ligne basse et la
ligne haute de la composante connexe, voir Figure (III.18). On la dsigne par
HC.
La hauteur de composante suprieure : Cest la hauteur en pixels de la
composante connexe dans la zone suprieure du mot. Elle est dfinie entre la
ligne haute de la composante et la ligne base haute du mot. On la dsigne par
HCS.
La Hauteur de composante infrieure : Cest la hauteur en pixels de la
composante connexe dans la zone infrieure du mot. Elle est dfinie entre la
ligne basse de la composante et la ligne de base du mot. On la dsigne par
HCI.

La figure suivante rcapitule tout ce quon a dfini jusqu prsent :

68
Ligne haute
Hauteur suprieure(HS)
Ligne base haute
Hauteur mdiane(HM)
Ligne de base
Hauteur infrieure(HI)
Ligne basse

Hauteur Composante Ligne haute de la composante


Suprieure(HCS)
Hauteur composante(HC)
Hauteur Composante
Infrieure(HCI)
Ligne basse de la composante

Figure IV.18. Illustrations des diffrentes informations ncessaires pou lanalyse dune
composante connexe.

En ce qui concerne les diffrentes informations de la composante connexe (AC, ACS,


ACI, ligne haute de la composante et la ligne basse de la composante), elles sont
extraites partir dune analyse de lhistogramme horizontale de cette dernire. On fait
une projection horizontale de tous les pixels de la composante connexe pour obtenir
cet histogramme, ensuite on obtient :

Ligne haute de la composante : corresponde au dbut de lhistogramme.


Ligne basse de la composante : corresponde la fin de lhistogramme.
AC : est la densit des pixels dans lhistogramme.
ACS : est la densit des pixels du dbut de lhistogramme jusqu Ligne base
haute du mot.
ACI : est la densit des pixels du ligne base du mot jusqu la fin de
lhistogramme.

Comme on a indiqu pour les mots, certaines composantes connexes aussi peuvent ne
pas avoir des zones infrieures et/ou des zones suprieures. Alors, pour chaque
composante connexe dtecter lors de ltape de prtraitement, on a effectu un certain
nombre de traitement pour extraire leurs caractristiques structurelles, cest ce quon
va discuter dans ce qui suit.
Dans lcriture arabe, un mot se compose gnralement dune ou plusieurs
composantes connexes, chacune contient un ou plusieurs caractres, et contient
diffrentes caractristiques structurelles comme :

Les hampes qui sont les dpassements hauts (ascendants).


Les jambages qui sont les dpassements bas (descendants).
Les boucles (occlusions).
Les points diacritiques qui sont :
le point unique haut (PSH) ;
les deux points lis hauts (PDH) ;
les trois points lis hauts (PTH) ;
le point unique bas (PSB) ;
les deux points lis bas (PDB) ;

69
Les figures (IV.19.a et IV.19.b) suivante rcapitulent ces caractristiques :

Hampes boucles hamza


Deux points lis hauts

Deux points lis bas Jambages point unique bas

a : caractristiques structurelles dans un mot crit en arabe.

6 composantes connexes

b : Composantes connexes dun mot arabe.

Figure IV.19. Topologie De Lcriture Arabe Illustre Dans Le Mot Oum-El-Bouaghi .

Dans notre travail, lextraction de toutes ces caractristiques, consiste prendre


chaque composante connexe dtecte dans la phase de prtraitement et de lui faire
subir un ensemble de traitements. La dtection de ces composantes connexes est
effectue par un balayage de limage tiquete de droite gauche dans le sens de
lorientation de lcriture arabe.

IV.7.5.1. Dtection des diffrents types des points diacritiques

On a procd notre analyse par la vrification si la composante connexe dtecte est


un point diacritique ou non, cette vrification est faite par le test suivant :

Test Vrification_Point_Diacritique ;
Si ((AC = ACS ) et ( HC <= HM )) Alors cest un point diacritique haut
Sinon Si ((AC = ACI ) et ( HC <= HM )) Alors cest un point diacritique bas
Sinon composante connexe nest pas un point diacritique ;

En effet dans un point diacritique haut, tout les pixels qui le constituent se situent
dans la zone suprieure du mot et sa hauteur ne dpasse pas la hauteur mdiane, cette
dernire tait dmontre exprimentalement. De la mme faon on dtecte les points
diacritiques bas dans la zone infrieure.
Si le rsultat du test assure que la composante connexe est un point diacritique. Nous
devons classer ce point selon leur types (point unique, deux point lis), comme le
montre le tableau ci-dessous :

70
catgories
Catgorie1 Catgorie2 Catgorie3
types

Un point _ _

Deux points lis _

Trois points lis

Tableau IV.3. Les Diffrents Type Des Points Diacritiques.

Dans un premier temps, on va dterminer la catgorie1 pour les trois types des points.
Apres une tude statistique sur la densit des pixels de chaque type on a constat les
rsultats dans lorganigramme dans la figure IV.20, tous les seuils utiliss
ultrieurement dpendent du trac de lcriture et la rsolution du capteur utilis pour
lacquisition.
Point diacritique

Oui Non
AD>seuil1

3P Oui Non
AD>seuil2

2P 1P

AD : aire du point diacritique.

1P : point unique.

2P : deux points lis.

3P : trois points lis.

Figure IV.20. Organigramme de dtection des diacritiques (Catgorie 1).

71
Pour la catgorie2 et la catgorie3 on aperoit que ce sont un mlange entre les points
diacritiques de la catgorie1, donc aprs avoir dterminer chaque type des points
diacritiques dans tout le mot (lorganigramme prcdent), on effectue une analyse
base sur lespace entre les points diacritiques dans la zone suprieure et la zone
infrieure sparment.

D2 D2

D2 D1 D3

D1

esp1 esp1 esp2 esp1 D1

[a] : trois points lis. [b] : deux points lis. [c] : trois points lis.

Figure IV.21. Types de points diacritiques (catgorie2 et catgorie3).

La dtection de chaque catgorie de cette figure est rsume dans lorganigramme


suivant :

72
Les points diacritiques D1,D2 et D3

D1=3P

3P (donc D1=1P)
D1=2P

esp1<S esp1<S

2P 1P
D2=1P

D2=1P (donc D2=2P)


2P
3P

3P
esp2<S

esp1 : espace entre D1,D2.


2P
D3=1P
esp2 : espace entre D2,D3.

S : seuil.

3P 2P 1P : point unique.

2P : deux points lis.

3P : trois points lis.

D1,D2,D3 : les points diacritiques.

oui non

oui

Figure IV.22. Organigramme de dtection des diacritiques (les 3 catgories).

73
Nous passons maintenant la dtection du reste des caractristiques structurelles si le
rsultat du test assure que la composante connexe nest pas un point diacritique.

IV.7.5.2. Dtection des boucles (occlusions)

Elles appartiennent aux composantes primaires proximit de la ligne de base.


Lide quon a utilise pour la dtection des boucles dans une composante connexe
est ltiquetage du fond (le blanc de limage).
Le total des boucles dans une composante connexe sera le nombre des fonds dtects
moins un (moins le fond de limage), Figure (IV.23) :

Algorithmes de dtection des nombres de boucles:

Copier limage du mot dans une nouvelle image, et inverser les couleurs de limage
binarise.
Dtecter le nombre de groupes de pixels blancs.
Nombre de boucles nombre de groupes de pixels blancs 1.

Fond de limage

Fond1 Fond2 Fond3

Figure IV.23. Trois Fonds Correspondent Aux Trois Boucles.

IV.7.5.3. Dtecter le nombre dascendants (hampes) et de descendants


(jambages)

Les ascendants et les descendants sont les primitives les plus utilises dans la
reconnaissance de lcriture arabe. Elles sont dtectes par une monte ou une
descente qui se termine en dehors de la zone mdiane dtermine partir de la ligne
de base.

Algorithmes de dtection des nombres des ascendants et des descendants


Dtecter le bottom de limage par rapport la ligne de base.
Si le bottom est infrieur la ligne de base
Alors incrmenter le nombre de descendants
Dtecter le top de limage par rapport la ligne de base.
Si le top est suprieur la ligne de base
Alors incrmenter le nombre dascendants.

74
IV.7.5.3.1. Dtection des jambages

Une composante connexe dun mot arabe contient au maximum un seul jambage, le
test suivant vrifie lexistence de ce jambage ou non :

Test Vrification_Jambage ;
Seuil_J (HM / 2) ;
Si (HCI >= Seuil_J ) Alors il existe un jambage
Sinon il nexiste pas un jambage ;

Le Seuil_J tait calcul exprimentalement par lanalyse suivante, on a remarqu dans


la plupart des mots manuscrits que la hauteur du jambage dpasse un certain seuil, on
a essay de calculer sa valeur minimale. On a trouv que le plus court jambage est
celui qui correspond la lettre et son hauteur dpasse la moiti de la zone
mdiane dans la plupart des mots de la base.

IV.7.5.3.2. Dtection des hampes

Par opposition des jambages, une composante connexe dun mot arabe peut contenir
plusieurs hampes, alors le test sur lexistence ne suffit pas, mais un autre traitement
est ajout pour compter le nombre de ces hampes sils existent.

Test Vrification_hampe ;
Seuil_H HM ;
Si (HCS >= Seuil_H ) Alors il existe des hampes
Sinon il nexiste pas des hampes ;

Le test prcdent nous permet de vrifier lexistence des hampes dans une
composante connexe, le Seuil_H tait obtenu exprimentalement et il est gal la
hauteur de la zone mdiane.
Si le test prcdent affirme quil existe des hampes dans la composante on fait appelle
lalgorithme suivant pour calculer leurs nombre :

Algorithme Calcul_Nombre_Hampe ;
Seuil (HCS / 3) ;
NiveauLigne haute de la composante + Seuil ;
On fait une projection verticale de la ligne dordre Niveau de limage ;
On calcule le nombre des hampes dans lhistogramme vertical rsultant ;

75
Nous pouvons expliquer cet algorithme schmatiquement (Seuil est obtenu par
exprience) :

2 hampes dtectes

Ligne haute de la composante

Niveau
Zone mdiane

Figure IV.24. Illustration du niveau de projection verticale pour obtenir le nombre de


hampes.

IV.8. dcomposition du vocabulaire considr


Les mots arabes et plus prcisment manuscrits comportent des diffrentes faons
dcriture entre les scripteurs, pour cette raison lors de la construction de la base des
images de notre systme, nous avons pris pour chaque mot un nombre dexemples.

Pour la construction de la base dimages, nous avons obtenu 300 pages de formulaires
remplis, les documents ont t scannriss et les mots qui y sont contenus ont t
extraits et tiquets de manire automatique (daprs un algorithme ralis par [BEN
00]). La phase dtiquetage consiste classer toutes les images, sachant que le
vocabulaire des noms de wilayas algriennes contient 48 mots, nous avons conu un
modle de formulaire pr-imprim constitu de trois pages (16 mots/page), chaque
mot devant tre recopis trois fois par chaque scripteur (limage contient un seul mot).
La base contient donc 14400 images de mots manuscrits (les 48 mots du vocabulaire,
crits 3 fois, par chacun des 100 scripteurs). Dans ce qui suit, nous prsentons en
chantillon des trois pages des formulaires (voir annexe1).

La limitation du lexique est un avantage de la reconnaissance de noms de wilayas


algriennes, chacun des 48 mots de notre lexique est compos dun, deux, , ou six
sous-mots SM (voir tableau IV.4). Nous avons pris lide de partitionner la base selon
le nombre de sous-mots daprs le travail ralis par [SOU 06].

76
N Description Mot N Description Mot
1 1- Tebessa00 25 3- Tiaret00
2 1- Jijel00 26 3- Tamanrasset00
3 1- Tissemsilt00 27 3- Tippaza00
4 1- Khenchela00 28 3- Ouargla00
5 1- Mila00 29 3- Illizi00
6 1- MSILA00 30 3- Relizane00
7 1- Mascara00 31 3- Medea00
8 1- Setif00 32 3- Blida00
9 1- Constantine00 33 3- Naama00
10 2- Saida00 34 4- Ghardaia00
11 2- Bechar00 35 4- Oran00
12 2- Bejaia00 36 4- SidiBELABES00
13 2- Annaba00 37 4- Bouira00
14 2- Batna00 38 4- Alger00
15 2- Biskra00 39 4- AinDefla00
16 2- Mostaganem00 40 4- Eltaref00
17 2- Skikda00 41 5- TiziOuzou00
18 2- Tlemcen00 42 5- Boumerdes00
19 2- ELbayad00 43 5- Adrar00
20 2- Ghuelma00 44 5- Eloued00
21 2- Chlef00 45 5- Laghouat00
22 2- Djelfa00 46 6- BBArreridj00
23 3- Tindouf00 47 6- SoukAhras00
24 3- AinTemouchent00 48 6- OumElBouaghi00

Tableau IV.4. Description globale des noms de wilayas en mots.

IV.9. Reconnaissance
Tous les types de caractristiques (statistiques, structurelles, gomtriques, transformations
globales) et les mthodes de classification (statistique, structurelle, stochastique,
connexionniste, logique flou,..) qui existent dans la littrature sont pratiquement utilises
dans la reconnaissance de lcriture arabe (voir section III.3).

Il y a trois faons daborder cette problmatique [VIN 02]. Soit le systme reconnat
le mot comme une entit entire et indivisible, il sagit dune approche globale ou
holistique [ARR 02]. Soit il reconnat le mot partir de ses caractres pralablement
segments, il sagit dune approche analytique [SAY 73, ARR 02]. Soit il nutilise
que certaines proprits et raffine sa description du mot par rebouclage, nous
parlerons alors de systmes bass sur la lecture humaine [ARR 02].

A partir ce que nous avons vue dans le paragraphe ci-dessus, nous proposons une
combinaison entre quatre types de classifieurs en focalisant la premire approche
(globale). Dans notre systme nous allons aborder la reconnaissance de mots arabes
en appliquant deux mthodes statistiques KPPV ; K-MEANS et FCM, et une
connexionniste en utilisant le rseau PNN qui est spcifique au problme de
classification. Nous obtenons un systme qui combine paralllement les sorties de ces
classifieurs qui sont dcrit en dtails dans le chapitre prcdent.

77
Notre mthode comporte deux phases principales : la slection des attributs par Les
trois types de descripteurs cits ci-dessus (moment de Zernike, code de Freeman et
Zonage) ; et la classification des mots partir des ces attributs. Nous allons dans cette
partie prsenter chacune de ces deux phases ainsi que les problmes rencontrs et les
choix effectus.

IV.9.1. Slection des attributs


Dans notre systme, nous avons retenu les trois ensembles de caractristiques, do
chacun est extrait partir dun type dimage diffrents : le premier ensemble est
extrait partir dune image binaire utilisant les moments de Zernike, le deuxime est
extrait a partir de contour de limage utilisant le code de Freeman et le troisime est
extrait partir de squelette utilisant la mthode de zonage. Enfin toutes ces
caractristiques sont regroupes en un seul vecteur identifiant le mot.

Algorithme rsumant lextraction de caractristiques

Pour chaque mot faire :

1) Dtecter les caractristiques structurelles du mot (9 caractristiques).


2) Dtecter le vecteur de caractristiques par le moment de Zernike (100
caractristiques).
3) Dtecter le code de Freeman (8 caractristique).
4) Dtecter le nombre de pixels noir pour chaque zone du mot (16
caractristiques)..
5) Combiner ces trois types de caractristique en un seul vecteur dite vecteur de
caractristiques.

Il faut noter que, comme beaucoup de techniques sont utilises en REM, lapproche
retenue pour notre systme dans ce domaine en tant que reconnaissance de mots est
celle base sur le calcul des vecteurs de caractristiques. En effet, les caractristiques
retenues pour notre dmarche sont celles bases sur le zonage avec le calcul de
densit des pixels, les moments de Zernike et code de Freeman. Les 133
caractristiques retenues (16 pour le zonage (Daprs la dcomposition choisie, nous
obtenons 16 caractristiques, chacune reprsente la concentration des points blancs.
O chaque valeur reprsente la densit de points blancs prsents dans chaque zone
(lire le tableau ligne par ligne de la zone 1 la zone 16), 100 pour les moments de
Zernike et 8 pour le code de Freeman), et les 9 caractristiques structurelles. Toutes
ces caractristiques constituent les composantes du vecteur de caractristiques utilis
pour la reconnaissance. De ce fait, les vecteurs de caractristiques sont calculs pour
chaque mot et stocks dans trois bases : une pour les caractristiques de zonage, une
pour les moments de Zernike et lautre pour la chaine de Freeman.
La difficult du choix des caractristiques rside dans le compromis tablir entre les
trois contraintes suivantes:

rapidit dextraction des caractristiques.


facilit de mise en uvre.
insensibilit aux distorsions du caractre (styles dcriture diffrents, bruits
dans limage, taille du caractre, ...)

78
IV.9.2. Classification par les mthodes implmentes
"Comme chaque mthode de classification a ses avantages et ses dfauts, nous
pouvons dduire que la performance d'un systme peut tre augment de manire
significative en combinant plusieurs classifieurs." [SUE 98].

Aprs avoir slectionn les caractristiques discriminantes de chaque image, il faut


ensuite sparer distinctement les diffrentes classes des mots. Pour cela, nous avons
appliqus trois mthodes en comparant les rsultats de chacune afin damliorer le
taux de reconnaissance : la mthode KPPV ; KMEANS ; FCM, KPPV et un rseau de
neurone de type PNN.

IV.9.2.1. Classification par la mthode KPPV

Un mauvais voisin est une calamit, un bon voisin un vrai trsor.


Hsiode (pote grec)

Un classifieur KPPV ncessite avant tout la cration dune base de rfrence, qui est
constitue dun nombre dchantillons (mots), Chaque entre sera compare avec
chaque lment de la base de rfrence (images des mots ayant dj t classes). La
comparaison seffectue en calculant la distance entre les deux (distance euclidienne),
Puis attribuer le mot la classe la plus reprsente parmi les K plus proche delle
(auxquels la distance est minimale). En se basant sur ses caractristiques extraites.

Algorithme du KPPV est comme suit:

Etape1 : pour chaque chantillon y identifier, on calcule la distance Euclidienne


donne par cette formule:

1
2
2
d1 X , Y X i Yi 4.7
i 1

Etape2 : consiste prendre en considration les k mots les plus proches voisins du
candidat inconnu y, afin de prendre la dcision le concernant. On slectionne la classe
la plus reprsente parmi les k votes o le mot y appartient lensemble {X1,
X2, .Xk} dont la distance est minimale.

On note deux aspects importants de lalgorithme KPPV : dune part, chaque


nouvelle classification il est ncessaire de parcourir lensemble de la base
dapprentissage, ce qui en fait un algorithmes qui nest pas ncessairement trs
efficaces (surtout que, habituellement, on cherche avoir la base dapprentissage la
plus grande possible afin davoir un meilleur classifieur), et dautre part, un point
crucial de cet algorithme est la fonction de distance utilise pour mesurer la proximit
des objets. Il nexiste pas de distance/similarit universellement optimale et une bonne
connaissance du problme trait guide gnralement le choix de cette
distance/similarit [BEL 01].

79
IV.9.2.2. Classification par la mthode C-Moyenne Floue

Une des caractristiques du raisonnement humain est quil est bas sur des donnes
imprcises ou incompltes, un ordinateur, lui, est bas sur des donnes exactes do la
ncessit de dvelopper une nouvelle logique dite logique floue cette dernire est une
extension de la logique boolenne dans laquelle les niveaux de vrits, au lieu d'tre
vrais ou faux peuvent prendre des valeurs entre 0 et 1.Il n y a en fait pas de domaine
o lon ne puisse appliquer les raisonnements propres la Logique Floue car elle a t
conue pour sadapter aux techniques de pense humaine. Nous prsentons dans la
suite une description de la mthode floue de Fuzzy C-Means clustering FCM .

La mthode C-moyenne floue est une mthode de classification itrative qui permet
de classifier les individus selon C classes [CHU 00, GUI 01]. Elle calcule chaque
fois les centres des classes et gnre la matrice dappartenance U des individus ces
classes.

Soient le centroide ou prototype de la classe i, U la matrice des coefficients et


celle des coordonnes des centres. Etant donns le nombre de classe C, le nombre
dindividus n et lexposant flou m (m>1), l'objectif de la mthode est de trouver U et
qui minimisent la fonction cot donne par la relation (4.8 et 4.9).

4.8

Avec

4.9

Est une mtrique choisie au sens dune norme. Gnralement, il sagit de la norme
euclidienne. Ainsi 2 : distance entre le vecteur et le prototype
i. La technique de classification par FCM repose sur lalgorithme prsent dans la
figure IV.25.

80
Algorithme de FCM

1. Soit les vecteurs reprsentant les individus classer

2. Fixer les paramtres

- m : coefficient flou
- C : le nombre de classes
- : critre darrt

3. initialiser le vecteur par centres alatoirement choisis

4. calculer la matrice U de taille (C x n) par les quations :

est la distance entre lindividu k et le centre

5. Calculer le nouveau centre de chaque classe laide de lquation :

6. Mettre jour la matrice U et incrmenter le compteur t

7. Calculer la distance entre les nouveaux et les anciens centres par :

8. Rpter les tapes de 3 6 tant que h>.

Figure IV.25. Algorithme de classification par C-moyenne floue.

Le coefficient flou m qui est important dans la classification, fera lobjet dun
ensemble de test pour choisir la valeur optimale. Lexposant flou m est un coefficient
>= 1. Le poids de cet exposant peut tre interprt comme un paramtre de distorsion.
Le flou de la partition augmente avec ce coefficient. Un tel coefficient accentue
les faibles niveaux dappartenance et contribue donc mieux sparer les classes. Dans
cette partie, nous nous proposons dtudier linfluence de ce paramtre sur le rsultat
de la classification FCM. Nous donnant un exemple pour classer les mots ayant 6
sous-mots (la derniers partition contenant 3 mots : , , ), en
variant ce paramtre. Nous avons utilis les trois ensembles de caractristiques (voir
section IV.7). Le taux de reconnaissance sera calcul comme suit :
Taux de reconnaissance = (nombre dimages reconnues * 100)/ nombre totale
dimages.
Dans cet exemple le nombre totale= 30*3=90 images (30 images pour chaque mots).

81
Nom m 2 3 4
BBArreridj00 25 24 25
SoukAhras00 24 25 28
OumElBouaghi00 25 27 25
totale 82.22 84.44 86.66

Tableau IV.5. Taux de reconnaissance obtenue en faisant varier le coefficient flou m et en


utilisant les caractristiques de zonage.

Nom m 2 3 4
BBArreridj00 27 26 25
SoukAhras00 28 27 28
OumElBouaghi00 25 24 25
totale 90 85.55 86.66

Tableau IV.6. Taux de reconnaissance obtenue en faisant varier le coefficient flou m et en


utilisant les caractristiques de freeman.

Nom m 2 3 4
BBArreridj00 26 24 25
SoukAhras00 24 25 27
OumElBouaghi00 25 28 26
totale 83.33 84.44 86.66

Tableau IV.7. Taux de reconnaissance obtenue en faisant varier le coefficient flou m et en


utilisant les caractristiques de moment de Zernike.

IV.9.2.3. Classification par mthode K-Means

La mthode K-Means, est une mthode classique de partitionnement [BOI 87]. Le but
de cette mthode est de trouver la partition et les centroides de faon minimiser la
distorsion totale D. Une procdure itrative peut tre base sur les deux observations
suivantes:

Pour un ensemble donn de centroides, la partition qui minimise D (la


distorsion totale pour l'ensemble des vecteurs) est celle pour laquelle chaque
vecteur xi (vecteur de caractristiques) est affect la classe dont le centroide
est le plus proche.
Pour une partition donne, il existe pour chaque classe i un vecteur Ji qui
minimise la distorsion totale Di de la classe i.
Le droulement typique de cet algorithme est rsum de la manire suivante :

a. Initialisation consistant faire le choix.

Des centres initiaux des classes (initialisation de code book).


Du seuil (10 e-6)
De la valeur initiale de la distorsion totale D.

b. Une boucle faisant alterner 2 tapes jusqu stabilit des rsultats ou pour un
nombre fix ditrations :

82
Affectation des objets restants au groupe le plus proche.
Redfinition des reprsentants des groupes.

Algorithme de rsolution
Le principe de fonctionnement de lalgorithme K-means est dcrit comme suit :

Algorithme de k-means

Entre: vecteur dapprentissage xi


/* Aprs lanalyse des images, nous obtenons des mots (X) dont chacun deux
est compos dun ensemble de vecteurs (zonage ; Zernike ; code de Freeman). */
Initialisation
Choisir un code-book initial C= { yi ; 1<= i < M.
/*le choix des M centroides (yi) initiaux est arbitraire, pratiquement, ils peuvent tre
choisis comme tant les M (M = 9) premires paramtres des mots de la base c d :
on prend pour chaque mot du vocabulaire le vecteur de caractristiques correspondant
au premier groupe contenant 9 mots */
Mettre m = 0; Dm = D0 (valeur max).
Construction des classes
Partitionner les vecteurs dapprentissage xj en M classes selon lhypothse suivante :
x j Ci si d(xj,,yi,) <= d(xj,,yi,) pour tout 1<= k <= M, o d reprsente la norme
euclidienne.
Mettre m=m+1; et calculer :
D=Mi=1 d(xj,,yi,); avec xj Ci
/* Une fentre xji est affecte une classe (i) si la distance euclidienne d(xij,yi) est
minimale par rapport aux autres classes */
Mise jour des centroides
Mettre jour chaque centroide yi par: Yi= (1/|Ci|) xj ; avec x j Ci
/* |Ci| est le nombre de vecteurs dans la classe Ci */
Test darrt
Si (Dm-Dm-1)/Dm > alors aller a /* = 0.01 */
Le code book est constitu de tous les vecteurs yi ; 1<= i <= M
Fin de lalgorithme

Figure IV.26. L'algorithme de rsolution pour la mthode K-Means [LLO 57]

83
IV.9.2.4. Classification par rseaux de neurones probabilistes (PNN)

Ces rseaux sont gnralement utiliss pour des problmes de classification. La


premire couche qui est un rseau base radiale, donne une information sur la
ressemblance entre la donne dentre et le jeu de donnes utilis lors de
lapprentissage. La deuxime couche produit comme sortie un vecteur de probabilit.
Finalement, une fonction de transfert comptitive produit 1 ou 0.

Figure IV.27. Architecture du rseau PNN.

III.9.2.4.1. Proprits gnrales dun PNN

Classificateur neuronique feedforward


Structure: rseau 3 couches :

1. couche dentre: units de distribution des caractristiques


2. couche cache: noyaux Gaussiennes sphriques centrs sur chaque
patron de TRAIN. Elle calcule les distances entre le vecteur d'entre et
tous les vecteurs dapprentissage et produit un vecteur dont les
lments indiquent comment ce vecteur dentre est proche de chaque
vecteur dapprentissage.
3. couche de sommation: sommation des neurones cachs par classe. Elle
additionne ces contributions pour chaque classe des entres pour
produire la sortie du rseau un vecteur des probabilits. Enfin, une
fonction de transfert de concurrence sur la sortie de la deuxime
couche slectionne le maximum de ces probabilits, et produit un 1
pour cette classe et un 0 pour les autres classes.

84
Figure IV.28. Structure dun rseau PNN.

IV.9.2.4.1. Avantages et inconvnients de PNN

Avantages:

apprentissage rapide (entrainement en une passe)


converge asymptotiquement vers la borne de dcision optimale quand
|TRAIN| augmente
peut donner des rsultats comparables au MLP.

Inconvnients:

ressources: un neurone cach est requis pour chaque patron de TRAIN


alors, on limite aux problmes avec petites bases.

IV.9.3. Rsultats et discussion


Dans ce paragraphe nous donnons quelques rsultats de classification avec diffrents
couples de descripteurs, classieurs. Lobjectif est de trouver les couples intressants
pour obtenir des combinaisons entre les mthodes de classifications prsentes ci-
dessus.

Pour pouvoir valuer les performances du systme ralis on doit passer certainement
par ltape test qui consiste bien videmment dmontrer lefficacit des mthodes
appliques savoir :

Test de La reconnaissance effectu par les classifieurs adopts dans notre


systme (KPPV, FCM, K-Means et PNN).
Test de la combinaison de ces classifieurs cits prcdemment.

85
Nous avons dcompos le vocabulaire selon le nombre de sous-mots constituant le
mot afin de choisir le FCM adquat (nous avons obtenu 6 FCMs), nous avons fait ca
parce que nous constatons que ce type de classifieur donne des rsultats mieux
lorsque le nombre de classes ainsi que le nombre de donnes diminuent ; le mme
principe sera suivi pour les autres.

Nous avons divis notre base en deux parties, une partie pour classer les mots (270
images pour chaque nom de wilaya) et une partie pour le test (30 image pour chaque
nom de wilaya).

Une mauvaise reconnaissance se produit quand un mot test est affect une autre
classe que celle laquelle il devait appartenir. Nous avons constat que ce problme
est gnralement caus lors du calcul de sous-mots (nombre de composantes
connexes), de plus certaines composantes connexes secondaires (les points
diacritiques) seront considres comme composantes primaires cause de la variation
de lcriture et les heuristiques utilises dans notre algorithme dvaluation
dexistence ou du type de diacritiques (voir section IV.7.5.1).

Nous avons utilis des classifications simples dont les rsultats sont combins de deux
manires ; par vote de majorit puis par priorit. Les rsultats obtenus par le systme
sont rsums dans les tableaux (IV.8.ad, IV.9.a, IV.9.b) :
Avec :
Groupe1(G1) :{ , , , , , , , ,}
Groupe2 (G2) :{, , , , , , , , , , , ,
}
Groupe3 (G3) :{ , , , , , , , , ,
,}
Groupe4 (G4) : {, , , , , , }
Groupe5 (G5) : {, , , , }
Groupe6 (G6) : { , , }

IV.9.3.1. Classication simple

Voici les rsultats obtenus utilisant les quatre types de classication avec une dcision
sans rejet :

Classification paramtrique gaussienne par un rseau PNN


Classification floue par FCM.
Classification statistique par K-Means.
Classification par la rgle des k-PPV avec une distance euclidienne.

Nous avons compar les rsultats de classication simple de trois types de


caractristiques :

Les descripteurs de Zernike.


Le descripteur externe de code de Freeman.
Par le Zonage, plus les 9 caractristiques structurelles du mot arabe.

Les rsultats obtenus par chacun des classifieurs indpendamment :

86
KPPV
Zonage (%) Zernike (%) Freeman (%) Taux par groupe (%)
G1 67.03 k=6 56.30 k=7 64.44 k=6 62.60
G2 61.02 k=6 56.67 k=8 58.46 k=8 58.72
G3 73.93 k=10 67.90 k=8 73.33 k=11 71.72
G4 75.71 k=6 78.09 k=5 71.90 k=4 75.23
G5 87.33 k=3 85.33 k=6 86.66 k=6 86.44
G6 95.55 k=3 94.44 k=3 94.44 k=6 94.81
Taux par type de
primitives (%) 76.76 61.80 74.87
(a)

FCM
Zonage Zernike Freeman Taux par groupe
(%) (%) (%) (%)
G1 60 41.48 61.48 54.32
G2 43.33 38.72 55.13 45.73
G3 66.06 52.12 67.27 61.82
G4 64.29 67.62 66.19 66.03
G5 76.67 72 78 75.56
G6 81.11 87.78 88.89 85.93
Taux par type de primitives
65.24 59.95 69.49
(%)
(b)

PNN
Zonage Zernike Freeman Taux par groupe
(%) (%) (%) (%)
G1 73.33 62.96 72.22 74.20
G2 63.85 57.70 65.13 62.05
G3 78.18 72.73 77.88 72.12
G4 71.43 77.62 70.48 76.68
G5 86.67 82.67 85.33 84.44
G6 94.45 93.33 92.22 93.71
Taux par type de primitives
77.98 74.50 77.21
(%)
(c)

K-means
Zonage Zernike Freeman Taux par groupe
(%) (%) (%) (%)
G1 60 41.85 58.89 53.58
G2 56.41 37.95 56.41 50.26
G3 66.67 49.09 66.36 60.71
G4 62.86 64.76 61.90 63.17
G5 71.33 72 70.67 71.33
G6 86.67 87.79 85.55 86.67
Taux par type de primitives
67.32 58.91 66.63
(%)
(d)
Tableau IV.8. Rsultats de classification simple (a,, d)

87
Daprs les rsultats obtenus, nous dduisons que le type de caractristiques les plus
intressant sont les caractristiques structurelles avec les caractristiques de zonage.
Du ct des classieurs, nous notons que lvaluation paramtrique gaussienne (PNN)
donne de bons rsultats avec le zonage. De lautre ct, nous voyons que le taux de
reconnaissance augmente lorsque le nombre de classe soit plus petit dans le groupe.

Globalement les deux classieurs KPPV et PNN atteignent des rsultats comparables,
et plus intressant par rapport aux deux autres.

IV.9.3.2. Combinaison de classifieurs

A lissue des rsultats prcdents, nous avons combin les quatre classifieurs , Cette
combinaison est faite soit de manire dmocratique, dans le sens o elle ne favorise
aucun classifieur par rapport un autre, o bien de manire dirige et, dans ce cas, on
attribue la rponse de chaque classifieur un poids en fonction de ses performances et
ceci est en fonction gnralement du taux obtenu lors de la phase d apprentissage ;
selon les rsultats obtenus prcdemment, nous avons donner la priorit au PNN puis
au KPPV, et les deux autres possdants la mme priorit. Les rsultats obtenus se
rsument dans les deux tableaux suivants :

Combinaison (vote de majorit)


Toutes les caractristiques (%) Zonage (%) Zernike (%) Freeman (%)
G1 67.8 62.59 42.59 60.74
G2 63.07 56.67 40.77 56.15
G3 74.85 69.09 53.33 69.09
G4 78.58 70.48 66.67 65.24
G5 87.33 79.33 72.67 80
G6 93.33 86.67 90 86.67
totale 77.50 70.80 61 69.65
(a)

Combinaison avec priorit entre les classifieurs


Toutes les caractristiques (%) Zonage (%) Zernike (%) Freeman (%)
G1 68.14 62.59 42.96 61.85
G2 63.33 58.46 42.82 57.43
G3 75.15 70.61 55.76 68.79
G4 88 72.86 66.67 65.24
G5 90.67 81.33 74 80
G6 93.33% 86.67 90 87.78
totale 79.80% 72.09 62.03 70.18
(b)
Tableaux IV.9. Rsultats de combinaison des classifieurs

88
IV.9.3.3. Influence de paramtre K sur les rsultats de la classification KPPV

Nous donnant un exemple pour classer les mots en variant le paramtre K. Nous
avons utilis lensemble de caractristiques de zonage. Le tableau suivant prsente les
rsultats obtenus :

zonage K=1 (%) K=3 (%) K=6 (%)


G1 63.70 64.07 67.03
G2 58.46 59 61.02
G3 66.67 69.70 71.51
G4 71.90 74.28 74.76
G5 85.33 87.33 84
G6 85.33 87.87 95.55

Tableau IV.10. Linfluence de paramtre K sur le rsultat de la classification KPPV.

Nous constatons que le paramtre K influence directement le taux de reconnaissance.


Dans lexemple prsent ci-dessus ; le meilleur score est obtenu lorsque K=6.

IV.9.3.4. Utilit de dcomposition du vocabulaire

K-means sans dcoupage de vocabulaire


Zonage Zernike Freeman Taux par groupe
(%) (%) (%) (%)
G1 51.11 25.55 49.26 41.97
G2 37.95 24.87 38.20 33.67
G3 46.06 28.79 46.06 40.30
G4 35.24 26.67 42.38 34.76
G5 46.67 34.67 46.67 42.67
G6 66.67 51.11 65.55 61.11
Taux par type de primitives
47.28 31.94 48.02
(%)

Tableau IV.11. Rsultats de K-means sans dcoupage de vocabulaire.

Le tableau prcdent montre que le taux de reconnaissance a diminu lorsquon a


utilis toute la base, cela mit en vidence limportance de dcouper la base selon le
nombre de sous-mots qui le constituent.

Enfin, Nous avons valu les performances de notre systme, nous lavons teste sur
une base de 1440 images des mots. Environ 80% de ces mots ont t bien affects la
classe.

89
IV.10. Conclusion
Dans ce chapitre, nous avons prsent le travail ralis au cours du dveloppement de
notre systme, o les diffrentes phases du processus de reconnaissance de lcriture
manuscrite qui le constituent ont t dtailles.

Grace la spcificit de lcriture arabe et afin daugmenter le taux de


reconnaissance, nous avons effectu une dcomposition du vocabulaire selon le
nombre de sous-mots constituant le mot. Nous avons extrait les caractristiques du
mot selon plusieurs visions (section IV.7)
Dans le systme propos, nous avons essay dadapter les concepts de la logique
floue la classification des noms des wilayas algriennes. Pour cela, nous avons
choisi dappliquer lalgorithme FCM afin de raliser une classification supervise des
48 noms des wilayas algriennes en les comparants avec les autres classifieurs
implments. Nous terminons ce chapitre par lexposition des diffrents rsultats
obtenus par notre systme et qui sont encourageants.

90
Conclusion gnrale
Comme nous lavons vu en introduction de ce mmoire, une question reste ouverte :
est ce quon peut concevoir un systme de reconnaissance permettant de dchiffrer un
texte manuscrit ? La rponse a cette question, que malgr les efforts et les travaux
intensifs raliss dans ce domaine, aucun systme OCR nest jug fiable 100%.
Mais au fur et mesure les auteurs essayent damliorer les scores pour de meilleurs
rsultats.
Cependant les problmes majeurs influenant la recherche en AOCR d
principalement la complexit de la morphologie de lcriture arabe, le manque
dchange entre les chercheurs du domaine et celui dinfrastructures adquates dans le
sens budgtaire, de bases de donnes, de dictionnaires et doutils de test et de
validation. Mais dernirement plusieurs travaux ont rcemment vu le jour. La
rsolution des ces problmes serait dun apport considrable, tant au niveau
simplification de la tache de lAOCR, quaux niveaux validation et portabilit des
produits raliss.

Lcriture arabe et lcriture latine cursive ont de nombreux points communs, qui
permettent le transfert vers larabe de techniques dj prouves sur le latin. Telles
que la segmentation en graphmes, lextraction de primitives et le moteur de
reconnaissance sont les mmes que ceux utiliss pour la reconnaissance de lecriture
latine. En revanche, certaines adaptations sont indispensables pour mettre en uvre
un systme de reconnaissance de lecriture arabe : Lextraction de la bande de base
en particulier doit tre adapte. Notamment en raison de la prsence de nombreux
signes diacritiques, et galement cause de la forme des ascendants/descendants qui,
contrairement lusage dans lcriture latine, peuvent tre tendus horizontalement
sous la bande de base. Le type de classieur est galement le mme que celui utilis
dans le cadre de la reconnaissance latine.

Lobjectif principal de toute recherche est daboutir des bons rsultats, ce qui
conduit des systmes performants, mais en focalisant sur le choix de la mthode
celle qui donne au mieux que possible la bonne dcision, dans le domaine de la
reconnaissance de formes on dispose de diffrentes mthodes telles que les mthodes
statistiques, structurelles, les rseaux de neurones,, avec possibilit de les
combines nous proposons un systme multi-classifieurs qui combine paralllement
quatre mthodes de classification: KPPV ; KMEANS; FCM et le rseau PNN.

Ce manuscrit a expos le travail orient vers la reconnaissance des mots manuscrits


arabe hors ligne (les 48 noms des wilayas algriennes). Deux problmatiques ont t
abordes, lextraction des attributs statistiques et morphologiques en analysant
limage du mot par un descripteur globale les moments de Zernike, un descripteur
externe le code de Freeman et la mthode de zonage dune part, et dautre part, une
classification dans lespace des attributs par quatre mthodes de classification :
KPPV, FCM, KMEANS, et PNN. Lobjectif principal de ce travail, est de faire une
comparaison entre ces diffrentes mthodes par rapport aux diffrents attributs
extraits.

91
Toutes les phases classiques dun processus de reconnaissance ont t ralises
commenant par les prtraitements, lextraction des caractristiques et enfin la
reconnaissance. Nous avons dmontr la procdure dextraction dinformations
fondamentales qui nous aide la description globale du mot traiter. Nous avons
propos une nouvelle ide au niveau de cette dernire qui comporte : Lanalyse par
les moments de Zernike au niveau de limage binaire (taille de vecteur=100),
lanalyse par Freeman faite au niveau du contour (taille de vecteur=8), lanalyse par
zonage au niveau du squelette (taille de vecteur=16), de plus les caractristiques
structurelles du mot (taille de vecteur=9). Ainsi nous obtenons un vecteur des attributs
compos de 133 caractristiques identifiant le mot.

Les rsultats obtenus par notre approche sont encourageants, notons que nous avons
focalis notre travail sur lapproche parallle. Cette dernire ncessite l'activation de
tous les classifieurs du systme qui doivent participer de manire concurrente et
indpendante. Par contre, la dcision finale est prise avec le maximum de
connaissances mises disposition par chaque classifieur. Ds lors se posent les
problmes de prcision des informations fournies par les classifieurs et de la
confiance qu'on peut accorder chacun d'eux. Donc ce travail ne reprsente quun
point de dpart, nous lui prvoyons des possibilits dvolution : Nous voyons quon
peut augmenter les performances de systme en appliquant une approche analytique,
nous pensons que cette dernire va donner de bons rsultats puisque elle prend en
compte la lettre arabe comme entit de traitement. Donc le nombre des classes
identifier va diminuer (29 lettres arabe). Mais cette approche ncessite une tape de
segmentation qui est de mme une tache plus ardue surtout pour lcriture arabe
manuscrite qui est un peu plus complexe par rapport la latine, nous esprons dans
lavenir pouvoir intgrer cette approche dans notre systme.

92
BIBLIOGRAPHIE

[ABU 93] I. S. I. Abuhaiba, P. Ahmed: "Restoration of temporal information in off-line arabic


recognition", Pattern Recognition, Vol. 26, N. 7, pp. 1009-1017, July 1993.

[ABU 94] I.S.I. Abuhaiba, S.A. Mahmoud, R.J. Green: "Recognition of handwritten cursive Arabic
characters", IEEE Transactions on PAMI, Vol. 16, N. 6, pp. 664-672, June 1994.

[ABU 95] I. S. I. Abuhaiba, S. Datta, M.J.J. Holt: "Fuzzy state machines to recognize totally
unconstructed handwritten strokes", Image and Vision Computing, Vol. 13, N. 10, pp.
755-769, December 1995.

[ABU 96] I. S. I. Abuhaiba, M.J. J. Holt, S. Datta: "Processing of binary images of handwritten text
documents", Pattern Recognition, Vol. 29, N 7, pp. 1161-1177, July 1996.

[ABU 98] I. S. I. Abuhaiba, Holt M. J. J., Datta S., "Recognition of off-line cursive handwriting",
Computer Vision and Image Understanding, Vol. 71, N. 1, pp. 19-38, July 1998.

[ALA 05] Pr. B. ALAIN, Anh. Tuan. NGHIEM : "Reconnaissance d'criture manuscrite", 15 juillet
2005.

[AlB 94] B. Al-Badr , R.M. Haralick : Symbol recognition without prior segmentation .
Conference SPIE-EI 1994.

[ALB 95a] B. Al-Badr, R. M.Haralick: "Segmentation-free word recognition with application to


Arabic". IEEE proceedings of ICDAR'95 Montreal, Canada, 1995.pp 355-359.

[ALB 95b] B. Al-Badr, S.A. Mahmoud: "Survey and bibliography of Arabic optical text recognition".
Signal processing, vol. 41, pp. 49-77, 1995.

[ALE 90] S.Al-Emami, M. Usher: "On-line recognition of handwritten Arabic characters". IEEE
Transactions on Pattern analysis and machine intelligence. Vol. 12. N7.1990.

[ALI 97] M. A. Alimi : "An evolutionary neuro-fuzzy approach to recognize on-line Arabic
handwriting", The Proceedings of ICDAR97, 4th International Conference on
Document Analysis and Recognition, Vol. 1, pp. 382-386, Ulm, Germany, August 1997.

[ALI 06] A. M. Alimi, O.A. Ghorbel : "Etude de l'influence du nombre de prototypes dans la
reconnaissance en ligne de lettres arabes moules". CNED' 94. pp 493-499. Rouen 6-7-8
Juillet 1996.

[ALM 87] H. Almuallim, S. Yamaguchi: "A method of recognition of arabic cursive handwriting",
IEEE Transactions on PAMI, Vol. 9, N. 5, pp. 715-722, September 1987.

[ALM 02] S. Al-Maadeed, C. Higgens, D. Elliman: "Adatabase for Arabic handwritten text
recognition research, Proceedings of the English IWFHR, Ontario, Canada, pp. 485-489,
2002.

[ALM 04] S. Al-Maadeed, D. Elliman, C. Higgins: "Off-line recognition of handwritten Arabic


words using multiple hidden Markov models", Knowledge-Based Systems, Vol. 17, N.
2-4, pp. 75-79, May 2004.

[ALM 06] S.Al-Maadeed: "Recognition of off-line handwritten Arabic words using neural network
", Proceeding of GMAI06, International Conference on Geometric Modeling and
Imaging, pp. 141-114, London, England, July 2006.

93
[ALO 02] Y. Al-Ohali: "Handwritten Word Recognition Application to Arabic Cheque Proce-
ssing", PhD Thesis, Concordia University, Montreal, Quebec, Canada, February 2002.

[ALP 97] A.Alper Atici, F. T. Yarman-Vural/ "A heuristic algorithm for optical character recogni-
tion of Arabic script", Signal Processing, Vol. 62, N. 1, pp. 87-99, October 1997.

[ALR 06] H. Al-Rashaideh/, "Preprocessing phase for Arabic word handwritten recognition",
Information Transmissions in Computer Networks, Vol. 6, N.1, pp. 11-19, 2006.
(Disponible sur la toile : www.jip.ru/2006/11-19-2006.pdf)

[ALS 06] B. Alsallakh,H. Safadi : "AraPen: an Arabic online handwriting recognition system",
Proceeding of ICTTA06, 2nd IEEE International Conference on Information &
Communication Technologies: from Theory to Applications, Vol. 1, pp. 1844-1849,
Damascus, Syria, April 2006.

[ALT 95] M. Altuwaijri, M. Bayoumi: "A new thinning algorithm for Arabic characters using self
optimizing neural network", Proccedings of ISCAS95, IEEE Symposium on Circuits
and Systems, Vol. 3, pp. 1824-1827, Seattle, WA, USA, April-May 1995.

[AMA 96] J.L. Amat, G. Yahiaoui : "Techniques avances pour le traitement de linformation".
Edition CEPADUES 1996.

[AME 94] A. Ameur, K. Romeo-Pakker, H. Miled, M. Cheriet : "Approche globale pour la


reconnaissance de mots manuscrits Arabes", Actes CNED94, 3me Colloque National
sur lEcrit et le Document, pp. 151-156, Juillet 1994.

[AMI 82] A. Amin: "Machine recognition of hand written arabic words by the IRAC II system",
Proceedings ICPR82, 6th International Conference on Pattern Recognition, Vol. 1, pp.
34-36, 1982.

[AMI 85] A.Amin :"IRAC : un systme pour la reconnaissance et pour la comprhension de l'Arabe
crit et imprim". Thse d'tat, Universit de Nancy I. 1985.

[AMI 96] A. Amin, H.B. Al-Sadoun, and S. Fisher: "Hand-printed Arabic character recognition
system using an artificial network ". Pattern recognition, vol. 29, N 4, pp. 663-675,
1996.

[AMI 97] A. Amin:"Off line Arabic character recognition - a survey", Proceedings of ICDAR97,
4thc International Conference on Document Analysis and Recognition, Vol. 2, pp. 596-
599, Ulm, Germany, August 1997.

[AMI 00a] A. Amin : "Recognition of printed Arabic text based on global features and decision tree
learning techniques", Pattern Recognition, Vol. 33, pp. 1309-1323, 2000.

[AMI 00b] A. Amin, N. Murshed : "off-line recognition of printed Arabic words through global
features and neural networks", 4th International workshop on Document Analysis
Systems, DAS2000, Rio de Janiro, Brazil, pp. 267-277, 2000.

[AMI 03] A. Amin : "Recognition of hand-printed characters based on structural description and
inductive logic programming", Pattern Recognition Letters, Vol. 24, pp. 3187-3196,
2003.

[ANI 92] J. Anigbogu : " Reconnaissance de textes imprims mutifontes laide de modles
stochastiques et mtriques ". Thse de doctorat, Universit de Nancy I, 1992.

[ARR 02] D. Arrivault : "Apport des Graphes dans la Reconnaissance Non-Contrainte de Caractres
Manusc-rits Anciens", (Universit de Poitiers)(Diplme National - Arrt du 25 Avril
2002).

94
[AVI 96] M.Avila : "Optimisation des modles Markoviens pour la reconnaissance de lcrit", Th-
se de Doctorat, Universit de Rouen, 1996.

[AYA 04] N. Ayat : "Slection De Modle Automatique Des Machines Vecteurs De Support:
Application La Reconnaissance Dimages De Chiffres Manuscrit", thse prsente
lEcole de Technologie Suprieure comme Exigence Partielle lobtention du Doctorat
en gnie P.H.D. Montral, Le 20 Janvier 2004.

[AZI 02a] N. Azizi : "Combinaison de classifieurs neuronaux base sur la logique floue : application
la reconnaissance des mots arabes manuscrits", Mmoire de magister, Laboratoire LRI,
Dpartement d'informatique, Universit d'Annaba, Algrie, 2002.

[AZI 02b] N. Azizi, T. Sari, L. Souici-Meslati, M. Sellami : "Une architecture de combinaison floue
de classifieurs neuronaux pour la reconnaissance de mots arabes manuscrits", CIFED02,
7me Colloque International Francophone sur lEcrit et le Document, pp. 89-96,
Hammamet, Tunisie, Octobre 2002.

[BEL 91] S.O. BELKASIM, M. SHRIDHAR et M. AHMADI: "Pattern recognition with moment
invariants: A comparative study and new results". Pattern Recognition, Vol. 24, N12,
pp. 11171138, 1991.

[BEL 92] A. Belaid,Y. Belaid : "Reconnaissance des formes: Mthodes et applications ",
InterEditions, jan-vier 1992.

[BEL 97] A.Belaid et G. SAON : "Utilisation des processus markoviens en reconnaissance de


lcriture". Revue Traitement du Signal, Vol.14, N2, pp. 161177, 1997.

[BEL 01] A.Belaid : "La reconnaissance automatique de lcriture et du document", pour la Science,
octobre 2001.

[BEN 98] N.Benamara, A. Belaid, N. Ellouze : "Modlisation pseudo bidimentionnelle pour la


reconnaissance des chanes de caractres arabes imprimes". Proc. 1er Colloque
International francophone sur lcrit et le document (CIFED98), pp. 131-140, Qubec,
Canada, 1998.

[BEN 99] N.Benamara : "Utilisation des modles de Markov cachs planaires en reconnaissance de
lcriture arabe imprime ". Thse de doctorat, spcialit Gnie Electrique, Universit
des sciences, des Techniques et de mdecine de Tunis II, 1999.

[BEN 00] A. Benouareth : " Reconnaissance de l'criture arabe manuscrite par une approche hybride
". Mmoire de magister, Labo. LRI, Dpartement d'informatique, Universit d'Annaba,
Algrie, Fvrier 2000.

[BEN 01a] N. Ben Amara, A.Belaid : "Une Methode Stochastique pour la Reconnaissance de
L'ecriture Arabe Imprimee ". Ecole Nationale d'Ingnieurs de Monastir 5019 Monastir
Tunisie, Centre de Recherche en Informatique de Nancy Btiment Loria, Campus
Scientifique- B.P. 239 54506 Vandoeuvre-Ls-Nancy- France. Soumis en 2001.

[BEN 01b] N. Ben Amara1, A. Belad2 et N. Ellouze : " Utilisation des modles markoviens en
reconnai-ssance de l'criture arabe : Etat de lart". Tunisie. Soumis en 2001.

[BEN 02] N.E. Ben Amara : "Sur la problmatique et les orientations en reconnaissance de lcriture
arabe", Proceedings of the Colloque International Francophone sur lEcrit et le
Document, CIFED2002, Hammamet, Tunisia, October 2002, pp. 2-10.

[BEN 04] A. Bensefia : "Analyse des documents manuscrits : identification et vrification du


scripteur". Th-se de Doctorat, Laboratoire LITIS, Universit de Rouen, Mai 2004.

95
[BEN 05] A. Benouareth, A. Ennaji, M. Sellami : " Utilisation des HMMs de Dure d'Etat Explicite
pour la Reconnaissance des Mots Arabes Manuscrits". Article soumi en 2005.

[BEN 07] A. Benouareth : "Reconnaissance de Mots Arabes Manuscrits par Modles de Markov
Cachs Dure dEtat Explicite". Thse Prsente en vue de lobtention du diplme de
Doctorat, 2007/2008.

[BIS 95] C. Bishop:Neural Networks for Pattern Recognition, University Press, Oxford, Great
Britain, 1995.

[BON 96] N. Bonnert, M. Herbin : "Classification automatique", Sminaire LERI Universit de


Reims Fvrier 1996.

[BOR 97] A. Boris:"A Thalamocortical Algorithm That Performs Handwritten Character Reco-
gnition", dans A.C. Downton & S. Impedovo (diteurs): Progress in Handwriting
Recognition , publi par World Scientific.1997.

[BOZ 89] R.M. Bozinovic and S.N. Srihari : " Off-line cursive script word recognition ", IEEE
Transaction on Pattern Analysis and Machine Recognition PAMI, Vol 11, NO. 1, pp: 68-
83, January, 1989.

[BRE 03] S. Bres, J.M. Jolion, F. Lebourgeois : "Traitement et analyse des images numriques".
Hermes, 2003

[BRO 83] M.K. Bown: Preprocessing thechniques for cursive script word recognition", Pattern
Recognition, Vol. 16, N. 5, pp. 447-458, 1983.

[BUN 01] H. Bunke: "Recent advances in structural pattern recognition with applications to visual
form analysis". In Workshop on Visual Form, page 11 ff., 2001.

[BUR 04] P. Burrow: "Arabic handwriting recognition". Master of Science thesis. School of
Informatics, university of Edinburg, England, 2004.

[CAS 96] R. G. Casey, E. Lecolinet: "A survey of methods and strategies in character segmen-
tation", IEEE Transaction on Pattern Analysis and Machine Intelligence, Vil. 18, No. 7,
pp. 690706, July 1996.

[CHE 94] M.Y. Chen, A. Kundu, J. Zhou: "off-line handwritten word recognition using a hidden
markov model tupe stochastic network", IEEE Transactions on PAMI, Vol. 16, No. 5,
pp. 4

[CHU 00] S. Chuai-Aree,C. Lursinsap, P. Sophatsathit and S. Siripant: "Fuzzy C-Mean: A statisti-
cal feature classification of text and image segmentation method", Proc. of Intern. Conf.
on Intelligent Technology 2000, December 13-15, Assumption University Bangkok,
Thailand, pp. 279-284, 2000.

[COH 94] E. Cohen, J.J. Hull, S.N. Srihari: "Control-structure for interpreting hand-written
addresses". IEEE Trans. Pattern Analysis and Machine Intelligence, Vol. 16, N.10, pp.
10491055, octobre 1994.

[DAR 94] P. Dargenton : "Contribution la segmentation et la reconnaissance de lcriture


manuscrite", Thse de Doctorat, Lyon, 1994.

[DUI 00] R.P.W. Duin and D.M.J. Tax: "Experiments with Classifier Combining Rules". Multiple
Classifier Systems (Proc. First International Workshop, MCS 2000, Cagliari, Italy, June
2000), Lecture Notes in Computer Science, vol. 1857, Springer, Berlin, 2000, 16-29,
2000.

[DUP 04] X. Dupr : "Contribution la reconnaissance de lcriture cursive laide de Modles de


Markov Cachs". Thse de Doctorat, universit Rni Descartes Paris V, 2004.

96
[ELD 90] S. S. El-Dabi, R. Ramsis, A. Kamel:"Arabic character recognition system: a statistical
approach for recognizing cursive typewritten text". Pat. recog., Vol. 23, No. 5, pp. 485-
495 1990.

[ELH 05] R. El-Hadj, L. Likeforman-Seulem, C. Mokbel: "Arabic handwriting recognition using


baseline dependant features and hidden Markov models", Proceedings of ICDAR05,
International Conference on Document Analysis and Recognition, Vol 2., pp. 893-897,
Seoul, Korea, August-September 2005.

[FAH 01] M.M.M. Fahmy, S.Al Ali: "Automatic recognition of handwritten Arabic characters using
their geometrical features ". Studies in informatics and control journal (SIC journal), vol.
10, No 2, 2001.

[FAN 95] M. FANTON : "Ligatures et informatique ". Cahiers Gutenberg, no 22, September 1995,
p. 61-85.

[FAR 05] N. Farah, A. Ennaji, T. Kadir, M. Sellami: "Benefit of multiclassifier systems for Arabic
handwri-tten words recognition", ICDAR05, 8th International Conference on Document
Analysis and Recognition, Vol. 1, pp. 222-226, Seoul, Korea, August-September 2005.

[FAR 06] N.Farah, L. Souici, M. Sellami : "Classifiers combination and syntax analysis for Arabic
literal amount recognition", Engineering Applications of Artificial Intelligence, Vol. 19,
N. 1, pp. 29-39, February 2006.

[FUK 90] K.Fukunaga: Introduction to Statistical Pattern Recognition Academic Press". San Diego
, 1990.

[GAA 01] N.Gorski, V. Anisimov, E. Augustin, O. Baret ET S. Maximov: "Industrial bank check
processing: the A2iA CheckReaderTM". International Journal on Document Analysis
and Recognition, 3(4):196206, 2001.

[GAS 05] I. Gasmi, H. Merouani, L. Souici-Meslati: "Combinaison de classifieurs". SETIT 2005


3rd International Conference: Sciences of Electronic, Technologies of Information and
Telecommunications March 27-31, 2005 TUNISIA

[GON 78] R.C. Gonzalez ET M.G. Thomason: "Syntactic Pattern Recognition: An Introduction".
Addison-Wesley, 1978.

[GOR 92] H .Goraine, S. Al Emami: "Off-line arabic character recognition", IEEE Computer
Journal , pp. 71-74, July 1992.

[GOS 96] B. Gosselin : " Application de rseaux de neurones artificiels a la reconnaissance


automatique de caractres manuscrits", 95/96.

[GOW 90] K.Gowely,O. El Dessouki, A. Nazif/ "Multi-phase recognition of multifont photoscript


Arabi text", Proceedings of ICPR90, 10th International Conference on Pattern
Recognition, Vol. 1, pp. 700-702, Atlantic City, NJ, USA, June 1990.

[GRA 03] F. Grandidier : "Un nouvel algorithme de slection de caractristiques-Application la


lecture automatique de lcriture manuscrite ". Thse de Doctorat, Ecole de Technologie
Suprieure, Universit du Qubec, Canada, Janvier 2003.

[GUI 95] D. Guillevic: "Unconstrained Handwriting Recognition Applied to the Processing of Bank
Cheque", Doctorat thesis, Computer Science Department, Concordia University,
Montreal, September 1995.

[GUI 01] S.Guillaume : "Induction de rgles floues interprtables", Thse de Doctorat Laboratoire
danalyse et darchitecture des systmes du CNRS Toulouse Novembre 2001

97
[GUO 92] Z. Guo,R. Hall:"Fast fully parallel thinning algorithm", Computer Vision, Graphical and
Image Processing, Vol. 55, N. 3, 317-328, May 1992.

[HAI 07] S.Haitaamar : "Segmentation de Textes en Caracteres pour la Reconnaissance Optique de


lEcriture Arabe", Universit El-Hadj Lakhdhar Batna, Pour lobtention du diplme de
Magister en informatique Option Informatique Industrielle. Soutenue le 08 Juillet 2007.

[HAS 06] A. Hassaine : "Codage De Graphemes Et Compression Sans Perte Dimages De Manusc-
rits Anciens". Master Recherche II IGI : Spcialit Informatique Graphique et Image.

[HA 96] T.M. Ha, G. Kaufmann, H. Bunke: " Text localization and handwriting recognition",
Technical report, university of Berne, 1996.

[HEU 03] L. Heutte :"Analyse et Reconnaissance de lEcriture : de Nouvelles Perspectives en


Traitement Automatique de Documents Manuscrits". Habilitation Diriger les
Recherches, Universit de Rouen, 2003.

[HEU 05] L.Heutte : "Combinaison de Classifieurs Pourquoi et comment les combiner? " Universit
de Rouen, 2005.

[HO 92] T. K. Ho: "A theory of multiple classifier systems and its application to visual word
recognition". PhD, Faculty of the Graduate School of State University of New-York at
Bufallo, May, 1992.

[HUS 93] D. R. Hush, B. G. Horne: Progress in Supervised Neural Networks". IEEE Signal
Processing Magazine, pp 8-39, Janvier 1993

[IMP 97] S. .Impedevo, P.S.P. Wang, H. Bunke (Editors): "Automatic bankcheck processing",
Series in Machine Perception and Artificial Intelligence, Vol. 28, World Scientific,
1997.

[JAI 00] A. K. Jain, R.P.W. Duin, J. Mao: "Statistical pattern recognition ". A Review, IEEE
Transaction on Pattern Analysis and Machine Intelligence, Vol. 22, No 1, January 2000.

[JAN 92] B. Jang, R. Chin/:"One-pass parallel thinning analysis, properties, and quantitative
evaluation", IEEE Transactions on PAMI, Vol. 14, N. 11, pp. 1129-b1140, November
1992.

[KAR 06] H. Karim : "Une tude de lvolutivit des modles pour la reconnaissance de documents
arabes dans un contexte interactif ". Thse de doctorat soumise la Facult des Sciences
de lUniversit de Fribourg (Suisse) pour lobtention du grade de Doctor Scientiarium
Informaticarum, Thse n1513 Imprimerie St Paul, Fribourg 2006

[KAU 00] G. Kaufmann ET H. Bunke: "Automated reading of cheque amounts". Pattern Analysis &
Applications, 3(2):132141, 2000.

[KB 00] G. Kaufmann et H. Bunke: "Automated reading of cheque amounts", Pattern Analysis &
Applications, 3(2):132141, 2000.

[KER 00] S. Kermi : "Classifieur neuronal base connaissances, application la reconnaissance des
caractres arabes isols manuscrits ". Mmoire de Magister, Universit Badji Mokhtar,
Annaba, Algerie 2000.

[KHP 05] G. Koch, L. Heutte ET T. Paquet: "Automatic extraction of numerical sequences in


handwritten incoming mail documents". Pattern Recognition Letters, 26(8):11181127,
juin 2005.

[KHA 99] N. Kharma, R. Ward: "A New Comprehensive Database of Hand6Written Arabic Words
, Numbers, and Signatures used for OCR Testing". Proceeding of the IEEE Canadian

98
Conference on Electrical & Computer Engineering, Edmonton, Canada, pp. 766-768,
1999.

[KHO 90a] A.Khotanzad ET Y.H. Hong: "Invariant image recognition by zernike moments". IEEE
Trans. Pattern Analysis and Machine Intelligence, 12(5):489497, mai 1990.

[KHO 90b] A.Khotanzad ET Y.H. Hong: "Rotation invariant image recognition using features selec-
ted via a systematic method". Pattern Recognition, 23(10):10891101, 1990.

[KHO 00] M. S. Khorsheed: "Automatic recognition of words in Arabic manuscripts". PHD Theis,
Churchill College, University of Cambridge, UK, Also available as University of
Cambridge, Computer Laboratory Technical Report No. 495, 200.

[KHO 03] M. S. Khorsheed:"Recognising handwritten Arabic manuscripts using a single hidden


Markov model", Pattern Recognition Letters, Vol. 24, N.14, pp. 2235- 2242, October
2003.

[KIM 00] H.K. Kim ET J.D. Kim: "Region-based shape descriptor invariant to rotation, scale and
translation ". Signal Processing: Image Communication, 16(1-2):8793, septembre 2000.

[KIT 98] J. Kittler, M. Hatef, R. Duin et J. Matas : "On Combining Classifiers", IEEE Trans. On
Pattern Analysis and Machine Intelligence, 226-238, 1998.

[KUN 01] L. I. Kuncheva, C. J. Bezdek, R.P.W. Duin: "Decision templates for multiple classifier
fusion: an experimental comparison". Pattern Recognition 34, pp. 299-314, 2001.

[LAA 97] J.Laaksonen: "Subspace Classifiers in Recognition of Handwritten Digits". Computer


science, Helsinky University of Technology, Finland, May 1997.

[LAR 98] J. Larmagnac: "Thinning and line segmentation by line following technique", Proceed-
ings of SPIE98, the International Society of Photo-Optical Instrumentation Engineers,
Vol. 3305, pp. 210-219, San Jose, CA, USA, 1998.

[LEC 93] Y. Lecourtier, B. Dorizzi, P. Sebire, A. Ennaji: "MLP Modular Versus YPR--EL
Classifiers". IWANN 1993: 569-574.

[LEC 94] E.Lecolinet, O. Barett: "Cursive word recognition: Methods and strategies ". in
Fundamentals in handwriting recognition, S. Impedovo Ed., pp. 235-263, NATO ASI
Series F: Computer and Systems Sciences, Vol. 124, Springer Verlag, 1994.

[LET 95] E. Lethelier, M. Leroux ET M. Gilloux: "An automatic reading system for handwritten
numeral amounts on frenches checks. In 3th International Conference on Document
Analysis and Recognition", Montreal, Canada, pages I :9297, 1995.

[LEY 04] Y. Leydier, F. Le Bourgeois et H. Emptoz : "Srialisation du k-means pour la segmentat-


ion des images en couleur". Dans Actes du 8ime colloque international francophone sur
l'crit et le document, CIFED, 21-25 juin 2004, La Rochelle. pp. 191-196. 2004.

[LIP 87] R.P Lippmann: An introduction to computing with neural nets ". IEEE, ASSP magazine,
April 1987.

[LLG 95] E. LETHELIER, M. LEROUX et M. GILLOUX : An automatic reading system for


handwritten numeral amounts on french checks. In 3th International Conference on
Document Analysis and Recognition, Montreal, Canada, pages I :9297, 1995.

[LOA 99] H. Loaiza : "Capteur de Vision Stroscopique Multiconfiguration Pour la Localisation


Dun RobotMobile", Thse Universit dEvry Val dEssonne, 1999.

[LON 98] S. Loncaric: "A survey of shape analysis techniques". Pattern Recognition, 31(8):983
1001, aot 1998.

99
[MAD 97] S. Madhvanath et V. Krpasundar: "Pruning large lexicons using generalized word shape
descriptors ". In 4th International Conference on Document Analysis and Recognition,
Ulm, Allemagne, page Poste, 1997.

[MAH 91] S.A. Mahmoud, I. Abuhaiba,R.J. Green/ "Skeletonization of Arabic characters using
clustering based skeletonization algorithm (CBSA)", Pattern Recognition,Vol. 24, N. 5,
pp. 453-464, 1991.

[MAH 94] S.A. Mahmoud: Arabic character recognition using Fourier descriptors and character
contour encoding ". Pattern recognition, vol. 27, No 6, pp. 815-824, 1994.

[MAS 00] S. Masmoudi, H. Amiri/"Reconnaissance de mots arabes manuscrits par modlisation


markovienne", Actes CIFED00, 6me Colloque International Francophone sur lEcrit et
le Document, pp. 473-482, Lyon, France, 2000.

[MER 04] D. Merad : "Reconnaissance 2D/2D et 2D/3D dobjets partir de leurs squelettes", thse
de Doctorat Spcialit : Robotique, Soutenue le 13 Dcembre 2004.

[MEZ 05] N. Mezghani : "Densits de probabilit dentropie maximale et mmoires associatives


pour la reconnaissance en ligne de caractres Arabes", Thse de Ph.d, Institut national de
la recherche scientifique (INRS), centre nergie, Matriaux et Tlcommunications,
Canada, Juin 2005.

[MIL 98] H. Miled : "Stratgies de rsolution en reconnaissance de lcriture semi-cursive :


application aux mots manuscrits arabes", Thse de doctorat, Universit de Rouen, 1998.

[MOH 96] M. Mohamed and P. Gader: Handwritten word recognition using segmentation-free
hidden Mar-kov modeling and segmentation-based dynamic programming techniques",
IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 18, No. 5, pp.
548-554, 1996.

[MON 95] L. Montoliu : "Architecture multiagents et rseaux connexionnistes : Application la


lecture de chques manuscrits". Thse de Doctorat, Laboratoire LIX, Ecole
polytechnique, Palaiseau, France, 1995.

[MOO 96] B. Moobed: "Combinaison de classifieurs: une nouvelle approche", Thse de Doctorat,
Laboratoi-re LIX, Ecole Polytechnique, Palaiseau, 1996.

[MOR 03] M. E. Morita : " Automatic recognition of handwritten dates on brazilian banh cheques",
Thse de Doctorat, Ecole de Technologie Suprieure, Universit du Qubec, Canada,
2003.

[NEM 09] S. Nemouchi, N. Farah : " Reconnaissance de lEcriture Arabe par systmes Flous",
Proceedings de la Confrence nationale en Informatique, JEESI09, Alger, Algrie,
Vol.6, N.76, Mai 2009.

[NEM 10] S. Nemouchi, N. Farah:"The Recognition of Arabic Writing by Fuzzy System"


, Proceeding IEEE International Conference on Computer and Communication
Engineering ICCCE 2010, Malaysia, Vol.6, N.45, May, 2010.

[OLL 99] B.Ollivier : "Une approche conomisant les traitements pour reconnaitre lcriture
manuscrite : application la de montants littraux de chques bancaires", Thse en
Informatique, Laboratoire LIX, Parie, 1999.

[OSO 98] F. S. Osorio : "INSS: un systeme hybrids neuro-symboliques pour lapprentissage


automatique constructif", Thse en Informatique, Laboratoire LEIBNIZ_IMAG, INPG-
Grenoble, 1998.

100
[OTS 79] N. Otsu: "Athreshold selection method from gray-level histogram ", IEEE Translations on
systems, man and cybernetics, Vol. 9, N. 1, pp. 62-66, 1979.

[PAQ 92] T. Paquet : "Segmentation et classification de mots en reconnaissance optique de textes


manuscrits", Thse de Doctorat, Universit de Rouen, 1992.

[PAR 89] J. Park, V. Govindaraju, S. Srihari : "Efficient word segmentation driven by uncounstrai-
ned handwritten phrase recognition", in : Proceedings of 5th International Conference on
Document Analysis and Recognition, Vol. 1, Bangalore, pp. 605-608, 1989.

[PAV 78] T. Pavlidis: "A review of algorithms for shape analysis". Computer Graphics Image
Processing,Vol. 7, N.2, pp. 243258, Avril 1978.

[PAV 81] T. Pavlidis: "A Flexible Parallel Thinning Algorithm". Proceeding IEEE Comput. Soc.
Conference. on Pattern Recognition and Image Processing. Aot. 1981, pp. 162-167.

[PAV 82] T. Pavlidis: "Algorithms for Graphic and Image Processing", Rockville, MD: Computer
science press, 1982.

[PEC 03] M. Pechwitz, V. Mrgner,"HMM based approach for handwritten Arabic word recogni-
tion using the IFN/ENITdatabase", Proceeding of ICDAR03, 7th International
Conference on Document Analysis and Recognition, Vol. 2, pp. 890-894, Edinburgh,
Scotland, 2003.

[PEC 06] M. Pechwitz,V. Mrgner, H. El Abed: "Comparison of two different feature set for off-
line recognition of handwritten Arabic words", Proceedings of IWFHR06, 10th
International Workshop on Frontiers in Handwriting Recognition, pp. 109-114, La
Baule, France, October 2006.

[QUI 86] J. R. Quinlan: "Induction of Decision Trees ", dans Machine Learning, 1:81-106, 19.

[RAB 89] L. Rabiner : "tutorial on Hiddim Markov Models and selected applications in speech
recognition", in A. Waibel, L. Kai-Fu (Eds), Readings in Speech Recognition , Morgan
Kaufmann, Palo Alto, CA, pp. 267-296, 1989.

[REI 69] G.M. Reicher: "Perceptual recognition as a function of meaningfulness of stimulus


material". Jour-nal of Experimental Psychology, Vol.81, pp. 275280, 1969.

[ROM 95] K Romeo-Pakker, H. Miled, Y. Lecouturier: "A new approach for Latin/Arabic character
segmentation".Proc. IEEE. ICDAR'95 Montreal, Canada, pp 874-877, 1995.

[SAA 85] S. Saadallah, S. G. Yacu :"Design of an Arabic character processing and transmission of
the Ara-bic language". Kuwait 1985.

[SAO 98] G. Saon : "Modles Markoviens uni-bidimensionnels pour la reconnaissance de lcriture


manusc-rite hors-ligne". Thse de doctorat, Universit Henri Poincar Nancy 1, 1997.

[SAR 00] T. Sari : "un systme de reconnaissance de mots arabes manuscrits bas segmentation ",
Mmoire de Magistre, Laboratoire LRI, Dpartement dInformatique, Universit Badji
Mokhtar, Annaba, Algrie, 2000.

[SAR 05] Sari T., Sellami M., "Cursive Arabic script segmentation and recognition system",
International Journal of Computers and Applications, Vol. 27, N. 3, 2005.

[SAU 97] J. Sauvola, T. Sepplanen, S. Haapakoski, ET M. Pietiklainen: "Adaptive Document


binarization", 4th International Conference on Document Analysis and Recognition,
Ulm, Allemagne, Aot, 1997.

[SAY 73] K.M. Sayre: "Machine recognition of handwritten words: a project report ". Pattern
recognition, vol.5, pp. 213-228, 1973.

101
[SEN 98] A. W. Senior, J. Rbinson: "AN off-line cursive handwriting recognition system", IEEE
Transsac-tion on Pattern Analysis and Machine Intelligence 20(3) (1998) 309-327.

[SEY 99] K. Seymore, A. McCallum, R. Rosenfeld: "Learning Hidden Markov model structure for
informa-tion extraction ". AAAI. Workshop on machine learning for information
extraction, pp. 37-42, 1999.

[SIM 84] J.C. Simon : "La Reconnaissance des Formes par Algorithmes". Masson, 1984.

[SIM 92] J.C. Simon: "Off-line cursive word recognition", Proceedings of IEEE, Vol. 80, N. 7, pp.
1150-1161, July 1992.

[SIN 99] S. Singh, A. Amin : "Fuzzy Recognition of Chinese Characters ", Proc. Irish Machine
Vision and Image Processing Conference (IMVIP99), Dublin, 8-9 September, 1999.

[SNO 02a] S. Snoussi-Maddouri,H. Amiri,A. Belaid,C. Choisy: "Combination of Local and Global
Vision Modeling for Arabic Handwritten Word Recognition", International Workshop
Frontier in Handwriting IWFHR02, Canada, pp. 128-135, 2002.

[SNO 02b] S.Snoussi-Maddouri,A. Belaid,C. Choisy,H. Amiri : " Modle perceptif neuronal vision
globale-locale pour la reconnaissance de mots manuscrits arabes", CIFED02, Colloque
International Francophone sur lEcrit et le Document, pp. 11-20, Hammamet, Tunisie,
Octobre 2002.

[SOU 97] L. Souici, Z. Zmirli, M. Sellami : " Systme connexionniste pour la reconnaissance de
larabe manuscrit ". 1res journes scientifiques et techniques (JST FRANCIL), pp. 383-
388, Avignon, France, 1997.

[SOU 06a] L. Souici-Meslati : "Reconnaissance des mots arabes manuscrits par intgration neuro-
symbo-lique", Thse de Doctorat dEtat, Labo. LRI, Dpartement d'informatique,
Universit d'Annaba, Algrie, Fvrier 2006.

[SOU 06b] L. Souici-Meslati, M. Sellami: "Toward a generalization of neuro-symbolic recognition:


An application to arabic words". KES, International Journal of Knowledge-Based and
Intelligent Engineering Systems, Vol.10, N.5, pp. 347-361, 2006.

[SRI 97] S. Srihari: Recent Advances in Off-line Handwriting Recognition" at CEDAR, dans A
.C. Down-ton & S. Impedovo (diteurs) : "Progress in Handwriting Recognition ",
publi par World Scientific, 1997.

[STE 99] T.Steinherz, E. Rivlin, N. Intrator: "Off-line cursive word recognition: a survey ". IJDAR,
International journal on document analysis and recognition, Vol 2, pp. 90-110, 1999.

[SUE 98] C. Y. Suen :"Rflexions sur la reconnaissance de l'criture cursive", CIFED98, premier
Congrs International Francophone sur lEcrit et le document, Vol. 14, pp : 1-8, Qubec,
Canada, Mai 1998.

[TEA 80] M. R. Teague: "Image analysis via the general theory of moments". Journal of the Optical
Society of America, Vol.70, N.8, pp. 920930, Aot 1980.

[THE 88] C.H. The, R.T. Chin: "On image analysis by the methods of moments". IEEE Transact-
ions Pattern Analysis and Machine Intelligence, Vol.10, N.4, pp.496513,Jjuillet 1988.

[TOL 90] M. F. Tolba, E. Shaddad: "On the automatic reading of printed Arabic characters", IEEE
International Conference on Systems, Man and Cybernetics Conference Proceedings, pp.
496 498, 1990.

102
[TRE 97] J.Trenkle, A. Gillies, S. Schlosser:"An off-line Arabic recognition 136 system for machine
printed documents ". Proceeding Of the symposium on document image understanding
technology (SDIUT97), pp. 155-161 1997.

[TRE 04] A. Trmeau, C. Fernandez-Maloigne et P. Bonton, Image numrique couleur, de


lacquisition au traitement, DUNOD, pp. 300.

[TRI 96] O.D. Trier, A.K. Jain et T. Taxt: "Feature-extraction methods for character recognition ":
A survey. Pattern Recognition, Vol. 29, N. 4, pp. 641662, Avril 1996.

[VIN 02] A. Vinciarelli: "A survey on off-line cursive word recognition". Pattern Recognition, Vol.
35, N.7, pp. 14331446, juillet 2002.

[XU 92] L. Xu, A. Krzyzak, C. Y. Seun: "Methods of combining multiple classifiers and their
applications to handwritting recognition", IEEE Transactions on Systems, Man, And
Cybemetics, Vol. 22, N. 3, pp.418-485, may/june 1992.

[YU 90] S.Yu S, W. Tsai: "A new thinning algorithm gray-scale images by the relaxation techni-
que " , Patte-rn Recognition, Vol. 23, N. 10, pp. 1067-1076, 1990

[ZAD 00] L.A. Zadeh: "From computing with numbers to computing with words - from manipula-
tion of measurements to manipulation of perceptions". In Intelligent Systems and Soft
Computing: Prospects, Tools and Applications, pp. 340, London, UK, 2000. Springer-
Verlag.

[ZAH 90] A.Zahour : "Une mthode de reconnaissance de lcriture arabe cursive", Thse de
Doctorat, Universit du Havre, France, 1990.

[ZER 34] F. Zernike: "Diffraction theory of the cut procedure and its improved form, the phase
contrast method". Physica, 1:689704, 1934.

[ZER 07] N. Zermi, M. Ramdani, M. Bedda: "Arabic handwriting word recognition based on hyb-
ride HMM/ANN approach", International Journal of Soft Computing, Vol. 2, N. 1, pp.
5-10, 2007.

[ZGH 02] R. Zeghibi : "Le codage informatique de lcriture arabe", dASMO 449 Unicode et
ISO/CEI 10646, Document numrique, Vol. 6, N. 3, pp. 155-182,2002.

[ZOU 02] H. Zouari, L. Heutte, Y. Lecourtier, A. Alimi : "Un panorama des mthodes de combinai-
son de classifieurs en reconnaissance de formes". RFIA2002, 11m Congrs
francophpne AFRIFAFIA de Reconnaissance des formes et Intelligence Artificielle, Vol.
2, pp. 499-508, Angers, France, janvier, 2002.

[ZOU 04] H. Zouari, L. Heutte, Y. Lecourtier, and A. Alimi: "Building diverse classifier outputs to
evaluate the behavior of combination methods: the case of two classifiers. Multiple
Classifier Systems", Lecture Notes in Computer Science, Springer, LNCS 3077, pp. 237-
282, 2004.

103
ANNEXE A

FORMULAIRES DE LA BASE DE DONNEES


DE MOTS ARABES MANUSCRITS

104
ANNEXE B

DESCRIPTION DE SYSTEME REALISE

B.1. Introduction
Aprs une description dtaille de notre systme et les diffrents algorithmes
utiliss pour le modliser, on parlera de lenvironnement de dveloppement choisi
pour raliser notre application (reconnaissance de mots arabes manuscrits).
Le systme ralis est un systme de reconnaissance des 48 noms des wilayas
algriennes bas sur une approche globale mulicalssifieurs , il comporte la plupart
des phases dun processus de la reconnaissance de lcriture manuscrite, voire Figure
(IV.1) de chapitre IV.
Dans cette annexe, nous allons prsenter lenvironnement de dveloppement de notre
systme, ensuite nous allons dmontrer le fonctionnement du systme et les
diffrentes tapes qui permettent leur mise en uvre.

B.2. Environnement MATLAB VERSION 7.7

Lapplication a t dveloppe sous lenvironnement Windows XP avec le langage de


programmation MATLAB 7.7.
Le nom de MATLAB drive du terme Matrix Laboratory. Il sagit dun outil de
dveloppement pour des problmes scientifiques et, plus gnralement pour tous les
domaines o des calculs numriques importants doivent tres faits.
Le langage de programmation Matlab consiste en un langage interprt qui s'excute
dans une fentre dite d'excution. L'intrt de Matlab tient, d'une part, sa
simplicit dutilisation : pas de compilation, dclaration implicite des variables
utilises et, d'autre part, sa richesse fonctionnelle : arithmtique matriciel et
nombreuses fonctions de haut niveau dans de nombreux domaines (analyse
numrique, graphique, ...). La programmation sous Matlab consiste crire des
scripts de commandes Matlab, excutables dans la fentre d'excution. En outre, grce
aux diverses Toolboxes spcialiss. Dans notre systme nous intressons au
traitement dimage : Filtrage et conception de filtres 2-D - Amlioration et
restauration d'images, oprations morphologiques, gomtriques, et coloration,
transformations 2-D, Analyse d'images et statistiques.

B.3. Fonctionnement du systme


Notre systme se divise en quatre grands modules distincts :

Module de prtraitement.
Module dextraction de caractristiques.
Module de classification :
Les K Plus Proches Voisins (KPPV).
K-MEANS
Fuzzy-C-Means (FCM).
Rseau de neurones (PNN).

108
Module de combinaison :
Par vote de majorit.
Par priorit.

B.3.1. Page d'accueil

Cette fentre permet une premire interaction de lutilisateur avec notre systme. Elle
contient cinq menus Fichier, Prtraitement, Analyse par, Classifier par,
combinaison. Plus dun bouton Close pour quitter le systme

Figure B.1. Page daccueil de systme.

Les autres interfaces ralises sont utilises principalement de manire interactive.


Cet ensemble de menus mis la disposition de lutilisateur afin de mieux guider ses
choix. Ils fonctionnent de la mme manire que les menus des programmes Windows.
Chaque menu est une liste de commandes parmi lesquelles, lutilisateur ralise son
choix laide de la souris. Il commence dabord par choisir le menu quil souhaite
ouvrir et slectionne ensuite, la commande quil veut dans ce menu.

Fichier : contient deux sous menus :

1. Ouvrir : pour choisir la partition la o il y a le dossier des images


sauvegardes.
2. Quit : pour fermer la fentre et sortir du logiciel.

109
Figure B.2. Interface de menu fichier.

Prtraitement : Aprs avoir slectionn limage du mot, lutilisateur peut lancer


la procdure de traitement dimage (Binarisation, Lissage, Squelette, Extraction
Contour).

Figure B.3. Interface de menu prtraitement.

Analyse par : permet dextraire les caractristiques dune image prtraite, en


choisissant le type de caractristiques voulu dextraire (Extraction des
caractristiques : structurelles, Zonage, Zernike ou Code de Freeman).

110
Figure B.4. Interface de menu danalyse de mot.

Classifier par : permet de choisir la mthode de classification parmi les quatre.

Figure B.5. Interface de menu de classification.

Combinaison : nous avons ralis la combinaison entre les quatre types de


classifieurs de deux manires :
1. Combinaison par vote de majorit : o tous les classifieurs ont la mme
priorit.
2. Combinaison avec priorit : en attribuant 2 points aux PNN et KPPV, et un
seul point pour FCM et K-MEANS.

111
Figure B.6. Interface de menu de combinaison.

Aprs la description gnrale de diffrents modules de notre systme, nous dtaillons


chacun de ces modules :

B.3.2. Module de Prtraitement


1. pour obtenir limage binaire on slectionne le sous menu : Binarisation.
2. Pour liminer le bruit, on slectionne le sous menu : Lissage.

La figure suivante illustre le rsultat de prtraitement.

Figure B.7. Rsultat de prtraitement.

112
3. Aprs le nettoyage de limage, nous dtectons les PAWs constituant le mot.
Et nous extrairons le squelette du mot.

Figure B.8. Dtection des composantes connexes et le squelette


.

4. Pour obtenir limage contour du mot, on slectionne le sous menu :


Extraction Contour.

Figure B.9. Dtection de contour.

113
B.3.3. Module dAnalyse
Comme nous avons vue dans le dernier chapitre, nous avons suivi trois mthodes pour
lextraction des caractristiques. Pour dmarrer lanalyse, nous cliquons sur le bouton
droite Dmarrer lanalyse . Et pour sauvegarder le rsultat danalyse, nous
cliquons sur le bouton gauche save .

1. Les caractristiques structurelles du mot :

Figure B.10. Extraction de caractristiques structurelles.

2. Les caractristiques de zonage :

Figure B.11. Extraction de caractristiques de zonage.

114
3. Extraction de code de Freeman :

Figure B.12. Extraction de code de Freeman

B.3.4. Module de Classification


A partir de ce module nous pouvons classifier le mot par les quatre classifieurs
implments selon les trois ensembles de caractristiques extraits dans le module
prcdent. Chacun va donner la classe o appartient le mot, comme le montre la
figure suivante :

Figure B.13. Rsultat de classification.

B.3.4. Module de Combinaison


Donne une dcision finale concernant limage dentre en combinant les diffrentes
dcisions donnes par chacun des classifieurs.

B.4. Rsultats
Pour valuer la performance de la mthode propose, des expriences ont t
ralises sur un sous ensemble de notre base de rfrence LRI relative au vocabulaire
des noms de wilayas algriennes. Ainsi, les expriences dvaluation ont t
drives sur un ensemble de 12960 images pour lapprentissage, et un ensemble de
1440 images pour le test. Le tableau B.1 prsente les rsultats du systme propos

115
Noms des
FCM(%) KMEANS(%) PNN(%)
wilayas
Tebessa 96.66 40 96.66 96.66 86.66 96.66 73.33 80 76.66
Jijel 70 23.33 63.33 63.33 56.66 63.33 73.33 50 76.66
Tissemsilt 40 63.33 33.33 33.33 30 26.66 53.33 93.33 53.33
Khenchela 70 63.33 70 60 30 63.33 76.66 60 80
Mila 53.33 56.66 33.33 56.66 53.33 53.33 50 66.66 43.33
MSILA 26.66 20 30 13.33 13.33 13.33 30 46.66 13.33
Mascara 63.33 33.33 73.33 73.33 63.33 73.33 73.33 40 73.33
Setif 53.33 20 73.33 70 63.33 70 66.66 53.33 66.66
Constantine 66.66 53.33 80 73.33 66.66 73.33 86.66 16.66 86.66
Saida 40 16.66 76.66 70 43.33 70 73.33 56.66 63.33
Bechar 60 73.33 73.33 66.66 56.66 63.33 83.33 93.33 76.66
Bejaia 60 13.33 66.66 63.33 46.66 63.33 46.66 53.33 60
Annaba 33.33 26.66 30 36.66 33.33 36.66 26.66 50 43.33
Batna 20 60 46.66 60 30 60 23.33 63.33 53.33
Biskra 43.33 40 53.33 50 26.66 50 70 33.33 50
Mostaganem 53.33 26.66 56.66 56.66 16.66 56.66 80 70 66.66
Skikda 33.33 33.33 33.33 30 2 30 63.33 36.66 33.33
Tlemcen 60 60 56.66 56.66 36.66 56.66 50 80 73.33
ELbayad 53.33 26.66 53.33 46.66 30 50 80 40 73.33
Ghuelma 36.66 50 70 70 53.33 70 66.66 33.33 73.33
Chlef 50 50 66.66 80 73.33 80 56.66 66.66 70
Djelfa 26.66 50 43.33 46.66 40 46.66 36.66 40 36.66
Tindouf 70 46.66 66.66 66.66 56.66 66.66 73.33 83.33 73.33
AinTemouchent 70 83.33 66.66 66.66 46.66 63.33 60 86.66 60
Tiaret 80 70 76.66 76.66 66.66 76.66 83.33 83.33 83.33
Tamanrasset 40 50 46.66 46.66 16.66 46.66 50 86.66 46.66
Tippaza 73.33 46.66 66.66 60 43.33 60 73.33 56.66 73.33
Ouargla 76.66 56.66 73.33 76.66 66.66 76.66 80 60 80
Illizi 76.66 43.33 66.66 73.33 46.66 73.33 86.66 50 86.66
Relizane 60 46.66 76.66 73.33 66.66 73.33 73.33 70 73.33
Medea 46.66 23.33 43.33 46.66 23.33 46.66 53.33 50 53.33
Blida 73.33 33.33 83.33 83.33 40 80 80 63.33 80
Naama 60 73.33 73.33 66.66 33.33 66.66 73.33 50 73.33
Ghardaia 83.33 70 73.33 76.66 40 76.66 86.66 66.66 83.33
Oran 73.33 50 73.33 73.33 60 73.33 70 53.33 80
SidiBELABES 73.33 83.33 76.66 73.33 60 73.33 70 80 73.33
Bouira 50 66.66 60 56.66 43.33 50 63.33 93.33 66.66
Alger 73.33 56.66 80 76.66 43.33 76.66 90 73.33 96.66
AinDefla 46.66 76.66 60 50 46.66 50 53.33 90 40
Eltaref 50 70 40 33.33 13.33 33.33 70 83.33 53.33
TiziOuzou 70 56.66 73.33 73.33 36.66 70 83.33 76.66 80
Boumerdes 83.33 70 80 76.66 40 76.66 83.33 83.33 80
Adrar 100 100 90 63.33 50 63.33 100 100 100
Eloued 46.66 63.33 56.66 56.66 33.33 56.66 70 83.33 76.66
Laghouat 83.33 70 90 90 73.33 86.66 96.66 70 90
BBArreridj 86.66 90 90 90 80 90 96.66 93.33 100
SoukAhras 96.66 80 93.33 96.66 73.33 93.33 100 93.33 80

OumElBouaghi 60 93.33 83.33 73.33 46.66 73.33 86.66 90 100

Tableau B.1. Rsultats de reconnaissance

116

You might also like