IRIS Readiris Pro 11 User Manual [fr]

I
GUIDE DE LUTILISATEUR
GUIDE DEGUIDE DE
GUIDE DE
GUIDE DEGUIDE DE
LL
’UTILISA’UTILISA
L
’UTILISA
LL
’UTILISA’UTILISA
TEUR
II
Readiris Pro
© 1990-2006 I.R.I.S. Tous droits réservés
Technologie OCR par I.R.I.S.
Technologie Connectionist, AutoFormat et linguistique par I.R.I.S.
Technologie ICR et de lecture de codes à barres
Technologie BCR et danalyse de champs par I.R.I.S.
© 1990-2006 I.R.I.S. Tous droits réservés
III
GUIDE DE LUTILISATEUR
GG
AGNEZAGNEZ
G
AGNEZ
AGNEZAGNEZ
GG
Nous vous félicitons pour votre acquisition de Readiris. Ce logiciel vous sera très utile pour la saisie de vos textes, tables, graphiques, codes à barres et même vos textes manuscrits.
Aussi efficaces que puissent être les ordinateurs, il vous faut toujours d’abord encoder les informations. S’il vous est déjà arrivé de devoir refrapper un rapport de 15 pages ou un grand tableau de chiffres, vous savez comme cette tâche peut être longue et fastidieuse. Utilisez ce logiciel à la pointe du progrès pour encoder automatiquement du texte dans vos applications et vous atteindrez un niveau d’efficacité et de confort jamais atteint! (Deux modes de reconnaisance sont disponibles: le premier assure une vitesse optimale, le second garantit une exac­titude maximale du processus OCR.)
Numérisez un document imprimé ou tapé à la machine, indiquez les zones à lire - ou laissez le système les détecter pour vous -, effectuez la reconnaissance de caractères et envoyez les résultats directement dans votre traitement de texte. Des documents composés de plusieurs pages seront traités du début à la fin avec un effort minime. Quelques clics vous épargnent de longues heures de travail car Readiris convertit vos documents papier en fichiers éditables par l’ordinateur: c’est jusqu’à 40 fois plus rapide que la refrappe manuelle.
L’assistant OCR vous mène à travers le processus d’OCR d’une manière confortable: vous répondez à quelques questions simples pour obtenir des résultats rapides avec Readiris. Vous pouvez envoyer les résultats de la lecture directement dans votre traitement de texte ou dans votre tableur. Pour reconnaître des télécopies et convertir des documents PDF, vous pouvez glisser-déposer les fichiers images depuis l’Explorateur de Windows vers la fenêtre de l’application de Readiris. Ou cliquez avec le bouton droit de la souris sur une image pour l’envoyer aussitôt dans Readiris.
Readiris reconnaît les données insérées dans des tables et les recrée comme feuille de calcul ou comme objet table dans votre traitement de texte; vos données numériques sont immédiatement prêtes pour les manipulations ultérieures.
DUDU
DU
DUDU
TEMPSTEMPS
TEMPS
TEMPSTEMPS
, ,
ENTREZENTREZ
,
ENTREZ
ENTREZENTREZ
, ,
SANSSANS
SANS
SANSSANS
FRAPPERFRAPPER
FRAPPER
FRAPPERFRAPPER
!!
!
!!
IV
Basé sur la technologie Connectionist d’I.R.I.S., Readiris représente ce que
l’OCR vous offre de mieux. La reconnaissance omnifonte est complétée par des techniques d’auto-apprentissage basées sur un réseau neuronal propriétaire. Le système peut apprendre des nouveaux caractères grâce à l’analyse contextuelle: des connaissances linguistiques à propos des syllabes et des mots améliorent les performances de l’OCR.
Readiris reconnaît jusqu’à 126 langues: toutes les langues américaines et
européennes, en ce y compris les langues de l’Europe de l’Est, les langues baltiques, le grec et les langues cyrilliques (“russes”). (De manière optionelle, vous pouvez lire les documents en arabe ainsi que quatre langues asiatiques - le japonais, le chinois simplifié et traditionnel et le coréen.) Readiris se charge également d’alphabets mixtes: le logiciel détecte les mots “occidentaux” qui surviennent dans des textes grecs, cyrilliques, arabes ou asiatiques - de nombreux noms propres, noms de marques, etc. intraduisibles sont écrits avec des symboles occidentaux.
Readiris utilise ces connaissances linguistiques
pendant
la phase de recon­naissance, pas après. Cela permet à Readiris de reconnaître des documents de tous types avec une précision maximale, en ce compris les documents de mauvaise qualité tels que les télécopies et les textes issus d’imprimantes à aiguille. Readiris se charge de documents mal numérisés et de copies de documents contenant des formes trop claires ou trop sombres. Des caractères collés (“ligatures”) sont reconnus avec succès et des formes fragmentées, tels que les symboles issus d’une imprimante matricielle, sont recomposés.
La vérification avec “contexte dans l’image” par l’utilisateur non seulement signale les caractères douteux, mais augmente également la précision du système. Toutes les solutions confirmées par l’utilisateur sont mémorisées, ce qui augmente la vitesse et la fiabilité au fur et à mesure de votre progression. Utiliser Readiris signifie le rendre plus intelligent à chaque fois! Ce puissant outil d’apprentissage vous permet non seulement d’apprendre à Readiris les caractères spéciaux tels que les symboles mathématiques et les dingbats mais aussi de se charger des polices tordues que vous pourrez trouver dans des documents réels.
Pour augmenter encore votre productivité, Readiris non seulement reconnaît vos textes, mais peut aussi les
formater
pour vous! Utilisez “l’autoformatage” et
V
GUIDE DE LUTILISATEUR
Readiris recrée une copie facsimile du document numérisé: le formatage du mot,
du paragraphe et de la page du document original sont retenus.
Les caractères sont reproduits dans une police similaire, la taille et le style des caractères sont également préservés lors de la reconnaissance. L’emplacement des colonnes, des blocs de texte et des graphiques est fidèle à celui de vos docu­ments originaux. Et puisque Readiris reconnaît sans problème les numérisations en échelle de gris et en couleur, vous pouvez saisir n’importe quel graphique ­qu’il s’agisse de modes traits, de photos en noir et blanc ou d’illustrations colorées. Lorsqu’un document contient des tables, Readiris les réorganise dans de vraies cellules et recrée les bordures des tables originales.
En d’autres mots, Readiris vous permet d’archiver une copie exacte de votre document, qui sera un fichier texte éditable et compact au lieu d’une image scannée! Plusieurs niveaux de formatage sont disponibles, le choix appartient à l’utilisateur.
Les codes à barres qui figurent sur les pages numérisées peuvent également être lus, ainsi que les textes manuscrits, à condition que les lettres “imprimées” majuscules soient suffisamment espacées.
Readiris supporte une large variété de numériseurs: de nombreux scanners à plat, à alimentation, les systèmes hybrides ou “tout en un” (également appelés “MFPs”, “périphériques multifonctionnels”) et les appareils photos numériques. Readiris supporte également le standard de saisie Twain, de même que certaines plates-formes de numérisation. automatique, la numérisation avec pause vous permettra toutefois d’acquérir rapidement des documents multipages.
Si vous ne disposez pas d’une alimentation
TT
ABLEABLE
T
ABLE
ABLEABLE
TT
Gagnez du temps, entrez sans frapper! ......................................................................... III
Table des matières .......................................................................................................... V
Droits d’auteur .............................................................................................................VII
Chapitre 1: InstallationChapitre 1: Installation
Chapitre 1: Installation
Chapitre 1: InstallationChapitre 1: Installation
Exigences du système .................................................................................................. 1-1
DESDES
DES
DESDES
MAMA
MA
MAMA
TIÈRESTIÈRES
TIÈRES
TIÈRESTIÈRES
VI
Installation de Readiris ................................................................................................ 1-1
Désinstallation de Readiris .......................................................................................... 1-3
Installation des options logicielles .............................................................................. 1-4
Installation de produits apparentés ............................................................................. 1-6
Fichiers installés .......................................................................................................... 1-8
Fichier “Lisez-moi” et documentation ........................................................................................... 1-8
Formulaire pour les textes manuscrits ............................................................................................ 1-8
Enregistrez-vous! ......................................................................................................... 1-8
Support du produit .................................................................................................... 1-10
Chapitre 2: Chapitre 2:
Chapitre 2:
Chapitre 2: Chapitre 2:
Démarrage du logiciel ...................................................................................................2-1
Le premier démarrage ................................................................................................... 2-2
Découvrez l’interface de Readiris .................................................................................2-2
Débuter avec une première leçon ................................................................................. 2-5
Agrandir l’image ........................................................................................................ 2-10
Un, décomposition d’une image numérisée ............................................................... 2-13
Un et demi, trier des fenêtres ..................................................................................... 2-16
Deux, fenêtrage manuel d’une image ......................................................................... 2-19
Trois, enregistrer des modèles de fenêtrage .............................................................. 2-24
Readiris vous emmène autour du monde ................................................................... 2-27
Readiris change de langue au besoin......................................................................... 2-32
Définir les caractéristiques du document ................................................................... 2-35
Vitesse ou précision? ................................................................................................. 2-37
Readiris devient chaque fois plus intelligent! ............................................................ 2-39
Apprendre......................................................................................................................................... 2-41
Ne Pas Apprendre............................................................................................................................ 2- 42
Effacer .............................................................................................................................................. 2-43
Annuler ............................................................................................................................................. 2-43
Finir ................................................................................................................................................... 2-43
Interrompre...................................................................................................................................... 2-43
Le rôle des dictionnaires de fontes ............................................................................ 2-43
Envoyer le résultat dans votre application ................................................................ 2-47
Sauvegarder les résultats dans un fichier texte .......................................................... 2-50
Créer des documents portables... ............................................................................... 2-54
... ou les lire! ............................................................................................................... 2-63
Reconnaissance de pages multiples .......................................................................... 2-66
Édition de documents multipages .............................................................................. 2-75
VV
isite guidéeisite guidée
V
isite guidée
VV
isite guidéeisite guidée
VII
GUIDE DE LUTILISATEUR
Commencer avec un nouveau document ................................................................... 2-78
Reconnaissance des zones de texte ........................................................................... 2-79
Organisation du texte saisi ......................................................................................... 2-81
Configuration du numériseur ..................................................................................... 2-82
Mettez un peu de couleur dans vos textes! ............................................................... 2-85
À différents appareils, différentes résolutions ........................................................... 2-88
Sauvegarder les paramètres par défaut ...................................................................... 2-93
Sauvegarde de paramètres spécifiques ...................................................................... 2-94
Numériser des documents .......................................................................................... 2-95
Ajuster les images numérisées ................................................................................... 2-98
Laisser l’assistant travailler pour vous .................................................................... 2-103
Readiris recrée la mise en page d’un document ....................................................... 2-104
Des colonnes s’il vous plait, pas de cadres! ............................................................ 2-109
Formater le texte, deuxième partie ............................................................................. 2-112
Exporter du texte plusieurs fois ................................................................................ 2-113
Sauvegarder des graphiques à part.......................................................................... 2-114
Recréer les couleurs des colonnes, des cadres ........................................................ 2-117
Retenir les couleurs du texte .................................................................................... 2-119
Lecture de fax et reconnaissance en différé ............................................................. 2-121
Reconnaissance des tables ...................................................................................... 2-123
Reconnaître des textes manuscrits ........................................................................... 2-132
Lire les barres et les espaces .................................................................................... 2-136
Obtenir de l’aide en ligne ......................................................................................... 2-139
DD
ROITSROITS
D
ROITS
ROITSROITS
DD
Le logiciel Readiris est conçu et développé par I.R.I.S. Les technologies OCR, ICR, lecture de codes à barres, Connectionist, AutoFormat et la technologie linguistique par I.R.I.S. I.R.I.S. détient tous les droits d’auteur pour le logiciel Readiris, la technologie OCR, la technologie ICR, la technologie de lecture de codes à barres, la technologie linguistique, l’aide en ligne et ce manuel.
AutoFormat, Cardiris, Connectionist, le logo I.R.I.S., Readiris et la technologie linguistique I.R.I.S. sont des marques déposées d’I.R.I.S.
’’
DD
D
DD
’’
AUTEURAUTEUR
AUTEUR
AUTEURAUTEUR
VIII
Le parser XML est développé par Apache. Ce produit inclut un logiciel conçu
par Apache Software Foundation (www.apache.org).
Acrobat et Reader sont des marques déposées d’Adobe. Excel, Windows et
Word sont des marques (déposées) de Microsoft. Intel est une marque déposée d’Intel.
1 - 1
GUIDE DE LUTILISATEUR
Chapitre 1
I NSTALLATION
Ce chapitre décrit les exigences du système et l’installation de Readiris.
EE
XIGENCESXIGENCES
E
XIGENCES
XIGENCESXIGENCES
EE
Voici la configuration minimale requise pour utiliser Readiris:
un PC Intel 486 ou compatible. Un PC Pentium est recommandé.
64 MO de mémoire vive. 128 MO de mémoire vive sont recommandés
pour traiter les images en échelle de gris et en couleur.
120 MO d’espace disponible sur le disque dur. 105 MO d’espace suffisent
si vous laissez les fichiers d’exemple sur le CD-ROM.
le système d’exploitation Windows XP, Windows ME, Windows 2000,
Windows 98 ou Windows NT 4.0.
Notez que certains sous la (ou les) dernière(s) version(s) de Windows! Consultez la documentation fournie avec votre scanner pour savoir quelles sont les plates-formes supportées.
II
NSTNST
ALLAALLA
I
NST
ALLA
NSTNST
ALLAALLA
II
Readiris est exclusivement livré sur un l’installer, insérez simplement le CD-ROM dans votre lecteur de CD-ROM et attendez que le programme d’installation commence à tourner. Suivez les instruc­tions à l’écran.
Si l’installation ne démarre pas quand le CD-ROM est inséré dans votre lecteur, utilisez le programme MENU.EXE
DUDU
DU
DUDU
TIONTION
TION
TIONTION
SYSTÈMESYSTÈME
SYSTÈME
SYSTÈMESYSTÈME
pilotes de numériseurspilotes de numériseurs
pilotes de numériseurs peuvent ne pas fonctionner
pilotes de numériseurspilotes de numériseurs
R R
DEDE
DE
DEDE
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
R R
CD-ROM auto-exécutableCD-ROM auto-exécutable
CD-ROM auto-exécutable. Pour
CD-ROM auto-exécutableCD-ROM auto-exécutable
pour installer le programme.
1 - 2
Les utilisateurs de Windows XP, Windows 2000 et Windows NT 4.0 doivent
s’assurer qu’ils ont les
droits d’accèsdroits d’accès
droits d’accès nécessaires - contactez l’administrateur
droits d’accèsdroits d’accès
du système si nécessaire.
Une installation complète et personnalisée est offerte. Assurez-vous d’installer
bases de données linguistiquesbases de données linguistiques
les
bases de données linguistiques de toutes les langues que vous souhaitez
bases de données linguistiquesbases de données linguistiques lire. Par défaut, tous les lexiques sont installés. Nous vous recommandons d’installer les
images exemples images exemples
images exemples qui sont utilisées dans le didacticiel de ce manuel.
images exemples images exemples
De façon similaire, le
manuel électroniquemanuel électronique
manuel électronique est par défaut copié sur votre
manuel électroniquemanuel électronique disque dur. Vous pouvez par contre le laisser sur le CD-ROM. (Installez le programme
Adobe ReaderAdobe Reader
Adobe Reader requis pour accéder à la documentation sur le
Adobe ReaderAdobe Reader
programme si cela s’avère nécessaire.)
Le sous-menu "Applications I.R.I.S.- Readiris" sous le menu "Programmes"
est automatiquement créé à l’installation du programme.
1 - 3
GUIDE DE LUTILISATEUR
Il en va de même pour le
dows. Vous pourrez ainsi démarrer directemment Readiris depuis votre bureau.
DD
ÉSINSTÉSINST
D
ÉSINST
ÉSINSTÉSINST
DD
Il n’y a qu’une manière correcte de désinstaller Readiris: en utilisant l’assistant
de (dés)installation de Windows. Nous vous recommandons fermement de
pas
désinstaller Readiris ou ses modules en supprimant manuellement les fichiers
du logiciel!
Exécutez les étapes suivantes pour utiliser l’
de de
WW
de
W
de de
WW
Cliquez sur "Paramètres" dans le menu "Démarrer" de Windows et
Cliquez sur l’icône "Ajout/Suppression de Programmes" dans le panneau
ALLAALLA
ALLA
ALLAALLA
indowsindows
indows.
indowsindows
passez sur le "Panneau de Configuration".
de configuration.
TIONTION
TION
TIONTION
raccourci raccourci
raccourci vers Readiris sur le
raccourci raccourci
R R
DEDE
DE
DEDE
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
R R
assistant de (dés)installationassistant de (dés)installation
assistant de (dés)installation
assistant de (dés)installationassistant de (dés)installation
bureau bureau
bureau de Win-
bureau bureau
ne
1 - 4
Suivez les instructions à l’écran pour supprimer le logiciel Readiris.
II
NSTNST
ALLAALLA
I
NST
ALLA
NSTNST
ALLAALLA
II
Il y a une seule option logicielle disponible qui complète Readiris: le
Complément d’OCR asiatiqueComplément d’OCR asiatique
Complément d’OCR asiatique”. Ce module vous permet de lire le japonais,
Complément d’OCR asiatiqueComplément d’OCR asiatique
le chinois traditionnel, le chinois simplifié et le coréen.
TIONTION
TION
TIONTION
DESDES
DES
DESDES
OPTIONSOPTIONS
OPTIONS
OPTIONSOPTIONS
LOGICIELLESLOGICIELLES
LOGICIELLES
LOGICIELLESLOGICIELLES
1 - 5
GUIDE DE LUTILISATEUR
Ce logiciel est également livré sur un CD-ROM auto-exécutable. En installant cette option, vous disposez d’une documentation spécifique traitant de la recon­naissance de documents asiatiques.
1 - 6
II
NSTNST
ALLAALLA
I
NST
ALLA
NSTNST
ALLAALLA
II
En fonction de la version du programme que vous venez d’acquérir, Readiris
peut être complété par une version d’essai du produit apparenté Cardiris, un organisateur de cartes de visiteorganisateur de cartes de visite
organisateur de cartes de visite.
organisateur de cartes de visiteorganisateur de cartes de visite
Si ce programme complémentaire gratuit se trouve sur votre CD-ROM, il est
également installé en utilisant le CD-ROM auto-exécutable et en suivant les in­structions à l’écran.
Contactez I.R.I.S. pour en savoir plus sur les programmes complémentaires;
la commande "Contacter I.R.I.S." sous le menu "Aide" de Readiris vous explique de quelles manières vous pouvez contacter I.R.I.S.
TIONTION
TION
TIONTION
DEDE
DE
DEDE
PRODUITSPRODUITS
PRODUITS
PRODUITSPRODUITS
APPAPP
APP
APPAPP
ARENTÉSARENTÉS
ARENTÉS
ARENTÉSARENTÉS
1 - 7
GUIDE DE LUTILISATEUR
Une icône d’application dans le sous-menu "Applications I.R.I.S. - Readiris" sous le menu "Programmes" vous permet d’accéder directement à la d’accueild’accueil
d’accueil d’I.R.I.S. De même l’écran de démarrage de Readiris et la commande
d’accueild’accueil "I.R.I.S. sur Internet" sous le menu "Aide" de Readiris.
pagepage
page
pagepage
1 - 8
FF
ICHIERSICHIERS
F
ICHIERS
ICHIERSICHIERS
FF
Le programme d’installation a créé un dossier où se trouvent les fichiers de
Readiris. N’essayez jamais de désinstaller Readiris ou certains de ses modules en supprimant manuellement des fichiers du programme, utilisez pour ce faire l’assistant de désinstallation de Windows. Voir plus haut.
Fichier “Lisez-moi” et documentationFichier “Lisez-moi” et documentation
Fichier “Lisez-moi” et documentation
Fichier “Lisez-moi” et documentationFichier “Lisez-moi” et documentation
README.HTML Fichier de type “Lisez-moi” (en format HTML) MANUAL.PDF Manuel d’utilisateur (en format Adobe Acrobat)
Formulaire pour les textes manuscritsFormulaire pour les textes manuscrits
Formulaire pour les textes manuscrits
Formulaire pour les textes manuscritsFormulaire pour les textes manuscrits
TEMPLATE.PDF Formulaire vierge pour textes manuscrits
TEMPLATE.DOC Formulaire vierge pour textes manuscrits
EE
NREGISTREZNREGISTREZ
E
NREGISTREZ
NREGISTREZNREGISTREZ
EE
N’oubliez pas d’enregistrer votre licence Readiris! Ceci nous permettra de
vous tenir informé des futurs développements du produit ainsi que des autres produits I.R.I.S. apparentés. Les avantages de l’enregistrement, entre autres le support support
support gratuit
support support aux utilisateurs enregistrés.
Vous pouvez enregistrer le produit de plusieurs façons: envoyez la carte
d’enregistrement ou télécopiez son équivalent électronique, téléphonez à I.R.I.S. pendant les heures ouvrables ou encore remplissez un formulaire d’enregistrement sur le site web d’I.R.I.S.
INSTINST
ALLÉSALLÉS
INST
ALLÉS
INSTINST
ALLÉSALLÉS
(version pour l’impression) (en format Adobe Acrobat)
(version éditable) (en format Word)
--
VOUSVOUS
-
VOUS
VOUSVOUS
--
du produitdu produit
du produit et les
du produitdu produit
!!
!
!!
offres spécialesoffres spéciales
offres spéciales, sont exclusivement réservés
offres spécialesoffres spéciales
1 - 9
GUIDE DE LUTILISATEUR
assistant d’enregistrementassistant d’enregistrement
L’
assistant d’enregistrement que vous trouverez sous le menu "Aide" du
assistant d’enregistrementassistant d’enregistrement logiciel Readiris vous accompagnera pour accomplir facilement la procédure d’enregistrement.
1 - 10
Selon la version que vous possédez, vous recevrez en retour la
qui vous sera peut-être nécessaire pour pouvoir continuer à utiliser Readiris après un mois.
SS
UPPORUPPOR
S
UPPOR
UPPORUPPOR
SS
La commande "Support du Produit" sous le menu "Aide" de Readiris vous
explique comment obtenir de l’aide technique. Décrivez clairement le problème rencontré et ajoutez à votre description toutes les données utiles au sujet de Readiris, votre numériseur et de votre ordinateur.
DUDU
DU
DUDU
PRODUITPRODUIT
PRODUIT
PRODUITPRODUIT
TT
T
TT
clé logicielleclé logicielle
clé logicielle
clé logicielleclé logicielle
1 - 11
GUIDE DE LUTILISATEUR
Mais avant de solliciter le support du produit, nous vous recommandons de vérifier si des Utilisez la commande "Rechercher des Mises à Jour" dans le menu "Aide" afin d’en vérifier la disponibilité.
mises à jour du logicielmises à jour du logiciel
mises à jour du logiciel sont disponibles au téléchargement.
mises à jour du logicielmises à jour du logiciel
1 - 12
2 - 1
GUIDE DE LUTILISATEUR
Chapitre 2
VISITE GUIDÉE
Readiris est un produit de pointe pour la reconnaissance optique de caractères (OCR), avec de nombreuses caractéristiques avancées. Nous envisagerons dans ce chapitre les principales applications de Readiris ainsi que de nombreuses astuces pour mieux l’utiliser.
DD
ÉMARRAGEÉMARRAGE
D
ÉMARRAGE
ÉMARRAGEÉMARRAGE
DD
Cliquez sur l’application Readiris dans le sous-menu "Applications I.R.I.S. ­Readiris", ou cliquez sur le raccourci vers Readiris sur votre bureau Windows.
L’écran de démarrage ainsi que la fenêtre de l’application Readiris apparaissent. L’écran de démarrage affiche la version du logiciel ainsi que des messages liés aux droits d’auteur. Il vous permet en outre un accès direct à la d’I.R.I.S. - il vous suffit de cliquer sur l’URL pour visiter le site web d’I.R.I.S. Cliquez avec la souris n’importe où ailleurs pour faire disparaître cet écran.
La fenêtre suivante concerne l’assistant d’OCR. Cliquez sur "Annuler" pour le moment.
DUDU
DU
DUDU
LOGICIELLOGICIEL
LOGICIEL
LOGICIELLOGICIEL
page d’accueilpage d’accueil
page d’accueil
page d’accueilpage d’accueil
2 - 2
LL
EE
PREMIERPREMIER
L
E
PREMIER
EE
PREMIERPREMIER
LL
En fonction de la version acquise du logiciel, le premier démarrage peut être
particulier: on peut vous demander d’enregistrer votre licence.
Si c’est le cas, l’utilisation de Readiris est limitée à un mois, et en vous
enregistrant, I.R.I.S. vous enverra gratuitement une continuer à utiliser le logiciel après 30 jours.
numéro d’identificationnuméro d’identification
Votre
numéro d’identification est nécessaire à la création de la clé logicielle.
numéro d’identificationnuméro d’identification Assurez-vous que ce numéro est disponible ou mentionné quand vous enregistrez votre licence.
DÉMARRAGEDÉMARRAGE
DÉMARRAGE
DÉMARRAGEDÉMARRAGE
clé logicielleclé logicielle
clé logicielle afin de pouvoir
clé logicielleclé logicielle
DD
ÉCOUVREZÉCOUVREZ
D
ÉCOUVREZ
ÉCOUVREZÉCOUVREZ
DD
La fenêtre d’application de Readiris ne contient pas seulement les
commandecommande
commande mais aussi deux barres de boutons qui donnent accès aux commandes
commandecommande fréquemment utilisées. Initialement, certains menus de commandes sont grisés: ils concernent la prévisualisation. Aussi longtemps qu’aucune image n’est ouverte, ils ne sont pas accessibles.
’’
LL
L
LL
’’
INTERFINTERF
INTERF
INTERFINTERF
ACEACE
ACE
ACEACE
DEDE
DE
DEDE
R R
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
R R
menus demenus de
menus de
menus demenus de
2 - 3
GUIDE DE LUTILISATEUR
Il en est de même pour la d’application: elle contient toutes les commandes utiles à la prévisualisation. La barre d’outils principalebarre d’outils principale
barre d’outils principale sur la gauche de l’écran permet un accès rapide à
barre d’outils principalebarre d’outils principale toutes les commandes générales fréquemment utilisées.
Pour savoir quelle commande correspond à quel bouton, tenez le pointeur de votre souris sur lui pendant un moment: la
barre d’outils imagebarre d’outils image
barre d’outils image à la droite de la fenêtre
barre d’outils imagebarre d’outils image
bulle explicative bulle explicative
bulle explicative de l’outil s’affichera.
bulle explicative bulle explicative
2 - 4
La zone centrale de la fenêtre ou la
zone d’imagezone d’image
zone d’image est l’endroit où les images
zone d’imagezone d’image numérisées sont affichées. Vous pouvez glisser-déposer des fichiers image dans la zone image et sur l’icône Readiris pour les reconnaître.
Dès que des images ont été traitées, une barre d’outils
barre d’outils des pagesbarre d’outils des pages
barre d’outils des pages, s’ajoute à gauche de la zone d’image: elle représente
barre d’outils des pagesbarre d’outils des pages
supplémentaire, la
les différentes pages du document et permet l’accès aux commandes de la page en cliquant sur le bouton droit de la souris (menu "Contexte").
2 - 5
GUIDE DE LUTILISATEUR
De plus, le numérisée. Ce panneau affiche des sur les pages scannées: la source de l’image et la résolution, la durée de la numérisation et de la reconnaissance, etc. (Le panneau des documents est également accompagné de bulles explicatives...)
DD
ÉBUTERÉBUTER
D
ÉBUTER
ÉBUTERÉBUTER
DD
La meilleure façon de se familiariser avec le logiciel Readiris est indubitablement de l’utiliser. Un certain nombre d’
panneau des documentspanneau des documents
panneau des documents est alors affiché en dessous de l’image
panneau des documentspanneau des documents
données statistiquesdonnées statistiques
données statistiques et des informations
données statistiquesdonnées statistiques
AA
A
AA
VECVEC
VEC
VECVEC
UNEUNE
UNE
UNEUNE
PREMIÈREPREMIÈRE
PREMIÈRE
PREMIÈREPREMIÈRE
LEÇONLEÇON
LEÇON
LEÇONLEÇON
images prénumériséesimages prénumérisées
images prénumérisées est
images prénumériséesimages prénumérisées
2 - 6
fourni avec le programme; elles vous permettent de commencer son utilisation même s’il n’y a pas de scanner connecté à votre ordinateur. Voyons ce qu’il en est.
Le bouton "Source" sur la barre des boutons principale détermine si vous allez
scanner une image ou si vous allez utiliser une image prénumérisée comme im­age source.
Les images en couleur, niveaux de gris et noir et blanc sont indifféremment
supportées. Readiris vous permet d’ouvrir des documents Adobe Acrobat PDF, des télécopies DCX (une version multipage du format Paintbrush), des images DjVu (*.djv, *.djvu), des images JPEG, des images JPEG 2000 (*.j2c, *.jp2), des images PNG, des images TIFF (non-compressées et compressées en LZW, PackBits, Groupe 3 et Groupe 4), des images TIFF multipages, des bitmaps Win­dows (*.bmp) et des images ZSoft Paintbrush (*.pcx).
Cette possibilité est particulièrement utile pour convertir vos
télécopies télécopies
télécopies en
télécopies télécopies
fichiers texte éditables.
Comme nous allons ouvrir une image préscannée, vous devez sélectionner
"Fichiers Image" et non le numériseur comme source d’image au moyen du bou­ton "Source".
Ensuite, cliquez sur le bouton "Ouvrir". (Quand vous sélectionnez le disque
comme source d’images, le bouton "Numériser" est remplacé par le bouton "Ouvrir" et la commande correspondante "Numériser" sous le menu "Action" est remplacé par la commande "Ouvrir".)
2 - 7
GUIDE DE LUTILISATEUR
Vous pourriez également sélectionner la commande "Ouvrir" du menu "Fichier" et ouvrir directement une image prénumérisée - ceci fonctionne même lorsque votre numériseur est utilisé comme source d’image.
Vous êtes invité à sélectionner un fichier image. Sélectionnez le fichier FRENCH.JPG dans le dossier "Samples", un sous-dossier du dossier de Readiris. (Toutes les images d’exemple se trouvent dans ce dossier!) Comme ce fichier d’exemple est une image couleur, il ne sera pas seulement lu depuis le disque dur: une version noir et blanc est créée pour le procéssus d’OCR (“binarisation”).
Finalement, l’image s’affiche dans la zone image. La barre d’outils des pages et le panneau des documents indiquent qu’une seule page est chargée dans Readiris.
2 - 8
Une troisième façon d’ouvrir des images prénumérisées est d’utiliser la méthode
glisserglisser
du “
-déposer-déposer
glisser
-déposer”. Faites glisser des images depuis l’Explorateur Windows
glisserglisser
-déposer-déposer
vers la zone image de Readiris ou sur l’icône Readiris pour les ouvrir directement.
2 - 9
GUIDE DE LUTILISATEUR
Enfin, vous pouvez également ouvrir des images à partir de l’Explorateur Win-
cliquezcliquez
dows:
cliquez avec le bouton
cliquezcliquez la commande "Reconnaître" du menu "Contexte". (Cette commande n’apparaît que lorsque le type de fichier est supporté.)
droit droit
droit de la souris sur un fichier image et sélectionnez
droit droit
2 - 10
Cela ne signifie pas que l’OCR s’éxécute sur le champ: afin que l’utilisateur
bénéficie de plus de souplesse, Readiris démarre tout simplement et l’image s’ouvre aussitôt.
La barre d’outils image à la droite de la fenêtre d’application de Readiris
contient toutes les commandes dont vous avez besoin pour la prévisualisation: les outils pour indiquer les zones d’intérêt, pour faire pivoter l’image, pour agrandir l’image, etc.
AA
GRANDIRGRANDIR
A
GRANDIR
GRANDIRGRANDIR
AA
Readiris a plusieurs commandes qui vous permettent d’
numérisée, par exemple pour vérifier la qualité de numérisation.
La barre d’outils image contient des boutons qui permettent d’effectuer un
zoom en taille réelle, d’ajuster l’image à la largeur de page et d’ajuster l’image
LL
L
LL
’’
IMAGEIMAGE
IMAGE
IMAGEIMAGE
’’
agrandiragrandir
agrandir l’image
agrandiragrandir
2 - 11
GUIDE DE LUTILISATEUR
entière dans la fenêtre d’aperçu. Le menu "Vue" contient les mêmes commandes et ajoute deux niveaux de zoom supplémentaires: vous pouvez afficher l’image à 50% et 200% de sa taille actuelle. A sa taille actuelle, un point écran correspond à un point image. (Des raccourcis clavier existent pour tous les niveaux de zoom!)
Remarquez aussi que les niveaux d’agrandissement sont accessibles grâce au double clic. Cliquez avec le bouton droit de la souris pour faire apparaître le menu contextuel et sélectionner le niveau de zoom approprié.
2 - 12
De plus, vous pouvez en cliquant
deux fois
avec le bouton droit de la souris sur une région de l’image numérisée en faire directement un agrandissement à sa taille réelle. Refaites l’opération pour revenir à la taille réelle.
Enfin, vous pouvez utiliser la
loupeloupe
loupe pour agrandir les détails des documents
loupeloupe numérisés. La loupe est aussi disponible sous le menu "Contexte" lorsque vous cliquez avec le bouton droit de la souris sur l’image.
Appuyez sur la touche Échappement ou cliquez avec la souris afin de faire
disparaître la loupe!
2 - 13
GUIDE DE LUTILISATEUR
UU
, ,
NN
U
UU
que vous souhaitez lire en traçant des cadres, également appelées “fenêtres”, autour des zones d’intérêt.
"Analyse de Page" est activée sous le bouton "Options" de la barre d’outils principale (ou sous le menu "Configuration").
des pourrait inclure des graphiques et des tables - sont reconnus.
DÉCOMPOSITIONDÉCOMPOSITION
N
,
DÉCOMPOSITION
NN
DÉCOMPOSITIONDÉCOMPOSITION
, ,
Maintenant que l’image est numérisée, vous pouvez définir les parties de textes
En fait, Readiris effectuera automatiquement cette opération quand l’option
La décomposition automatique de la page est particulièrement utile lorsque
textes sous formes de colonnestextes sous formes de colonnes
textes sous formes de colonnes ou à la mise en page complexe - qui
textes sous formes de colonnestextes sous formes de colonnes
’’
DD
D
DD
’’
UNEUNE
UNE
UNEUNE
IMAGEIMAGE
IMAGE
IMAGEIMAGE
NUMÉRISÉENUMÉRISÉE
NUMÉRISÉE
NUMÉRISÉENUMÉRISÉE
2 - 14
L’analyse de page utilise trois
types de fenêtrestypes de fenêtres
types de fenêtres: les fenêtres textes, les
types de fenêtrestypes de fenêtres fenêtres graphiques et les fenêtres tables. Readiris distingue les blocs de texte, les tables et les zones graphiques qui contiennent des photos, des illustrations, etc. (La sauvegarde des graphiques et la reconnaissance des tables seront expliquées plus tard.)
Il y a deux types de fenêtres que vous devez toujours dessiner manuellement:
les zones de codes à barres et les zones de texte manuscrit. (Nous parlerons de
2 - 15
GUIDE DE LUTILISATEUR
lecture de codes à barres et de reconnaissance de lettres manuscrites “non cursives” plus tard.)
code couleurcode couleur
Un
code couleur permet de distinguer les types de fenêtre: les fenêtres
code couleurcode couleur textes ont un bord orange, les fenêtres graphiques ont un bord pourpre et les fenêtres tables un bord rose. Les fenêtres de codes à barres sont vertes et les fenêtres de texte manuscrit sont bleues.
Le nombre de fenêtres est spécifié à tout moment dans les bulles explicatives
des outils des fenêtres.
L’analyse de page est rapide et hautement précise, elle reconnaît des lignes
inclinées et elle trace des figures complexes, “irrégulières”.
L’analyse de page détectera même des zones où vous aurez un
sur fond noirsur fond noir
sur fond noir. La reconnaissance de ce type d’insertions ne pose pas de problème:
sur fond noirsur fond noir l’image apparaît à l’écran telle qu’elle est numérisée, mais Readiris “inverse” l’image pendant la phase de reconnaissance pour reconnaître de tels blocs de texte. (Vous pouvez grâce à votre numériseur générer des images inversées pour les pages ayant du texte blanc sur fond noir. Voir plus bas.)
texte blanctexte blanc
texte blanc
texte blanctexte blanc
complètement
2 - 16
UU
NN
ETET
U
N
NN
UU
Readiris ne détecte pas seulement les différents blocs, mais en plus le logiciel
les
trie
traiter les documents multicolonnes. Des numéros indiquent l’ordre de tri.
Vous pouvez évidemment modifier l’
bouton "Trier" sur la barre d’outils image. Le curseur prend la forme d’une main qui pointe dès que le mode de tri est activé.
Cliquez à l’intérieur des fenêtres pour les inclure. Les fenêtres sur lesquelles
vous différence entre les fenêtres séléctionnées et les fenêtres non sélectionnées est claire: les fenêtres séléctionnées ont une couleur plus vive, les fenêtres non sélectionnées ont une couleur plus pâle et ne portent pas de numéro.
DEMIDEMI
ET
DEMI
ETET
DEMIDEMI
: les blocs sont triés du haut vers le bas, de gauche à droite afin de bien
ne
cliquez
, ,
TRIERTRIER
,
TRIER
TRIERTRIER
, ,
pas
sont tout simplement ignorées, exclues de la “lecture”. La
DESDES
DES
DESDES
FENÊTRESFENÊTRES
FENÊTRES
FENÊTRESFENÊTRES
ordre deordre de
ordre de
ordre deordre de
tritri
tri. Pour ce faire, cliquez sur le
tritri
2 - 17
GUIDE DE LUTILISATEUR
L’analyse de page est activée par défaut. Pour forcer Readiris à décomposer la page activée - ce pourrait être nécessaire si vous avez désactivé l’analyse de page ou supprimé certaines fenêtres par erreur et souhaitez recommencer l’analyse de page, etc. -, cliquez simplement sur le bouton "Analyser la Page" dans la barre d’outils image.
2 - 18
Si vous traitez des documents asiatiques, sélectionnez la langue du document
avant
d’effectuer l’analyse de page car des routines spécifiques propres à la
langue sont utilisées. L’espace interligne des documents asiatiques est généralement plus grand que dans les documents occidentaux, le texte est composé de petites icônes (“idéogrammes”) qui pourraient facilement être interprétées comme des zones graphiques dans les documents occidentaux, en outre le texte peut se lire de haut en bas, de droite à gauche. Si toutefois vous oubliez de sélectionner la langue adéquate, sélectionnez-la tout de même à postériori. Readiris refera automatiquement l’analyse de page!
Les images des documents peuvent contenir du bruit (taches “parasites” sur
le texte, bord noir autour du texte, etc.). Des petites fenêtres apparaissent alors à l'écran pour indiquer la présence de ce bruit. Si les petites fenêtres ne contiennent aucun texte, vous pouvez les supprimer en cliquant sur la commande "Supprimer les Petites Fenêtres" sous le menu "Edition". Ce faisant, Readiris triera à nouveau les autres fenêtres affichées à l'écran.
Une routine similaire opère de façon automatique: la non-détection des zones
sur les bords. Quand cette routine est désactivée dans le menu "Configuration", l’analyse de page ignore tout simplement les zones sur les bords de page. Cette option est particulièrement utile parce que certains numériseurs ajoutent des bords noirs autour de l’image numérisée; l’analyse de page détecte normalement des petites fenêtres indiquant la présence de “bruit”. Grâce à la routine, les fenêtres inutiles ne s’affichent donc pas! Attention, si les bords de page contiennent des zones graphiques, photos ou illustrations - par exemple, une illustration en arrière-
2 - 19
GUIDE DE LUTILISATEUR
plan ou qui couvre la page entière, etc. -, Readiris détectera malgré tout correctement ces éléments!
DD
D
DD
mais vous pouvez dessiner manuellement des zones avec les de Readiris.
, ,
EUXEUX
EUX
EUXEUX
L’analyse de page traite automatiquement le fenêtrage d’une page numérisée,
FENÊTRAGEFENÊTRAGE
,
FENÊTRAGE
FENÊTRAGEFENÊTRAGE
, ,
MANUELMANUEL
MANUEL
MANUELMANUEL
’’
DD
D
DD
’’
UNEUNE
UNE
UNEUNE
IMAGEIMAGE
IMAGE
IMAGEIMAGE
outils de fenêtrageoutils de fenêtrage
outils de fenêtrage
outils de fenêtrageoutils de fenêtrage
2 - 20
(Comme nous avons déjà indiqué, les fenêtres de codes à barres et de texte
manuscrit sont toujours dessinées à la main par l’utilisateur: l’analyse de page ne les détecte pas!)
tracer tracer
Pour
tracer un rectangle autour d’une zone d’interêt, sélectionnez l’outil
tracer tracer correspondant dans la barre d’outils image et glissez la souris du coin supérieur gauche vers le coin inférieur droit de la zone. (Les côtés du rectangle ne peuvent être inférieurs à 1 mm. car ils ne seraient pas suffisants pour contenir les caractères.)
Si vous avez sélectionné le mauvais type de zone, vous pouvez corriger rapidement l’erreur en exécutant un clic du bouton droit au-dessus de la fenêtre. Sélectionnez la commande "Fenêtre - Type" du menu contextuel.
2 - 21
GUIDE DE LUTILISATEUR
Les fenêtres sont automatiquement triées par ordre de création; des numéros
indiquent l’ordre de tri.
Vous pouvez également encadrer des blocs de texte “irréguliers” en dessinant
fenêtres polygonales fenêtres polygonales
des
fenêtres polygonales autour d’eux. Les fenêtres non rectangulaires sont
fenêtres polygonales fenêtres polygonales créées par l’assemblage de zones rectangulaires: dès que deux rectangles (du même type) entrent en intersection, ils deviennent automatiquement une seule et même fenêtre! En quelque sorte, vous construisez une maison en ajoutant une pièce à l’autre… (Attention, créer des fenêtres de tables ou de codes à barres polygonaux n’a pas de sens.)
Notez également que le fenêtrage manuel peut être combiné avec le tri des fenêtres: vous pouvez tracer de nouvelles fenêtres pendant que le “mode de tri” est activé. Vous utilisez alors le tri pour inclure certaines fenêtres détectées, et créez manuellement d’autres fenêtres là où l’analyse de page n’a pas obtenu les résultats idéaux. Dès que vous commencez à créer des fenêtres en “mode de tri”, toutes les fenêtres non sélectionnées sont aussitôt effacées!
Pour modifier, déplacer ou supprimer des fenêtres, il vous faut d’abord les sélectionnersélectionner
sélectionner. Pour ce faire, cliquez sur l’icône "Sélectionner une Fenêtre" (la
sélectionnersélectionner flèche) sur la barre d’outils image et cliquez à l’intérieur de la fenêtre. Des
2 - 22
marqueurs rectangulaires apparaissent alors à chaque coin et sur les bords de la fenêtre.
annuler la sélectionannuler la sélection
Pour
annuler la sélection des fenêtres, cliquez ailleurs avec le bouton de la
annuler la sélectionannuler la sélection
souris. Pour sélectionner des
fenêtres supplémentairesfenêtres supplémentaires
fenêtres supplémentaires, maintenez appuyée
fenêtres supplémentairesfenêtres supplémentaires la touche Maj tout en cliquant sur ces fenêtres supplémentaires. Pour sélectionner une fenêtre et les
fenêtres incluses fenêtres incluses
fenêtres incluses (d’un autre type), maintenez enfoncée la
fenêtres incluses fenêtres incluses
touche Ctrl tout en cliquant sur la fenêtre principale.
Voici pour la sélection des fenêtres. Pour
modifier modifier
modifier une fenêtre, sélectionnez-
modifier modifier la, placez le curseur de la souris sur un marqueur et faites glisser le bord pour changer la taille de la fenêtre.
déplacer déplacer
Pour
déplacer une fenêtre, sélectionnez-la et faites-la simplement glisser
déplacer déplacer
vers l’endroit désiré.
supprimer supprimer
Pour
supprimer des fenêtres, sélectionnez-les, cliquez sur celles-ci avec le
supprimer supprimer bouton droit de la souris et sélectionnez la commande "Fenêtre - Supprimer" du menu "Contexte". Cette action supprime aussi bien toutes les fenêtres sélectionneés que la fenêtre sous le curseur de votre souris.
2 - 23
GUIDE DE LUTILISATEUR
Alternativement, vous pouvez sélectionner les zones et choisir la commande "Couper" ou "Effacer" du menu "Edition". La commande "Couper" place votre fenêtre dans une mémoire tampon interne, la commande "Effacer" la supprime définitivement. Lorsque vous collez des fenêtres, elles sont réintégrées à leur place originale et vous devez les déplacer vers l’endroit souhaité.
toutes
En fait, fenêtres: vous pouvez les supprimer, les couper, les copier et les coller! La commande "Annuler" peut également vous servir: si vous avez malencontreusement supprimé, déplacé, redimensionné, etc. certaines fenêtres, "Annuler" annulera votre dernière opération!
les commandes habituelles du menu "Edition" s’appliquent aux
2 - 24
Notez aussi que des raccourcis existent pour toutes les commandes! Par
exemple: pour supprimer toutes les fenêtres existantes, vous pouvez utiliser la commande "Sélectionner Tout" du menu "Édition" ou son raccourci clavier Ctrl+A et cliquer sur la commande "Effacer" ou son raccourci Supprimer. Vous pouvez maintenant recréer la mise en page désirée. Pour restaurer la mise en page antérieure, choisissez la commande "Annuler" ou le raccourci Ctrl+Z.
TT
T
TT
utilisation ultérieure avec la commande "Sauvegarder le Fenêtrage" du menu "Fichier" et chargée en mémoire avec la commande "Charger un Fenêtrage".
exemple un rapport de 50 pages où les en-tête et pied de page doivent être supprimés pour des raisons évidentes, un simple modèle peut servir à aménager les 50 pages.
automatiquement et le gabarit choisi reste actif jusqu’à ce que vous réactiviez l’analyse de page sur la barre d’outils principale. Si vous chargez un fenêtrage
, ,
ROISROIS
ROIS
ROISROIS
Le masque créé peut être enregistré en
Si vous devez reconnaître des documents avec une mise en page similaire, par
Lorsque vous chargez un fenêtrage fixe, l’analyse de page se désactive
ENREGISTRERENREGISTRER
,
ENREGISTRER
ENREGISTRERENREGISTRER
, ,
DESDES
DES
DESDES
MODÈLESMODÈLES
MODÈLES
MODÈLESMODÈLES
DEDE
FENÊTRAGEFENÊTRAGE
DE
FENÊTRAGE
DEDE
FENÊTRAGEFENÊTRAGE
gabarits de fenêtragegabarits de fenêtrage
gabarits de fenêtrage pour une
gabarits de fenêtragegabarits de fenêtrage
2 - 25
GUIDE DE LUTILISATEUR
mis en mémoire, activez l’option "Appliquer Fenêtrage à Toutes les Pages" pour appliquer ce fenêtrage directement à toutes les pages du document en cours.)
De plus, vous disposez d’une alternative très intérressante aux gabarits: l’outil de prévisualisation "Ignorer la Zone Extérieure" limite la décomposition de la page à la partie “encadrée” de l’image.
Sélectionnez cet outil et saisissez la portion de l’image que vous voulez traiter. Si vous utilisez un document multipage, vous pouvez exclure la même zone externe de l’analyse de page à chaque page. (Relancez l’analyse de page pour supprimer la “découpe” de l’image, ou pour changer les zones manuellement.)
2 - 26
2 - 27
GUIDE DE LUTILISATEUR
RR
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
RR
Maintenant que les fenêtres sont correctement définies, vous êtes presque prêt à effectuer la reconnaissance de caractères. “Presque” parce que nous n’avons pas encore vérifié la langue et les caractéristiques du document!
Le paramètre de langue se trouve sur la barre d’outils principale.
Cliquez sur le bouton "Langue" pour modifier la langue du document.
VOUSVOUS
VOUS
VOUSVOUS
EMMÈNEEMMÈNE
EMMÈNE
EMMÈNEEMMÈNE
AUTAUT
AUT
AUTAUT
OUROUR
OUR
OUROUR
DUDU
DU
DUDU
MONDEMONDE
MONDE
MONDEMONDE
2 - 28
(Cette option donne également accès aux modes de reconnaissance - rapide
et précis. Vous en apprendrez plus un peu plus loin dans ce manuel!)
Vous pouvez appuyer sur une touche lettre pour la sélectionner directement: si
le français est actuellement sélectionné et que vous souhaitez choisir l’occitan, vous pouvez enfoncer la lettre "O" de votre clavier: l’occitan sera sélectionnée. Quand différentes langues ont la même initiale, appuyez sur la lettre plusieurs fois
2 - 29
GUIDE DE LUTILISATEUR
afin de trouver les options. Par exemple: Readiris lit le polonais et le portugais. En appuyant sur "P" une fois, vous sélectionnez le polonais, en appuyant une seconde fois sur la touche "P", vous sélectionnez le portugais, et en appuyant une troisième fois sur "P", vous revenez au polonais. (Pour sélectionner une exemple "D", appuyez sur Arrière avant d’appuyer sur la touche "D".)
Readiris est de loin limiter au français: il reconnaît jusqu’à 126 les langues européennes et américaines sont supportées, y compris les langues d’Europe centrale, le grec, le turc, les langues cyrilliques (“russes”) et les langues de l’Europe baltique.
Un module optionnel permet de lire les logicielle “Complément d’OCR asiatique” propose la reconnaissance du japonais, du chinois simplifié, du chinois traditionnel et du coréen. (Le chinois simplifié est utilisé sur le continent chinois et à Singapour, le chinois traditionnel est employé à Hong Kong, Taiwan, Macau et dans les communautés chinoises d’outre-mer.)
Notez également que l’on distingue les variantes britanniques et américaines ­“internationales” devrions-nous dire - de la langue anglaise. Le logiciel permet également de distinguer l’espagnol et le mexicain, parmi d’autres.
Une configuration de Windows particulière est obligatoire pour afficher les caractères des langues “exotiques” - les langues cyrilliques et asiatiques, le grec et le turc, etc. Vous pourriez avoir à installer le module " MultilingueMultilingue
Multilingue" de Windows avant que votre système Windows ne puisse s’adapter
MultilingueMultilingue à ces langues.
Sur un système d’exploitation Windows XP, 2000 et Windows NT 4.0, sélectionnez l’icône "Options Régionales (et Langues)" sous le "Panneau de Con­figuration".
documents asiatiquesdocuments asiatiques
documents asiatiques: l’option
documents asiatiquesdocuments asiatiques
autre
lettre, par
langueslangues
langues! Toutes
langueslangues
Prise en CharPrise en Char
Prise en Char
Prise en CharPrise en Char
gege
ge
gege
2 - 30
Sur un système d’exploitation Windows ME et 98, sélectionnez l’icône "Ajout/
Suppression de Programmes" dans le "Panneau de Configuration" pour vérifier si le module de prise en charge multilingue est installé sur votre PC.
2 - 31
GUIDE DE LUTILISATEUR
Pour afficher et éditer des documents asiatiques, vous devez installer une version asiatique du système Windows. Vous pouvez également utiliser Word 2003, Word 2002 ou Word 2000 pour visualiser et modifier ce genre de docu­ments: Office 2003 System, Office XP et Office 2000 ont été spécifiquement conçus pour traiter des documents dans une grande diversité de langues.
Rien de tout ceci n’est nécessaire pour la lecture des logiciels Adobe Acrobat et Adobe Reader sont automatiquement mis à jour lorsque des documents dans des langues “exotiques” - russe, japonais, etc. - doivent être lus!
documents PDFdocuments PDF
documents PDF: les
documents PDFdocuments PDF
2 - 32
Référez-vous au
ce sujet.
Sélectionner correctement la langue du document est impératif. Basé sur la
sélection d’une langue, le logiciel sait quel Un support multi-linguistique vous assure une reconnaissance correcte de caractères “exotiques” tels que ß, ñ, ψ et ø.
Deuxièmement, le logiciel utilise de façon extensive ses
linguistiqueslinguistiques
linguistiques pour valider ses résultats. Supposez que vous ayez à lire le mot
linguistiqueslinguistiques "président" où une tache d’encre donne au "r" l’aspect d’un "f". En consultant le lexique de la langue française, Readiris reconnaît de façon autonome le mot "président" et conclut qu’il n’y a aucun sens à la présence du symbole "f". Cette techniquetechnique
technique “
techniquetechnique
La linguistique offre une aide utile pour résoudre des
"O" qui pourrait être confondu avec '0'. Un autre cas typique est la lettre "l" et le chiffre '1' qui ont une forme identique dans de nombreuses fontes - pensez aux textes produits sur d’anciennes machines à écrire! Le contexte linguistique aide à déterminer s’il s’agit d’un "l" ou d’un '1'.
L’illustration ci-dessous montre différentes formes de "l" et de '1'. Les formes
sur la première ligne ne sont pas ambiguës, les formes sur la deuxième ligne peuvent prêter à confusion, mais la linguistique peut résoudre leur interprétation. Lorsque le contexte ne suffit pas, l’utilisateur intervient.
d’auto-apprentissaged’auto-apprentissage
d’auto-apprentissage” dépend étroitement du contexte linguistique.
d’auto-apprentissaged’auto-apprentissage
fichierfichier
fichier
fichierfichier
“Lisez-moi”“Lisez-moi”
“Lisez-moi” de Readiris pour plus d’infomations à
“Lisez-moi”“Lisez-moi”
jeu de symbolesjeu de symboles
jeu de symboles il doit reconnaître.
jeu de symbolesjeu de symboles
bases de donnéesbases de données
bases de données
bases de donnéesbases de données
cas ambiguscas ambigus
cas ambigus tels qu’un
cas ambiguscas ambigus
RR
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
RR
La performance ne s’arrête pas là: Readiris peut changer de langue en cours
de phrase sans l’intervention de l’utilisateur! Quand des mots occidentaux apparaissent dans des documents grecs, cyrilliques ou asiatiques - beaucoup de
CHANGECHANGE
CHANGE
CHANGECHANGE
DEDE
DE
DEDE
LANGUELANGUE
LANGUE
LANGUELANGUE
AUAU
AU
AUAU
BESOINBESOIN
BESOIN
BESOINBESOIN
2 - 33
GUIDE DE LUTILISATEUR
noms propres non modifiables, des noms de marques, etc. sont écrits en utilisant les symboles latins -, Readiris peut s’adapter automatiquement au type d’alphabet. En d’autres mots, il est possible d’activer des grecs, cyrilliques ou asiatiques et occidentaux en même temps.
Assurez-vous de sélectionner "Grec-anglais" ou l’option correcte cyrillique ­par exemple "Biélorusse-anglais". En d’autre mots: ne vous contentez pas juste de sélectionner "Grec" ou "Biélorusse" en espérant que les caractères occidentaux seront reconnus correctement!
Voici l’exemple d’un texte russe contenant des mots anglais. Vous pouvez tester par vous-même cette page: ouvrez le fichier image ALPHABETS.TIF et lancez la reconnaissance de la page correspondante.
alphabets mélangés alphabets mélangés
alphabets mélangés de caractères
alphabets mélangés alphabets mélangés
2 - 34
Le résultat final ressemble à ceci lorsque vous l’ouvrez avec votre traitement
de texte - vous pourriez avoir à sélectionner la
fonte fonte
fonte cyrillique pour pouvoir
fonte fonte
afficher le texte russe correctement.
2 - 35
GUIDE DE LUTILISATEUR
mélanger mélanger
Pour
mélanger d’
mélanger mélanger le jeu de caractères le plus étendu. Si vous avez un document où par exemple la traduction anglaise se trouve placée le long du texte français, vous devez sélectionner le français comme langue pour vous assurer que des caractères accentués seront correctement reconnus.
DD
ÉFINIRÉFINIR
D
ÉFINIR
ÉFINIRÉFINIR
DD
Maintenant que la langue est définie, allons voir les autres caractéristiques du document. Vous pouvez peaufiner la reconnaissance en indiquant quelques spécifications du document: le type de fonte et l’espacement de caractère. (Ces
LESLES
LES
LESLES
autres languesautres langues
autres langues, sélectionnez simplement la langue avec
autres languesautres langues
CARACTÉRISTIQUESCARACTÉRISTIQUES
CARACTÉRISTIQUES
CARACTÉRISTIQUESCARACTÉRISTIQUES
DUDU
DOCUMENTDOCUMENT
DU
DOCUMENT
DUDU
DOCUMENTDOCUMENT
2 - 36
commandes ne s’appliquent pas aux documents asiatiques.) Qu’est-ce que cela veut dire?
Commençons par la commande "Type de Police" dans le menu "Configura-
tion". Ce mode distingue les documents “normaux” des en qualité
matriciellematricielle
matricielle. Les symboles matriciels “qualité brouillon” ou “9
matriciellematricielle
documents imprimésdocuments imprimés
documents imprimés
documents imprimésdocuments imprimés
aiguilles” sont composés de points isolés, séparés, et des routines de reconnais­sance hautement spécialisées sont requises pour les reconnaître.
La qualité d’impression matricielle “qualité lettre” ou “25 aiguilles” exige l’option
normale "Automatique", de même que les
qualités d’impressionqualités d’impression
qualités d’impression imprimées,
qualités d’impressionqualités d’impression
tapées, impression laser et impression à jet d’encre.
L’option "Automatique" permet à Readiris de détecter automatiquement le
type de police utilisée. Laissez dans tous les cas Readiris détecter automatiquement le type de police - à moins que vous ne soyez certain de reconnaître des docu­ments matriciels! (Bien entendu, "Automatique" est la valeur par défaut.)
La bulle explicative du bouton "Reconnaître-Enregistrer" indique le mode de lecture: lorsqu’aucun message n’est ajouté à la bulle explicative, la détection automatique de la qualité d’impression s’applique, lorsque le message "À aigu­illes" est ajouté à la bulle, le mode matriciel est activé.
espacement de caractèresespacement de caractères
L’
espacement de caractères peut être placé avec la commande "Dis-
espacement de caractèresespacement de caractères
tance des Caractères" sous le menu "Configuration".
2 - 37
GUIDE DE LUTILISATEUR
Avec les fontes même largeur. Un "l" prend autant d’espace horizontal sur une ligne qu’un "w", comme cest le cas dans cette phrase. Pensez aux documents produits par une machine à écrire, où le chariot se déplace selon une distance fixe pour chaque symbole tapé.
Un espacement sa forme. Les symboles comme "m" et "w" sont plus larges, occupent un espace horizontal plus large sur une ligne que les caractères minces "l" ou "j". Pratiquement tous les livres, magazines et journaux sont imprimés avec un espacement proportionnel.
La solution la plus simple est de toujours laisser cette option activée par défaut sur "Automatique": Readiris détectera la largeur de caractère automatiquement.
VV
ITESSEITESSE
V
ITESSE
ITESSEITESSE
VV
Il y a un dernier point que nous devons aborder avant d’entamer la reconnais­sance - le lorsque nous avons indiqué la langue du document avec le bouton "Langue". Ce bouton nous permet aussi de sélectionner un compromis entre vitesse et précision. (Ces modes de reconnaissance ne s’appliquent pas au mode matriciel et aux documents en langues asiatiques!)
mode de reconnaissancemode de reconnaissance
mode de reconnaissance. Nous nous en sommes déjà approché
mode de reconnaissancemode de reconnaissance
fixes
proportionnel
OUOU
PRÉCISIONPRÉCISION
OU
PRÉCISION
OUOU
PRÉCISIONPRÉCISION
ou “mono-espace”, tous les symboles de la fonte ont la
signifie que la largeur d’un caractère dépend de
??
?
??
2 - 38
Le mode de reconnaissance rapide est recommandé pour les documents
possédant une bonne qualité d’impression (et de numérisation). Pensez, par exemple, à un document imprimé avec une imprimante laser et numérisé avec la bonne résolution et la bonne luminosité... Le mode précis de reconnaissance sera utilisé de préférence lorsque l’image est de moins bonne qualité - nous parlons alors de télécopies, de photos numériques ou autres images de basse résolution, etc. Le mode précis de reconnaissance assure des résultats d’OCR optimaux pour tout type de documents, mais prend plus de temps.
Le mode précis de reconnaissance est activé par défaut. La bulle explicative
du bouton "Reconnaître-Enregistrer" indique quel mode de reconnaisance est actuellement utilisé.
2 - 39
GUIDE DE LUTILISATEUR
RR
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
RR
Quand la langue du document est choisie et ses caractéristiques définies, activez l’apprentissage interactif et cliquez sur le bouton "Reconnaître-Enregistrer".
La progression de l’OCR est indiquée sur l’écran. Vous pouvez cliquer le bouton "Arrêter" ou appuyer sur la touche Échappement pour interrompre la reconnaissance du texte.
DEVIENTDEVIENT
DEVIENT
DEVIENTDEVIENT
CHAQUECHAQUE
CHAQUE
CHAQUECHAQUE
FOISFOIS
FOIS
FOISFOIS
PLUSPLUS
PLUS
PLUSPLUS
INTELLIGENTINTELLIGENT
INTELLIGENT
INTELLIGENTINTELLIGENT
!!
!
!!
En fin de lecture, Readiris entre en phase interactive d’apprentissage si l’apprentissage est activé grâce au bouton "Apprentissage" sur la barre d’outils principale. L’apprentissage interactif est désactivé par défaut.
(L’apprentissage interactif ne s’applique pas aux documents asiatiques: l’apprentissage n’a pas de sens pour ces langues qui connaissent des milliers de symboles différents - en supposant que vous êtes capable d’introduire les idéogrammes, ce qui n’est pas chose aisée sur un clavier occidental!)
apprentissage de fontesapprentissage de fontes
L’
apprentissage de fontes peut sensiblement mettre en valeur l’exactitude
apprentissage de fontesapprentissage de fontes
du système d’identification. Quand l’utilisateur essaye de lire des symboles distordus
2 - 40
et déformés comme on en trouve dans des documents réels ou des fontes stylisées que Readiris n’identifie pas de façon optimale, l’apprentissage peut surmonter cet “échec” provisoire.
L’apprentissage par l’utilisateur est également utilisé pour entrainer le système
sur les
symboles spéciaux symboles spéciaux
symboles spéciaux que Readiris ne peut pas identifier, comme des
symboles spéciaux symboles spéciaux symboles mathématiques et scientifiques et des dingbats. Quelques exemples: Readiris peut être formé pour identifier le symbole "π" comme "pi" ou le caractère spécial "" en tant que "Tél.". (Cependant, la liste de symboles identifiés ne peut pas être étendue avec les symboles "π" et ""!)
Le texte reconnu s’affiche progressivement et le système s’arrête sur les caractères douteux, ou - si vous traitez les caractères joints (“ligatures”) - sur les chaînes de caractères douteuses. Elles sont toujours présentées dans leur contexte et les caractères douteux sont mis en surbrillance. Les caractères non reconnus sont représentés par un tilde (le symbole "~").
2 - 41
GUIDE DE LUTILISATEUR
La première chose à faire est de vérifier si vous avez activé le dictionnaire de fontes et le mode de dictionnaire corrects - ceux-ci sont toujours indiqués dans le titre de la fenêtre d’apprentissage. Si ce n’est pas le cas, cliquez sur le bouton "Interrompre" - le document est à nouveau affichée avec son fenêtrage tel qu’il avait été créé - activez le bon dictionnaire ou mode de dictionnaire et relancez l’OCR. (Le fonctionnement des dictionnaires de fontes sera expliqué sous peu.)
Si nécessaire, entrez un caractère (ou une chaîne de caractères) pour une forme incorrecte ou inconnue et cliquez sur un des boutons suivants.
ApprendreApprendre
Apprendre
ApprendreApprendre
Vous êtes d’accord avec la solution proposée ou vous la corrigez. Le programme sauvegarde le caractère douteux dans le dictionnaire de fontes comme étant
2 - 42
“certain”, final. La reconnaissance suivante n’exigera plus votre intervention, la forme est considérée apprise une fois pour toutes.
Dans l’exemple ci-dessus, le système s’arrête sur des caractères joints, et
nous cliquons sur "Apprendre" pour accepter une forme qui ne peut pas être confondue avec d’autres caractères.
Ne Pas Ne Pas
Ne Pas
Ne Pas Ne Pas
Vous êtes d’accord avec la solution proposée ou vous la corrigez. La différence
avec le bouton "Apprendre" est que le symbole appris obtient le statut “incertain” dans le dictionnaire. Pour une future identification, le système proposera la solu­tion “apprise” mais exigera toujours une confirmation.
Ce bouton est utilisé pour les symboles qui pourraient être confondus avec
d’autres: un "e" déformé qui pourrait être confondu avec un "c", un "t" endommagé qui ressemblerait étroitement à un "r", etc.
ApprendreApprendre
Apprendre
ApprendreApprendre
2 - 43
GUIDE DE LUTILISATEUR
Le "e" ci-dessus est sérieusement endommagé - en fait il est proche du symbole "c" -, et vous devriez cliquer "Ne Pas Apprendre" pour ne pas le confondre avec le symbole "c".
EffacerEffacer
Effacer
EffacerEffacer
On élimine la forme affichée du résultat. Ce bouton est utilisé pour ignorer le “bruit” sur les documents - taches de café, etc. qui pourraient être reconnues comme points, virgule, etc. -, et pour effacer tout autre symbole non désiré.
AnnulerAnnuler
Annuler
AnnulerAnnuler
Vous retournez en arrière pour corriger les erreurs. Vous pouvez annuler les 32 dernières opérations.
FinirFinir
Finir
FinirFinir
L’apprentissage est interrompu mais l’OCR continue en mode automatique. Toutes les décisions du système sont acceptées sans validation de l’utilisateur.
Cliquez sur ce bouton quand vous voyez que la reconnaissance est précise et n’exige pas de correction approfondie.
InterrompreInterrompre
Interrompre
InterrompreInterrompre
Ne confondez pas le bouton "Finir" avec le bouton "Interrompre". Ce dernier arrête le processus alors qu’avec le bouton "Finir", le texte est créé, il ne subit simplement plus de correction approfondie!
LL
EE
RÔLERÔLE
L
E
RÔLE
EE
RÔLERÔLE
LL
Les résultats de chaque session de formation sont temporairement maintenus dans la mémoire mais ils peuvent et doivent être enregistrés dans des fichiers appelés les “dictionnaires” pour une future utilisation.
(Ne confondez pas dictionnaires de polices et lexiques! Les dictionnaires de fontes contiennent des formes de caractères apprises durant la phase interactive
DESDES
DES
DESDES
DICTIONNAIRESDICTIONNAIRES
DICTIONNAIRES
DICTIONNAIRESDICTIONNAIRES
DEDE
DE
DEDE
FONTESFONTES
FONTES
FONTESFONTES
2 - 44
de l’OCR, les lexiques sont des bases de données linguistiques qui assistent la reconnaissance.)
Ces dictionnaires de polices doivent être chargés en mémoire quand vous
voulez reconnaître des documents semblables afin d’utiliser l’intelligence supplémentaire qu’ils contiennent. De cette façon, Readiris tient compte de l’intelligence enregistrée dans ces bibliothèques de polices. Vous pourriez dire que Readiris devient plus intelligent à chaque utilisation!
Comment cela se fait-il? L’enrichissement des dictionnaires de fontes est
contrôlé par le menu "Apprendre": vous devez choisir un dictionnaire avec la commande "Dictionnaire de Polices" et déterminer son mode de fonctionnement.
dictionnaires de policesdictionnaires de polices
Les
dictionnaires de polices sont limités à 500 formes, et nous vous
dictionnaires de policesdictionnaires de polices recommandons de créer des dictionnaires séparés pour des applications spécifiques, par exemple par type de document. Les dictionnaires ont par défaut l’extension *.dus. L’apprentissage et l’enrichissement n’ont plus d’effet quand le
2 - 45
GUIDE DE LUTILISATEUR
dictionnaire est rempli: les résultats de l’apprentissage ne sont plus mémorisés et stockés dans un dictionnaire.
Vous pouvez sélectionner le mode dictionnaire sous la commande "Dictionnaire de Polices" ou directement sous le menu "Apprendre". Trois modes de dictionnaires sont disponibles: nouveau, enrichir et lire.
En choisissant "Nouveau Dictionnaire", vous indiquez que les résultats d’apprentissage seront sauvegardés dans un choisissez un dictionnaire existant, son contenu sera effacé.)
Le mode d’enrichissement indique que les résultats d’apprentissage seront sauvegardés dans un dictionnaire l’intelligence déjà contenue dans le dictionnaire, et vous lui ajoutez les nouvelles formes de fonte. En termes simples, cette option vous permet de construire un dictionnaire de fontes en plusieurs étapes.
(Quand vous définissez le nom de fichier d’un nouveau dictionnaire et activez le mode d’ajout, un dictionnaire vide est créé et vous le complétez.)
Avec la dernière option, "Lire le Dictionnaire", le dictionnaire fonctionne en mode inaltérable: vous vous servez du dictionnaire formes de fonte.
Choisissez le nouveau mode quand une page simple est reconnue. Pour lire beaucoup de pages du même type - des pages avec une qualité d’impression et des fontes similaires - choisissez le mode nouveau pour la première page, le mode ajout pour les pages suivantes et le mode lecture pour le reste du document.
existant
nouveau
: la reconnaissance se sert de
dictionnaire. (Si vous
sans
lui ajouter de nouvelles
2 - 46
Sachez que votre bouton d’apprentissage vous indiquera à tout moment grâce
à sa bulle explicative quel est le dictionnaire de fontes actif et dans quel mode ce dictionnaire fonctionne.
Quand vous êtes en mode d’apprentissage interactif, le dictionnaire et son
mode opératoire sont indiqués en titre de fenêtre; en cas d’erreur, vous pouvez cliquer sur "Interrompre" et recommencer.
2 - 47
GUIDE DE LUTILISATEUR
EE
NVOYERNVOYER
E
NVOYER
NVOYERNVOYER
EE
L’apprentissage interactif vient en conclusion à la reconnaissance de caractères. Comme Microsoft Word fonctionne comme application cible par défaut, votre traitement de texte est démarré automatiquement (si nécessaire) à la fin de la reconnaissance, et le texte reconnu est inséré.
Il est possible de voir une barre de progression apparaître à l’écran lors du traitement du texte reconnu. (Que cette barre apparaisse ou non à l’écran dépend de la taille du document et de la complexité du traitement à réaliser.)
L’image numérisée est à nouveau affichée avec son fenêtrage. L’image est disponible pour la poursuite du traitement, elle reste affichée jusqu’à ce que vous numérisiez une autre page.
Vous venez en effet de convertir un document papier en un fichier ordinateur éditable, et ce 40 fois plus vite qu’en dactylographie manuelle! Vous pouvez maintenant comparer votre texte à l’image qui se trouve dans votre fenêtre Readiris.
En fait, Readiris vous offre trois méthodes pour enregistrer le résultat OCR: envoyer le document reconnu dans une application cible, sauvegarder les fichiers dans un fichier externe et placer les résultats dans le presse-papiers Windows.
LELE
LE
LELE
RÉSULRÉSUL
RÉSUL
RÉSULRÉSUL
TT
AA
TT
DANSDANS
T
A
T
DANS
TT
AA
TT
DANSDANS
VOTREVOTRE
VOTRE
VOTREVOTRE
APPLICAAPPLICA
APPLICA
APPLICAAPPLICA
TIONTION
TION
TIONTION
cible sortiecible sortie
La
cible sortie est sélectionnée avec le bouton "Format" de la barre d’outils
cible sortiecible sortie
(ou la commande "Format de Texte" du menu "Configuration").
2 - 48
L’option "Envoyer à" offre un lien OCR direct entre votre numériseur et vos
applications Windows: vous
envoyez envoyez
envoyez les documents numérisés directement dans
envoyez envoyez votre traitement de texte, dans votre feuille de calcul ou votre navigateur web, dans Adobe Reader, etc.!
2 - 49
GUIDE DE LUTILISATEUR
À la fin de la reconnaissance, l’application cible démarre automatiquement et
le document reconnu est inséré dans un nouveau fichier texte ou feuille de calcul.
2 - 50
Cependant, n’oubliez pas que l’option "Envoyer à" permet également de copier le document reconnu dans le besoin impérieux d’exporter le résultat… ou de l’enregistrer dans un fichier externe!
presse-papierspresse-papiers
presse-papiers Windows. Il n’y a donc pas de
presse-papierspresse-papiers
SS
AUVEGARDERAUVEGARDER
S
AUVEGARDER
AUVEGARDERAUVEGARDER
SS
Vous pouvez en effet placer le résultat du processus OCR dans un fichier “externe”! Ici encore, Readiris supporte un grand nombre de formats de fichiers (fichiers de tous les traitements de texte, des feuilles de calcul, des applications web courantes, etc.) (Readiris supporte entre autres le format WordML et SpreadsheetML, les nouveaux formats de Microsoft Office 2003!)
LESLES
LES
LESLES
RÉSULRÉSUL
RÉSUL
RÉSULRÉSUL
TT
AA
TSTS
A
DANSDANS
TS
DANS
AA
TSTS
DANSDANS
T
TT
UNUN
UN
UNUN
FICHIERFICHIER
FICHIER
FICHIERFICHIER
TEXTETEXTE
TEXTE
TEXTETEXTE
2 - 51
GUIDE DE LUTILISATEUR
L’option "Enregistrer et Ouvrir" est en grande partie identique à la fonction
"Envoyer": vous ouvrez le document reconnu une fois qu’il est sauvé.
2 - 52
Cependant, la méthode employée pour envoyer vers une sortie cible est différente. Cette fois, le
type de fichier type de fichier
type de fichier
type de fichier type de fichier
WW
indowsindows
W
indows détermine quelle application
WW
indowsindows sera lancée. C’est comme si vous double-cliquiez sur le fichier dans l’Explorateur Windows... (Avec l’option "Envoyer à", Readiris envoie le fichier directement vers l’application cible.)
2 - 53
GUIDE DE LUTILISATEUR
L’option "Envoyer par E-mail" crée un nouveau message document reconnu comme pièce jointe. Connaissez-vous une manière plus rapide pour envoyer un document papier...?
mail mail
mail et insère le
mail mail
2 - 54
CC
RÉERRÉER
C
RÉER
RÉERRÉER
CC
PDFPDF
PDF. Readiris vous permet de générer des documents PDF basés sur le texte et
PDFPDF sur l’image.
Nous allons aborder plus en profondeur un des formats:
DESDES
DOCUMENTSDOCUMENTS
DES
DOCUMENTS
DESDES
DOCUMENTSDOCUMENTS
PORPOR
POR
PORPOR
TT
ABLESABLES
T
ABLES
TT
ABLESABLES
......
...
......
Adobe Adobe
Adobe
Adobe Adobe
AcrobatAcrobat
Acrobat
AcrobatAcrobat
2 - 55
GUIDE DE LUTILISATEUR
Quelle est la différence entre ces formats? Lorsque vous sélectionnez le for­mat "PDF Texte", Readiris crée un fichier PDF contenant le résultat sous forme de texte. (Il peut y avoir des graphiques mais seulement lorsque des zones
2 - 56
graphiques sont présentes sur la page - photographies, illustrations, etc.) En réalité, l’image de la page
n’
est
pas
contenue dans le fichier PDF. Ce dernier est constitué d’une seule couche. Le format "PDF Image", quant à lui, ne contient lui non plus qu’une seule couche. Cette couche contient en fait l’image numérisée, et non pas le résultat de la reconnaissance.
2 - 57
GUIDE DE LUTILISATEUR
Les formats "PDF Texte-Image" et "PDF Image-Texte" génèrent des résultats différents: Readiris crée un fichier PDF pouvant être recherché et contenant le texte reconnu et l’image de la page. Dans le cas des fichiers de type “texte-
2 - 58
image”, le texte est placé
au-dessus
de l’image de la page dans un fichier PDF composé de deux couches; dans le cas des fichiers de type “image-texte”, le texte est placé
en-dessous
de l’image de la page. Pour bien comprendre ces
concepts, utilisez la commande "Rechercher" d’Adobe Reader.
Les fichiers PDF de type “texte-image” sont en fait assez sophistiqués: les pixels du texte reconnu sont effacés pour assurer la création d’un document lisible! Afficher le texte reconnu en noir sur des bitmaps de caractères noirs vous donnerait du texte avec une ombre lourde...
Servez-vous de l’image d’exemple BACKGROUND.JPG pour tester ce phénomène.
2 - 59
GUIDE DE LUTILISATEUR
Tous les fichiers PDF basés sur du texte encodent les URLs de sites web et les adresses courriel comme des liens visibles: cliquez sur un lien et vous visitez directement le site web mentionné ou envoyez un nouveau courriel à la personne de contact. (En fait, les autres formats de texte “riches” de Readiris - Word, WordML, HTML, etc. - recréent également les liens hypertextes!)
2 - 60
Cliquez sur le bouton "Format" pour découvrir quelques options du format
PDF Acrobat: "Créer les Signets" et "Inclure les Polices". (Dès que le format PDF est sélectionné, l’autoformatage s’applique - et ne peut pas être désactivé.)
L’option "Créer les Signets" assure que des
signetssignets
signets seront créés par page
signetssignets pour chaque élément du document - les graphiques tout comme les blocs de texte et les tables. Pour les zones de texte, Readiris applique un algorithme intelligent qui engendre un titre, un “sommaire” pour chaque zone; les tables et les graphiques sont simplement numérotés. (Un autre élément de navigation des documents PDF,
vignettes vignettes
les
vignettes de la page, peut être réalisé dynamiquement par votre logiciel
vignettes vignettes
Adobe Reader!)
2 - 61
GUIDE DE LUTILISATEUR
L’option "Inclure les Polices" inclut les fontes dans les fichiers PDF. L’inclusion des polices empêche la substitution des fontes lorsque les lecteurs affichent et impriment le document reconnu. Cette option s’assure que les lecteurs - quelque soit leur configuration d’ordinateur - visualisent le texte dans les polices originales. Cependant, l’inclusion des polices augmentent la taille du fichier des documents reconnus (légèrement)!
Autre fonction de Readiris, appréciable pour les documents de sortie PDF: les propriétés du documentpropriétés du document
propriétés du document! Les propriétés du document reprennent le titre d’un
propriétés du documentpropriétés du document document, le nom et la société de l’auteur, le sujet, quelques mots clés et commentaires, etc. Les propriétés du document sont évidemment utilisées pour le tri et la recherche de documents...
2 - 62
La commande "Propriétés du Document" du le menu "Fichier" répond à cette
demande. Notez également que vous pouvez définir les propriétés du document de sortie plus tard, lorsque vous sauvegardez les résultats de la reconnaissance...!
Sachez que les propriétés du document ne concernent pas seulement les docu-
ments PDF: les documents au format Word (*.doc), RTF (“Rich Text Format”),
2 - 63
GUIDE DE LUTILISATEUR
WorldML (*.xml), SpreadsheetML (*.xml) et HTML supportent également les propriétés du document - malheureusement d’une manière moins complète que ne le fait le format Adobe Acrobat PDF. (Il va de soi que les formats de texte “pauvre” tels que le format Texte (ANSI) et Texte MS-DOS (ASCII) ne supportent pas les propriétés du document.)
... ...
...
... ...
support total du format Adobe Acrobat PDF, vous ne disposez pas seulement de la possibilité de générer des fichiers PDF, vous pouvez également les
une des applications principales de Readiris. Et ce pour plusieurs raisons. Tout d’abord car c’est un moyen de convertir des images en texte: ouvrez des docu­ments PDF basés sur l’image, exécutez la reconnaissance et enregistrez le résultat OCR sous un document texte (dans n’importe quel format texte supporté). Or, les fichiers texte sont éditables, tandis que les fichiers image ne le sont pas.
ments PDF basés sur du texte. Vous exécutez la reconnaissance sur des fichiers PDF “image uniquement” et sauvegardez les résultats OCR... comme des textes PDF! Vous pouvez rechercher et éditer des fichiers PDF basés sur du texte mais pas des fichiers PDF “image uniquement”.
d’un fichier PDF. Vous pouvez reconnaître des documents PDF “en lecture seule”, où le texte est inaccessible en temps normal. Avec les fichiers PDF non protégés, le contenu peut être récupéré (copié et sauvé dans un fichier Texte). Avec les fichiers “en lecture seule”, le contenu ne peut pas être extrait. De tels fichiers peuvent seulement être affichés et imprimés!
de protection, il n’ouvre pas les documents PDF protégés par mot de passe! (Plus précisément, les mots de passe “maîtres” qui établissent les permissions d’un fichier PDF ne gênent pas Readiris, mais les mots de passe “utilisateur”
OUOU
OU
OUOU
Découvrons une autre possibilité de Readiris... Alors que Readiris offre un
Pouvoir
Ensuite, vous pouvez convertir des fichiers PDF basés sur l’image en docu-
Enfin, convertir des fichiers PDF est une manière de “déverrouiller” le contenu
Deux nuances importantes: même si Readiris franchit toutes les autres barrières
LESLES
LES
LESLES
donner un nouveau but aux documents PDFdonner un nouveau but aux documents PDF
donner un nouveau but aux documents PDF est certainement
donner un nouveau but aux documents PDFdonner un nouveau but aux documents PDF
LIRELIRE
LIRE
LIRELIRE
!!
!
!!
lire
!
2 - 64
dont vous avez besoin pour ouvrir un fichier PDF sont une entrave pour Readiris.) Par ailleurs, Readiris ne convertit pas les documents PDF qui contiennent des images compressées au format JPEG 2000.
Procédez comme d’habitude: chargez les fichiers PDF dans la mémoire comme
vous ouvrez des images prénumérisées - des télécopies, des instantanés pris avec votre caméra numérique, etc. Cliquez sur le bouton "Arrêter" ou enfoncez la touche Échappement pour arrêter le processus de chargement entre deux pages. (Cela fonctionne également pour les images TIFF multipages et les télécopies DCX.)
Vous trouverez une option spécifique pour les fichiers PDF. Vous pouvez les
ouvrir comme documents couleur et noir et blanc. Cette option est offerte car ouvrir des documents couleur est beaucoup plus lent!
2 - 65
GUIDE DE LUTILISATEUR
En outre, vous pouvez indiquer quelles pages vous voulez convertir. Si vous souhaitez reprendre seulement un chapître d’une longue publication au format PDF, rien ne vous oblige à charger le livre entier dans Readiris... Indiquez les pages à convertirpages à convertir
pages à convertir et vous gagnerez beaucoup de temps! (Il en va de même
pages à convertirpages à convertir pour les images TIFF multipages et les faxes DCX.)
Les documents PDF basés sur du texte offrent en général une excellente qualité; le mode de reconnaissance rapide suffit pour les convertir avec succès. La qualité des fichiers PDF basés sur l’image dépendent des caractéristiques du document papier, de la luminosité et de la résolution lors de la numérisation, etc.
Vous pouvez essayer cette application avec le fichier SAMPLE.PDF dans le
dossier d’images de Readiris...
2 - 66
RR
ECONNAISSANCEECONNAISSANCE
R
ECONNAISSANCE
ECONNAISSANCEECONNAISSANCE
RR
Après l’OCR, le document numérisé sera ré-affiché avec les zones créées en
vue d’être disponible pour un traitement ultérieur.
Vous pouvez maintenant ouvrir le texte reconnu avec votre traitement de texte
ou votre éditeur de texte, l’importer dans le logiciel de publication ou dans n’importe quelle application texte, l’archiver ou le partager avec d’autres personnes, le “publier” sur un serveur Intranet, etc. Allez-y et comparez-le avec l’image que vous avez dans votre fenêtre Readiris...
Mais comment sauvegarder le texte pour les pages supplémentaires? En
d’autres mots: comment traiter un document de plusieurs pages? C’est en fait très simple: continuez à reconnaître des pages et enregistrez dans le même fichier! (Soyez sûr qu’il n’est pas déjà ouvert, car cela vous empêcherait de vous y enregistrer!) Ensuite, n’oubliez pas de mettre le dictionnaire de fontes en mode d’enrichissement pour vous permettre de poursuivre le traitement des fontes confortablement.
Dès que vous numérisez des pages (ou ouvrez des fichiers image) dans un
document, vous devrez décider si vous désirez démarrer un nouveau document ou compléter le document actuel.
DEDE
DE
DEDE
PP
P
PP
AGESAGES
AGES
AGESAGES
MULMUL
MUL
MULMUL
TIPLESTIPLES
TIPLES
TIPLESTIPLES
Répondez "non" pour ajouter des pages au document actuel, "oui" pour créer
un nouveau document. Cette réponse a le même effet que la commande "Nouveau Document" dans le menu "Fichier".
2 - 67
GUIDE DE LUTILISATEUR
Mais il existe un moyen plus efficace pour reconnaître d’affilée plusieurs pages que de les numériser et les OCRiser l’une après l’autre: il suffit de traiter directement des
Pour numériser un document composé de plusieurs pages en une seule opération, activez l’alimentation automatique de votre scanner grâce à l’option "ADF" sous le bouton "Numériseur".
documents multipagesdocuments multipages
documents multipages!
documents multipagesdocuments multipages
Placez les pages de votre document dans l’alimentation automatique et démarrez la numérisation: toutes les pages sont numérisées jusqu’à ce que l’alimentation se soit vidée.
Si votre numériseur ne dispose pas d’une alimentation automatique, vous pouvez utiliser la avec efficacité. Le numériseur scanne automatiquement une autre page après un délai déterminé par l’utilisateur. La pause vous laisse le temps de remplacer la page qui se trouve sur la fenêtre de votre numériseur à plat.
(La numérisation avec pause est également très utile quand vous scannez un livre (lourd): vos mains gardent le livre proprement sur le plateau du numériseur, et vous n’avez donc pas le temps de cliquer avec la souris...!)
Indiquez dans les paramètres de numérisation quel temps de pause vous souhaitez déterminer pour pouvoir placer chaque nouvelle page dans votre numériseur: cliquez sur le bouton "Numériseur" et choissisez une valeur pour l’option "Numériser la Page Suivante après x Seconde(s)".
numérisation avec pausenumérisation avec pause
numérisation avec pause pour acquérir des documents multipages
numérisation avec pausenumérisation avec pause
2 - 68
Cliquez sur le bouton "Numériser" pour démarrer l’acquisition des images.
Cliquez sur "Interrompre" dans la fenêtre de numérisation avec pause si vous voulez mettre fin à la numérisation automatique.
Readiris est très flexible: vous pouvez réduire l’intervalle de temps afin
d’acquérir une image plus rapidement, ou encore “geler” la pause si le téléphone vous interrompt! Cliquez sur le bouton "Suspendre" dans la fenêtre de numérisation avec pause pour geler l’intervalle de numérisation; cliquez sur "Poursuivre" quand
2 - 69
GUIDE DE LUTILISATEUR
vous prêt à continuer. Cliquez sur "Numériser Maintenant" dans cette fenêtre pour réduire le temps de la pause.
ouvrir
Vous pouvez également plusieurs images en mémoire, sélectionnez la première image et maintenez la touche Ctrl enfoncée pendant que vous sélectionnez les images supplémentaires. Pour charger une rangée continue d’images, sélectionnez la première image et maintenez la touche Maj enfoncée tout en sélectionnant la dernière image.
plusieurs images prénumérisées. Pour charger
Vous pouvez obtenir aisément le même résultat depuis l’Explorateur Windows: sélectionnez plusieurs fichiers image, cliquez dessus avec le bouton droit de la souris et sélectionnez la commande "Reconnaître" dans le menu "Contexte". Vous pouvez répeter cette opération: toutes les images envoyées vers Readiris enrichissent le document actuel jusqu’à ce que vous cliquiez sur la commande "Nouveau Document".
2 - 70
Vous pouvez même
glisser-déposer
plusieurs images préscannées depuis l’Explorateur Windows vers la fenêtre de Readiris! Le même principe est appli­cable: toutes les images que vous faites glisser vers la fenêtre de Readiris sont ajoutées au document actuel jusqu’à ce que vous cliquiez sur la commande "Nouveau Document".
Readiris trie automatiquement les images - l’image 001.tif précède l’image
002.tif qui précède 003.tif, etc.
panneau des documentspanneau des documents
Le
panneau des documents affiche des
panneau des documentspanneau des documents
données statistiques données statistiques
données statistiques et donne
données statistiques données statistiques des informations sur toute page acquise - la source de l’image et sa résolution, la durée de la numérisation et de la lecture, etc. Vous pouvez cacher ou afficher le panneau des documents avec l’option correspondante du menu "Vue".
Le panneau des documents vous indique également quelle est l’image qui est
chargée en mémoire. Attention: si une image multipage a été ouverte, il n’y a
2 - 71
GUIDE DE LUTILISATEUR
évidemment qu’un seul fichier pour toutes les images! Pendant la numérisation, le panneau des documents ne mentionne que le modèle du numériseur.
Vous pouvez modifier la taille des colonnes à l’aide de votre curseur. (Vous ne pouvez pas modifier l’ n’affiche pas des données complètes, survolez la ligne d’information à l’aide de votre curseur pour obtenir une information complète.
Si vous sélectionnez la commande "Informations" du menu "Fichier", Readiris affichera le même type d’information pour toutes les pages. Vous pouvez aussi afficher ces mêmes informations pour chaque page individuellement en maintenant votre curseur sur la vignette de la page voulue dans la pagespages
pages. Cette barre d’outils s’affiche automatiquement dans la partie gauche de
pagespages l’écran dès l’instant où des pages sont en cours de traitement. Un simple clic droit sur la vignette d’une page permet par ailleurs d’accéder aux actions à réaliser sur cette page.
ordre
des colonnes.) Si par manque de place, une colonne
barre d’outils desbarre d’outils des
barre d’outils des
barre d’outils desbarre d’outils des
2 - 72
La page active est mise en évidence dans le panneau des documents et la
barre d’outils des pages et est mentionnée dans la barre de titre de Readiris.
Pour supprimer une page d’un document, placez le curseur sur elle dans le
panneau des documents et appuyez sur la touche Effacer. Ou mettez le curseur au-dessus de son imagette dans la barre d’outils des pages et enfoncez la touche Effacer. (Ou encore: sélectionnez la page dans la barre d’outils des pages et sélectionner la commande "Effacer Page" du menu "Contexte".)
Si vous souhaitez obtenir un aperçu de votre document, vous pouvez rapidement
imprimerimprimer
imprimer les
imprimerimprimer
imagesimages
images scannées via le bouton "Imprimer" de la barre d’outils
imagesimages
image (ou avec la commande "Imprimer les Images" sous le menu "Fichier").
Vous pouvez imprimer la page actuelle ou toutes les pages. Sélectionnez le
nombre de pages ou de vignettes que vous désirez imprimer sur une page.
Mais vous ne devez pas nécessairement imprimer toutes les pages: le panneau
des documents (ainsi que les commandes correspondantes du menu "Édition" et les commandes contextuelles de la barre d’outils des pages) permet d’exclure (temporairement) des pages du processus d'impression. Pour exclure une page du processus d’impression (et de reconnaissance), cliquez sur le numéro de cette
2 - 73
GUIDE DE LUTILISATEUR
page dans le panneau des documents. Pour l’inclure à nouveau, cliquez une deuxième fois. Pour appliquer ces commandes directement sur utilisez les commandes du menu "Édition".
Les vignettes des pages exclues sont rayées. Rappelez vous que l’impression de la page actuelle fonctionne toujours, même si celle-ci est désactivée en ce moment!
toutes
les pages,
(L’exclusion de pages est également effective lors de la reconnaissance: lorsque vous lancez l’OCR, les pages (temporairement) exclues
Chargez l’image d’exemple MULTIPAGE.TIF et démarrez la reconnaissance. Les différentes pages s’affichent les unes après les autres; la barre de titre de Readiris indique le numéro de la page.
ne
sont
pas
reconnues!)
2 - 74
Si l’apprentissage interactif est activé, vous exécuterez les phases de recon-
naissance et d’apprentissage page par page. Le mode dictionnaire "Nouveau" s’appliquera à la première page et le mode "Enrichir" aux pages suivantes.
Quand vous cliquez sur le bouton "Finir", toutes les décisions seront acceptées
par le système sans validation de l’utilisateur. En d’autres termes, l’apprentissage
2 - 75
GUIDE DE LUTILISATEUR
interactif est interrompu pour automatique pour ce document.
Le résultat de la reconnaissance de documents multipages est enregistré dans un seul fichier de sortie. Lorsque le résultat de la reconnaissance est envoyé dans une application cible, des pages multiples sont créées à l’intérieur d’un seul docu­ment.
C’est en tout cas ce qui l’on peut réaliser si l’option "Créer un Fichier par Page" est désactivée au moment de sauvegarder le document reconnu. Cette option permet de faire en sorte que chaque page d’un document multipage soit sauvegardée dans un fichier séparé. Si l’utilisateur donne le nom de fichier texte.doc, les fichiers seront nommés texte-1.doc, texte-2.doc, etc. (Cette option n’est pas disponible quand vous envoyez les résultats de l’OCR vers une applica­tion cible, elle n’est utilisable que lors de la création de fichiers externes.)
toutes
les pages; l’OCR se poursuit en mode
ÉÉ
DITIONDITION
É
DITION
DITIONDITION
ÉÉ
L’utilisateur peut modifier des documents multipages, principalement afin de corriger des erreurs dues à la numérisation: il peut ainsi effacer des pages du document et déplacer des pages à d’autres endroits du document.
Voyons d’abord le déplacement. Pour dans le panneau des documents ou sur sa vignette sur la barre d’outils des pages. (Ou placez le curseur sur sa vignette, cliquez dessus avec le bouton droit de la souris pour faire apparaître le menu "Contexte" et utilisez la commande
DEDE
DOCUMENTSDOCUMENTS
DE
DOCUMENTS
DEDE
DOCUMENTSDOCUMENTS
MULMUL
TIPTIP
MUL
MULMUL
AGESAGES
TIP
AGES
TIPTIP
AGESAGES
accéder à une page
, cliquez sur la page
2 - 76
"Sélectionner Page".) Pour aller à la page précédente, vous pouvez utiliser le raccourci PagePréc et pour aller à la page suivante, appuyez sur PageSuiv. Appuyer sur la touche Début pour aller à la première page et sur la touche Fin pour vous rendre à la dernière page. Alternativement, vous pouvez utiliser les commandes correspondantes du menu "Vue".
Abordons à présent la question de l’édition des documents. Pour
une page
d’un document, placez le curseur sur elle dans le panneau des docu-
supprimer
ments et appuyez sur la touche Effacer. Ou mettez le curseur au-dessus de son imagette dans la barre d’outils des pages et enfoncez la touche Effacer. (Ou encore, sélectionnez la page dans la barre d’outils des pages et sélectionner la commande "Effacer Page" du menu "Contexte".)
Nous vous rappelons que vous pouvez temporairement exclure les pages, sans
les supprimer, du processus de reconnaissance (et de l’impression des images): le panneau des documents, la barre d’outils de la page (et le menu "Édition") offrent les commandes nécessaires.
2 - 77
Pour
déplacer une page vers l’avant
"Déplacer Page en Avant" et pour commande "Déplacer Page en Arrière".
déplacer une page
Pour l’icône vers cette nouvelle localisation.
vers une location différente dans le document, glissez
déplacer
GUIDE DE LUTILISATEUR
du document, utilisez la commande
une page
vers l’arrière
, utilisez la
2 - 78
CC
OMMENCEROMMENCER
C
OMMENCER
OMMENCEROMMENCER
CC
Vous pouvez utiliser la commande "Nouveau Document" sous le menu "Fichier"
pour fermer le document actuel.
AA
VECVEC
A
VEC
AA
VECVEC
UNUN
NOUVEAUNOUVEAU
UN
NOUVEAU
UNUN
NOUVEAUNOUVEAU
DOCUMENTDOCUMENT
DOCUMENT
DOCUMENTDOCUMENT
2 - 79
GUIDE DE LUTILISATEUR
Cette commande “efface l’ardoise”. Tout document chargé en mémoire ­contenant une seule ou plusieurs pages - sera effacé. Vous pouvez donc créer un nouveau document dès à présent.
Mais vous pouvez aussi créer un nouveau document depuis le document actif. Tant que l’OCR n’a pas été exécuté, le système suppose que vous voulez ajouter des pages au document actuel. Vous pouvez par exemple numériser toutes les pages depuis l’alimentation automatique du scanner, remplir à nouveau l’alimentation et recommencer. Toutes les pages numérisées composeront un seul et même document. Ou alors vous pouvez numériser un certain nombre de pages et y ajouter des fichiers image, par exemple des télécopies. Ces pages forment encore un document unique, tout ce que vous devez faire c’est changer entretemps l’image source au moyen du bouton "Source".
était
Lorsque l’OCR numérisation (ou le chargement d’images), vous êtes invité à démarrer un nouveau document ou compléter le document actuel.
déjà exécuté auparavant et que vous recommencez la
RR
ECONNAISSANCEECONNAISSANCE
R
ECONNAISSANCE
ECONNAISSANCEECONNAISSANCE
RR
Nous savons maintenant comment reconnaître des pages et comment traiter des documents multipages. Mais est-ce possible de reconnaître plus d’une page avec un confort identique? C’est possible! Cliquez sur le bouton droit de la souris et sélectionnez la commande "Copier comme Texte" du menu "Contexte": la fenêtre de texte sous la souris est reconnue et envoyée vers le presse-papiers.
DESDES
DES
DESDES
ZONESZONES
ZONES
ZONESZONES
DEDE
DE
DEDE
TEXTETEXTE
TEXTE
TEXTETEXTE
2 - 80
La configuration du système actuel - langue, mode de reconnaissance, type de
police, etc. - s’applique. Le résultat de la reconnaissance est placé dans le presse­papiers comme texte “continu”, non-formaté.
Loading...