Nous vous félicitons pour votre acquisition de Readiris. Ce logiciel vous sera
très utile pour la saisie de vos textes, tables, graphiques, codes à barres et même
vos textes manuscrits.
Aussi efficaces que puissent être les ordinateurs, il vous faut toujours d’abord
encoder les informations. S’il vous est déjà arrivé de devoir refrapper un rapport
de 15 pages ou un grand tableau de chiffres, vous savez comme cette tâche peut
être longue et fastidieuse. Utilisez ce logiciel à la pointe du progrès pour encoder
automatiquement du texte dans vos applications et vous atteindrez un niveau
d’efficacité et de confort jamais atteint! (Deux modes de reconnaisance sont
disponibles: le premier assure une vitesse optimale, le second garantit une exactitude maximale du processus OCR.)
Numérisez un document imprimé ou tapé à la machine, indiquez les zones à
lire - ou laissez le système les détecter pour vous -, effectuez la reconnaissance
de caractères et envoyez les résultats directement dans votre traitement de texte.
Des documents composés de plusieurs pages seront traités du début à la fin avec
un effort minime. Quelques clics vous épargnent de longues heures de travail car
Readiris convertit vos documents papier en fichiers éditables par l’ordinateur:
c’est jusqu’à 40 fois plus rapide que la refrappe manuelle.
L’assistant OCR vous mène à travers le processus d’OCR d’une manière
confortable: vous répondez à quelques questions simples pour obtenir des résultats
rapides avec Readiris. Vous pouvez envoyer les résultats de la lecture directement
dans votre traitement de texte ou dans votre tableur. Pour reconnaître des télécopies
et convertir des documents PDF, vous pouvez glisser-déposer les fichiers images
depuis l’Explorateur de Windows vers la fenêtre de l’application de Readiris. Ou
cliquez avec le bouton droit de la souris sur une image pour l’envoyer aussitôt
dans Readiris.
Readiris reconnaît les données insérées dans des tables et les recrée comme
feuille de calcul ou comme objet table dans votre traitement de texte; vos données
numériques sont immédiatement prêtes pour les manipulations ultérieures.
DUDU
DU
DUDU
TEMPSTEMPS
TEMPS
TEMPSTEMPS
, ,
ENTREZENTREZ
,
ENTREZ
ENTREZENTREZ
, ,
SANSSANS
SANS
SANSSANS
FRAPPERFRAPPER
FRAPPER
FRAPPERFRAPPER
!!
!
!!
IV
Basé sur la technologie Connectionist d’I.R.I.S., Readiris représente ce que
l’OCR vous offre de mieux. La reconnaissance omnifonte est complétée par des
techniques d’auto-apprentissage basées sur un réseau neuronal propriétaire. Le
système peut apprendre des nouveaux caractères grâce à l’analyse contextuelle:
des connaissances linguistiques à propos des syllabes et des mots améliorent les
performances de l’OCR.
Readiris reconnaît jusqu’à 126 langues: toutes les langues américaines et
européennes, en ce y compris les langues de l’Europe de l’Est, les langues baltiques,
le grec et les langues cyrilliques (“russes”). (De manière optionelle, vous pouvez
lire les documents en arabe ainsi que quatre langues asiatiques - le japonais, le
chinois simplifié et traditionnel et le coréen.) Readiris se charge également
d’alphabets mixtes: le logiciel détecte les mots “occidentaux” qui surviennent
dans des textes grecs, cyrilliques, arabes ou asiatiques - de nombreux noms propres,
noms de marques, etc. intraduisibles sont écrits avec des symboles occidentaux.
Readiris utilise ces connaissances linguistiques
pendant
la phase de reconnaissance, pas après. Cela permet à Readiris de reconnaître des documents de
tous types avec une précision maximale, en ce compris les documents de mauvaise
qualité tels que les télécopies et les textes issus d’imprimantes à aiguille. Readiris
se charge de documents mal numérisés et de copies de documents contenant des
formes trop claires ou trop sombres. Des caractères collés (“ligatures”) sont
reconnus avec succès et des formes fragmentées, tels que les symboles issus
d’une imprimante matricielle, sont recomposés.
La vérification avec “contexte dans l’image” par l’utilisateur non seulement
signale les caractères douteux, mais augmente également la précision du système.
Toutes les solutions confirmées par l’utilisateur sont mémorisées, ce qui augmente
la vitesse et la fiabilité au fur et à mesure de votre progression. Utiliser Readiris
signifie le rendre plus intelligent à chaque fois! Ce puissant outil d’apprentissage
vous permet non seulement d’apprendre à Readiris les caractères spéciaux tels
que les symboles mathématiques et les dingbats mais aussi de se charger des
polices tordues que vous pourrez trouver dans des documents réels.
Pour augmenter encore votre productivité, Readiris non seulement reconnaît
vos textes, mais peut aussi les
formater
pour vous! Utilisez “l’autoformatage” et
V
GUIDEDEL’UTILISATEUR
Readiris recrée une copie facsimile du document numérisé: le formatage du mot,
du paragraphe et de la page du document original sont retenus.
Les caractères sont reproduits dans une police similaire, la taille et le style des
caractères sont également préservés lors de la reconnaissance. L’emplacement
des colonnes, des blocs de texte et des graphiques est fidèle à celui de vos documents originaux. Et puisque Readiris reconnaît sans problème les numérisations
en échelle de gris et en couleur, vous pouvez saisir n’importe quel graphique qu’il s’agisse de modes traits, de photos en noir et blanc ou d’illustrations colorées.
Lorsqu’un document contient des tables, Readiris les réorganise dans de vraies
cellules et recrée les bordures des tables originales.
En d’autres mots, Readiris vous permet d’archiver une copie exacte de votre
document, qui sera un fichier texte éditable et compact au lieu d’une image scannée!
Plusieurs niveaux de formatage sont disponibles, le choix appartient à l’utilisateur.
Les codes à barres qui figurent sur les pages numérisées peuvent également
être lus, ainsi que les textes manuscrits, à condition que les lettres “imprimées”
majuscules soient suffisamment espacées.
Readiris supporte une large variété de numériseurs: de nombreux scanners à
plat, à alimentation, les systèmes hybrides ou “tout en un” (également appelés
“MFPs”, “périphériques multifonctionnels”) et les appareils photos numériques.
Readiris supporte également le standard de saisie Twain, de même que certaines
plates-formes de numérisation.
automatique, la numérisation avec pause vous permettra toutefois d’acquérir
rapidement des documents multipages.
Si vous ne disposez pas d’une alimentation
TT
ABLEABLE
T
ABLE
ABLEABLE
TT
Gagnez du temps, entrez sans frapper! ......................................................................... III
Table des matières .......................................................................................................... V
Le rôle des dictionnaires de fontes ............................................................................ 2-43
Envoyer le résultat dans votre application ................................................................ 2-47
Sauvegarder les résultats dans un fichier texte .......................................................... 2-50
Créer des documents portables... ............................................................................... 2-54
... ou les lire! ............................................................................................................... 2-63
Reconnaissance de pages multiples .......................................................................... 2-66
Édition de documents multipages .............................................................................. 2-75
VV
isite guidéeisite guidée
V
isite guidée
VV
isite guidéeisite guidée
VII
GUIDEDEL’UTILISATEUR
Commencer avec un nouveau document ................................................................... 2-78
Reconnaissance des zones de texte ........................................................................... 2-79
Organisation du texte saisi ......................................................................................... 2-81
Configuration du numériseur ..................................................................................... 2-82
Mettez un peu de couleur dans vos textes! ............................................................... 2-85
À différents appareils, différentes résolutions ........................................................... 2-88
Sauvegarder les paramètres par défaut ...................................................................... 2-93
Sauvegarde de paramètres spécifiques ...................................................................... 2-94
Numériser des documents .......................................................................................... 2-95
Ajuster les images numérisées ................................................................................... 2-98
Laisser l’assistant travailler pour vous .................................................................... 2-103
Readiris recrée la mise en page d’un document ....................................................... 2-104
Des colonnes s’il vous plait, pas de cadres! ............................................................ 2-109
Formater le texte, deuxième partie ............................................................................. 2-112
Exporter du texte plusieurs fois ................................................................................ 2-113
Sauvegarder des graphiques à part.......................................................................... 2-114
Recréer les couleurs des colonnes, des cadres ........................................................ 2-117
Retenir les couleurs du texte .................................................................................... 2-119
Lecture de fax et reconnaissance en différé ............................................................. 2-121
Reconnaissance des tables ...................................................................................... 2-123
Reconnaître des textes manuscrits ........................................................................... 2-132
Lire les barres et les espaces .................................................................................... 2-136
Obtenir de l’aide en ligne ......................................................................................... 2-139
DD
ROITSROITS
D
ROITS
ROITSROITS
DD
Le logiciel Readiris est conçu et développé par I.R.I.S. Les technologies OCR,
ICR, lecture de codes à barres, Connectionist, AutoFormat et la technologie
linguistique par I.R.I.S. I.R.I.S. détient tous les droits d’auteur pour le logiciel
Readiris, la technologie OCR, la technologie ICR, la technologie de lecture de
codes à barres, la technologie linguistique, l’aide en ligne et ce manuel.
AutoFormat, Cardiris, Connectionist, le logo I.R.I.S., Readiris et la technologie
linguistique I.R.I.S. sont des marques déposées d’I.R.I.S.
’’
DD
D
’
DD
’’
AUTEURAUTEUR
AUTEUR
AUTEURAUTEUR
VIII
Le parser XML est développé par Apache. Ce produit inclut un logiciel conçu
par Apache Software Foundation (www.apache.org).
Acrobat et Reader sont des marques déposées d’Adobe. Excel, Windows et
Word sont des marques (déposées) de Microsoft. Intel est une marque déposée
d’Intel.
1 - 1
GUIDEDEL’UTILISATEUR
Chapitre 1
I NSTALLATION
Ce chapitre décrit les exigences du système et l’installation de Readiris.
EE
XIGENCESXIGENCES
E
XIGENCES
XIGENCESXIGENCES
EE
Voici la configuration minimale requise pour utiliser Readiris:
un PC Intel 486 ou compatible. Un PC Pentium est recommandé.
64 MO de mémoire vive. 128 MO de mémoire vive sont recommandés
pour traiter les images en échelle de gris et en couleur.
120 MO d’espace disponible sur le disque dur. 105 MO d’espace suffisent
si vous laissez les fichiers d’exemple sur le CD-ROM.
le système d’exploitation Windows XP, Windows ME, Windows 2000,
Windows 98 ou Windows NT 4.0.
Notez que certains
sous la (ou les) dernière(s) version(s) de Windows! Consultez la documentation
fournie avec votre scanner pour savoir quelles sont les plates-formes supportées.
II
NSTNST
ALLAALLA
I
NST
ALLA
NSTNST
ALLAALLA
II
Readiris est exclusivement livré sur un
l’installer, insérez simplement le CD-ROM dans votre lecteur de CD-ROM et
attendez que le programme d’installation commence à tourner. Suivez les instructions à l’écran.
Si l’installation ne démarre pas quand le CD-ROM est inséré dans votre lecteur,
utilisez le programme MENU.EXE
DUDU
DU
DUDU
TIONTION
TION
TIONTION
SYSTÈMESYSTÈME
SYSTÈME
SYSTÈMESYSTÈME
pilotes de numériseurspilotes de numériseurs
pilotes de numériseurs peuvent ne pas fonctionner
pilotes de numériseurspilotes de numériseurs
R R
DEDE
DE
DEDE
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
R R
CD-ROM auto-exécutableCD-ROM auto-exécutable
CD-ROM auto-exécutable. Pour
CD-ROM auto-exécutableCD-ROM auto-exécutable
pour installer le programme.
1 - 2
Les utilisateurs de Windows XP, Windows 2000 et Windows NT 4.0 doivent
Une installation complète et personnalisée est offerte. Assurez-vous d’installer
bases de données linguistiquesbases de données linguistiques
les
bases de données linguistiques de toutes les langues que vous souhaitez
bases de données linguistiquesbases de données linguistiques
lire. Par défaut, tous les lexiques sont installés. Nous vous recommandons
d’installer les
images exemples images exemples
images exemples qui sont utilisées dans le didacticiel de ce manuel.
images exemples images exemples
De façon similaire, le
manuel électroniquemanuel électronique
manuel électronique est par défaut copié sur votre
manuel électroniquemanuel électronique
disque dur. Vous pouvez par contre le laisser sur le CD-ROM. (Installez le
programme
Adobe ReaderAdobe Reader
Adobe Reader requis pour accéder à la documentation sur le
Adobe ReaderAdobe Reader
programme si cela s’avère nécessaire.)
Le sous-menu "Applications I.R.I.S.- Readiris" sous le menu "Programmes"
est automatiquement créé à l’installation du programme.
1 - 3
GUIDEDEL’UTILISATEUR
Il en va de même pour le
dows. Vous pourrez ainsi démarrer directemment Readiris depuis votre bureau.
DD
ÉSINSTÉSINST
D
ÉSINST
ÉSINSTÉSINST
DD
Il n’y a qu’une manière correcte de désinstaller Readiris: en utilisant l’assistant
de (dés)installation de Windows. Nous vous recommandons fermement de
pas
désinstaller Readiris ou ses modules en supprimant manuellement les fichiers
du logiciel!
Exécutez les étapes suivantes pour utiliser l’
de de
WW
de
W
de de
WW
Cliquez sur "Paramètres" dans le menu "Démarrer" de Windows et
Cliquez sur l’icône "Ajout/Suppression de Programmes" dans le panneau
ALLAALLA
ALLA
ALLAALLA
indowsindows
indows.
indowsindows
passez sur le "Panneau de Configuration".
de configuration.
TIONTION
TION
TIONTION
raccourci raccourci
raccourci vers Readiris sur le
raccourci raccourci
R R
DEDE
DE
DEDE
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
R R
assistant de (dés)installationassistant de (dés)installation
assistant de (dés)installation
assistant de (dés)installationassistant de (dés)installation
bureau bureau
bureau de Win-
bureau bureau
ne
1 - 4
Suivez les instructions à l’écran pour supprimer le logiciel Readiris.
II
NSTNST
ALLAALLA
I
NST
ALLA
NSTNST
ALLAALLA
II
Il y a une seule option logicielle disponible qui complète Readiris: le
le chinois traditionnel, le chinois simplifié et le coréen.
TIONTION
TION
TIONTION
DESDES
DES
DESDES
OPTIONSOPTIONS
OPTIONS
OPTIONSOPTIONS
LOGICIELLESLOGICIELLES
LOGICIELLES
LOGICIELLESLOGICIELLES
1 - 5
GUIDEDEL’UTILISATEUR
Ce logiciel est également livré sur un CD-ROM auto-exécutable. En installant
cette option, vous disposez d’une documentation spécifique traitant de la reconnaissance de documents asiatiques.
1 - 6
II
NSTNST
ALLAALLA
I
NST
ALLA
NSTNST
ALLAALLA
II
En fonction de la version du programme que vous venez d’acquérir, Readiris
peut être complété par une version d’essai du produit apparenté Cardiris, un
organisateur de cartes de visiteorganisateur de cartes de visite
organisateur de cartes de visite.
organisateur de cartes de visiteorganisateur de cartes de visite
Si ce programme complémentaire gratuit se trouve sur votre CD-ROM, il est
également installé en utilisant le CD-ROM auto-exécutable et en suivant les instructions à l’écran.
Contactez I.R.I.S. pour en savoir plus sur les programmes complémentaires;
la commande "Contacter I.R.I.S." sous le menu "Aide" de Readiris vous explique
de quelles manières vous pouvez contacter I.R.I.S.
TIONTION
TION
TIONTION
DEDE
DE
DEDE
PRODUITSPRODUITS
PRODUITS
PRODUITSPRODUITS
APPAPP
APP
APPAPP
ARENTÉSARENTÉS
ARENTÉS
ARENTÉSARENTÉS
1 - 7
GUIDEDEL’UTILISATEUR
Une icône d’application dans le sous-menu "Applications I.R.I.S. - Readiris"
sous le menu "Programmes" vous permet d’accéder directement à la
d’accueild’accueil
d’accueil d’I.R.I.S. De même l’écran de démarrage de Readiris et la commande
d’accueild’accueil
"I.R.I.S. sur Internet" sous le menu "Aide" de Readiris.
pagepage
page
pagepage
1 - 8
FF
ICHIERSICHIERS
F
ICHIERS
ICHIERSICHIERS
FF
Le programme d’installation a créé un dossier où se trouvent les fichiers de
Readiris. N’essayez jamais de désinstaller Readiris ou certains de ses modules
en supprimant manuellement des fichiers du programme, utilisez pour ce faire
l’assistant de désinstallation de Windows. Voir plus haut.
Fichier “Lisez-moi” et documentationFichier “Lisez-moi” et documentation
Fichier “Lisez-moi” et documentation
Fichier “Lisez-moi” et documentationFichier “Lisez-moi” et documentation
README.HTMLFichier de type “Lisez-moi” (en format HTML)
MANUAL.PDFManuel d’utilisateur (en format Adobe Acrobat)
Formulaire pour les textes manuscritsFormulaire pour les textes manuscrits
Formulaire pour les textes manuscrits
Formulaire pour les textes manuscritsFormulaire pour les textes manuscrits
TEMPLATE.PDFFormulaire vierge pour textes manuscrits
TEMPLATE.DOCFormulaire vierge pour textes manuscrits
EE
NREGISTREZNREGISTREZ
E
NREGISTREZ
NREGISTREZNREGISTREZ
EE
N’oubliez pas d’enregistrer votre licence Readiris! Ceci nous permettra de
vous tenir informé des futurs développements du produit ainsi que des autres
produits I.R.I.S. apparentés. Les avantages de l’enregistrement, entre autres le
support support
support gratuit
support support
aux utilisateurs enregistrés.
Vous pouvez enregistrer le produit de plusieurs façons: envoyez la carte
d’enregistrement ou télécopiez son équivalent électronique, téléphonez à I.R.I.S.
pendant les heures ouvrables ou encore remplissez un formulaire d’enregistrement
sur le site web d’I.R.I.S.
INSTINST
ALLÉSALLÉS
INST
ALLÉS
INSTINST
ALLÉSALLÉS
(version pour l’impression) (en format Adobe Acrobat)
assistant d’enregistrement que vous trouverez sous le menu "Aide" du
assistant d’enregistrementassistant d’enregistrement
logiciel Readiris vous accompagnera pour accomplir facilement la procédure
d’enregistrement.
1 - 10
Selon la version que vous possédez, vous recevrez en retour la
qui vous sera peut-être nécessaire pour pouvoir continuer à utiliser Readiris après
un mois.
SS
UPPORUPPOR
S
UPPOR
UPPORUPPOR
SS
La commande "Support du Produit" sous le menu "Aide" de Readiris vous
explique comment obtenir de l’aide technique. Décrivez clairement le problème
rencontré et ajoutez à votre description toutes les données utiles au sujet de
Readiris, votre numériseur et de votre ordinateur.
DUDU
DU
DUDU
PRODUITPRODUIT
PRODUIT
PRODUITPRODUIT
TT
T
TT
clé logicielleclé logicielle
clé logicielle
clé logicielleclé logicielle
1 - 11
GUIDEDEL’UTILISATEUR
Mais avant de solliciter le support du produit, nous vous recommandons de
vérifier si des
Utilisez la commande "Rechercher des Mises à Jour" dans le menu "Aide" afin
d’en vérifier la disponibilité.
mises à jour du logicielmises à jour du logiciel
mises à jour du logiciel sont disponibles au téléchargement.
mises à jour du logicielmises à jour du logiciel
1 - 12
2 - 1
GUIDEDEL’UTILISATEUR
Chapitre 2
VISITE GUIDÉE
Readiris est un produit de pointe pour la reconnaissance optique de caractères
(OCR), avec de nombreuses caractéristiques avancées. Nous envisagerons dans
ce chapitre les principales applications de Readiris ainsi que de nombreuses astuces
pour mieux l’utiliser.
DD
ÉMARRAGEÉMARRAGE
D
ÉMARRAGE
ÉMARRAGEÉMARRAGE
DD
Cliquez sur l’application Readiris dans le sous-menu "Applications I.R.I.S. Readiris", ou cliquez sur le raccourci vers Readiris sur votre bureau Windows.
L’écran de démarrage ainsi que la fenêtre de l’application Readiris apparaissent.
L’écran de démarrage affiche la version du logiciel ainsi que des messages liés
aux droits d’auteur. Il vous permet en outre un accès direct à la
d’I.R.I.S. - il vous suffit de cliquer sur l’URL pour visiter le site web d’I.R.I.S.
Cliquez avec la souris n’importe où ailleurs pour faire disparaître cet écran.
La fenêtre suivante concerne l’assistant d’OCR. Cliquez sur "Annuler" pour
le moment.
DUDU
DU
DUDU
LOGICIELLOGICIEL
LOGICIEL
LOGICIELLOGICIEL
page d’accueilpage d’accueil
page d’accueil
page d’accueilpage d’accueil
2 - 2
LL
EE
PREMIERPREMIER
L
E
PREMIER
EE
PREMIERPREMIER
LL
En fonction de la version acquise du logiciel, le premier démarrage peut être
particulier: on peut vous demander d’enregistrer votre licence.
Si c’est le cas, l’utilisation de Readiris est limitée à un mois, et en vous
enregistrant, I.R.I.S. vous enverra gratuitement une
continuer à utiliser le logiciel après 30 jours.
numéro d’identificationnuméro d’identification
Votre
numéro d’identification est nécessaire à la création de la clé logicielle.
numéro d’identificationnuméro d’identification
Assurez-vous que ce numéro est disponible ou mentionné quand vous enregistrez
votre licence.
DÉMARRAGEDÉMARRAGE
DÉMARRAGE
DÉMARRAGEDÉMARRAGE
clé logicielleclé logicielle
clé logicielle afin de pouvoir
clé logicielleclé logicielle
DD
ÉCOUVREZÉCOUVREZ
D
ÉCOUVREZ
ÉCOUVREZÉCOUVREZ
DD
La fenêtre d’application de Readiris ne contient pas seulement les
commandecommande
commande mais aussi deux barres de boutons qui donnent accès aux commandes
commandecommande
fréquemment utilisées. Initialement, certains menus de commandes sont grisés:
ils concernent la prévisualisation. Aussi longtemps qu’aucune image n’est ouverte,
ils ne sont pas accessibles.
’’
LL
L
’
LL
’’
INTERFINTERF
INTERF
INTERFINTERF
ACEACE
ACE
ACEACE
DEDE
DE
DEDE
R R
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
R R
menus demenus de
menus de
menus demenus de
2 - 3
GUIDEDEL’UTILISATEUR
Il en est de même pour la
d’application: elle contient toutes les commandes utiles à la prévisualisation. La
barre d’outils principalebarre d’outils principale
barre d’outils principale sur la gauche de l’écran permet un accès rapide à
barre d’outils principalebarre d’outils principale
toutes les commandes générales fréquemment utilisées.
Pour savoir quelle commande correspond à quel bouton, tenez le pointeur de
votre souris sur lui pendant un moment: la
barre d’outils imagebarre d’outils image
barre d’outils image à la droite de la fenêtre
barre d’outils imagebarre d’outils image
bulle explicative bulle explicative
bulle explicative de l’outil s’affichera.
bulle explicative bulle explicative
2 - 4
La zone centrale de la fenêtre ou la
zone d’imagezone d’image
zone d’image est l’endroit où les images
zone d’imagezone d’image
numérisées sont affichées. Vous pouvez glisser-déposer des fichiers image dans
la zone image et sur l’icône Readiris pour les reconnaître.
Dès que des images ont été traitées, une barre d’outils
barre d’outils des pagesbarre d’outils des pages
barre d’outils des pages, s’ajoute à gauche de la zone d’image: elle représente
barre d’outils des pagesbarre d’outils des pages
supplémentaire, la
les différentes pages du document et permet l’accès aux commandes de la page
en cliquant sur le bouton droit de la souris (menu "Contexte").
2 - 5
GUIDEDEL’UTILISATEUR
De plus, le
numérisée. Ce panneau affiche des
sur les pages scannées: la source de l’image et la résolution, la durée de la
numérisation et de la reconnaissance, etc. (Le panneau des documents est
également accompagné de bulles explicatives...)
DD
ÉBUTERÉBUTER
D
ÉBUTER
ÉBUTERÉBUTER
DD
La meilleure façon de se familiariser avec le logiciel Readiris est
indubitablement de l’utiliser. Un certain nombre d’
panneau des documentspanneau des documents
panneau des documents est alors affiché en dessous de l’image
panneau des documentspanneau des documents
données statistiquesdonnées statistiques
données statistiques et des informations
données statistiquesdonnées statistiques
AA
A
AA
VECVEC
VEC
VECVEC
UNEUNE
UNE
UNEUNE
PREMIÈREPREMIÈRE
PREMIÈRE
PREMIÈREPREMIÈRE
LEÇONLEÇON
LEÇON
LEÇONLEÇON
images prénumériséesimages prénumérisées
images prénumérisées est
images prénumériséesimages prénumérisées
2 - 6
fourni avec le programme; elles vous permettent de commencer son utilisation
même s’il n’y a pas de scanner connecté à votre ordinateur. Voyons ce qu’il en
est.
Le bouton "Source" sur la barre des boutons principale détermine si vous allez
scanner une image ou si vous allez utiliser une image prénumérisée comme image source.
Les images en couleur, niveaux de gris et noir et blanc sont indifféremment
supportées. Readiris vous permet d’ouvrir des documents Adobe Acrobat PDF,
des télécopies DCX (une version multipage du format Paintbrush), des images
DjVu (*.djv, *.djvu), des images JPEG, des images JPEG 2000 (*.j2c, *.jp2), des
images PNG, des images TIFF (non-compressées et compressées en LZW,
PackBits, Groupe 3 et Groupe 4), des images TIFF multipages, des bitmaps Windows (*.bmp) et des images ZSoft Paintbrush (*.pcx).
Cette possibilité est particulièrement utile pour convertir vos
télécopies télécopies
télécopies en
télécopies télécopies
fichiers texte éditables.
Comme nous allons ouvrir une image préscannée, vous devez sélectionner
"Fichiers Image" et non le numériseur comme source d’image au moyen du bouton "Source".
Ensuite, cliquez sur le bouton "Ouvrir". (Quand vous sélectionnez le disque
comme source d’images, le bouton "Numériser" est remplacé par le bouton
"Ouvrir" et la commande correspondante "Numériser" sous le menu "Action" est
remplacé par la commande "Ouvrir".)
2 - 7
GUIDEDEL’UTILISATEUR
Vous pourriez également sélectionner la commande "Ouvrir" du menu "Fichier"
et ouvrir directement une image prénumérisée - ceci fonctionne même lorsque
votre numériseur est utilisé comme source d’image.
Vous êtes invité à sélectionner un fichier image. Sélectionnez le fichier
FRENCH.JPG dans le dossier "Samples", un sous-dossier du dossier de Readiris.
(Toutes les images d’exemple se trouvent dans ce dossier!) Comme ce fichier
d’exemple est une image couleur, il ne sera pas seulement lu depuis le disque dur:
une version noir et blanc est créée pour le procéssus d’OCR (“binarisation”).
Finalement, l’image s’affiche dans la zone image. La barre d’outils des pages
et le panneau des documents indiquent qu’une seule page est chargée dans
Readiris.
2 - 8
Une troisième façon d’ouvrir des images prénumérisées est d’utiliser la méthode
glisserglisser
du “
-déposer-déposer
glisser
-déposer”. Faites glisser des images depuis l’Explorateur Windows
glisserglisser
-déposer-déposer
vers la zone image de Readiris ou sur l’icône Readiris pour les ouvrir directement.
2 - 9
GUIDEDEL’UTILISATEUR
Enfin, vous pouvez également ouvrir des images à partir de l’Explorateur Win-
cliquezcliquez
dows:
cliquez avec le bouton
cliquezcliquez
la commande "Reconnaître" du menu "Contexte". (Cette commande n’apparaît
que lorsque le type de fichier est supporté.)
droit droit
droit de la souris sur un fichier image et sélectionnez
droit droit
2 - 10
Cela ne signifie pas que l’OCR s’éxécute sur le champ: afin que l’utilisateur
bénéficie de plus de souplesse, Readiris démarre tout simplement et l’image s’ouvre
aussitôt.
La barre d’outils image à la droite de la fenêtre d’application de Readiris
contient toutes les commandes dont vous avez besoin pour la prévisualisation: les
outils pour indiquer les zones d’intérêt, pour faire pivoter l’image, pour agrandir
l’image, etc.
AA
GRANDIRGRANDIR
A
GRANDIR
GRANDIRGRANDIR
AA
Readiris a plusieurs commandes qui vous permettent d’
numérisée, par exemple pour vérifier la qualité de numérisation.
La barre d’outils image contient des boutons qui permettent d’effectuer un
zoom en taille réelle, d’ajuster l’image à la largeur de page et d’ajuster l’image
LL
L
LL
’’
IMAGEIMAGE
’
IMAGE
IMAGEIMAGE
’’
agrandiragrandir
agrandir l’image
agrandiragrandir
2 - 11
GUIDEDEL’UTILISATEUR
entière dans la fenêtre d’aperçu. Le menu "Vue" contient les mêmes commandes
et ajoute deux niveaux de zoom supplémentaires: vous pouvez afficher l’image à
50% et 200% de sa taille actuelle. A sa taille actuelle, un point écran correspond
à un point image. (Des raccourcis clavier existent pour tous les niveaux de zoom!)
Remarquez aussi que les niveaux d’agrandissement sont accessibles grâce au
double clic. Cliquez avec le bouton droit de la souris pour faire apparaître le menu
contextuel et sélectionner le niveau de zoom approprié.
2 - 12
De plus, vous pouvez en cliquant
deux fois
avec le bouton droit de la souris sur
une région de l’image numérisée en faire directement un agrandissement à sa
taille réelle. Refaites l’opération pour revenir à la taille réelle.
Enfin, vous pouvez utiliser la
loupeloupe
loupe pour agrandir les détails des documents
loupeloupe
numérisés. La loupe est aussi disponible sous le menu "Contexte" lorsque vous
cliquez avec le bouton droit de la souris sur l’image.
Appuyez sur la touche Échappement ou cliquez avec la souris afin de faire
disparaître la loupe!
2 - 13
GUIDEDEL’UTILISATEUR
UU
, ,
NN
U
UU
que vous souhaitez lire en traçant des cadres, également appelées “fenêtres”,
autour des zones d’intérêt.
"Analyse de Page" est activée sous le bouton "Options" de la barre d’outils
principale (ou sous le menu "Configuration").
des
pourrait inclure des graphiques et des tables - sont reconnus.
DÉCOMPOSITIONDÉCOMPOSITION
N
,
DÉCOMPOSITION
NN
DÉCOMPOSITIONDÉCOMPOSITION
, ,
Maintenant que l’image est numérisée, vous pouvez définir les parties de textes
En fait, Readiris effectuera automatiquement cette opération quand l’option
La décomposition automatique de la page est particulièrement utile lorsque
textes sous formes de colonnestextes sous formes de colonnes
textes sous formes de colonnes ou à la mise en page complexe - qui
textes sous formes de colonnestextes sous formes de colonnes
’’
DD
D
’
DD
’’
UNEUNE
UNE
UNEUNE
IMAGEIMAGE
IMAGE
IMAGEIMAGE
NUMÉRISÉENUMÉRISÉE
NUMÉRISÉE
NUMÉRISÉENUMÉRISÉE
2 - 14
L’analyse de page utilise trois
types de fenêtrestypes de fenêtres
types de fenêtres: les fenêtres textes, les
types de fenêtrestypes de fenêtres
fenêtres graphiques et les fenêtres tables. Readiris distingue les blocs de texte,
les tables et les zones graphiques qui contiennent des photos, des illustrations, etc.
(La sauvegarde des graphiques et la reconnaissance des tables seront expliquées
plus tard.)
Il y a deux types de fenêtres que vous devez toujours dessiner manuellement:
les zones de codes à barres et les zones de texte manuscrit. (Nous parlerons de
2 - 15
GUIDEDEL’UTILISATEUR
lecture de codes à barres et de reconnaissance de lettres manuscrites “non
cursives” plus tard.)
code couleurcode couleur
Un
code couleur permet de distinguer les types de fenêtre: les fenêtres
code couleurcode couleur
textes ont un bord orange, les fenêtres graphiques ont un bord pourpre et les
fenêtres tables un bord rose. Les fenêtres de codes à barres sont vertes et les
fenêtres de texte manuscrit sont bleues.
Le nombre de fenêtres est spécifié à tout moment dans les bulles explicatives
des outils des fenêtres.
L’analyse de page est rapide et hautement précise, elle reconnaît des lignes
inclinées et elle trace des figures complexes, “irrégulières”.
L’analyse de page détectera même des zones où vous aurez un
sur fond noirsur fond noir
sur fond noir. La reconnaissance de ce type d’insertions ne pose pas de problème:
sur fond noirsur fond noir
l’image apparaît à l’écran telle qu’elle est numérisée, mais Readiris “inverse”
l’image pendant la phase de reconnaissance pour reconnaître de tels blocs de
texte. (Vous pouvez grâce à votre numériseur générer des images
inversées pour les pages ayant du texte blanc sur fond noir. Voir plus bas.)
texte blanctexte blanc
texte blanc
texte blanctexte blanc
complètement
2 - 16
UU
NN
ETET
U
N
NN
UU
Readiris ne détecte pas seulement les différents blocs, mais en plus le logiciel
les
trie
traiter les documents multicolonnes. Des numéros indiquent l’ordre de tri.
Vous pouvez évidemment modifier l’
bouton "Trier" sur la barre d’outils image. Le curseur prend la forme d’une main
qui pointe dès que le mode de tri est activé.
Cliquez à l’intérieur des fenêtres pour les inclure. Les fenêtres sur lesquelles
vous
différence entre les fenêtres séléctionnées et les fenêtres non sélectionnées est
claire: les fenêtres séléctionnées ont une couleur plus vive, les fenêtres non
sélectionnées ont une couleur plus pâle et ne portent pas de numéro.
DEMIDEMI
ET
DEMI
ETET
DEMIDEMI
: les blocs sont triés du haut vers le bas, de gauche à droite afin de bien
ne
cliquez
, ,
TRIERTRIER
,
TRIER
TRIERTRIER
, ,
pas
sont tout simplement ignorées, exclues de la “lecture”. La
DESDES
DES
DESDES
FENÊTRESFENÊTRES
FENÊTRES
FENÊTRESFENÊTRES
ordre deordre de
ordre de
ordre deordre de
tritri
tri. Pour ce faire, cliquez sur le
tritri
2 - 17
GUIDEDEL’UTILISATEUR
L’analyse de page est activée par défaut. Pour forcer Readiris à décomposer
la page activée - ce pourrait être nécessaire si vous avez désactivé l’analyse de
page ou supprimé certaines fenêtres par erreur et souhaitez recommencer l’analyse
de page, etc. -, cliquez simplement sur le bouton "Analyser la Page" dans la barre
d’outils image.
2 - 18
Si vous traitez des documents asiatiques, sélectionnez la langue du document
avant
d’effectuer l’analyse de page car des routines spécifiques propres à la
langue sont utilisées. L’espace interligne des documents asiatiques est
généralement plus grand que dans les documents occidentaux, le texte est composé
de petites icônes (“idéogrammes”) qui pourraient facilement être interprétées
comme des zones graphiques dans les documents occidentaux, en outre le texte
peut se lire de haut en bas, de droite à gauche. Si toutefois vous oubliez de
sélectionner la langue adéquate, sélectionnez-la tout de même à postériori. Readiris
refera automatiquement l’analyse de page!
Les images des documents peuvent contenir du bruit (taches “parasites” sur
le texte, bord noir autour du texte, etc.). Des petites fenêtres apparaissent alors à
l'écran pour indiquer la présence de ce bruit. Si les petites fenêtres ne contiennent
aucun texte, vous pouvez les supprimer en cliquant sur la commande "Supprimer
les Petites Fenêtres" sous le menu "Edition". Ce faisant, Readiris triera à nouveau
les autres fenêtres affichées à l'écran.
Une routine similaire opère de façon automatique: la non-détection des zones
sur les bords. Quand cette routine est désactivée dans le menu "Configuration",
l’analyse de page ignore tout simplement les zones sur les bords de page. Cette
option est particulièrement utile parce que certains numériseurs ajoutent des bords
noirs autour de l’image numérisée; l’analyse de page détecte normalement des
petites fenêtres indiquant la présence de “bruit”. Grâce à la routine, les fenêtres
inutiles ne s’affichent donc pas! Attention, si les bords de page contiennent des
zones graphiques, photos ou illustrations - par exemple, une illustration en arrière-
2 - 19
GUIDEDEL’UTILISATEUR
plan ou qui couvre la page entière, etc. -, Readiris détectera malgré tout
correctement ces éléments!
DD
D
DD
mais vous pouvez dessiner manuellement des zones avec les
de Readiris.
, ,
EUXEUX
EUX
EUXEUX
L’analyse de page traite automatiquement le fenêtrage d’une page numérisée,
FENÊTRAGEFENÊTRAGE
,
FENÊTRAGE
FENÊTRAGEFENÊTRAGE
, ,
MANUELMANUEL
MANUEL
MANUELMANUEL
’’
DD
D
’
DD
’’
UNEUNE
UNE
UNEUNE
IMAGEIMAGE
IMAGE
IMAGEIMAGE
outils de fenêtrageoutils de fenêtrage
outils de fenêtrage
outils de fenêtrageoutils de fenêtrage
2 - 20
(Comme nous avons déjà indiqué, les fenêtres de codes à barres et de texte
manuscrit sont toujours dessinées à la main par l’utilisateur: l’analyse de page ne
les détecte pas!)
tracer tracer
Pour
tracer un rectangle autour d’une zone d’interêt, sélectionnez l’outil
tracer tracer
correspondant dans la barre d’outils image et glissez la souris du coin supérieur
gauche vers le coin inférieur droit de la zone. (Les côtés du rectangle ne peuvent
être inférieurs à 1 mm. car ils ne seraient pas suffisants pour contenir les
caractères.)
Si vous avez sélectionné le mauvais type de zone, vous pouvez corriger
rapidement l’erreur en exécutant un clic du bouton droit au-dessus de la fenêtre.
Sélectionnez la commande "Fenêtre - Type" du menu contextuel.
2 - 21
GUIDEDEL’UTILISATEUR
Les fenêtres sont automatiquement triées par ordre de création; des numéros
indiquent l’ordre de tri.
Vous pouvez également encadrer des blocs de texte “irréguliers” en dessinant
fenêtres polygonales fenêtres polygonales
des
fenêtres polygonales autour d’eux. Les fenêtres non rectangulaires sont
fenêtres polygonales fenêtres polygonales
créées par l’assemblage de zones rectangulaires: dès que deux rectangles (du
même type) entrent en intersection, ils deviennent automatiquement une seule et
même fenêtre! En quelque sorte, vous construisez une maison en ajoutant une
pièce à l’autre… (Attention, créer des fenêtres de tables ou de codes à barres
polygonaux n’a pas de sens.)
Notez également que le fenêtrage manuel peut être combiné avec le tri des
fenêtres: vous pouvez tracer de nouvelles fenêtres pendant que le “mode de tri”
est activé. Vous utilisez alors le tri pour inclure certaines fenêtres détectées, et
créez manuellement d’autres fenêtres là où l’analyse de page n’a pas obtenu les
résultats idéaux. Dès que vous commencez à créer des fenêtres en “mode de
tri”, toutes les fenêtres non sélectionnées sont aussitôt effacées!
Pour modifier, déplacer ou supprimer des fenêtres, il vous faut d’abord les
sélectionnersélectionner
sélectionner. Pour ce faire, cliquez sur l’icône "Sélectionner une Fenêtre" (la
sélectionnersélectionner
flèche) sur la barre d’outils image et cliquez à l’intérieur de la fenêtre. Des
2 - 22
marqueurs rectangulaires apparaissent alors à chaque coin et sur les bords de la
fenêtre.
annuler la sélectionannuler la sélection
Pour
annuler la sélection des fenêtres, cliquez ailleurs avec le bouton de la
annuler la sélectionannuler la sélection
souris. Pour sélectionner des
fenêtres supplémentairesfenêtres supplémentaires
fenêtres supplémentaires, maintenez appuyée
fenêtres supplémentairesfenêtres supplémentaires
la touche Maj tout en cliquant sur ces fenêtres supplémentaires. Pour sélectionner
une fenêtre et les
fenêtres incluses fenêtres incluses
fenêtres incluses (d’un autre type), maintenez enfoncée la
fenêtres incluses fenêtres incluses
touche Ctrl tout en cliquant sur la fenêtre principale.
Voici pour la sélection des fenêtres. Pour
modifier modifier
modifier une fenêtre, sélectionnez-
modifier modifier
la, placez le curseur de la souris sur un marqueur et faites glisser le bord pour
changer la taille de la fenêtre.
déplacer déplacer
Pour
déplacer une fenêtre, sélectionnez-la et faites-la simplement glisser
déplacer déplacer
vers l’endroit désiré.
supprimer supprimer
Pour
supprimer des fenêtres, sélectionnez-les, cliquez sur celles-ci avec le
supprimer supprimer
bouton droit de la souris et sélectionnez la commande "Fenêtre - Supprimer" du
menu "Contexte". Cette action supprime aussi bien toutes les fenêtres sélectionneés
que la fenêtre sous le curseur de votre souris.
2 - 23
GUIDEDEL’UTILISATEUR
Alternativement, vous pouvez sélectionner les zones et choisir la commande
"Couper" ou "Effacer" du menu "Edition". La commande "Couper" place votre
fenêtre dans une mémoire tampon interne, la commande "Effacer" la supprime
définitivement. Lorsque vous collez des fenêtres, elles sont réintégrées à leur
place originale et vous devez les déplacer vers l’endroit souhaité.
toutes
En fait,
fenêtres: vous pouvez les supprimer, les couper, les copier et les coller! La
commande "Annuler" peut également vous servir: si vous avez malencontreusement
supprimé, déplacé, redimensionné, etc. certaines fenêtres, "Annuler" annulera
votre dernière opération!
les commandes habituelles du menu "Edition" s’appliquent aux
2 - 24
Notez aussi que des raccourcis existent pour toutes les commandes! Par
exemple: pour supprimer toutes les fenêtres existantes, vous pouvez utiliser la
commande "Sélectionner Tout" du menu "Édition" ou son raccourci clavier Ctrl+A et
cliquer sur la commande "Effacer" ou son raccourci Supprimer. Vous pouvez
maintenant recréer la mise en page désirée. Pour restaurer la mise en page
antérieure, choisissez la commande "Annuler" ou le raccourci Ctrl+Z.
TT
T
TT
utilisation ultérieure avec la commande "Sauvegarder le Fenêtrage" du menu
"Fichier" et chargée en mémoire avec la commande "Charger un Fenêtrage".
exemple un rapport de 50 pages où les en-tête et pied de page doivent être
supprimés pour des raisons évidentes, un simple modèle peut servir à aménager
les 50 pages.
automatiquement et le gabarit choisi reste actif jusqu’à ce que vous réactiviez
l’analyse de page sur la barre d’outils principale. Si vous chargez un fenêtrage
, ,
ROISROIS
ROIS
ROISROIS
Le masque créé peut être enregistré en
Si vous devez reconnaître des documents avec une mise en page similaire, par
Lorsque vous chargez un fenêtrage fixe, l’analyse de page se désactive
ENREGISTRERENREGISTRER
,
ENREGISTRER
ENREGISTRERENREGISTRER
, ,
DESDES
DES
DESDES
MODÈLESMODÈLES
MODÈLES
MODÈLESMODÈLES
DEDE
FENÊTRAGEFENÊTRAGE
DE
FENÊTRAGE
DEDE
FENÊTRAGEFENÊTRAGE
gabarits de fenêtragegabarits de fenêtrage
gabarits de fenêtrage pour une
gabarits de fenêtragegabarits de fenêtrage
2 - 25
GUIDEDEL’UTILISATEUR
mis en mémoire, activez l’option "Appliquer Fenêtrage à Toutes les Pages" pour
appliquer ce fenêtrage directement à toutes les pages du document en cours.)
De plus, vous disposez d’une alternative très intérressante aux gabarits: l’outil
de prévisualisation "Ignorer la Zone Extérieure" limite la décomposition de la
page à la partie “encadrée” de l’image.
Sélectionnez cet outil et saisissez la portion de l’image que vous voulez traiter.
Si vous utilisez un document multipage, vous pouvez exclure la même zone externe
de l’analyse de page à chaque page. (Relancez l’analyse de page pour supprimer
la “découpe” de l’image, ou pour changer les zones manuellement.)
2 - 26
2 - 27
GUIDEDEL’UTILISATEUR
RR
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
RR
Maintenant que les fenêtres sont correctement définies, vous êtes presque
prêt à effectuer la reconnaissance de caractères. “Presque” parce que nous
n’avons pas encore vérifié la langue et les caractéristiques du document!
Le paramètre de langue se trouve sur la barre d’outils principale.
Cliquez sur le bouton "Langue" pour modifier la langue du document.
VOUSVOUS
VOUS
VOUSVOUS
EMMÈNEEMMÈNE
EMMÈNE
EMMÈNEEMMÈNE
AUTAUT
AUT
AUTAUT
OUROUR
OUR
OUROUR
DUDU
DU
DUDU
MONDEMONDE
MONDE
MONDEMONDE
2 - 28
(Cette option donne également accès aux modes de reconnaissance - rapide
et précis. Vous en apprendrez plus un peu plus loin dans ce manuel!)
Vous pouvez appuyer sur une touche lettre pour la sélectionner directement: si
le français est actuellement sélectionné et que vous souhaitez choisir l’occitan,
vous pouvez enfoncer la lettre "O" de votre clavier: l’occitan sera sélectionnée.
Quand différentes langues ont la même initiale, appuyez sur la lettre plusieurs fois
2 - 29
GUIDEDEL’UTILISATEUR
afin de trouver les options. Par exemple: Readiris lit le polonais et le portugais. En
appuyant sur "P" une fois, vous sélectionnez le polonais, en appuyant une seconde
fois sur la touche "P", vous sélectionnez le portugais, et en appuyant une troisième
fois sur "P", vous revenez au polonais. (Pour sélectionner une
exemple "D", appuyez sur Arrière avant d’appuyer sur la touche "D".)
Readiris est de loin limiter au français: il reconnaît jusqu’à 126
les langues européennes et américaines sont supportées, y compris les langues
d’Europe centrale, le grec, le turc, les langues cyrilliques (“russes”) et les langues
de l’Europe baltique.
Un module optionnel permet de lire les
logicielle “Complément d’OCR asiatique” propose la reconnaissance du japonais,
du chinois simplifié, du chinois traditionnel et du coréen. (Le chinois simplifié est
utilisé sur le continent chinois et à Singapour, le chinois traditionnel est employé à
Hong Kong, Taiwan, Macau et dans les communautés chinoises d’outre-mer.)
Notez également que l’on distingue les variantes britanniques et américaines “internationales” devrions-nous dire - de la langue anglaise. Le logiciel permet
également de distinguer l’espagnol et le mexicain, parmi d’autres.
Une configuration de Windows particulière est obligatoire pour afficher les
caractères des langues “exotiques” - les langues cyrilliques et asiatiques, le grec
et le turc, etc. Vous pourriez avoir à installer le module "
MultilingueMultilingue
Multilingue" de Windows avant que votre système Windows ne puisse s’adapter
MultilingueMultilingue
à ces langues.
Sur un système d’exploitation Windows XP, 2000 et Windows NT 4.0,
sélectionnez l’icône "Options Régionales (et Langues)" sous le "Panneau de Configuration".
documents asiatiquesdocuments asiatiques
documents asiatiques: l’option
documents asiatiquesdocuments asiatiques
autre
lettre, par
langueslangues
langues! Toutes
langueslangues
Prise en CharPrise en Char
Prise en Char
Prise en CharPrise en Char
gege
ge
gege
2 - 30
Sur un système d’exploitation Windows ME et 98, sélectionnez l’icône "Ajout/
Suppression de Programmes" dans le "Panneau de Configuration" pour vérifier si
le module de prise en charge multilingue est installé sur votre PC.
2 - 31
GUIDEDEL’UTILISATEUR
Pour afficher et éditer des documents asiatiques, vous devez installer une
version asiatique du système Windows. Vous pouvez également utiliser Word
2003, Word 2002 ou Word 2000 pour visualiser et modifier ce genre de documents: Office 2003 System, Office XP et Office 2000 ont été spécifiquement
conçus pour traiter des documents dans une grande diversité de langues.
Rien de tout ceci n’est nécessaire pour la lecture des
logiciels Adobe Acrobat et Adobe Reader sont automatiquement mis à jour lorsque
des documents dans des langues “exotiques” - russe, japonais, etc. - doivent être
lus!
documents PDFdocuments PDF
documents PDF: les
documents PDFdocuments PDF
2 - 32
Référez-vous au
ce sujet.
Sélectionner correctement la langue du document est impératif. Basé sur la
sélection d’une langue, le logiciel sait quel
Un support multi-linguistique vous assure une reconnaissance correcte de
caractères “exotiques” tels que ß, ñ, ψ et ø.
Deuxièmement, le logiciel utilise de façon extensive ses
linguistiqueslinguistiques
linguistiques pour valider ses résultats. Supposez que vous ayez à lire le mot
linguistiqueslinguistiques
"président" où une tache d’encre donne au "r" l’aspect d’un "f". En consultant le
lexique de la langue française, Readiris reconnaît de façon autonome le mot
"président" et conclut qu’il n’y a aucun sens à la présence du symbole "f". Cette
techniquetechnique
technique “
techniquetechnique
La linguistique offre une aide utile pour résoudre des
"O" qui pourrait être confondu avec '0'. Un autre cas typique est la lettre "l" et le
chiffre '1' qui ont une forme identique dans de nombreuses fontes - pensez aux
textes produits sur d’anciennes machines à écrire! Le contexte linguistique aide à
déterminer s’il s’agit d’un "l" ou d’un '1'.
L’illustration ci-dessous montre différentes formes de "l" et de '1'. Les formes
sur la première ligne ne sont pas ambiguës, les formes sur la deuxième ligne
peuvent prêter à confusion, mais la linguistique peut résoudre leur interprétation.
Lorsque le contexte ne suffit pas, l’utilisateur intervient.
d’auto-apprentissaged’auto-apprentissage
d’auto-apprentissage” dépend étroitement du contexte linguistique.
d’auto-apprentissaged’auto-apprentissage
fichierfichier
fichier
fichierfichier
“Lisez-moi”“Lisez-moi”
“Lisez-moi” de Readiris pour plus d’infomations à
“Lisez-moi”“Lisez-moi”
jeu de symbolesjeu de symboles
jeu de symboles il doit reconnaître.
jeu de symbolesjeu de symboles
bases de donnéesbases de données
bases de données
bases de donnéesbases de données
cas ambiguscas ambigus
cas ambigus tels qu’un
cas ambiguscas ambigus
RR
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
RR
La performance ne s’arrête pas là: Readiris peut changer de langue en cours
de phrase sans l’intervention de l’utilisateur! Quand des mots occidentaux
apparaissent dans des documents grecs, cyrilliques ou asiatiques - beaucoup de
CHANGECHANGE
CHANGE
CHANGECHANGE
DEDE
DE
DEDE
LANGUELANGUE
LANGUE
LANGUELANGUE
AUAU
AU
AUAU
BESOINBESOIN
BESOIN
BESOINBESOIN
2 - 33
GUIDEDEL’UTILISATEUR
noms propres non modifiables, des noms de marques, etc. sont écrits en utilisant
les symboles latins -, Readiris peut s’adapter automatiquement au type d’alphabet.
En d’autres mots, il est possible d’activer des
grecs, cyrilliques ou asiatiques et occidentaux en même temps.
Assurez-vous de sélectionner "Grec-anglais" ou l’option correcte cyrillique par exemple "Biélorusse-anglais". En d’autre mots: ne vous contentez pas juste
de sélectionner "Grec" ou "Biélorusse" en espérant que les caractères occidentaux
seront reconnus correctement!
Voici l’exemple d’un texte russe contenant des mots anglais. Vous pouvez
tester par vous-même cette page: ouvrez le fichier image ALPHABETS.TIF et
lancez la reconnaissance de la page correspondante.
alphabets mélangés alphabets mélangés
alphabets mélangés de caractères
alphabets mélangés alphabets mélangés
2 - 34
Le résultat final ressemble à ceci lorsque vous l’ouvrez avec votre traitement
de texte - vous pourriez avoir à sélectionner la
fonte fonte
fonte cyrillique pour pouvoir
fonte fonte
afficher le texte russe correctement.
2 - 35
GUIDEDEL’UTILISATEUR
mélanger mélanger
Pour
mélanger d’
mélanger mélanger
le jeu de caractères le plus étendu. Si vous avez un document où par exemple la
traduction anglaise se trouve placée le long du texte français, vous devez
sélectionner le français comme langue pour vous assurer que des caractères
accentués seront correctement reconnus.
DD
ÉFINIRÉFINIR
D
ÉFINIR
ÉFINIRÉFINIR
DD
Maintenant que la langue est définie, allons voir les autres caractéristiques du
document. Vous pouvez peaufiner la reconnaissance en indiquant quelques
spécifications du document: le type de fonte et l’espacement de caractère. (Ces
LESLES
LES
LESLES
autres languesautres langues
autres langues, sélectionnez simplement la langue avec
autres languesautres langues
CARACTÉRISTIQUESCARACTÉRISTIQUES
CARACTÉRISTIQUES
CARACTÉRISTIQUESCARACTÉRISTIQUES
DUDU
DOCUMENTDOCUMENT
DU
DOCUMENT
DUDU
DOCUMENTDOCUMENT
2 - 36
commandes ne s’appliquent pas aux documents asiatiques.) Qu’est-ce que cela
veut dire?
Commençons par la commande "Type de Police" dans le menu "Configura-
tion". Ce mode distingue les documents “normaux” des
en qualité
matriciellematricielle
matricielle. Les symboles matriciels “qualité brouillon” ou “9
matriciellematricielle
documents imprimésdocuments imprimés
documents imprimés
documents imprimésdocuments imprimés
aiguilles” sont composés de points isolés, séparés, et des routines de reconnaissance hautement spécialisées sont requises pour les reconnaître.
La qualité d’impression matricielle “qualité lettre” ou “25 aiguilles” exige l’option
normale "Automatique", de même que les
qualités d’impressionqualités d’impression
qualités d’impression imprimées,
qualités d’impressionqualités d’impression
tapées, impression laser et impression à jet d’encre.
L’option "Automatique" permet à Readiris de détecter automatiquement le
type de police utilisée. Laissez dans tous les cas Readiris détecter automatiquement
le type de police - à moins que vous ne soyez certain de reconnaître des documents matriciels! (Bien entendu, "Automatique" est la valeur par défaut.)
La bulle explicative du bouton "Reconnaître-Enregistrer" indique le mode de
lecture: lorsqu’aucun message n’est ajouté à la bulle explicative, la détection
automatique de la qualité d’impression s’applique, lorsque le message "À aiguilles" est ajouté à la bulle, le mode matriciel est activé.
espacement de caractèresespacement de caractères
L’
espacement de caractères peut être placé avec la commande "Dis-
espacement de caractèresespacement de caractères
tance des Caractères" sous le menu "Configuration".
2 - 37
GUIDEDEL’UTILISATEUR
Avec les fontes
même largeur. Un "l" prend autant d’espace horizontal sur uneligne qu’un "w", comme c’est le cas dans cette phrase. Pensez
aux documents produits par une machine à écrire, où le chariot se déplace selon
une distance fixe pour chaque symbole tapé.
Un espacement
sa forme. Les symboles comme "m" et "w" sont plus larges, occupent un espacehorizontal plus large sur une ligne que les caractères “minces” "l" ou "j". Pratiquement
tous les livres, magazines et journaux sont imprimés avec un espacement
proportionnel.
La solution la plus simple est de toujours laisser cette option activée par défaut
sur "Automatique": Readiris détectera la largeur de caractère automatiquement.
VV
ITESSEITESSE
V
ITESSE
ITESSEITESSE
VV
Il y a un dernier point que nous devons aborder avant d’entamer la reconnaissance - le
lorsque nous avons indiqué la langue du document avec le bouton "Langue". Ce
bouton nous permet aussi de sélectionner un compromis entre vitesse et précision.
(Ces modes de reconnaissance ne s’appliquent pas au mode matriciel et aux
documents en langues asiatiques!)
mode de reconnaissancemode de reconnaissance
mode de reconnaissance. Nous nous en sommes déjà approché
mode de reconnaissancemode de reconnaissance
fixes
proportionnel
OUOU
PRÉCISIONPRÉCISION
OU
PRÉCISION
OUOU
PRÉCISIONPRÉCISION
ou “mono-espace”, tous les symboles de la fonte ont la
signifie que la largeur d’un caractère dépend de
??
?
??
2 - 38
Le mode de reconnaissance rapide est recommandé pour les documents
possédant une bonne qualité d’impression (et de numérisation). Pensez, par
exemple, à un document imprimé avec une imprimante laser et numérisé avec la
bonne résolution et la bonne luminosité... Le mode précis de reconnaissance sera
utilisé de préférence lorsque l’image est de moins bonne qualité - nous parlons
alors de télécopies, de photos numériques ou autres images de basse résolution,
etc. Le mode précis de reconnaissance assure des résultats d’OCR optimaux
pour tout type de documents, mais prend plus de temps.
Le mode précis de reconnaissance est activé par défaut. La bulle explicative
du bouton "Reconnaître-Enregistrer" indique quel mode de reconnaisance est
actuellement utilisé.
2 - 39
GUIDEDEL’UTILISATEUR
RR
EADIRISEADIRIS
R
EADIRIS
EADIRISEADIRIS
RR
Quand la langue du document est choisie et ses caractéristiques définies, activez
l’apprentissage interactif et cliquez sur le bouton "Reconnaître-Enregistrer".
La progression de l’OCR est indiquée sur l’écran. Vous pouvez cliquer le
bouton "Arrêter" ou appuyer sur la touche Échappement pour interrompre la
reconnaissance du texte.
DEVIENTDEVIENT
DEVIENT
DEVIENTDEVIENT
CHAQUECHAQUE
CHAQUE
CHAQUECHAQUE
FOISFOIS
FOIS
FOISFOIS
PLUSPLUS
PLUS
PLUSPLUS
INTELLIGENTINTELLIGENT
INTELLIGENT
INTELLIGENTINTELLIGENT
!!
!
!!
En fin de lecture, Readiris entre en phase interactive d’apprentissage si
l’apprentissage est activé grâce au bouton "Apprentissage" sur la barre d’outils
principale. L’apprentissage interactif est désactivé par défaut.
(L’apprentissage interactif ne s’applique pas aux documents asiatiques:
l’apprentissage n’a pas de sens pour ces langues qui connaissent des milliers de
symboles différents - en supposant que vous êtes capable d’introduire les
idéogrammes, ce qui n’est pas chose aisée sur un clavier occidental!)
apprentissage de fontesapprentissage de fontes
L’
apprentissage de fontes peut sensiblement mettre en valeur l’exactitude
apprentissage de fontesapprentissage de fontes
du système d’identification. Quand l’utilisateur essaye de lire des symboles distordus
2 - 40
et déformés comme on en trouve dans des documents réels ou des fontes stylisées
que Readiris n’identifie pas de façon optimale, l’apprentissage peut surmonter
cet “échec” provisoire.
L’apprentissage par l’utilisateur est également utilisé pour entrainer le système
sur les
symboles spéciaux symboles spéciaux
symboles spéciaux que Readiris ne peut pas identifier, comme des
symboles spéciaux symboles spéciaux
symboles mathématiques et scientifiques et des dingbats. Quelques exemples:
Readiris peut être formé pour identifier le symbole "π" comme "pi" ou le caractère
spécial "" en tant que "Tél.". (Cependant, la liste de symboles identifiés ne peut
pas être étendue avec les symboles "π" et ""!)
Le texte reconnu s’affiche progressivement et le système s’arrête sur les
caractères douteux, ou - si vous traitez les caractères joints (“ligatures”) - sur les
chaînes de caractères douteuses. Elles sont toujours présentées dans leur contexte
et les caractères douteux sont mis en surbrillance. Les caractères non reconnus
sont représentés par un tilde (le symbole "~").
2 - 41
GUIDEDEL’UTILISATEUR
La première chose à faire est de vérifier si vous avez activé le dictionnaire de
fontes et le mode de dictionnaire corrects - ceux-ci sont toujours indiqués dans le
titre de la fenêtre d’apprentissage. Si ce n’est pas le cas, cliquez sur le bouton
"Interrompre" - le document est à nouveau affichée avec son fenêtrage tel qu’il
avait été créé - activez le bon dictionnaire ou mode de dictionnaire et relancez
l’OCR. (Le fonctionnement des dictionnaires de fontes sera expliqué sous peu.)
Si nécessaire, entrez un caractère (ou une chaîne de caractères) pour une
forme incorrecte ou inconnue et cliquez sur un des boutons suivants.
ApprendreApprendre
Apprendre
ApprendreApprendre
Vous êtes d’accord avec la solution proposée ou vous la corrigez. Le programme
sauvegarde le caractère douteux dans le dictionnaire de fontes comme étant
2 - 42
“certain”, final. La reconnaissance suivante n’exigera plus votre intervention, la
forme est considérée apprise une fois pour toutes.
Dans l’exemple ci-dessus, le système s’arrête sur des caractères joints, et
nous cliquons sur "Apprendre" pour accepter une forme qui ne peut pas être
confondue avec d’autres caractères.
Ne Pas Ne Pas
Ne Pas
Ne Pas Ne Pas
Vous êtes d’accord avec la solution proposée ou vous la corrigez. La différence
avec le bouton "Apprendre" est que le symbole appris obtient le statut “incertain”
dans le dictionnaire. Pour une future identification, le système proposera la solution “apprise” mais exigera toujours une confirmation.
Ce bouton est utilisé pour les symboles qui pourraient être confondus avec
d’autres: un "e" déformé qui pourrait être confondu avec un "c", un "t" endommagé
qui ressemblerait étroitement à un "r", etc.
ApprendreApprendre
Apprendre
ApprendreApprendre
2 - 43
GUIDEDEL’UTILISATEUR
Le "e" ci-dessus est sérieusement endommagé - en fait il est proche du symbole
"c" -, et vous devriez cliquer "Ne Pas Apprendre" pour ne pas le confondre avec
le symbole "c".
EffacerEffacer
Effacer
EffacerEffacer
On élimine la forme affichée du résultat. Ce bouton est utilisé pour ignorer le
“bruit” sur les documents - taches de café, etc. qui pourraient être reconnues
comme points, virgule, etc. -, et pour effacer tout autre symbole non désiré.
AnnulerAnnuler
Annuler
AnnulerAnnuler
Vous retournez en arrière pour corriger les erreurs. Vous pouvez annuler les
32 dernières opérations.
FinirFinir
Finir
FinirFinir
L’apprentissage est interrompu mais l’OCR continue en mode automatique.
Toutes les décisions du système sont acceptées sans validation de l’utilisateur.
Cliquez sur ce bouton quand vous voyez que la reconnaissance est précise et
n’exige pas de correction approfondie.
InterrompreInterrompre
Interrompre
InterrompreInterrompre
Ne confondez pas le bouton "Finir" avec le bouton "Interrompre". Ce dernier
arrête le processus alors qu’avec le bouton "Finir", le texte est créé, il ne subit
simplement plus de correction approfondie!
LL
EE
RÔLERÔLE
L
E
RÔLE
EE
RÔLERÔLE
LL
Les résultats de chaque session de formation sont temporairement maintenus
dans la mémoire mais ils peuvent et doivent être enregistrés dans des fichiers
appelés les “dictionnaires” pour une future utilisation.
(Ne confondez pas dictionnaires de polices et lexiques! Les dictionnaires de
fontes contiennent des formes de caractères apprises durant la phase interactive
DESDES
DES
DESDES
DICTIONNAIRESDICTIONNAIRES
DICTIONNAIRES
DICTIONNAIRESDICTIONNAIRES
DEDE
DE
DEDE
FONTESFONTES
FONTES
FONTESFONTES
2 - 44
de l’OCR, les lexiques sont des bases de données linguistiques qui assistent la
reconnaissance.)
Ces dictionnaires de polices doivent être chargés en mémoire quand vous
voulez reconnaître des documents semblables afin d’utiliser l’intelligence
supplémentaire qu’ils contiennent. De cette façon, Readiris tient compte de
l’intelligence enregistrée dans ces bibliothèques de polices. Vous pourriez dire
que Readiris devient plus intelligent à chaque utilisation!
Comment cela se fait-il? L’enrichissement des dictionnaires de fontes est
contrôlé par le menu "Apprendre": vous devez choisir un dictionnaire avec la
commande "Dictionnaire de Polices" et déterminer son mode de fonctionnement.
dictionnaires de policesdictionnaires de polices
Les
dictionnaires de polices sont limités à 500 formes, et nous vous
dictionnaires de policesdictionnaires de polices
recommandons de créer des dictionnaires séparés pour des applications
spécifiques, par exemple par type de document. Les dictionnaires ont par défaut
l’extension *.dus. L’apprentissage et l’enrichissement n’ont plus d’effet quand le
2 - 45
GUIDEDEL’UTILISATEUR
dictionnaire est rempli: les résultats de l’apprentissage ne sont plus mémorisés et
stockés dans un dictionnaire.
Vous pouvez sélectionner le mode dictionnaire sous la commande "Dictionnaire
de Polices" ou directement sous le menu "Apprendre". Trois modes de dictionnaires
sont disponibles: nouveau, enrichir et lire.
En choisissant "Nouveau Dictionnaire", vous indiquez que les résultats
d’apprentissage seront sauvegardés dans un
choisissez un dictionnaire existant, son contenu sera effacé.)
Le mode d’enrichissement indique que les résultats d’apprentissage seront
sauvegardés dans un dictionnaire
l’intelligence déjà contenue dans le dictionnaire, et vous lui ajoutez les nouvelles
formes de fonte. En termes simples, cette option vous permet de construire un
dictionnaire de fontes en plusieurs étapes.
(Quand vous définissez le nom de fichier d’un nouveau dictionnaire et activez
le mode d’ajout, un dictionnaire vide est créé et vous le complétez.)
Avec la dernière option, "Lire le Dictionnaire", le dictionnaire fonctionne en
mode inaltérable: vous vous servez du dictionnaire
formes de fonte.
Choisissez le nouveau mode quand une page simple est reconnue. Pour lire
beaucoup de pages du même type - des pages avec une qualité d’impression et
des fontes similaires - choisissez le mode nouveau pour la première page, le mode
ajout pour les pages suivantes et le mode lecture pour le reste du document.
existant
nouveau
: la reconnaissance se sert de
dictionnaire. (Si vous
sans
lui ajouter de nouvelles
2 - 46
Sachez que votre bouton d’apprentissage vous indiquera à tout moment grâce
à sa bulle explicative quel est le dictionnaire de fontes actif et dans quel mode ce
dictionnaire fonctionne.
Quand vous êtes en mode d’apprentissage interactif, le dictionnaire et son
mode opératoire sont indiqués en titre de fenêtre; en cas d’erreur, vous pouvez
cliquer sur "Interrompre" et recommencer.
2 - 47
GUIDEDEL’UTILISATEUR
EE
NVOYERNVOYER
E
NVOYER
NVOYERNVOYER
EE
L’apprentissage interactif vient en conclusion à la reconnaissance de caractères.
Comme Microsoft Word fonctionne comme application cible par défaut, votre
traitement de texte est démarré automatiquement (si nécessaire) à la fin de la
reconnaissance, et le texte reconnu est inséré.
Il est possible de voir une barre de progression apparaître à l’écran lors du
traitement du texte reconnu. (Que cette barre apparaisse ou non à l’écran dépend
de la taille du document et de la complexité du traitement à réaliser.)
L’image numérisée est à nouveau affichée avec son fenêtrage. L’image est
disponible pour la poursuite du traitement, elle reste affichée jusqu’à ce que vous
numérisiez une autre page.
Vous venez en effet de convertir un document papier en un fichier ordinateur
éditable, et ce 40 fois plus vite qu’en dactylographie manuelle! Vous pouvez
maintenant comparer votre texte à l’image qui se trouve dans votre fenêtre Readiris.
En fait, Readiris vous offre trois méthodes pour enregistrer le résultat OCR:
envoyer le document reconnu dans une application cible, sauvegarder les fichiers
dans un fichier externe et placer les résultats dans le presse-papiers Windows.
LELE
LE
LELE
RÉSULRÉSUL
RÉSUL
RÉSULRÉSUL
TT
AA
TT
DANSDANS
T
A
T
DANS
TT
AA
TT
DANSDANS
VOTREVOTRE
VOTRE
VOTREVOTRE
APPLICAAPPLICA
APPLICA
APPLICAAPPLICA
TIONTION
TION
TIONTION
cible sortiecible sortie
La
cible sortie est sélectionnée avec le bouton "Format" de la barre d’outils
cible sortiecible sortie
(ou la commande "Format de Texte" du menu "Configuration").
2 - 48
L’option "Envoyer à" offre un lien OCR direct entre votre numériseur et vos
applications Windows: vous
envoyez envoyez
envoyez les documents numérisés directement dans
envoyez envoyez
votre traitement de texte, dans votre feuille de calcul ou votre navigateur web,
dans Adobe Reader, etc.!
2 - 49
GUIDEDEL’UTILISATEUR
À la fin de la reconnaissance, l’application cible démarre automatiquement et
le document reconnu est inséré dans un nouveau fichier texte ou feuille de calcul.
2 - 50
Cependant, n’oubliez pas que l’option "Envoyer à" permet également de copier
le document reconnu dans le
besoin impérieux d’exporter le résultat… ou de l’enregistrer dans un fichier externe!
presse-papierspresse-papiers
presse-papiers Windows. Il n’y a donc pas de
presse-papierspresse-papiers
SS
AUVEGARDERAUVEGARDER
S
AUVEGARDER
AUVEGARDERAUVEGARDER
SS
Vous pouvez en effet placer le résultat du processus OCR dans un fichier
“externe”! Ici encore, Readiris supporte un grand nombre de formats de fichiers
(fichiers de tous les traitements de texte, des feuilles de calcul, des applications
web courantes, etc.) (Readiris supporte entre autres le format WordML et
SpreadsheetML, les nouveaux formats de Microsoft Office 2003!)
LESLES
LES
LESLES
RÉSULRÉSUL
RÉSUL
RÉSULRÉSUL
TT
AA
TSTS
A
DANSDANS
TS
DANS
AA
TSTS
DANSDANS
T
TT
UNUN
UN
UNUN
FICHIERFICHIER
FICHIER
FICHIERFICHIER
TEXTETEXTE
TEXTE
TEXTETEXTE
2 - 51
GUIDEDEL’UTILISATEUR
L’option "Enregistrer et Ouvrir" est en grande partie identique à la fonction
"Envoyer": vous ouvrez le document reconnu une fois qu’il est sauvé.
2 - 52
Cependant, la méthode employée pour envoyer vers une sortie cible est
différente. Cette fois, le
type de fichier type de fichier
type de fichier
type de fichier type de fichier
WW
indowsindows
W
indows détermine quelle application
WW
indowsindows
sera lancée. C’est comme si vous double-cliquiez sur le fichier dans l’Explorateur
Windows... (Avec l’option "Envoyer à", Readiris envoie le fichier directement
vers l’application cible.)
2 - 53
GUIDEDEL’UTILISATEUR
L’option "Envoyer par E-mail" crée un nouveau message
document reconnu comme pièce jointe. Connaissez-vous une manière plus rapide
pour envoyer un document papier...?
mail mail
mail et insère le
mail mail
2 - 54
CC
RÉERRÉER
C
RÉER
RÉERRÉER
CC
PDFPDF
PDF. Readiris vous permet de générer des documents PDF basés sur le texte et
PDFPDF
sur l’image.
Nous allons aborder plus en profondeur un des formats:
DESDES
DOCUMENTSDOCUMENTS
DES
DOCUMENTS
DESDES
DOCUMENTSDOCUMENTS
PORPOR
POR
PORPOR
TT
ABLESABLES
T
ABLES
TT
ABLESABLES
......
...
......
Adobe Adobe
Adobe
Adobe Adobe
AcrobatAcrobat
Acrobat
AcrobatAcrobat
2 - 55
GUIDEDEL’UTILISATEUR
Quelle est la différence entre ces formats? Lorsque vous sélectionnez le format "PDF Texte", Readiris crée un fichier PDF contenant le résultat sous forme
de texte. (Il peut y avoir des graphiques mais seulement lorsque des zones
2 - 56
graphiques sont présentes sur la page - photographies, illustrations, etc.) En réalité,
l’image de la page
n’
est
pas
contenue dans le fichier PDF. Ce dernier est constitué
d’une seule couche. Le format "PDF Image", quant à lui, ne contient lui non plus
qu’une seule couche. Cette couche contient en fait l’image numérisée, et non pas
le résultat de la reconnaissance.
2 - 57
GUIDEDEL’UTILISATEUR
Les formats "PDF Texte-Image" et "PDF Image-Texte" génèrent des résultats
différents: Readiris crée un fichier PDF pouvant être recherché et contenant le
texte reconnu et l’image de la page. Dans le cas des fichiers de type “texte-
2 - 58
image”, le texte est placé
au-dessus
de l’image de la page dans un fichier PDF
composé de deux couches; dans le cas des fichiers de type “image-texte”, le
texte est placé
en-dessous
de l’image de la page. Pour bien comprendre ces
concepts, utilisez la commande "Rechercher" d’Adobe Reader.
Les fichiers PDF de type “texte-image” sont en fait assez sophistiqués: les
pixels du texte reconnu sont effacés pour assurer la création d’un document
lisible! Afficher le texte reconnu en noir sur des bitmaps de caractères noirs vous
donnerait du texte avec une ombre lourde...
Servez-vous de l’image d’exemple BACKGROUND.JPG pour tester ce
phénomène.
2 - 59
GUIDEDEL’UTILISATEUR
Tous les fichiers PDF basés sur du texte encodent les URLs de sites web et
les adresses courriel comme des liens visibles: cliquez sur un lien et vous visitez
directement le site web mentionné ou envoyez un nouveau courriel à la personne
de contact. (En fait, les autres formats de texte “riches” de Readiris - Word,
WordML, HTML, etc. - recréent également les liens hypertextes!)
2 - 60
Cliquez sur le bouton "Format" pour découvrir quelques options du format
PDF Acrobat: "Créer les Signets" et "Inclure les Polices". (Dès que le format
PDF est sélectionné, l’autoformatage s’applique - et ne peut pas être désactivé.)
L’option "Créer les Signets" assure que des
signetssignets
signets seront créés par page
signetssignets
pour chaque élément du document - les graphiques tout comme les blocs de texte
et les tables. Pour les zones de texte, Readiris applique un algorithme intelligent
qui engendre un titre, un “sommaire” pour chaque zone; les tables et les graphiques
sont simplement numérotés. (Un autre élément de navigation des documents PDF,
vignettes vignettes
les
vignettes de la page, peut être réalisé dynamiquement par votre logiciel
vignettes vignettes
Adobe Reader!)
2 - 61
GUIDEDEL’UTILISATEUR
L’option "Inclure les Polices" inclut les fontes dans les fichiers PDF. L’inclusion
des polices empêche la substitution des fontes lorsque les lecteurs affichent et
impriment le document reconnu. Cette option s’assure que les lecteurs - quelque
soit leur configuration d’ordinateur - visualisent le texte dans les polices originales.
Cependant, l’inclusion des polices augmentent la taille du fichier des documents
reconnus (légèrement)!
Autre fonction de Readiris, appréciable pour les documents de sortie PDF: les
propriétés du documentpropriétés du document
propriétés du document! Les propriétés du document reprennent le titre d’un
propriétés du documentpropriétés du document
document, le nom et la société de l’auteur, le sujet, quelques mots clés et
commentaires, etc. Les propriétés du document sont évidemment utilisées pour
le tri et la recherche de documents...
2 - 62
La commande "Propriétés du Document" du le menu "Fichier" répond à cette
demande. Notez également que vous pouvez définir les propriétés du document
de sortie plus tard, lorsque vous sauvegardez les résultats de la reconnaissance...!
Sachez que les propriétés du document ne concernent pas seulement les docu-
ments PDF: les documents au format Word (*.doc), RTF (“Rich Text Format”),
2 - 63
GUIDEDEL’UTILISATEUR
WorldML (*.xml), SpreadsheetML (*.xml) et HTML supportent également les
propriétés du document - malheureusement d’une manière moins complète que
ne le fait le format Adobe Acrobat PDF. (Il va de soi que les formats de texte
“pauvre” tels que le format Texte (ANSI) et Texte MS-DOS (ASCII) ne supportent
pas les propriétés du document.)
... ...
...
... ...
support total du format Adobe Acrobat PDF, vous ne disposez pas seulement de
la possibilité de générer des fichiers PDF, vous pouvez également les
une des applications principales de Readiris. Et ce pour plusieurs raisons. Tout
d’abord car c’est un moyen de convertir des images en texte: ouvrez des documents PDF basés sur l’image, exécutez la reconnaissance et enregistrez le résultat
OCR sous un document texte (dans n’importe quel format texte supporté). Or,
les fichiers texte sont éditables, tandis que les fichiers image ne le sont pas.
ments PDF basés sur du texte. Vous exécutez la reconnaissance sur des fichiers
PDF “image uniquement” et sauvegardez les résultats OCR... comme des textes
PDF! Vous pouvez rechercher et éditer des fichiers PDF basés sur du texte mais
pas des fichiers PDF “image uniquement”.
d’un fichier PDF. Vous pouvez reconnaître des documents PDF “en lecture seule”,
où le texte est inaccessible en temps normal. Avec les fichiers PDF non protégés,
le contenu peut être récupéré (copié et sauvé dans un fichier Texte). Avec les
fichiers “en lecture seule”, le contenu ne peut pas être extrait. De tels fichiers
peuvent seulement être affichés et imprimés!
de protection, il n’ouvre pas les documents PDF protégés par mot de passe!
(Plus précisément, les mots de passe “maîtres” qui établissent les permissions
d’un fichier PDF ne gênent pas Readiris, mais les mots de passe “utilisateur”
OUOU
OU
OUOU
Découvrons une autre possibilité de Readiris... Alors que Readiris offre un
Pouvoir
Ensuite, vous pouvez convertir des fichiers PDF basés sur l’image en docu-
Enfin, convertir des fichiers PDF est une manière de “déverrouiller” le contenu
Deux nuances importantes: même si Readiris franchit toutes les autres barrières
LESLES
LES
LESLES
donner un nouveau but aux documents PDFdonner un nouveau but aux documents PDF
donner un nouveau but aux documents PDF est certainement
donner un nouveau but aux documents PDFdonner un nouveau but aux documents PDF
LIRELIRE
LIRE
LIRELIRE
!!
!
!!
lire
!
2 - 64
dont vous avez besoin pour ouvrir un fichier PDF sont une entrave pour Readiris.)
Par ailleurs, Readiris ne convertit pas les documents PDF qui contiennent des
images compressées au format JPEG 2000.
Procédez comme d’habitude: chargez les fichiers PDF dans la mémoire comme
vous ouvrez des images prénumérisées - des télécopies, des instantanés pris avec
votre caméra numérique, etc. Cliquez sur le bouton "Arrêter" ou enfoncez la
touche Échappement pour arrêter le processus de chargement entre deux pages.
(Cela fonctionne également pour les images TIFF multipages et les télécopies
DCX.)
Vous trouverez une option spécifique pour les fichiers PDF. Vous pouvez les
ouvrir comme documents couleur et noir et blanc. Cette option est offerte car
ouvrir des documents couleur est beaucoup plus lent!
2 - 65
GUIDEDEL’UTILISATEUR
En outre, vous pouvez indiquer quelles pages vous voulez convertir. Si vous
souhaitez reprendre seulement un chapître d’une longue publication au format
PDF, rien ne vous oblige à charger le livre entier dans Readiris... Indiquez les
pages à convertirpages à convertir
pages à convertir et vous gagnerez beaucoup de temps! (Il en va de même
pages à convertirpages à convertir
pour les images TIFF multipages et les faxes DCX.)
Les documents PDF basés sur du texte offrent en général une excellente
qualité; le mode de reconnaissance rapide suffit pour les convertir avec succès.
La qualité des fichiers PDF basés sur l’image dépendent des caractéristiques du
document papier, de la luminosité et de la résolution lors de la numérisation, etc.
Vous pouvez essayer cette application avec le fichier SAMPLE.PDF dans le
dossier d’images de Readiris...
2 - 66
RR
ECONNAISSANCEECONNAISSANCE
R
ECONNAISSANCE
ECONNAISSANCEECONNAISSANCE
RR
Après l’OCR, le document numérisé sera ré-affiché avec les zones créées en
vue d’être disponible pour un traitement ultérieur.
Vous pouvez maintenant ouvrir le texte reconnu avec votre traitement de texte
ou votre éditeur de texte, l’importer dans le logiciel de publication ou dans n’importe
quelle application texte, l’archiver ou le partager avec d’autres personnes, le
“publier” sur un serveur Intranet, etc. Allez-y et comparez-le avec l’image que
vous avez dans votre fenêtre Readiris...
Mais comment sauvegarder le texte pour les pages supplémentaires? En
d’autres mots: comment traiter un document de plusieurs pages? C’est en fait
très simple: continuez à reconnaître des pages et enregistrez dans le même fichier!
(Soyez sûr qu’il n’est pas déjà ouvert, car cela vous empêcherait de vous y
enregistrer!) Ensuite, n’oubliez pas de mettre le dictionnaire de fontes en mode
d’enrichissement pour vous permettre de poursuivre le traitement des fontes
confortablement.
Dès que vous numérisez des pages (ou ouvrez des fichiers image) dans un
document, vous devrez décider si vous désirez démarrer un nouveau document
ou compléter le document actuel.
DEDE
DE
DEDE
PP
P
PP
AGESAGES
AGES
AGESAGES
MULMUL
MUL
MULMUL
TIPLESTIPLES
TIPLES
TIPLESTIPLES
Répondez "non" pour ajouter des pages au document actuel, "oui" pour créer
un nouveau document. Cette réponse a le même effet que la commande "Nouveau
Document" dans le menu "Fichier".
2 - 67
GUIDEDEL’UTILISATEUR
Mais il existe un moyen plus efficace pour reconnaître d’affilée plusieurs pages
que de les numériser et les OCRiser l’une après l’autre: il suffit de traiter
directement des
Pour numériser un document composé de plusieurs pages en une seule
opération, activez l’alimentation automatique de votre scanner grâce à l’option
"ADF" sous le bouton "Numériseur".
documents multipagesdocuments multipages
documents multipages!
documents multipagesdocuments multipages
Placez les pages de votre document dans l’alimentation automatique et démarrez
la numérisation: toutes les pages sont numérisées jusqu’à ce que l’alimentation se
soit vidée.
Si votre numériseur ne dispose pas d’une alimentation automatique, vous pouvez
utiliser la
avec efficacité. Le numériseur scanne automatiquement une autre page après un
délai déterminé par l’utilisateur. La pause vous laisse le temps de remplacer la
page qui se trouve sur la fenêtre de votre numériseur à plat.
(La numérisation avec pause est également très utile quand vous scannez un
livre (lourd): vos mains gardent le livre proprement sur le plateau du numériseur,
et vous n’avez donc pas le temps de cliquer avec la souris...!)
Indiquez dans les paramètres de numérisation quel temps de pause vous
souhaitez déterminer pour pouvoir placer chaque nouvelle page dans votre
numériseur: cliquez sur le bouton "Numériseur" et choissisez une valeur pour
l’option "Numériser la Page Suivante après x Seconde(s)".
numérisation avec pausenumérisation avec pause
numérisation avec pause pour acquérir des documents multipages
numérisation avec pausenumérisation avec pause
2 - 68
Cliquez sur le bouton "Numériser" pour démarrer l’acquisition des images.
Cliquez sur "Interrompre" dans la fenêtre de numérisation avec pause si vous
voulez mettre fin à la numérisation automatique.
Readiris est très flexible: vous pouvez réduire l’intervalle de temps afin
d’acquérir une image plus rapidement, ou encore “geler” la pause si le téléphone
vous interrompt! Cliquez sur le bouton "Suspendre" dans la fenêtre de numérisation
avec pause pour geler l’intervalle de numérisation; cliquez sur "Poursuivre" quand
2 - 69
GUIDEDEL’UTILISATEUR
vous prêt à continuer. Cliquez sur "Numériser Maintenant" dans cette fenêtre
pour réduire le temps de la pause.
ouvrir
Vous pouvez également
plusieurs images en mémoire, sélectionnez la première image et maintenez la
touche Ctrl enfoncée pendant que vous sélectionnez les images supplémentaires.
Pour charger une rangée continue d’images, sélectionnez la première image et
maintenez la touche Maj enfoncée tout en sélectionnant la dernière image.
plusieurs images prénumérisées. Pour charger
Vous pouvez obtenir aisément le même résultat depuis l’Explorateur Windows:
sélectionnez plusieurs fichiers image, cliquez dessus avec le bouton droit de la
souris et sélectionnez la commande "Reconnaître" dans le menu "Contexte". Vous
pouvez répeter cette opération: toutes les images envoyées vers Readiris
enrichissent le document actuel jusqu’à ce que vous cliquiez sur la commande
"Nouveau Document".
2 - 70
Vous pouvez même
glisser-déposer
plusieurs images préscannées depuis
l’Explorateur Windows vers la fenêtre de Readiris! Le même principe est applicable: toutes les images que vous faites glisser vers la fenêtre de Readiris sont
ajoutées au document actuel jusqu’à ce que vous cliquiez sur la commande
"Nouveau Document".
Readiris trie automatiquement les images - l’image 001.tif précède l’image
002.tif qui précède 003.tif, etc.
panneau des documentspanneau des documents
Le
panneau des documents affiche des
panneau des documentspanneau des documents
données statistiques données statistiques
données statistiques et donne
données statistiques données statistiques
des informations sur toute page acquise - la source de l’image et sa résolution, la
durée de la numérisation et de la lecture, etc. Vous pouvez cacher ou afficher le
panneau des documents avec l’option correspondante du menu "Vue".
Le panneau des documents vous indique également quelle est l’image qui est
chargée en mémoire. Attention: si une image multipage a été ouverte, il n’y a
2 - 71
GUIDEDEL’UTILISATEUR
évidemment qu’un seul fichier pour toutes les images! Pendant la numérisation,
le panneau des documents ne mentionne que le modèle du numériseur.
Vous pouvez modifier la taille des colonnes à l’aide de votre curseur. (Vous ne
pouvez pas modifier l’
n’affiche pas des données complètes, survolez la ligne d’information à l’aide de
votre curseur pour obtenir une information complète.
Si vous sélectionnez la commande "Informations" du menu "Fichier", Readiris
affichera le même type d’information pour toutes les pages. Vous pouvez aussi
afficher ces mêmes informations pour chaque page individuellement en maintenant
votre curseur sur la vignette de la page voulue dans la
pagespages
pages. Cette barre d’outils s’affiche automatiquement dans la partie gauche de
pagespages
l’écran dès l’instant où des pages sont en cours de traitement. Un simple clic
droit sur la vignette d’une page permet par ailleurs d’accéder aux actions à réaliser
sur cette page.
ordre
des colonnes.) Si par manque de place, une colonne
barre d’outils desbarre d’outils des
barre d’outils des
barre d’outils desbarre d’outils des
2 - 72
La page active est mise en évidence dans le panneau des documents et la
barre d’outils des pages et est mentionnée dans la barre de titre de Readiris.
Pour supprimer une page d’un document, placez le curseur sur elle dans le
panneau des documents et appuyez sur la touche Effacer. Ou mettez le curseur
au-dessus de son imagette dans la barre d’outils des pages et enfoncez la touche
Effacer. (Ou encore: sélectionnez la page dans la barre d’outils des pages et
sélectionner la commande "Effacer Page" du menu "Contexte".)
Si vous souhaitez obtenir un aperçu de votre document, vous pouvez rapidement
imprimerimprimer
imprimer les
imprimerimprimer
imagesimages
images scannées via le bouton "Imprimer" de la barre d’outils
imagesimages
image (ou avec la commande "Imprimer les Images" sous le menu "Fichier").
Vous pouvez imprimer la page actuelle ou toutes les pages. Sélectionnez le
nombre de pages ou de vignettes que vous désirez imprimer sur une page.
Mais vous ne devez pas nécessairement imprimer toutes les pages: le panneau
des documents (ainsi que les commandes correspondantes du menu "Édition" et
les commandes contextuelles de la barre d’outils des pages) permet d’exclure
(temporairement) des pages du processus d'impression. Pour exclure une page
du processus d’impression (et de reconnaissance), cliquez sur le numéro de cette
2 - 73
GUIDEDEL’UTILISATEUR
page dans le panneau des documents. Pour l’inclure à nouveau, cliquez une
deuxième fois. Pour appliquer ces commandes directement sur
utilisez les commandes du menu "Édition".
Les vignettes des pages exclues sont rayées. Rappelez vous que l’impression
de la page actuelle fonctionne toujours, même si celle-ci est désactivée en ce
moment!
toutes
les pages,
(L’exclusion de pages est également effective lors de la reconnaissance: lorsque
vous lancez l’OCR, les pages (temporairement) exclues
Chargez l’image d’exemple MULTIPAGE.TIF et démarrez la reconnaissance.
Les différentes pages s’affichent les unes après les autres; la barre de titre de
Readiris indique le numéro de la page.
ne
sont
pas
reconnues!)
2 - 74
Si l’apprentissage interactif est activé, vous exécuterez les phases de recon-
naissance et d’apprentissage page par page. Le mode dictionnaire "Nouveau"
s’appliquera à la première page et le mode "Enrichir" aux pages suivantes.
Quand vous cliquez sur le bouton "Finir", toutes les décisions seront acceptées
par le système sans validation de l’utilisateur. En d’autres termes, l’apprentissage
2 - 75
GUIDEDEL’UTILISATEUR
interactif est interrompu pour
automatique pour ce document.
Le résultat de la reconnaissance de documents multipages est enregistré dans
un seul fichier de sortie. Lorsque le résultat de la reconnaissance est envoyé dans
une application cible, des pages multiples sont créées à l’intérieur d’un seul document.
C’est en tout cas ce qui l’on peut réaliser si l’option "Créer un Fichier par
Page" est désactivée au moment de sauvegarder le document reconnu. Cette
option permet de faire en sorte que chaque page d’un document multipage soit
sauvegardée dans un fichier séparé. Si l’utilisateur donne le nom de fichier
texte.doc, les fichiers seront nommés texte-1.doc, texte-2.doc, etc. (Cette option
n’est pas disponible quand vous envoyez les résultats de l’OCR vers une application cible, elle n’est utilisable que lors de la création de fichiers externes.)
toutes
les pages; l’OCR se poursuit en mode
ÉÉ
DITIONDITION
É
DITION
DITIONDITION
ÉÉ
L’utilisateur peut modifier des documents multipages, principalement afin de
corriger des erreurs dues à la numérisation: il peut ainsi effacer des pages du
document et déplacer des pages à d’autres endroits du document.
Voyons d’abord le déplacement. Pour
dans le panneau des documents ou sur sa vignette sur la barre d’outils des pages.
(Ou placez le curseur sur sa vignette, cliquez dessus avec le bouton droit de la
souris pour faire apparaître le menu "Contexte" et utilisez la commande
DEDE
DOCUMENTSDOCUMENTS
DE
DOCUMENTS
DEDE
DOCUMENTSDOCUMENTS
MULMUL
TIPTIP
MUL
MULMUL
AGESAGES
TIP
AGES
TIPTIP
AGESAGES
accéder à une page
, cliquez sur la page
2 - 76
"Sélectionner Page".) Pour aller à la page précédente, vous pouvez utiliser le
raccourci PagePréc et pour aller à la page suivante, appuyez sur PageSuiv.
Appuyer sur la touche Début pour aller à la première page et sur la touche Fin
pour vous rendre à la dernière page. Alternativement, vous pouvez utiliser les
commandes correspondantes du menu "Vue".
Abordons à présent la question de l’édition des documents. Pour
une page
d’un document, placez le curseur sur elle dans le panneau des docu-
supprimer
ments et appuyez sur la touche Effacer. Ou mettez le curseur au-dessus de son
imagette dans la barre d’outils des pages et enfoncez la touche Effacer. (Ou
encore, sélectionnez la page dans la barre d’outils des pages et sélectionner la
commande "Effacer Page" du menu "Contexte".)
Nous vous rappelons que vous pouvez temporairement exclure les pages, sans
les supprimer, du processus de reconnaissance (et de l’impression des images): le
panneau des documents, la barre d’outils de la page (et le menu "Édition") offrent
les commandes nécessaires.
2 - 77
Pour
déplacer une page vers l’avant
"Déplacer Page en Avant" et pour
commande "Déplacer Page en Arrière".
déplacer une page
Pour
l’icône vers cette nouvelle localisation.
vers une location différente dans le document, glissez
déplacer
GUIDEDEL’UTILISATEUR
du document, utilisez la commande
une page
vers l’arrière
, utilisez la
2 - 78
CC
OMMENCEROMMENCER
C
OMMENCER
OMMENCEROMMENCER
CC
Vous pouvez utiliser la commande "Nouveau Document" sous le menu "Fichier"
pour fermer le document actuel.
AA
VECVEC
A
VEC
AA
VECVEC
UNUN
NOUVEAUNOUVEAU
UN
NOUVEAU
UNUN
NOUVEAUNOUVEAU
DOCUMENTDOCUMENT
DOCUMENT
DOCUMENTDOCUMENT
2 - 79
GUIDEDEL’UTILISATEUR
Cette commande “efface l’ardoise”. Tout document chargé en mémoire contenant une seule ou plusieurs pages - sera effacé. Vous pouvez donc créer un
nouveau document dès à présent.
Mais vous pouvez aussi créer un nouveau document depuis le document actif.
Tant que l’OCR n’a pas été exécuté, le système suppose que vous voulez ajouter
des pages au document actuel. Vous pouvez par exemple numériser toutes les
pages depuis l’alimentation automatique du scanner, remplir à nouveau
l’alimentation et recommencer. Toutes les pages numérisées composeront un
seul et même document. Ou alors vous pouvez numériser un certain nombre de
pages et y ajouter des fichiers image, par exemple des télécopies. Ces pages
forment encore un document unique, tout ce que vous devez faire c’est changer
entretemps l’image source au moyen du bouton "Source".
était
Lorsque l’OCR
numérisation (ou le chargement d’images), vous êtes invité à démarrer un nouveau
document ou compléter le document actuel.
déjà exécuté auparavant et que vous recommencez la
RR
ECONNAISSANCEECONNAISSANCE
R
ECONNAISSANCE
ECONNAISSANCEECONNAISSANCE
RR
Nous savons maintenant comment reconnaître des pages et comment traiter
des documents multipages. Mais est-ce possible de reconnaître plus d’une page
avec un confort identique? C’est possible! Cliquez sur le bouton droit de la souris
et sélectionnez la commande "Copier comme Texte" du menu "Contexte": la fenêtre
de texte sous la souris est reconnue et envoyée vers le presse-papiers.
DESDES
DES
DESDES
ZONESZONES
ZONES
ZONESZONES
DEDE
DE
DEDE
TEXTETEXTE
TEXTE
TEXTETEXTE
2 - 80
La configuration du système actuel - langue, mode de reconnaissance, type de
police, etc. - s’applique. Le résultat de la reconnaissance est placé dans le pressepapiers comme texte “continu”, non-formaté.
Loading...
+ hidden pages
You need points to download manuals.
1 point = 1 manual.
You can buy points or you can get point for every manual you upload.