Le logiciel présenté dans ce manuel est fourni sous licence et son utilisation et sa copie sont
soumises aux termes de la licence.
EMARQUEIMPORTANTE
R
ScanSoft, Inc. fournit cette publication « en l’état », sans garantie d’aucune sorte, expresse ou
implicite, y compris, mais de manière non limitative, toute garantie implicite de qualité
commerciale ou d’adéquation à un usage particulier. Certaines juridictions ne reconnaissant
pas les limitations de garantie expresse ou implicite dans certaines transactions, cette clause
peut ne pas s’appliquer à votre cas. ScanSoft se réserve le droit de réviser et/ou modifier cette
publication périodiquement sans obligation de notification de telles révisions ou
modifications.
ARQUESCOMMERCIALES
M
ScanSoft, OmniPage, OmniPage Pro, PaperPort, Pagis, True Page, Direct OCR, RealSpeak et
ASR-1600 sont des marques commerciales ou des marques commerciales déposées de
ScanSoft, Inc., aux États-Unis et/ou dans d’autres pays.Tous les autres noms de sociétés ou de
produits cités peuvent être des marques de leurs propriétaires respectifs.
L
ICENCES/NOTICESDEPRODUITSTIERS
Veuillez vous reporter à la fin de ce guide pour obtenir les reconnaissances/notices de produits
tiers.
ScanSoft, Inc.
9 Centennial Drive
Peabody, MA 01960
États-Unis
ScanSoft Belgium BVBA
Guldensporenpark 32
BE-9820 Merelbeke
Belgique
Numéro de référence : 50-281F-10119
TABLEDESMATIÈRES
PRÉSENTATIONGÉNÉRALE7
Utilisation de ce manuel 8
Consultation de l’aide en ligne 9
Aide HTML en ligne9
Aide contextuelle9
Notes techniques10
Glossaire10
Quand consulter l’aide en ligne10
1INSTALLATIONETCONFIGURATION11
Environnement requis 12
Installation d’OmniPage Pro 13
Configuration d’un scanner pour une utilisation avec
OmniPage Pro 15
Lancement d’OmniPage Pro 18
Enregistrement du logiciel 19
Nouvelles fonctions d’OmniPage Pro 14 20
2INTRODUCTION23
Reconnaissance optique de caractères (OCR) 24
Technologie OCR d’OmniPage Pro24
Documents dans OmniPage Pro25
Principales étapes de l’OCR25
Bureau OmniPage 27
Barre des menus28
Barres d’outils28
Fenêtre d’image29
Éditeur de texte30
Boîte à outils OmniPage31
Manuel d’utilisation d’OmniPage Proiii
Gestion de documents 32
Vignettes32
Gestionnaire de documents33
Personnaliser des colonnes dans le
gestionnaire de documents34
Supprimer des pages d’un document35
Imprimer un document35
Fermer un document36
Documents OmniPage 36
Avantages du format OPD37
Enregistrer au format OPD37
Comment charger un fichier OPD38
Réglages 38
3TRAITEMENTDESDOCUMENTS41
Guide de démarrage rapide 42
Charger et reconnaître les exemples de fichiers
image42
Numériser et reconnaître un document
d’une page42
Présentation du traitement 44
Traitement automatique 46
Arrêter et relancer le traitement automatique48
Traitement manuel 48
Traitement combiné 51
Traitement à l’aide de flux de travail 52
Traitement à partir d’autres applications 53
Configuration de Direct OCR53
Utilisation de Direct OCR54
Utilisation d’OmniPage Pro avec PaperPort56
Traitement à l’aide de Batch Manager 57
Définition de la source des images de page 58
Importer des fichiers image58
Importer des documents à partir d’un scanner60
Numériser avec un chargeur ADF61
Numériser sans chargeur ADF62
ivTable des matières
Définition de la mise en page du document 62
Zones et fonds 64
Découpage en zones automatique64
Traçage de zones manuel65
Types et propriétés de zone67
Gestion des zones69
Définition rapide de zones71
Gestion des grilles du tableau dans l’image 71
Utilisation des gabarits de zones 73
4VÉRIFICATIONETÉDITION77
Modes d’affichage de l’éditeur de texte 78
Vérification des résultats de l’OCR 79
Vérification du texte reconnu 81
Dictionnaires utilisateur 83
Langues 84
Apprentissage 84
Édition du texte et des images 88
Édition en direct 91
Lecture du texte à voix haute 92
5ENREGISTREMENTETEXPORTATION95
Enregistrement d’un document OmniPage 96
Bouton Exporter les résultats 97
Enregistrement des images originales 97
Enregistrement des résultats de l’OCR 98
Sélection d’un niveau de formatage100
Sélection d’options de filtre102
Utilisation de filtres multiples103
Enregistrement d’un document au
format PDF105
Conversion de documents PDF106
Manuel d’utilisation d’OmniPage Prov
Copie des pages dans le Presse-papiers 106
Ajout de pages à un e-mail comme pièce jointe 107
Autres destinations d’exportation 110
6FLUXDETRAVAIL111
Flux de travail 112
Modèles de flux de travail prédéfinis112
Exécution de flux de travail115
Assistant Flux de travail 117
Création d’un flux de travail118
Modification d’un flux de travail121
Batch Manager 122
Création d’un travail122
Modification d’un travail123
Gestion et exécution de travaux123
Dossiers surveillés 125
Flux de travail invoqués par des codes à barres 127
Reconnaissance vocale 129
7INFORMATIONSTECHNIQUES131
Dépannage 132
Solutions de premier recours132
Test d’OmniPage Pro133
Augmentation de la quantité de mémoire
disponible134
Augmentation de l’espace disque135
Reconnaissance de texte incorrecte135
Reconnaissance de fax incorrecte136
Problèmes de système ou de performances
pendant l’OCR137
Types de fichier supportés 138
Types de fichier pour l’ouverture et
l’enregistrement des images138
Types de fichier pour l’enregistrement
des résultats de l’OCR140
Désinstallation du logiciel 142
viTable des matières
Présentation générale
Nous vous remercions de la confiance que vous portez à notre logiciel de
reconnaissance OmniPage Pro
destinée à vous présenter le programme et à faciliter son utilisation.
Manuel d’utilisation
Le présent manuel fournit des informations relatives aux principes
d’utilisation d’OmniPage Pro 14 : procédures d’installation et de
configuration, description des commandes et zones de travail disponibles,
instructions de réalisation de différentes tâches, méthodes de
personnalisation et de gestion de traitement et diverses informations
techniques. Ce manuel est proposé au format PDF ; vous pouvez ainsi
utiliser les outils de navigation de votre afficheur PDF et les liens hypertexte
intégrés pour passer aux différentes sections du document.
Aide en ligne
L’aide en ligne d’OmniPage Pro contient des informations sur les fonctions,
les réglages et les procédures relatives au logiciel. Au format HTML, cette
aide a été conçue pour garantir une consultation aisée et rapide. Son module
d’aide contextuelle très complet assure une assistance suffisante pour vous
permettre d’accomplir sans délai les opérations requises. Voir « Consultation
de l’aide en ligne », page 9.
Fichier ReadMe/LisezMoi
Ce fichier au format HTML comporte les informations de dernière minute
concernant le logiciel. Il est vivement recommandé de le consulter avant
d’utiliser OmniPage Pro. Pour ouvrir le fichier ReadMe/LisezMoi, vous
pouvez, lors de l’installation d’OmniPage Pro, sélectionner l’option ReadMe/
LisezMoi, ou, à tout moment, choisir la commande correspondante dans le
menu Aide.
®
. La documentation citée ci-dessous est
7
Informations de numérisation et renseignements divers
Le site Web de ScanSoft (www.scansoft.com) fournit des informations
actualisées au sujet du programme. La section « Scanner Guide » contient des
données régulièrement mises à jour et relatives aux scanners supportés et à
d’autres questions y afférentes ; ScanSoft effectue des tests sur les 25 modèles
les plus répandus. Pour accéder au site Web de ScanSoft, vous pouvez, lors de
l’installation d’OmniPage Pro, sélectionner l’option d’accès au site Web, ou,
à tout moment choisir la commande correspondante dans le menu Aide.
Utilisation de ce manuel
Ce manuel présuppose que vous maîtrisez les principes de travail dans
l’environnement Microsoft Windows. Pour tous détails sur cet
environnement (utilisation des boîtes de dialogue, des menus déroulants et
contextuels, des barres de défilement, de la fonction Glisser-déplacer, etc.),
reportez-vous à la documentation Windows appropriée.
Vous devriez également connaître le fonctionnement de votre scanner et de
son logiciel. Avant de procéder à la configuration du scanner avec
OmniPage Pro 14, assurez-vous qu’il est installé et qu’il fonctionne
correctement. Reportez-vous, si nécessaire, à la documentation du scanner.
Ce manuel utilise les conventions suivantes :
Texte en gras
Texte en
italiques
Police sans
empattement
8
Présentation générale
Introduit les nouveaux termes et signale les titres des différentes sections de chaque chapitre.
Indique le nom des rubriques de l’aide en ligne.
Indique le texte développé des options dans les boîtes de dialogue.
Indique les noms de fichiers : exemple.tif
Présente une remarque qui introduit des informations supplémentaires.
Présente un conseil qui introduit des suggestions sur l’exécution de tâches spécifiques à l’aide
des fonctions du logiciel.
OmniPage Pro 14 Office est une version du produit conçue pour une utilisation intensive
répondant aux besoins d’utilisateurs professionnels. Les fonctionnalités spécifiques à cette
version sont signalées dans ce guide à l’aide de ce symbole. Pour obtenir une liste complète de
ces fonctionnalités, voir « Nouvelles fonctions d’OmniPage Pro 14 », page 20.
Consultation de l’aide en ligne
L’aide en ligne d’OmniPage Pro contient des informations sur les fonctions,
les réglages et les procédures relatives au programme. Le système d’aide
devient disponible dès l’installation du logiciel.
Aide HTML en ligne
Pour accéder à l’aide en ligne d’OmniPage Pro, choisissez la commande Aide
OmniPage Pro dans le menu d’aide. Vous pourrez obtenir les informations
requises en consultant des rubriques de la table des matières, en sélectionnant
des mots-clés dans l’index alphabétique ou en effectuant des recherches sur
l’intégralité du texte d’aide. Les autres commandes du menu Aide vous
permettront d’accéder à de nombreux sujets ou pages Web utiles.
Lors de l’utilisation d’OmniPage Pro, vous pouvez consulter la rubrique
d’aide relative à la boîte de dialogue, la zone d’écran ou le message affiché en
appuyant sur la touche F1.
Aide contextuelle
Pour afficher des informations succinctes sur un élément d’interface
d’OmniPage Pro (commande de menu, bouton de barre d’outils, groupe
d’options, boîte de dialogue, etc.), vous pouvez procéder des manières
suivantes :
Pour afficher la rubrique d’aide relative à un élément du bureau en dehors
d’une boîte de dialogue ou d’une fenêtre de message, cliquez sur le bouton
d’aide dans la barre d’outils standard afin d’afficher l’icône d’aide (flèche
accompagnée d’un point d’interrogation), puis cliquez sur cette icône et sur
l’élément requis.
Vous pouvez également afficher cette icône via la séquence Maj. + F1. Cette
combinaison affiche l’aide relative aux commandes des menus contextuels.
Pour afficher une mini-fenêtre décrivant un élément de boîte de dialogue,
cliquez sur le point d’interrogation situé dans l’angle supérieur droit de la
boîte en question puis sur l’élément requis.
Certaines boîtes de dialogue ou fenêtres de message comportent un bouton
Aide (icône ou libellé). Pour accéder aux informations sur leurs éléments,
cliquez sur ce bouton.
Manuel d’utilisation d’OmniPage Pro 9
Pour supprimer une fenêtre d’aide contextuelle, cliquez n’importe où sur le
bureau.
Notes techniques
Le site Web de ScanSoft (www.scansoft.com) propose des notes techniques
(Tech Notes) concernant les problèmes les plus courants concernant
l’utilisation d’OmniPage Pro 14. Ces pages Web peuvent également inclure
des conseils sur l’installation et le dépannage du logiciel.
Glossaire
Ce manuel ne comporte pas de glossaire. En revanche, l’aide en ligne inclut
un glossaire exhaustif, assorti d’un index alphabétique et d’une table des
matières. Consultez-le pour trouver la définition d’un terme utilisé dans ce
manuel ou dans le programme.
Quand consulter l’aide en ligne
Ce guide présente des informations succinctes sur l’utilisation du programme
et de ses fonctionnalités. L’aide en ligne présente de nombreuses procédures
de manière détaillée. Accédez à l’aide en ligne pour obtenir des informations
sur les sujets suivants :
10
◆Guide des touches
◆Conseils de configuration
◆Apprentissage manuel
◆Options de filtre d’exportation
◆Utilisation de l’éditeur de texte
◆Tracé de zones et édition directe
Présentation générale
Chapitre 1
Installation et
configuration
Ce chapitre contient les informations nécessaires à l’installation et au
lancement d’OmniPage Pro 14, soit les sections suivantes :
◆Environnement requis
◆Installation d’OmniPage Pro
◆Configuration d’un scanner pour une utilisation avec
OmniPage Pro
◆Lancement d’OmniPage Pro
◆Enregistrement du logiciel
◆Nouvelles fonctions d’OmniPage Pro 14
Manuel d’utilisation d’OmniPage Pro11
Environnement requis
Pour installer et utiliser OmniPage Pro 14, vous devez prévoir
l’environnement minimum suivant :
◆Ordinateur doté d’un processeur Intel
◆Microsoft
Windows Me, Windows NT
®
Windows®98 (à partir de la Deuxième Édition),
®
Windows 2000 (à partir de Service Pack 2), Windows XP ou
Windows Server 2003
◆Microsoft Internet Explorer 5.01 avec Service Pack 2 au minimum
◆128 Mo de mémoire RAM (256 Mo recommandés)
◆135 Mo d’espace disque disponible destiné aux fichiers
d’application et aux exemples d’images, plus 40 à 45 Mo d’espace de
travail disponible lors de l’installation. De plus :
• de 20 à 67 Mo par module vocal RealSpeak
les 9 modules)
• 2 Mo par module de reconnaissance vocale ASR (15 Mo pour
les 7 modules)*
• 18 Mo pour le programme ScanSoft PDF Converter*
• 3,4 Mo pour le pilote d’impression PDF ScanSoft*
®
Pentium®III ou équivalent
4.0 (à partir de Service Pack 6),
™
(343 Mo pour
12Installation et configuration
◆5 Mo d’espace disque si l’installateur MSI de Windows n’est pas
présent (ce module est intégré de façon standard à la plupart des
versions de Windows)
◆Un maximum de 5 Mo pour les mises à jour du système
◆Affichage SVGA en 256 couleurs (Couleur 16 bits recommandé
[65536 couleurs sous Windows 2000 et Moyenne (16 bits) sous
Windows XP]) et une résolution minimum de 800 x 600 pixels
◆Lecteur de CD-ROM pour l’installation
◆Souris (ou équivalent) compatible Windows
◆Scanner compatible avec son propre pilote (si vous prévoyez de
numériser des documents). Pour consulter la liste des scanners
compatibles, reportez-vous au guide des scanners (Scanner Guide)
sur le site Web de ScanSoft (www.scansoft.com).
Chapitre 1
◆Accès à Internet requis pour l’enregistrement du produit, la mise à
jour de la base de données des scanners et la réception de mises à
jour automatiques du programme
* OmniPage Pro 14 Office uniquement.
Vous obtiendrez de meilleures performances avec un processeur plus puissant, et
des valeurs supérieures de RAM et d’espace disque.
Installation d’OmniPage Pro
Pour vous guider dans l’installation, OmniPage Pro 14 affiche des
instructions sur chaque écran.
Avant de lancer l’installation d’OmniPage Pro, respectez les points
suivants :
◆Fermez les applications actives, en particulier les logiciels antivirus.
◆Si vous installez OmniPage Pro sur un système Windows NT,
Windows 2000, Windows XP ou Server 2003, ouvrez une session
avec privilèges d’administrateur.
◆Si votre système dispose d’une version antérieure d’OmniPage Pro
ou que vous effectuez une mise à niveau à partir d’une version de
démonstration ou d’une édition limitée d’OmniPage, le programme
d’installation vous demandera l’autorisation de désinstaller le
logiciel existant.
▼ Pour installer OmniPage Pro
1. Insérez le CD-ROM OmniPage Pro dans le lecteur approprié. En
principe, le programme d’installation démarre automatiquement. Si ce
n’est pas le cas, ouvrez l’Explorateur Windows, cliquez sur l’icône du
lecteur de CD-ROM, puis cliquez deux fois sur le fichier de programme
Autorun.exe.
2. Choisissez la langue d’installation souhaitée. Lisez et acceptez l’accord de
licence, puis entrez le numéro de série figurant sur la pochette du CD
d’installation du produit.
Installation d’OmniPage Pro13
3. Choisissez de procéder à une installation complète ou personnalisée. Si
vous choisissez Installation complète, tous les modules de synthèse
vocale RealSpeak
TM
seront installés (ces modules sont au nombre de 9).
Avec OmniPage Pro 14 Office, 7 modules de reconnaissance vocale
ASR-1600™ sont également copiés. Choisissez Installation
personnalisée pour sélectionner de manière individuelle les composants
que vous souhaitez installer. Pour choisir de ne pas installer un module,
cliquez sur la flèche pointant vers le bas située à côté de son nom, puis
sélectionnez Ce composant sera installé à la demande.
4. Pour installer le logiciel, suivez les instructions affichées sur les écrans
successifs. Tous les fichiers nécessaires à la numérisation sont copiés
automatiquement lors de l’installation.
Certains problèmes peuvent être résolus en désinstallant puis en réinstallant
OmniPage Pro. Voir « Désinstallation du logiciel », page 142.
Pour ajouter ou supprimer ultérieurement des modules RealSpeak ou ASR, utilisez
la fonction Ajout/Suppression de programmes du Panneau de configuration. Vous
devrez vous munir du CD d’installation du produit.
14Installation et configuration
Chapitre 1
Configuration d’un scanner pour une utilisation
avec OmniPage Pro
Tous les fichiers nécessaires à la configuration et au support du scanner sont
copiés automatiquement lors de l’installation du programme. Le scanner
n’est toutefois pas configuré au moment de l’installation. Avant de numériser
des documents à l’aide d’OmniPage Pro 14, vous devrez vérifier que votre
scanner est installé correctement, avec le pilote approprié, et tester son
fonctionnement. Les pilotes du scanner ne sont pas fournis avec
OmniPage Pro.
L’installation et la configuration d’un scanner s’effectuent par l’intermédiaire
de l’Assistant de configuration de scanner. Vous pouvez lancer celui-ci en
suivant la procédure ci-dessous. Cet Assistant apparaît également la première
fois que vous tentez de lancer une numérisation. Procédez comme suit :
◆Choisissez Démarrer!Programmes!ScanSoft
OmniPage Pro 14.0!Assistant du scanner
ou cliquez sur le bouton Configuration dans l’onglet Scanner de la
boîte de dialogue Options
ou sélectionnez Numériser dans la liste déroulante Importer page(s)
de la boîte à outils d’OmniPage, puis cliquez sur le bouton Importer
page(s).
◆L’Assistant de configuration de scanner s’affiche. Si vous êtes
connecté à Internet, la première fenêtre vous invite à mettre à jour la
base de données des pilotes de scanners livrée avec le programme.
Cliquez sur Oui ou sur Non, puis sur Suivant.
◆Choisissez Sélectionner et tester un scanner ou un appareil photo
numérique et cliquez sur Suivant. Si un seul scanner est installé, il
apparaît avec l’ensemble des scanners précédemment configurés avec
OmniPage Pro. Si le scanner que vous souhaitez utiliser ne figure pas
dans cette liste, cliquez sur Ajouter un scanner...
◆Une liste présentant l’ensemble des pilotes de scanners détectés
apparaît. Cette liste peut contenir des périphériques de réseau.
Sélectionnez un périphérique, puis cliquez sur OK. Pour installer un
second périphérique, exécutez à nouveau l’Assistant.
Configuration d’un scanner pour une utilisation avec OmniPage Pro15
◆L’Assistant indique si le modèle de scanner choisi est associé à des
réglages de configuration dans la base de données des scanners. Si tel
est le cas, vous n’aurez pas besoin de tester votre scanner. Dans le cas
contraire, nous vous recommandons de le tester. Cliquez sur
Suivant.
◆Si vous avez choisi de ne pas tester votre scanner, cliquez sur
Terminé. Dans le cas contraire, cliquez sur Suivant pour tester la
connexion au scanner. Si la connexion s’effectue correctement, un
menu de tests complémentaires apparaît. Sélectionnez les tests que
vous souhaitez effectuer. Nous vous recommandons d’effectuer un
test élémentaire.
◆OmniPage Pro utilise par défaut sa propre interface de
numérisation, accessible via l’onglet Scanner de la boîte de dialogue
Options. Si vous préférez utiliser l’interface de votre scanner, cliquez
sur Réglages avancés et choisissez cette option. Choisissez Modifier
les conseils si vous êtes un utilisateur expérimenté ou si vous avez été
invité à effectuer cette opération par le service de support technique.
◆Cliquez sur Suivant pour lancer les tests. Pour réaliser un test
élémentaire, placez une page dans votre scanner. L’Assistant
procédera à la numérisation en utilisant le logiciel du fabricant du
scanner. Cliquez sur Suivant. L’interface utilisateur native de votre
scanner s’affiche.
◆Cliquez sur Numériser pour lancer la numérisation de la page de
test.
◆Si nécessaire, cliquez sur Image manquante... ou sur Mauvaise
orientation… et effectuez les sélections appropriées.
◆Si l’image affichée dans la fenêtre est correcte, cliquez sur Suivant.
◆Effectuez les tests restants, en suivant les instructions qui
apparaissent à l’écran.
◆Lorsque l’ensemble des tests requis ont été effectués avec succès,
l’Assistant vous en informe et vous demande de cliquer sur Terminé.
◆Vous venez de configurer votre scanner pour une utilisation avec
OmniPage Pro 14 !
Pour modifier les réglages du scanner par la suite ou pour configurer ou
supprimer un autre scanner, ouvrez de nouveau l’Assistant de configuration
de scanner depuis le menu Démarrer de Windows ou depuis l’onglet Scanner
de la boîte de dialogue Options.
16Installation et configuration
Chapitre 1
Pour tester et dépanner un scanner qui ne fonctionne pas correctement,
lancez l’Assistant de configuration de scanner et sélectionnez Tester un
scanner ou un appareil photo numérique, puis suivez la procédure décrite
ci-dessus ou reportez-vous aux instructions communiquées par le service de
support technique.
Pour sélectionner un autre scanner à utiliser par défaut, ouvrez l’Assistant
pour afficher la liste des scanners configurés. Sélectionnez le scanner que
vous souhaitez utiliser par défaut, puis refermez l’Assistant en cliquant sur
Te r m i né .
Pour obtenir les réglages les plus récents pour votre scanner, ouvrez
l’Assistant, demandez le téléchargement de la base de données la plus récente,
choisissez Utiliser les paramètres actuels avec le périphérique actuel, cliquez
sur Suivant, puis sur Terminé.
Configuration d’un scanner pour une utilisation avec OmniPage Pro17
Lancement d’OmniPage Pro
Pour lancer OmniPage Pro 14, effectuez l’une des opérations suivantes :
◆Dans la barre des tâches Windows, choisissez
Démarrer!Programmes!ScanSoft
OmniPage Pro 14.0!OmniPage Pro 14.0.
◆Cliquez deux fois sur l’icône OmniPage Pro située dans le dossier
d’installation d’OmniPage Pro ou sur le bureau de Windows (si vous
l’y avez placée).
◆Cliquez deux fois sur l’icône ou le nom de fichier d’un document
OmniPage (OPD) pour le charger. Voir « Documents OmniPage »,
page 36.
◆Cliquez avec le bouton droit sur l’icône ou sur le nom d’un ou de
plusieurs fichiers image pour afficher un menu contextuel. Pointez
sur Ouvrir avec... OmniPage Pro application. Les images sont alors
chargées dans le programme.
Lorsque vous ouvrez l’application, l’écran d’accueil puis le bureau
OmniPage Pro s’affichent. Voir « Bureau OmniPage », page 27. Cette section
présente les principales zones de travail du programme.
Vous pouvez également exécuter le programme avec une interface limitée :
18Installation et configuration
◆Utilisez le programme Batch Manager. Dans la barre des tâches
◆Dans une application déclarée dans Direct OCR™, choisissez
Acquérir texte dans le menu Fichier. Voir « Configuration de
Direct OCR », page 53.
◆Cliquez avec le bouton droit sur l’icône ou le nom d’un ou de
plusieurs fichiers image pour afficher un menu contextuel. Pointez
sur OmniPage Pro 14, puis choisissez un format d’exportation cible
ou un flux de travail dans le sous-menu qui s’affiche. Les fichiers
seront traités conformément aux instructions du flux de travail
sélectionné. Voir page 115.
Chapitre 1
◆Cliquez sur l’icône OmniPage dans la barre des tâches. Dans le
menu contextuel qui s’affiche, sélectionnez sur un flux de travail
pour démarrer le programme et exécuter le flux de travail. Dans
OmniPage Pro 14 Office, il vous est possible d’utiliser des
commandes vocales pour sélectionner et lancer vos flux de travail.
◆Pour ajouter des services d’OCR, utilisez OmniPage Pro 14 avec les
produits de gestion de documents de ScanSoft, PaperPort
®
Pagis
. Voir « Utilisation d’OmniPage Pro avec PaperPort »,
®
ou
page 56.
Enregistrement du logiciel
L’Assistant d’enregistrement de ScanSoft est lancé à la fin de l’installation du
logiciel. Assurez-vous d’être connecté à Internet. L’enregistrement s’effectue
via un formulaire électronique facile à remplir (moins de cinq minutes). Une
fois le formulaire rempli, cliquez sur Envoyer. Si vous n’enregistrez pas votre
copie du logiciel pendant son installation, le programme vous invitera
régulièrement à accomplir cette formalité. Vous pouvez vous connecter au
site Web de ScanSoft (www.scansoft.fr) pour vous enregistrer en ligne.
Cliquez sur Support, puis dans l’écran de support principal, choisissez
Enregistrer dans la colonne de gauche. Pour obtenir des informations sur
l’utilisation des données communiquées lors de l’enregistrement, consultez la
politique de protection de la vie privée de ScanSoft.
Enregistrement du logiciel19
Nouvelles fonctions d’OmniPage Pro 14
La famille de produits OmniPage® vient de s’enrichir d’OmniPage Pro 14. Si
vous effectuez une mise à jour du produit, il est probable que vous n’ayez pas
à lire en détail le présent manuel. Le tableau suivant présente les
améliorations principales apportées par rapport à la version 12 du produit.
Les fonctionnalités spécifiques à OmniPage Pro 14 Office sont signalées à
l’aide de l’icône Office.
FonctionDescriptionVoir
Meilleure précision de
reconnaissance
Meilleure conservation des
formatages
Création de flux de travail et
accès direct aux flux de
travail enregistrés
Reconnaissance par
« Glisser-Déposer »
Performances de
reconnaissance sur mesure
Définition rapide des zones
Dictionnaire financier anglais
Validation de caractères
Puces et numérotation
Meilleure portabilité des
fichiers OPD
Fruit de quatre années de développement, le nouveau moteur de
reconnaissance et d’analyse garantit un niveau de précision encore plus
élevé.
Ce nouveau moteur offre également une meilleure conservation des formats
de page grâce aux niveaux de formatage True Page et Pages en continu. Les
habillages de graphiques à l’aide de texte sont mieux conservés.
Créez et enregistrez des flux de travail qui vous permettent d’automatiser
entièrement l’exécution de tâches récurrentes complexes. Lancez vos flux de
travail directement depuis la barre d’outils de l’application.
Sélectionnez une zone reconnue, puis faites-la glisser vers la zone de travail
d’une application cible. Les zones de textes sont insérées sous la forme de
texte éditable et les graphiques sous la forme d’images.
Le processus de reconnaissance peut être optimisé pour privilégier la vitesse
ou la précision. Sur des documents de bonne qualité, même un traitement
rapide peut donner d’excellents résultats.
Dessinez rapidement les zones de reconnaissance. Cliquez deux fois sur une
zone détectée automatiquement pour la convertir en zone réelle.
Un dictionnaire financier anglais vient compléter les dictionnaires
professionnels existants (Juridique et Médical) disponibles dans différentes
langues.
Validez la reconnaissance de caractères accentués individuels, en
complément de ceux acceptés par les langues sélectionnées.
Détection automatique des paragraphes numérotés et des listes à puces.
L’éditeur de texte permet d’insérer, de supprimer et d’éditer des listes à puces
et des paragraphes numérotés.
Enregistrez vos documents au format Document OmniPage (étendu) pour
incorporer vos fichiers d’apprentissage, vos dictionnaires et vos gabarits de
zones à votre fichier.
page 38
page 100
page 111
page 106
page 38
page 71
page 38
page 38
page 88
page 36
20Installation et configuration
Chapitre 1
FonctionDescriptionVoirOffice
Arrière-plan en couleurs
Contrôle de la résolution
Système de vérification
amélioré
Enregistrement simultané
sous plusieurs formats
Exportation des résultats
au format audio
Lecture à voix haute
Batch Manager
Export vers Office 2003
Dossiers intelligents
Pages de garde avec code
à barres
Meilleure prise en charge
du format PDF
Obtenez une meilleure reconnaissance des textes imprimés sur
des arrières-plans en couleurs et en dégradés, ainsi qu’une
meilleure gestion des caractères parasites.
Choisissez la résolution des images de page enregistrées et des
images incorporées à des pages reconnues.
Les deux parties d’un mot césuré peuvent désormais être
regroupées. Les fenêtres d’aperçu du document et du vérificateur
affichent les deux parties du mot.
Créez des filtres d’exportation multiples pour enregistrer
simultanément un fichier dans différents formats, pour enregistrer
les images de pages et les pages reconnues, par exemple.
Enregistrez les textes reconnus sous forme de fichiers audio WAV.
Transférez ces fichiers sur CD pour obtenir la lecture à voix haute
de tous vos documents numérisés, où que vous soyez.
Développés par ScanSoft, les modules de synthèse vocale
RealSpeak permettent d’obtenir une « lecture à voix haute »
réaliste de vos documents, dans un plus grand nombre de
langues.
Version améliorée de l’ancien utilitaire Planifier l’OCR, Batch
Manager vous permet de contrôler au mieux le traitement
automatique de travaux prédéfinis.
Prise en charge du nouveau format d’exportation Microsoft Word
2003 (Word ML). OmniPage Pro Office propose en plus un
nouveau format d’exportation : Microsoft Reader (.LIT) et maintient
la prise en charge des formats XML et eBook.
Des travaux peuvent automatiquement importer des documents
provenant d’un ou plusieurs dossiers surveillés. Le traitement
automatique de ces documents est lancé dès que des fichiers
image sont placés dans ces dossiers. Batch Manager vous permet
également de répéter l’exécution de travaux.
Lancez un flux de travail en plaçant une page de garde sur
laquelle figure un code à barres au début de votre document. La
reconnaissance de ce code à barres lancera automatiquement
l’exécution du flux de travail qui y est associé.
Générez des fichiers PDF balisés, signés et cryptés. Autorisez la
lecture des balises lors de l’ouverture de fichiers PDF pour
bénéficier d’une meilleure conservation des formatages.
page 60
page 102
page 79
page 103
page 140
page 92
page 122
page 140
page 125
page 127
page 105
Ouverture de fichiers PDF
dans MS Word
Contrôle à la voix
ScanSoft vous permet de convertir automatiquement des fichiers
PDF au format Word, sans avoir à utiliser OmniPage Pro.
Grâce aux modules de reconnaissance vocale ASR-1600 de
ScanSoft, utilisez des commandes vocales pour lancer des flux de
travail et contrôler vos corrections de vérification au simple son de
votre voix.
Nouvelles fonctions d’OmniPage Pro 1421
page 106
page 129
FonctionDescriptionVoirOffice
Connexion à des serveurs
SharePoint, FTP et à des
systèmes de gestion
documentaire
Exportation au format PDF
Importez des fichiers image depuis des serveurs Microsoft
SharePoint, des systèmes de gestion documentaire compatibles
ODMA ou des sites FTP et exportez vos résultats vers des
répertoires centralisés afin de les partager avec d’autres
utilisateurs.
Créez des fichiers PDF éditables et autorisant les recherches à
partir de fichiers texte, tels que des documents Word.
OmniPage Pro installe un pilote d’impression au format PDF,
accessible dans toutes les applications autorisant les impressions.
page 110
page 105
Pour obtenir une liste plus détaillée des améliorations apportées aux
fonctionnalités de l’application, reportez-vous à l’aide en ligne.
22Installation et configuration
Chapitre 2
Introduction
De nos jours, la plupart des activités professionnelles (correspondance,
création de rapports, gestion des données, etc.) font appel à un ordinateur et
pourtant, certaines sources d’information circulent toujours sous la forme
imprimée et ne sont pas directement exploitables par la machine.
Ainsi, si vous voulez insérer un article de magazine au format papier dans un
rapport en cours de création sur ordinateur, vous devez trouver un moyen de
le faire, en évitant la saisie manuelle, source d’erreur et synonyme de perte de
temps.
OmniPage Pro vous propose une solution sûre : la reconnaissance optique de
caractères (OCR). Ce chapitre décrit l’emploi de la technologie OCR par
OmniPage Pro 14 dans le but de transformer les informations contenues
dans vos documents numérisés ou fichiers image en données électroniques
éditables par vos applications habituelles.
Ce chapitre propose les sections suivantes :
◆Reconnaissance optique de caractères (OCR)
• Documents dans OmniPage Pro
• Principales étapes de l’OCR
◆Bureau OmniPage
◆Gestion de documents
◆Documents OmniPage
◆Réglages
Manuel d’utilisation d’OmniPage Pro 23
Reconnaissance optique de caractères (OCR)
La reconnaissance optique de caractères (OCR) est une opération qui
consiste à extraire du texte d’une image obtenue par numérisation d’un
document papier ou par ouverture d’un fichier image électronique. Le texte
d’une image n’est pas directement utilisable car ses caractères se composent
de groupes de points (pixels).
Pendant la reconnaissance, OmniPage Pro analyse l’image proposée, identifie
les caractères qu’elle contient et définit les solutions permettant de les
transformer en texte éditable. À l’issue de la reconnaissance, le texte peut être
enregistré dans la plupart des applications (logiciels de traitement de texte ou
de PAO, tableurs, etc.).
Technologie OCR d’OmniPage Pro
Outre le texte, OmniPage Pro peut reconnaître les éléments et
caractéristiques suivants du document :
Éléments graphiques
Photos, logos, illustrations, etc.
Formatage du texte
Format des caractères, tel que type (Arial, Times New Roman...), corps
(8, 12…) et style (gras, italique, souligné
paragraphes, tel que retraits, tabulations, marges et interlignes.
) d’une police. Format des
24Introduction
Mise en page
Agencement des colonnes, agencement des tableaux, emplacement des
éléments graphiques et des en-têtes.
Les éléments et caractéristiques conservés par OmniPage Pro dépendent des
réglages sélectionnés pour chaque document. Pour plus de détails sur le choix
des réglages, consultez la rubrique Conseils de réglages de l’aide en ligne
OmniPage Pro.
OmniPage Pro reconnaît uniquement les caractères imprimés, tels que les sorties
imprimante ou le texte tapé à la machine. Vous pouvez toutefois lui demander de
conserver un bloc de texte manuscrit (une signature, par exemple) en affectant
celui-ci du type de zone Graphique.
Chapitre 2
Documents dans OmniPage Pro
OmniPage Pro 14 gère les documents de façon individuelle. Lorsque vous
importez la première image (à partir d’un scanner ou d’un fichier), le
programme crée un document. Toutes les images importées par la suite sont
ajoutées à ce document, jusqu’à son enregistrement et sa fermeture.
Dans OmniPage Pro, un document comporte une ou plusieurs pages,
chacune d’elles constituée par une image importée. Après la reconnaissance,
le document comportera également le texte reconnu correspondant à ses
images (affichable via l’éditeur de texte) et des graphiques ou des tableaux
éventuels. Voir « Bureau OmniPage », page 27.
Principales étapes de l’OCR
OmniPage Pro propose trois modes de traitement des documents :
automatique, manuel ou par flux de travail. Voir « Traitement
automatique », page 46, « Traitement manuel », page 48 et « Flux de
travail », page 112. Ces trois modes impliquent globalement les mêmes
étapes principales :
1. Importer des images de document dans OmniPage Pro
Vous pouvez numériser un document papier (avec ou sans le chargeur de
feuilles automatique [ADF]) ou charger un ou plusieurs fichiers image.
Les images importées apparaissent sous la forme de vignettes dans la
fenêtre d’image ; l’image de la première page est affichée. Les
informations relatives aux pages concernées s’affichent dans le
gestionnaire de documents. Voir « Définition de la source des images de
page », page 58.
2. Exécuter l’OCR pour obtenir du texte éditable
Pendant la reconnaissance, OmniPage Pro trace des zones autour des
parties de l’image à traiter, puis interprète le contenu textuel et
graphique de chaque zone. Vous pouvez également créer des zones
manuellement ou en appliquant un gabarit de zones prédéfini. À l’issue
de la reconnaissance, vous pouvez détecter et corriger les erreurs
éventuelles à l’aide du module de vérification de l’OCR et éditer le
document dans l’éditeur de texte.
Reconnaissance optique de caractères (OCR)25
3. Exporter le document vers la destination de votre choix
Une fois le document reconnu, vous pouvez l’enregistrer dans un fichier
(en spécifiant le nom et le type voulus), le copier dans le Presse-papiers,
l’envoyer comme pièce jointe à un e-mail ou le publier. Vous pouvez
également l’enregistrer au format de document OmniPage (OPD) selon
la procédure décrite ci-après. Un même document peut être enregistré
plusieurs fois avec différents réglages d’emplacement, de type de fichier,
de formatage, etc., selon vos besoins. Voir « Enregistrement et
exportation », page 95.
26Introduction
Barre d’outils
Standard
Boîte à
outils OmniPage
L’onglet Vignettes
contient des images
réduites de toutes les
pages du document.
La page actuelle
présente une icône
en forme d’« œil ».
Chapitre 2
Bureau OmniPage
Le bureau OmniPage Pro dispose d’une barre de titre et de menus dans sa
partie supérieure et d’une barre d’état dans sa partie inférieure. Il est composé
de trois espaces de travail ou fenêtres : gestionnaire de documents, fenêtre
d’image et éditeur de texte. Dans leur partie supérieure, ces trois espaces de
travail comprennent les boutons de fermeture, d’agrandissement et de
réduction de la fenêtre. La Fenêtre d’image est munie de la barre d’outils
Image et la fenêtre Éditeur de texte de la barre d’outils Formatage.
Barre d’outils
Formatage
Ce symbole marque
une page reconnue.
Barre
d’outils Image
Boutons pour
explorer le
document.
Boutons permettant
d’afficher ou de masquer le
gestionnaire de documents,
l’éditeur de texte et
l’affichage des vignettes et
de la page actuelle pour la
fenêtre d’image. Vous
pouvez également effectuer
ces opérations depuis le
menu Affichage.
Faites glisser ces barres de
fractionnement pour
redimensionner les zones
de travail.
Fenêtre d’image :
Cette fenêtre affiche l’image de la page
actuelle et indique les zones tracées. La
fenêtre d’image peut afficher la page actuelle,
la page des vignettes ou les deux.
Boutons de l’éditeur
de texte offrant trois
niveaux de
formatage.
Éditeur de texte :
Affiche le résultat de la
reconnaissance de la page
actuelle en mode True Page.
Bureau OmniPage27
L’exemple utilisé s’appuie sur un document de trois pages. La page 1
représente la page actuelle, reconnue et vérifiée ; la page 2 a été reconnue
mais non vérifiée ; la page 3 a été importée et divisée manuellement en zones,
mais n’a pas été reconnue. L’icône figurant dans la partie inférieure de chaque
vignette indique l’état de la page correspondante.
Les boutons de la barre d’état vous permettent d’afficher et de masquer les
fenêtres du bureau OmniPage Pro, et de passer à d’autres pages du
document. Un clic avec le bouton droit dans une fenêtre affiche son menu
contextuel avec les commandes les plus utiles pour cette fenêtre.
Barre des menus
Pour obtenir des informations succinctes sur une commande de menu,
cliquez sur le bouton d’aide contextuelle puis sur la commande concernée.
La fenêtre qui apparaît explique la fonction de la commande. Pour fermer
cette fenêtre, cliquez n’importe où sur l’écran.
Barres d’outils
Le programme propose trois barres d’outils principales, qui peuvent toutes
être flottantes, si besoin. Le menu Affichage permet de les afficher, de les
masquer et de les personnaliser. L’aide contextuelle explique l’action de
chaque outil. Deux barres d’outils supplémentaires permettent de piloter des
tâches spécifiques.
28Introduction
Barre
d’outils
Emplacement
par défaut
Autres
emplacements
d’ancrage
Chapitre 2
Action
Standard
Image
Formatage
Vérificateur
Réagencement
Horizontalement
sous la barre de
menus
Verticalement à
gauche de la page
d’image actuelle
Horizontalement en
haut de l’éditeur de
texte
Placez le curseur sur la fenêtre du
vérificateur pour afficher cette barre d’outils
flottante.
Cliquez sur l’outil Changer l’ordre de
lecture. Cette barre d’outils remplace la
barre d’outils Formatage.
Tout bord du bureau
OmniPage
Verticalement à
droite de la page
d’image actuelle
Aucun
Exécution des fonctions de base du
programme. Voir page 36 et page 79.
Opérations sur les images, les zones
et les tableaux. Voir page 64 et
page 71.
Formatage du texte reconnu dans
l’éditeur de texte. Voir page 88.
Contrôle de l’emplacement et de
l’aspect du vérificateur. Voir page 81.
Modification de l’ordre des éléments
dans les pages reconnues. Voir
page 88.
Fenêtre d’image
Lorsque cette fenêtre affiche l’image de page actuelle, la barre d’outils Image
est disponible. Les images de page possèdent toutes une valeur de fond :
Traiter ou Ignorer. Les zones peuvent être tracées manuellement sur les
images de page ou placées automatiquement à l’issue de la reconnaissance. Il
existe cinq types de zones : Traiter, Ignorer, Texte, Tableau et Graphique. Les
zones sont automatiquement tracées pour les éléments placés à l’intérieur des
zones Traiter et sur un fond Traiter en dehors d’autres zones, et leurs types de
zones sont déterminés pendant le traitement. Voir « Zones et fonds »,
page 64.
Bureau OmniPage29
Si l’image de page actuelle est masquée, les vignettes apparaissent en rangées
pour assurer une utilisation optimale de l’espace disponible.
Éditeur de texte
L’éditeur de texte affiche les résultats de la reconnaissance selon trois niveaux
de formatage :
Aucun formatage
Conserver le formatage polices/paragraphes
30Introduction
True Page (TP)
Le mode True Page
®
conserve la mise en page sur la base des cadres et des
blocs de texte, de tableaux et d’images. True Page peut afficher des zones
multicolonnes, afin de présenter des blocs de texte pouvant être assimilés à
un enchaînement de colonnes au moment de l’exportation. Tr ue Pa g e
correspond également à un niveau de formatage d’exportation, de même que
Pages en continu, qui conserve la mise en page sans blocs ni cadres. Voir
page 78.
Dans la fenêtre d’image et dans l’éditeur de texte, un menu contextuel
(accessible par clic droit) vous permet de zoomer en avant et en arrière. La
barre d’outils Standard vous permet également de zoomer sur votre
document.
Chapitre 2
Boîte à outils OmniPage
La boîte à outils d’OmniPage Pro vous permet de gérer toutes les étapes du
traitement. Elle est placée par défaut dans la partie supérieure du bureau
OmniPage, au-dessus des fenêtres de travail, mais peut également prendre la
forme de fenêtre flottante ou être ancrée le long du bord inférieur du bureau.
Bouton Lancer/ArrêterBouton Importer page(s)Bouton Exécuter l’OCRBouton Exporter les résultats
Liste déroulante Flux de
travail affichant les flux de
travail prédéfinis et ceux
créés par l’utilisateur.
Liste déroulante
Importer page(s)
Liste déroulante
Description de la
mise en page
Liste déroulante
Exporter les
résultats
Un traitement automatique peut être lancé, interrompu et repris en
cliquant sur le bouton Lancer lorsque 1-2-3 est sélectionné dans la liste
déroulante Flux de travail. Voir « Traitement automatique », page 46.
Le traitement manuel permet de traiter des documents page par page et
étape par étape. Chaque étape peut être lancée en cliquant sur le bouton
correspondant (toujours lorsque 1-2-3 est sélectionné) : Importer page(s) (1),
Exécuter l’OCR (2) et Exporter les résultats (3). Voir « Traitement manuel »,
page 48.
Vous pouvez passer du mode automatique au mode manuel à tout moment,
à la seule condition que le programme ne soit pas en train d’effectuer une
opération de traitement. Cette propriété signifie que vous pouvez modifier le
mode sélectionné entre les différentes étapes du traitement d’un document.
Par exemple, il est possible de traiter automatiquement certaines pages, puis
insérer dans le document d’autres pages traitées manuellement. Selon le
même principe, vous pouvez appliquer le mode automatique à une pile de
pages, puis vérifier le résultat obtenu et, si nécessaire, retraiter certaines pages
manuellement. Cette procédure est décrite au chapitre 3. Voir « Traitement
combiné », page 51.
Le traitement par flux de travail vous permet d’exécuter rapidement des
tâches récurrentes. Sélectionnez Nouveau flux de travail... dans la liste
déroulante Flux de travail. L’Assistant Flux de travail vous permet de créer un
flux de travail et de l’enregistrer en vue d’une utilisation ultérieure. Voir
« Assistant Flux de travail », page 117.
Bureau OmniPage31
Gestion de documents
La gestion de documents s’effectue à partir des vignettes de la fenêtre d’image
ou du gestionnaire de documents (partie inférieure du bureau OmniPage).
Les deux fenêtres comportent des informations succinctes sur les pages du
document traité et sont synchronisées. Les illustrations utilisées dans ce
manuel présentent ces deux fenêtres avec le même document de sept pages.
Les pages 1 et 2 sont sélectionnées et la page 4 est la page actuelle (c.-à-d. la
page affichée dans la fenêtre d’image). L’état de la page est indiqué comme
suit :
PageÉtatIcôneOpérations effectuées sur la page
1ImportéePage importée, mais pas encore reconnue.
2Reconnue
3
4Modifiée
5
6En instance
7Enregistrée
Reconnue,
vérifiée
Modifiée,
vérifiée
Page reconnue, non vérifiée ou vérification
interrompue.
Page reconnue et entièrement vérifiée.
Page reconnue, avec exécution dans
l’éditeur de texte d’au moins une
modification ou un changement de
formatage.
Page reconnue, modifiée dans l’éditeur de
texte et entièrement vérifiée.
Page importée et peut-être reconnue, avec
certains changements de type de zone
stockés, mais pas traités.
Page reconnue et enregistrée au moins
une fois.
Vignettes
L’onglet Vignettes contient des images réduites de toutes les pages du
document. Vu leur présentation verticale, vous devrez peut-être faire défiler les
vignettes pour atteindre l’élément requis. La page actuelle présente une icône
en forme d’« œil ». Vous pouvez sélectionner plusieurs pages dans un
document ; toute page sélectionnée présente un aspect « distinctif ». Utilisez les
vignettes pour les opérations de page, comme suit :
32Introduction
Pour passer à une page, cliquez sur sa vignette.
Pour modifier l’ordre d’apparition d’une page, cliquez sur sa vignette et
faites-la glisser sur le numéro de page voulu. Les pages sont renumérotées
automatiquement.
Chapitre 2
Pour supprimer une page, sélectionnez sa vignette et appuyez sur la touche
Suppr.
Pour sélectionner plusieurs pages adjacentes, maintenez enfoncée la
touche Maj. et cliquez sur la première, puis sur la dernière vignette du
groupe requis. Pour sélectionner plusieurs vignettes non adjacentes,
maintenez enfoncée la touche Ctrl et cliquez sur les pages individuelles
pertinentes. Cela permet ensuite de déplacer, supprimer ou soumettre à
l’OCR le groupe de pages sélectionnées. Vous pouvez aussi exporter les pages
sélectionnées.
Pour obtenir des informations sur une image, placez votre curseur sur cette dernière
après avoir activé l’option Infos sur l’image dans le menu contextuel, dans la fenêtre
d’image. La mini-fenêtre qui s’affiche spécifie la taille de l’image en pixels et en
unités de mesure du programme. Vous êtes également informé de la résolution de
l’image.
Gestionnaire de documents
Cette fonction fournit un résumé d’informations sur un document sous la
forme d’un tableau. Les rangées représentent les pages ; les colonnes offrent
les données statistiques ou d’état des pages, et (le cas échéant) spécifient les
statistiques globales du document. L’illustration ci-dessous affiche les
colonnes définies par l’utilisateur.
Pour afficher la vignette d’une page,
placez le curseur sur son icône d’état.
La page actuelle présente une icône en forme d’« œil ». Dans le gestionnaire
de documents, vous pouvez effectuer les opérations suivantes :
Entrez des
commentaires
ou des mots-clés
sur lesquels
pourront porter
des recherches.
Gestion de documents33
Pour passer à une page, cliquez sur la partie gauche de la rangée de pages ou
double-cliquez dans sa rangée.
Pour modifier l’ordre d’apparition d’une page, cliquez sur sa rangée et
faites-la glisser à l’emplacement requis. Un indicateur s’affiche pour vous
signaler l’endroit d’insertion de la page. Les pages sont renumérotées
automatiquement.
Pour supprimer une page, sélectionnez sa rangée et appuyez sur la touche
Suppr.
Pour sélectionner plusieurs pages adjacentes, maintenez enfoncée la
touche Maj. et cliquez sur la première, puis sur la dernière rangée du groupe
requis. Pour sélectionner plusieurs rangées non adjacentes, maintenez
enfoncée la touche Ctrl et cliquez sur les éléments individuels pertinents.
Cela permet ensuite de déplacer, supprimer ou soumettre à l’OCR le groupe
de pages sélectionnées. Vous pouvez aussi exporter les pages sélectionnées.
La sélection de plusieurs pages n’affecte pas l’état de la page actuelle. Toutes
les pages sélectionnées sont contrastées.
Personnaliser des colonnes dans le gestionnaire de documents
Vous pouvez spécifier les colonnes que vous souhaitez inclure dans le
gestionnaire de documents. Dans le menu Affichage, cliquez sur
34Introduction
Chapitre 2
Personnaliser les colonnes pour afficher la boîte de dialogue illustrée
ci-dessous.
Cet élément est
contrasté.
Pour sélectionner
(activer) un
élément, cochez
sa case.
Les tailles des
images sont
affichées en
pixels.
Définissez la
largeur de la
colonne
contrastée.
Pour modifier
l’ordre
d’affichage des
colonnes,
contrastez un
élément, puis
cliquez sur l’une
de ces flèches.
Définissez les colonnes à afficher, leur largeur et leur ordre d’apparition. Le
contenu de chaque colonne est décrit en détail dans la rubrique Personnaliser les colonnes du gestionnaire de documents de l’aide en ligne. Vous pouvez
modifier la largeur des colonnes tout simplement en faisant glisser les
séparations de colonne voulues dans la barre de titre.
Supprimer des pages d’un document
Toute suppression de page doit être confirmée et ne peut pas être annulée.
Pour supprimer la page actuelle, vous devez recourir à la commande
Supprimer la page actuelle du menu Édition. Pour supprimer toutes les pages
sélectionnées dans le gestionnaire de documents ou dans la page des
vignettes, appuyez sur la touche Suppr ou utilisez la commande Effacer du
menu contextuel.
Imprimer un document
Pour imprimer un document, utilisez la commande Imprimer du menu
Fichier. Vous pouvez décider d’imprimer une image de page ou le texte
reconnu (c.-à-d., le résultat de l’OCR affiché dans l’éditeur de texte). Vous
Gestion de documents35
pouvez imprimer tout ou partie des pages d’un document. L’outil Imprimer
de la barre d’outils Standard envoie à l’imprimante des images ou du texte,
en fonction de la fenêtre active (fenêtre d’image ou éditeur de texte).
Fermer un document
Pour fermer un document, utilisez la commande Fermer du menu Fichier. Si
vous n’avez pas effectué de sauvegarde du document ou si vous y avez apporté
des modifications depuis le dernier enregistrement, vous êtes invité à
l’enregistrer. Pour plus de détails sur l’enregistrement d’un document au
format de document OmniPage (*.OPD), reportez-vous à la section qui suit.
Un message vous demande également d’enregistrer les nouvelles données
d’apprentissage, si vous avez sélectionné l’option Demander l’enregistrement
des données d’apprentissage à la fermeture des documents dans la section
Vérification de la boîte de dialogue Options.
Documents OmniPage
Le format Document OmniPage correspond au type de fichier propre à
OmniPage Pro (extension .OPD). Le format OPD est destiné à
l’enregistrement des documents sur lesquels vous avez l’intention de
retravailler plus tard dans OmniPage Pro. Ainsi, vous pourrez terminer le
traitement du document, y ajouter des pages ou modifier le texte reconnu.
36Introduction
Un document OmniPage contient l’image de page originale (corrigée et
prétraitée) et toute zone tracée sur celle-ci. À l’issue de la reconnaissance, un
fichier OPD comporte également le résultat de l’OCR. Les caractères
reconnus sont enregistrés avec leurs coordonnées et détails techniques, ce qui
permet de conserver le lien entre l’image et le texte correspondant, et rend
possible la vérification lors de la réouverture du fichier dans OmniPage Pro.
Au moment de l’enregistrement au format de document OmniPage, le
logiciel sauvegarde également les réglages en cours (et les nouvelles données
d’apprentissage). Lors de l’ouverture d’un document OmniPage, ses réglages
sont appliqués, remplaçant les paramètres du programme.
Chapitre 2
Avantages du format OPD
Le format OPD, proposé parmi d’autres types de fichiers disponibles dans
OmniPage Pro, est particulièrement adapté aux circonstances suivantes :
◆Vous ne pouvez pas terminer le traitement d’un document au cours
de la session en cours.
◆Vous souhaitez transmettre le document à d’autres utilisateurs
disposant d’OmniPage Pro (par exemple, l’envoyer à un spécialiste
pour vérification). Votre bureau est équipé d’un scanner générant
des images destinées à la reconnaissance et la vérification sur
plusieurs postes de travail.
◆Vous souhaitez mettre en place une archive des documents reconnus
dont les images originales restent accessible. (le texte reconnu
permet d’effectuer des recherches par mot-clé et accepte d’autres
techniques de récupération de documents).
Avant d’installer une mise à jour d’OmniPage Pro, vous devez enregistrer les
résultats de la reconnaissance stockés dans les fichiers OPD. En effet, ces fichiers ne
seront peut-être pas compatibles avec les nouveaux formats de fichier OPD ; il se
peut aussi que seules les images soient conservées. Lorsque vous ouvrez un fichier
OPD créé dans OmniPage Pro 10, seules les images sont chargées. Lorsque vous
ouvrez un fichier OPD créé dans OmniPage Pro 11, les images et les pages
reconnues sont chargées, mais les zones ne sont pas conservées. Tous ces éléments
sont conservés dans les fichiers OPD créés à partir de la version 12
d’OmniPage Pro.
Enregistrer au format OPD
L’enregistrement au format OPD s’effectue depuis le menu Fichier, ou à
l’aide du bouton Enregistrer de la barre d’outils Standard. La barre de titre
affiche le nom de fichier du document OmniPage. Si vous avez l’intention de
créer un fichier OPD, il est recommandé d’enregistrer votre document sous
ce format dès le début de son traitement (à des fins de protection). Cliquez
ensuite régulièrement sur le bouton Enregistrer pour enregistrer votre travail.
Enregistrez-le de nouveau à la fin de votre session de travail.
Lors de la fermeture du document ou de l’application, vous serez invité à
enregistrer le document en tant que fichier OPD. Lorsque vous créez un flux
de travail, vous pouvez définir plusieurs étapes d’enregistrement du
Documents OmniPage37
document au format OPD et d’enregistrement des images ou des résultats de
reconnaissance dans d’autres formats de fichiers. Voir « Création d’un flux de
travail », page 118.
Deux formats de fichier OmniPage sont disponibles au moment de
l’enregistrement : Document OmniPage ou Document OmniPage (étendu).
Le format OmniPage étendu vous permet d’incorporer un dictionnaire
utilisateur, un fichier d’apprentissage ou un gabarit de zones à votre fichier
OPD. S’il génère des fichiers beaucoup plus volumineux, ce format améliore
la portabilité et facilite l’échange des fichiers OPD. Pour incorporer ces
fichiers à un document OPD, veillez à les charger avant d’enregistrer votre
fichier au format Document OmniPage (étendu).
Comment charger un fichier OPD
Dans le menu Fichier, sélectionnez Ouvrir OPD... Le type de fichiers
Document OmniPage comprend aussi bien les fichiers OPD classiques que
les fichiers au format étendu. Sélectionnez le fichier que vous souhaitez
ouvrir, puis cliquez sur OK. Un dictionnaire utilisateur, un fichier
d’apprentissage ou un gabarit de zones incorporé à un fichier OPD peut être
ultérieurement enregistré sous la forme d’un fichier individuel distinct.
L’ouverture d’un document OmniPage peut également constituer une étape
d’un flux de travail.
38Introduction
Réglages
Les réglages OmniPage Pro sont regroupés dans la boîte de dialogue
Options. Vous pouvez y accéder depuis la barre d’outils Standard ou le menu
Outils. Chaque onglet est présenté sommairement ci-dessous (reportez-vous
à l’aide contextuelle en ligne pour obtenir des informations détaillées sur
chaque fenêtre de réglages).
OCR
Permet de spécifier la ou les langues de reconnaissance, les caractères
supplémentaires validés lors de la reconnaissance ainsi qu’un dictionnaire
utilisateur ou professionnel. Pour sélectionner ou désélectionner une langue,
cochez ou décochez la case correspondante. Vous pouvez effectuer plusieurs
sélections, mais limitez-vous aux langues apparaissant dans le document à
reconnaître. Les langues indiquées dans la partie supérieure de la liste
Chapitre 2
correspondent à celles sélectionnés en dernier. Pour afficher directement une
langue, entrez les premières lettres de la langue à l’aide du clavier. Vous
pouvez également optimiser le processus d’OCR en termes de vitesse ou de
précision, définir un caractère de rejet, définir la méthode de mappage des
polices ainsi qu’une mise en page personnalisée. Voir page 62.
Scanner
Permet de définir la taille et l’orientation de la page à numériser. Vous pouvez
également spécifier les réglages de luminosité et de contraste et définir les
options de numérisation des documents multipages, avec ou sans
chargeur automatique (ADF). Cet onglet permet aussi de modifier la
configuration du scanner, d’installer un nouveau scanner ou de changer de
scanner par défaut. Voir « Importer des documents à partir d’un scanner »,
page 60. L’onglet Scanner ne s’affiche pas si vous avez spécifié l’affichage de
l’interface TWAIN native de votre scanner lors de la configuration de ce
dernier. Voir « Configuration d’un scanner pour une utilisation avec
OmniPage Pro », page 15.
Direct OCR
Permet de définir les réglages de Direct OCR, fonction assurant les services
de reconnaissance directement à partir des applications extérieures
(traitement de texte, etc.). Utilisez cet onglet pour enregistrer/désenregistrer
des applications pour Direct OCR et activer/désactiver ce service. Vous
pouvez également sélectionner le découpage en zones automatique ou
manuel, et activer ou désactiver la vérification. Voir « Configuration de
Direct OCR », page 53.
Tr ai te me n t
Permet de définir l’emplacement d’insertion de nouvelles images, d’activer le
message demandant la suite des pages lors de la numérisation, de spécifier la
numérisation sur deux pages pour le traitement des livres et de définir
d’autres paramètres.
Vérification
Permet d’activer ou de désactiver la vérification automatique à la suite de la
reconnaissance. Vous pouvez aussi utiliser cet onglet pour configurer
IntelliTrain dans le but de charger ou de travailler avec un fichier
d’apprentissage. Voir « Vérification des résultats de l’OCR », page 79.
Réglages39
Général
Permet de choisir la langue de l’interface utilisateur. Permet également de
placer une icône OmniPage dans la barre des tâches de votre ordinateur, sur
laquelle vous pourrez cliquer pour afficher et lancer rapidement vos flux de
travail. Permet également d’activer la recherche automatique de mises à jour
et de définir d’autres réglages généraux.
Éditeur de texte
Permet d’afficher ou de masquer certaines fonctions de l’éditeur de texte, de
définir l’unité de mesure à appliquer et d’activer ou de désactiver le retour à
la ligne automatique. Voir « Édition du texte et des images », page 88.
Certains réglages s’appliquent uniquement aux sessions de reconnaissance suivantes
(c’est le cas, par exemple, de la langue de reconnaissance, du fichier d’apprentissage
et de la luminosité du scanner). De ce fait, il est important de définir correctement
ces réglages avant le lancement d’un traitement. Pour appliquer les nouveaux
réglages aux pages reconnues, vous devez recommencer l’OCR de celles-ci. Par
contre, les autres réglages sont activés immédiatement dans les pages existantes (par
exemple, retour à la ligne automatique ou unité de mesure dans l’éditeur de texte).
40Introduction
Chapitre 3
Traitement des
documents
Ce chapitre décrit les modes de traitement des documents disponibles sous
OmniPage Pro et fournit des détails sur les principales étapes des procédures
impliquées :
◆Guide de démarrage rapide
◆Présentation du traitement
◆Traitement automatique
◆Traitement manuel
◆Traitement combiné
◆Traitement à l’aide de flux de travail
◆Traitement à partir d’autres applications (Direct OCR, PaperPort)
◆Traitement à l’aide de Batch Manager
Les instructions détaillées portent sur les opérations suivantes :
◆Définition de la source des images de page
◆Définition de la mise en page du document
◆Zones et fonds
• Découpage en zones automatique
• Traçage de zones manuel
• Types et propriétés de zone
•Gestion des zones
• Définition rapide de zones
◆Gestion des grilles du tableau dans l’image
◆Utilisation des gabarits de zones
Manuel d’utilisation d’OmniPage Pro 41
Guide de démarrage rapide
Cette section vous présente toutes les étapes de la procédure d’OCR de base.
Charger et reconnaître les exemples de fichiers image
Les exemples de fichiers image (comportant une seule page et multipages)
sont mis à votre disposition dans le dossier Programmes. Traitez ces fichiers
en appliquant la procédure décrite ci-dessous, mais dans un premier temps
ignorez toute référence au scanner. Voir « Importer des fichiers image »,
page 58. Les résultats vous donneront une référence indiquant la qualité
d’OCR que vous devriez obtenir avec vos propres fichiers aux caractéristiques
comparables.
Par la suite, passez à la numérisation d’une page placée dans votre scanner.
Numériser et reconnaître un document d’une page
Mettez votre scanner sous tension et assurez-vous qu’il fonctionne
correctement. Pour ce test, choisissez une page au texte net.
Ce test présuppose qu’OmniPage Pro présente les réglages par défaut et que
votre document est rédigé dans la langue qui a été spécifiée comme langue
d’interface pendant l’installation. S’il ne s’agit pas de la première utilisation
du programme, ouvrez la boîte de dialogue Options (via le menu Outils) et
choisissez Valeurs par défaut.
Le document sera traité automatiquement et les résultats de l’OCR seront
enregistrés dans un fichier. Vous allez effectuer la vérification, mais non
l’édition, du document dans l’éditeur de texte.
42Traitement des documents
ActionRésultat
Chapitre 3
1.Le cas échéant, configurez le scanner à l’aide de
l’Assistant du scanner.
2.Sélectionnez Démarrer!Programmes!
ScanSoft OmniPage Pro 14.0!
OmniPage Pro 14.0.
3.Placez le document soigneusement dans le
scanner.
4.Dans le menu déroulant Importer page(s),
sélectionnez l’option de numérisation adaptée à
votre document : noir et blanc, niveaux de gris
ou couleur.
5.Dans le menu déroulant de description de la
mise en page, vérifiez que la commande
Automatique est sélectionnée. Ce réglage est le
plus approprié à un grand nombre de
documents.
6.Dans la liste déroulante Exporter les résultats,
vérifiez que l’option Enregistrer dans un fichier
est sélectionnée.
7.Assurez-vous que l’option 1-2-3 est sélectionnée
dans la liste déroulante Flux de travail. Cliquez
sur Lancer.
8.Utilisez la fenêtre Vérification de l’OCR pour
modifier les mots que le programme considère
comme reconnus incorrectement.
9.Cliquez dans la fenêtre de l’éditeur de texte.
Sélectionnez les différents modes de l’éditeur de
texte pour comparer les modifications
d’affichage de la page.
10.Cliquez sur Reprendre pour relancer la
vérification. Lorsque le message La vérification de l’OCR est terminée. s’affiche, cliquez sur OK.
11.Choisissez le nom et le type de fichier, ainsi que
le chemin et le niveau de formatage requis pour
l’enregistrement du document reconnu. Cliquez
sur OK.
12.Vérifiez le document dans votre programme de
traitement de texte.
OmniPage Pro est configuré pour l’utilisation avec votre
scanner.
Le programme OmniPage Pro est ouvert.
Vous pouvez spécifier l’aspect des images ou des textes et
fonds de couleur dans le document exporté. Notez que la
numérisation en couleur exige un scanner couleur.
OmniPage Pro est configuré pour le traçage des zones et
spécification des propriétés de zones automatiques.
Vous pouvez attribuer un nom au fichier d’exportation
après la vérification du document.
OmniPage Pro lance la numérisation de votre document.
Une vignette apparaît, assortie d’une jauge de
progression. La fenêtre Vérification de l’OCR apparaît.
Le module Vérification de l’OCR est similaire à la fonction
de vérification orthographique d’un programme de
traitement de texte, mais offre des fonctionnalités
supplémentaires spécifiques à la reconnaissance. Les
marques de vérification sont supprimées une fois que vous
avez terminé l’opération.
Chaque mode de l’éditeur de texte définit un niveau de
formatage différent. Vous pouvez ainsi choisir le niveau
voulu lors de l’enregistrement.
La vérification de la reconnaissance est terminée. La boîte
de dialogue Enregistrer dans un fichier apparaît.
Par défaut, la fonction Enregistrer et lancer est activée et
votre document est ouvert automatiquement dans le
programme de traitement de texte associé au type de
fichier sélectionné.
Vous avez utilisé OmniPage Pro 14 avec succès pour
reconnaître le document et l’ouvrir dans votre application
cible.
Guide de démarrage rapide43
Si vous obtenez de bons résultats lors de la reconnaissance des exemples de
fichiers image, mais non de la page numérisée, vérifiez l’installation et la
configuration de votre scanner, notamment la luminosité et la résolution
d’image. Voir « Importer des documents à partir d’un scanner », page 60.
Vous obtiendrez un modèle de réglage de luminosité optimal. Consultez
également les rubriques Configurer le scanner et Dépanner le scanner de l’aide
en ligne.
Présentation du traitement
Le diagramme suivant récapitule les principales étapes :
Importer
des pages
À partir
d’un fichier
page 58
À partir du
scanner
page 60
Autre
page 58
Décrire la
mise en
page
page 62
Appliquer
un gabarit
page 73
Zones auto-
matiques
page 64
Zones
manuelles
page 65
Exécuter
l’OCR
Avec les
paramètres
courants
page 38
Vérifier et
éditer
page 81
Vérifier
page 79
Exporter les
pages
Dans un fichier
page 98
Dans le Presse-
papiers page 106
Par e-mail
page 107
Autre
page 110
Les méthodes de traitement disponibles dans OmniPage Pro sont présentées
succinctement ci-dessous. Une description approfondie de chaque mode est
fournie dans les pages suivantes du manuel.
Automatique
Une solution simple et efficace de traiter un document consiste à laisser
OmniPage Pro s’en charger pour vous. Sélectionnez les réglages dans la boîte
de dialogue Options et les commandes dans la boîte à outils OmniPage, puis
cliquez sur Lancer. OmniPage Pro soumet chaque page à toutes les étapes du
traitement, si possible effectuant plusieurs opérations en parallèle. Sous ce
mode, le logiciel se charge également de tracer les zones.
44Traitement des documents
Chapitre 3
Manuel
Le traitement manuel vous assure un contrôle plus précis du traitement de
votre document. Vous pouvez traiter chaque page individuellement avec
différents réglages. Le programme marque une pause entre chaque étape du
traitement : importation d’images, reconnaissance et exportation. Vous
pouvez ainsi tracer des zones manuellement ou modifier les langues de
reconnaissance. Pour lancer une étape, cliquez sur l’un des trois boutons
correspondants dans la boîte à outils OmniPage.
Combiné
Vous pouvez traiter un document automatiquement, puis afficher le résultat
obtenu dans l’éditeur de texte. Si la qualité de l’ensemble du document est
bonne et que seules certaines pages sont insatisfaisantes, vous pouvez passer
au traitement manuel pour modifier les réglages et relancer la reconnaissance
des pages incorrectes. Vous pouvez aussi importer les images manuellement,
tracer des zones sur tout ou partie d’entre elles, puis appliquer à toutes les
pages le traitement automatique.
Flux de travail
Les flux de travail se composent d’une série d’étapes et de réglages s’y
rapportant. Ils incluent généralement, mais pas obligatoirement, une étape de
reconnaissance. Les flux de travail sont répertoriés dans la liste déroulante Flux
de travail. Celle-ci comprend un certain nombre de flux de travail proposés par
le système, en plus de ceux que vous créez. Vous pouvez placer l’icône
OmniPage Workflow Starter dans votre barre de tâches. Le menu contextuel
associé répertorie vos flux de travail. Cliquez sur un flux de travail pour lancer
OmniPage Pro et exécuter ce flux.
L’Assistant Flux de travail vous guide tout au long de la création de vos flux de
travail. Il propose une série d’étapes et les réglages qui y sont associés. Chaque
fois que l’icône d’une étape a été sélectionnée et que ses réglages (s’il en existe)
ont été définis, de nouvelles icônes d’étapes apparaissent, pour que vous
puissiez les sélectionner. Une fois votre flux de travail créé, vous pouvez
l’enregistrer pour une utilisation ultérieure, mais cette action n’est pas
obligatoire. L’Assistant vous assiste, si besoin, lors du traitement automatique.
Voir « Assistant Flux de travail », page 117.
Traitement à partir d’autres applications
La fonction Direct OCR permet de faire appel aux services OCR
d’OmniPage Pro à partir de votre application de traitement de texte usuelle
ou d’une autre application. De plus, OmniPage Pro établit un lien
automatique avec les programmes de gestion de documents de ScanSoft –
PaperPort et Pagis.
Présentation du traitement45
Tra iteme nt di ffé ré
Un module permet de différer la reconnaissance automatique des documents
(par exemple, à une heure où vous n’utilisez pas votre ordinateur). La gestion
et l’exécution des travaux s’effectuent dans Batch Manager. Lorsque vous
sélectionnez l’option Nouveau Travail, l’Assistant Flux de travail apparaît. La
sélection d’options et de réglages est légèrement modifiée. La principale
différence réside dans la fenêtre de fermeture, qui permet de spécifier une
date de début, de configurer des travaux récurrents et de définir des
instructions de surveillance de dossiers.
Un travail Batch Manager est un flux de travail pour lequel des instructions
de planification ont été définies. Voir « Batch Manager », page 122.
Traitement automatique
Le mode automatique représente une méthode efficace pour le traitement de
documents, notamment de documents volumineux. Vous définissez les
réglages pertinents, puis utilisez le bouton Lancer dans la boîte à outils
OmniPage pour appliquer toutes les étapes du traitement à un nouveau
document ou pour relancer et terminer le traitement d’un document ouvert.
Liste déroulante Importer page(s)
Certaines options apparaissent uniquement
dans OmniPage Pro 14 Office, d’autres
apparaissent uniquement si la source est
disponible.
Description de la
mise en page
46Traitement des documents
Bouton Exporter les
résultats
Liste déroulante
Exporter les
résultats
Chapitre 3
1. Assurez-vous que l’option 1-2-3 est sélectionnée dans la liste déroulante
Flux de travail.
2. Dans la liste déroulante du bouton Importer page(s), sélectionnez la
commande requise. Vous définissez la source du document (fichier
image ou scanner). Voir « Définition de la source des images de page »,
page 58.
3. Dans la liste déroulante de description de la mise en page, sélectionnez
l’option pertinente (voir l’illustration plus haut). La description du type
de document importé ou le choix d’un gabarit de zones aide le
programme dans le processus de traçage de zones automatique. Voir
« Définition de la mise en page du document », page 62.
4. Dans la liste déroulante du bouton Exporter les résultats, sélectionnez la
commande requise. Vous pouvez enregistrer les pages voulues (la page
actuelle, les pages sélectionnées ou toutes les pages) dans un fichier, les
copier dans le Presse-papiers, les envoyer comme pièces jointes à un email ou les transférer vers d’autres destinations.
en tant que document OmniPage à partir du menu Fichier ou de la barre
d’outils Standard.
Voir « Enregistrement et exportation », page 95.
Enregistrez le document
5. Choisissez la commande dans la barre d’outils Standard ou dans le
menu Outils et vérifiez que les réglages en cours conviennent au
document. Vous pouvez, par exemple, spécifier la ou les langues de
reconnaissance et activer/désactiver la vérification du texte reconnu. Voir
« Réglages », page 38.
6. Cliquez sur le bouton Lancer ou choisissez un flux de travail dans le
menu Traitement et cliquez sur Lancer avec l’option 1-2-3 sélectionnée.
Les pages du document sont traitées les unes après les autres ;
OmniPage Pro peut effectuer plusieurs tâches simultanément. Ainsi, le
programme peut lancer le chargement et la reconnaissance d’une
nouvelle page pendant la vérification de la page précédente.
Traitement automatique47
Arrêter et relancer le traitement automatique
Arrêter : Lorsque le traitement automatique est en cours, le bouton Arrêter
remplace le bouton Lancer. Cliquez sur ce bouton pour arrêter l’opération.
Cette commande est utile lorsque vous souhaitez modifier certains réglages
alors que le traitement est déjà entamé.
Relancer : Lorsque le traitement automatique est terminé, le bouton Lancer
réapparaît. Cliquez sur ce bouton pour relancer le traitement. La boîte de
dialogue Traitement automatique vous permet d’effectuer les actions
suivantes :
◆Te r mi n e r le traitement des pages non reconnues et non vérifiées,
puis exporter les résultats.
◆Ajouter des pages de la même source ou d’une autre source, en
conservant ou modifiant les réglages.
◆Recommencer le traitement de toutes les pages pour éliminer
tous les résultats de l’OCR et relancer la reconnaissance de
toutes les pages du document avec des réglages différents. Vous
pouvez activer le découpage en zones automatique ou appliquer
un fichier de gabarit. Le relancement du traitement est utile si
un réglage inadéquat a produit des résultats insatisfaisants dans
l’intégralité du document. Une telle intervention peut
s’imposer, par exemple, lorsque la spécification d’une langue
incorrecte lors du premier traitement a entraîné le marquage de
la plupart des mots du document comme douteux pendant la
vérification. Cette option permet de réexécuter l’OCR sans
avoir à recommencer la numérisation, le chargement ou le
redécoupage en zones de toutes les images.
Traitement manuel
Le traitement manuel vous assure un contrôle plus précis du traitement de
votre document. Vous pouvez traiter chaque page individuellement avec
différents réglages. Le programme marque une pause entre chaque étape du
traitement : importation d’images, reconnaissance et exportation. Vous
pouvez ainsi tracer des zones manuellement ou modifier le fond de chaque
page. Pour lancer une étape, vous cliquez sur l’un des trois boutons
correspondants dans la boîte à outils OmniPage.
48Traitement des documents
Chapitre 3
1. Sélectionnez 1-2-3 dans la liste déroulante Flux de travail. Pour vérifier
ou modifier les réglages de la boîte de dialogue Options, cliquez sur
dans la barre d’outils Standard ou choisissez Options dans le menu
Outils. Voir « Réglages », page 38.
2. Dans la liste déroulante du bouton Importer page(s), sélectionnez
l’option requise. Vous définissez la source du document (fichier image
ou scanner). Si vous effectuez une numérisation via l’interface
d’OmniPage, sélectionnez le mode voulu et effectuez les réglages
appropriés dans les onglets Scanner et Traitement de la boîte de dialogue
Options. Voir « Définition de la source des images de page », page 58.
3. Cliquez sur le bouton Importer page(s). Ceci lance la numérisation ou
affiche une boîte de dialogue vous permettant de sélectionner un fichier
image, le cas échéant. Des vignettes de chaque page apparaissent dans la
fenêtre d’image, avec l’image de page actuelle. Les boutons de la barre
d’état vous permettent d’afficher ou de masquer ces images. Les
informations relatives aux pages concernées s’affichent dans le
gestionnaire de documents.
4.
Les images de page importées dans le programme sont toujours dotées de
la valeur de fond Traiter. Si vous ne tracez aucune zone sur ces pages, elles
seront soumises à un découpage en zones automatique lors du lancement
de la reconnaissance.
5.
Vous pouvez tracer et modifier manuellement des zones sur une ou
plusieurs images, et leur attribuer des propriétés. Les boutons de la barre
d’état vous permettent de passer d’une page à l’autre. Dès que vous tracez
une zone sur une page, son fond reçoit la valeur Ignorer. Tracez des zones
à valeur Traiter pour définir le découpage en zones automatique sur des
parties d’une page. Voir « Zones et fonds », page 64.
6. Dans la liste déroulante du bouton Exécuter l’OCR, sélectionnez
l’option requise. Choisissez la mise en page du document original. La
valeur spécifiée est prise en compte dans le processus de traçage de zones
automatique. Voir « Définition de la mise en page du document »,
page 62. Vous pouvez également sélectionner un gabarit pour appliquer
ses zones à la page actuelle. Voir « Utilisation des gabarits de zones »,
page 73.
Traitement manuel49
7. Cliquez sur le bouton Exécuter l’OCR pour reconnaître la page actuelle.
Pour reconnaître plusieurs pages, sélectionnez le groupe de pages requis à
l’aide des vignettes ou dans le gestionnaire de documents (« Gestion de
documents », page 32) et cliquez sur le bouton Exécuter l’OCR. Les
pages reconnues s’affichent dans l’éditeur de texte.
8. Si vous avez activé l’option de vérification, la boîte de dialogue
Vérification de l’OCR affiche la liste des mots douteux provenant des
pages reconnues. Vous pouvez vérifier et éditer le texte traité. Voir
« Vérification des résultats de l’OCR », page 79.
9. Continuez à charger les pages, à exécuter l’OCR et à procéder aux
opérations d’édition et de vérification selon vos besoins. Vous pouvez
changer l’ordre de lecture des éléments de page dans l’éditeur de texte.
Voir « Édition du texte et des images », page 88.
10.
Dans la liste déroulante du bouton Exporter les résultats, sélectionnez
l’option requise. Vous pouvez enregistrer les pages voulues (la page
actuelle, les pages sélectionnées ou toutes les pages) dans un fichier, les
copier dans le Presse-papiers, les envoyer comme pièces jointes à un e-mail
ou les transférer vers d’autres destinations. Certaines destinations sont
uniquement disponibles dans OmniPage Pro 14 Office. D’autres
apparaissent seulement si elles sont détectées par le système. Cliquez sur le
bouton Exporter les résultats. Voir « Enregistrement et exportation »,
page 95. Enregistrez le document en tant que document OmniPage à
partir du menu Fichier ou de la barre d’outils Standard.
50Traitement des documents
Chapitre 3
Traitement combiné
Le traitement automatique garantit rapidité et efficacité. S’il exige une plus
grande attention, le traitement manuel assure un meilleur contrôle sur les
résultats. Vous pouvez combiner ces deux avantages lorsque vous traitez un
seul document.
Pour lancer une reconnaissance automatique et terminer l’opération en
mode manuel
Dans le cas d’un document volumineux dont seules quelques pages exigent
une attention particulière de votre part, vous n’avez pas besoin de traiter
manuellement l’intégralité du document. Vous pouvez le traiter
automatiquement dans un premier temps, puis afficher le résultat obtenu
dans l’éditeur de texte, où vous identifiez les pages reconnues correctement,
et celles qui nécessitent des réglages différents ou un traçage de zones
manuel. Ajustez certains paramètres et/ou modifiez des zones, puis passez au
mode manuel pour relancer la reconnaissance des pages inadéquates.
1. Préparez le document et exécutez un traitement en mode automatique,
selon la procédure décrite dans les sections précédentes.
2. Si vous interrompez ou terminez la vérification, vous serez invité à
enregistrer le document. Il est recommandé d’effectuer une sauvegarde,
même si le document se trouve dans un état intermédiaire.
3. Sélectionnez une page exigeant la redéfinition des zones et supprimez ou
modifiez les zones existantes dans la fenêtre d’image. Vous pouvez
également charger un gabarit pour appliquer ses zones à la page actuelle.
Tracez les nouvelles zones selon vos besoins. Voir « Zones et fonds »,
page 64.
4. Modifiez les autres réglages en fonction des particularités de la page
actuelle. Voir « Réglages », page 38.
5. Cliquez sur le bouton Exécuter l’OCR pour relancer la reconnaissance
de la page actuelle. Dans la fenêtre affichée, confirmez l’annulation des
résultats de l’OCR précédents. Vous pouvez aussi choisir d’appliquer le
traitement en direct pour appliquer les modifications apportées aux
zones sans devoir relancer la reconnaissance de la page entière. Voir
« Édition en direct », page 91.
Traitement combiné51
6. Pour relancer la reconnaissance de plusieurs pages, sélectionnez le groupe
de pages voulu dans la page des vignettes ou dans le gestionnaire de
documents avant de cliquer sur le bouton Exécuter l’OCR.
7. Lorsque toutes les pages soumises au nouveau traitement fournissent un
résultat satisfaisant, réenregistrez le document.
Pour lancer une reconnaissance manuelle et terminer l’opération en mode
automatique
1. Cliquez sur le bouton Importer page(s) afin de définir les réglages et
d’importer les images pour le document.
2. Examinez les pages pour en déterminer la luminosité, l’orientation et le
contenu. Renumérisez ou faites pivoter les images insatisfaisantes.
Réordonnez les pages selon vos besoins.
3. Tracez manuellement les zones dans les pages dont vous ne voulez traiter
qu’une partie ou pour lesquelles vous voulez fournir des instructions de
zones précises. Appliquez la valeur Ignorer aux fonds ou aux zones que
vous voulez exclure du traitement. Appliquez la valeur Traiter aux fonds
ou aux zones pour lesquels vous voulez définir le découpage en zones
automatique.
4. Cliquez sur le bouton Lancer, puis choisissez Terminer le traitement des
pages existantes dans la boîte de dialogue Traitement automatique.
5. À l’issue de la vérification (le cas échéant), vous pouvez enregistrer ou
exporter le document.
Traitement à l’aide de flux de travail
Les flux de travail se composent d’une série d’étapes et de réglages s’y
rapportant. Leur déroulement ne peut pas se conformer au schéma de
traitement traditionnel (« 1-2-3 »). Les flux de travail vous permettent de
gérer plus efficacement les tâches récurrentes. Les différentes étapes et leurs
réglages y sont prédéfinis.
Pour exécuter un flux de travail lorsqu’OmniPage Pro est fermé
Cliquez sur l’icône OmniPage Workflow Starter dans la barre des tâches.
Sélectionnez un flux de travail dans le sous-menu qui apparaît.
OmniPage Pro démarre et exécute immédiatement le flux de travail. Si
l’icône n’apparaît pas, activez l’option correspondante dans l’onglet Général
de la boîte de dialogue Options.
52Traitement des documents
Chapitre 3
Pour exécuter un flux de travail lorsqu’OmniPage Pro est ouvert
Vous pouvez utiliser l’icône de la barre des tâches tel que décrit dans la
procédure ci-dessus, ou sélectionner le flux de travail dans la liste déroulante
Flux de travail et cliquer sur Lancer. Lorsqu’un flux de travail est en cours
d’exécution, la plupart des commandes du programme ne sont pas
accessibles.
Pour modifier un flux de travail
Sélectionnez le flux de travail dans la liste déroulante Flux de travail et
cliquez sur le bouton Assistant Flux de travail dans la barre d’outils Standard.
Vous pouvez également sélectionner l’option Flux de travail... dans le menu
Outils, sélectionner le flux de travail souhaité et cliquer sur Modifier.
Pour créer un flux de travail
Des modèles de flux de travail prédéfinis sont proposés dans le programme.
Vous pouvez les modifier ou les utiliser pour créer de nouveaux flux de
travail. L’Assistant Flux de travail vous guide tout au long de la création de
flux de travail. Voir page 117 dans le chapitre 6.
Traitement à partir d’autres applications
La fonction Direct OCR™ permet de faire appel aux services OCR
d’OmniPage Pro à partir de votre application de traitement de texte usuelle
ou d’une autre application. Le recours à cette fonction suppose
l’établissement préalable d’un lien direct entre OmniPage Pro et l’application
en question. À l’issue de cette opération, deux commandes ajoutées au menu
Fichier de l’application relient celle-ci aux services d’OCR.
Configuration de Direct OCR
1. Démarrez l’application à lier à OmniPage Pro. Lancez OmniPage Pro,
ouvrez la boîte de dialogue Options, puis la fenêtre Direct OCR et
sélectionnez Activer Direct OCR.
2. Sélectionnez les options de traitement pour la vérification et le
découpage en zones. Les réglages effectués s’appliquent à l’ensemble des
opérations futures de Direct OCR jusqu’à leur éventuelle modification ;
ils ne sont pas pris en compte si vous utilisez OmniPage Pro sans
Direct OCR.
Traitement à partir d’autres applications53
Pour que l’option Direct OCR
fonctionne, cette case doit
être activée.
Ces cases doivent être
activées pour conserver un
contrôle manuel pendant le
traitement. Pour une
exécution automatique,
désactivez-les.
Ces applications sont
configurées pour prendre
en charge la fonction
Direct OCR.
3. La liste Non enregistrées affiche les applications actives ou enregistrées
dans le passé. Sélectionnez la ou les applications voulues et cliquez sur
Ajouter ou recherchez une application absente de la liste au moyen du
bouton Parcourir.
Utilisation de Direct OCR
1. Démarrez l’application liée à OmniPage Pro et ouvrez un document.
2. Sélectionnez la commande Configuration d’acquisition du texte dans le
54Traitement des documents
Pour importer dans le document les résultats des pages numérisées,
placez celles-ci correctement dans le scanner.
menu Fichier de l’application cible pour spécifier les réglages à appliquer
lors de la reconnaissance. Tout réglage non défini conserve la valeur
utilisée lors de la dernière session OmniPage Pro, et tout réglage modifié
dans Direct OCR est reflété dans OmniPage Pro.
Chapitre 3
3. Sélectionnez la commande Acquérir texte du menu Fichier pour
importer des images à partir d’un scanner ou d’un fichier.
4. Si vous avez sélectionné l’option Définir les zones automatiquement dans
la fenêtre Direct OCR de la boîte de dialogue Options ou dans la fenêtre
Configuration d’acquisition du texte, la reconnaissance est lancée
immédiatement.
5. Si vous n’avez pas sélectionné l’option Définir les zones automatiquement,
le programme vous propose de tracer des zones manuellement sur
chaque image de page. Cliquez sur le bouton Exécuter l’OCR pour
poursuivre la reconnaissance.
6. Si la fonction de vérification a été activée, cette opération suit l’OCR. Le
texte reconnu est ensuite inséré dans votre application à l’emplacement
du curseur, avec le niveau de formatage spécifié avec la commande
Acquérir les réglages de texte.
Si OmniPage Pro est ouvert au moment de l’appel de la fonction Direct OCR à
partir d’une application cible, une nouvelle session d’OmniPage Pro démarre.
Pour plus de détails, reportez-vous aux rubriques relatives à Direct OCR dans l’aide
en ligne, notamment à Direct OCR – Questions et réponses. Le fichier ReadMe/
LisezMoi et le site Web de ScanSoft peuvent proposer des informations plus
récentes sur certaines applications cibles spécifiques.
Traitement à partir d’autres applications55
Utilisation d’OmniPage Pro avec PaperPort
PaperPort® est un produit de gestion de documents papier de ScanSoft.
Ce programme permet de lier vos pages aux applications appropriées.
Ces pages peuvent comporter des graphiques et/ou du texte. Si
PaperPort est présent sur un ordinateur doté d’OmniPage Pro, les
services d’OCR de ce dernier étendent les fonctionnalités de PaperPort.
Pour choisir un programme d’OCR, cliquez avec le bouton droit sur le
lien PaperPort d’application de texte, sélectionnez Préférences, puis
spécifiez OmniPage Pro 14 en tant que programme d’OCR à utiliser.
À l’instar de Direct OCR, vous pouvez spécifier les réglages d’OCR de
votre choix.
Dans cet exemple, OmniPage Pro 14 a été sélectionné comme
programme d’OCR pour Word 2000. Par la suite, vous pouvez faire
glisser des images de page depuis le bureau PaperPort sur le lien Word de
PaperPort. Lors de la reconnaissance du texte, seule une jauge de
progression apparaît ; toutefois, l’utilisateur peut demander l’affichage
de la fenêtre de découpage en zones manuel ou de vérification
d’OmniPage Pro. Les résultats de l’OCR sont placés dans un nouveau
document sans titre de l’application cible.
:
56Traitement des documents
Chapitre 3
Traitement à l’aide de Batch Manager
Vous pouvez différer le traitement automatique des travaux, en planifiant leur
exécution à une heure précise. Chaque « travail planifié » porte sur un
document. Les pages de celui-ci peuvent provenir d’un scanner muni d’un
chargeur automatique (ADF) ou d’un fichier image. Lors du démarrage d’un
travail planifié, vous n’avez pas besoin d’être présent et OmniPage Pro ne doit
pas obligatoirement être actif. L’ordinateur doit simplement être allumé au
moment du lancement d’un travail différé, mais vous pouvez l’éteindre entre le
moment où le travail est créé dans Batch Manager et l’heure à laquelle débute le
traitement planifié. Si le travail en question implique une numérisation, votre
scanner doit être actif au moment du démarrage du travail et les pages
correspondantes doivent être placées dans le chargeur ADF. Pour configurer
votre premier travail planifié, procédez comme suit :
1. Cliquez sur Batch Manager... dans le menu Traitement ou dans le menu
Démarrer de Windows : sélectionnez Programmes!ScanSoft
OmniPage Pro 14.0!OmniPage Batch Manager. La fenêtre Batch
Manager apparaît. Étant donné qu’il s’agit du premier travail, l’Assistant
Flux de travail apparaît immédiatement.
2. Définissez un point de départ pour le nouveau travail. Il peut s’agir d’un
travail entièrement nouveau, d’un flux de travail existant ou d’un travail
existant (quand vous aurez créé des travaux). Cliquez sur Suivant pour
terminer chaque étape.
3. Les fenêtres qui apparaissent vous permettent de configurer le flux de
travail correspondant au travail, tel que décrit au Chapitre 6.
4. La dernière fenêtre vous permet de nommer le travail et de spécifier des
instructions de planification. Dans OmniPage Pro 14 Office, vous
pouvez choisir d’envoyer un e-mail de notification de fin d’exécution de
travail, créer des travaux récurrents et indiquer une heure de fin pour les
travaux provenant de dossiers surveillés.
5.
Cliquez sur Terminer pour confirmer la création du travail.
Traitement à l’aide de Batch Manager57
La fenêtre Batch Manager répertorie tous les travaux planifiés et indique leur état :
En attente, En cours, Surveillé, En pause ou Terminé. Sélectionnez Modifier... dans
le menu Édition pour modifier les réglages des travaux dont le statut est Non
planifié ou Terminé. Vous pouvez afficher, modifier et réutiliser les travaux
terminés pour traiter de nouveaux documents exigeant des réglages similaires. Vous
pouvez aussi supprimer les travaux terminés lorsque vous n’en avez plus besoin.
Pour plus de détails, reportez-vous à la rubrique Batch Manager dans l’aide en
ligne et à la section « Batch Manager », page 122 .
Définition de la source des images de page
Les images de page peuvent provenir des sources suivantes : fichier image ou
scanner. Il existe essentiellement deux types de scanner : à plat et à
alimentation feuille à feuille. Pour faciliter la numérisation des documents
multipages, un scanner peut être équipé d’un chargeur de feuilles
automatique (ADF). Les images des documents numérisés peuvent être soit
exportées directement dans OmniPage Pro, soit enregistrées avec le logiciel
du scanner au format de fichier image pour ouverture dans OmniPage Pro.
Importer des fichiers image
Vous pouvez créer un fichier image à partir de votre scanner, ou le recevoir
par e-mail ou par fax. La liste des types de fichier image compatibles avec
OmniPage Pro est très étendue. Voir « Types de fichier pour l’ouverture et
l’enregistrement des images », page 138. Sélectionnez Charger un fichier image dans la liste déroulante Importer page(s). Les fichiers figurent dans la
boîte de dialogue Charger un fichier image, qui apparaît au moment du
lancement d’un traitement automatique. Lors d’un traitement manuel,
cliquez sur le bouton Importer page(s) ou utilisez le menu Traitement. Les
réglages évolués proposés dans la partie inférieure de la boîte de dialogue
illustrée ci-dessous peuvent être affichés ou masqués selon vos préférences.
58Traitement des documents
Chapitre 3
Dossier
actuel.
Pour placer
plusieurs fichiers
dans la zone Nom
de fichier, utilisez
les séquences
Maj.+clic ou
Ctrl+clic.
Spécifiez le ou les
types de fichiers à
afficher.
Cette option est
destinée aux fichiers
TIFF, DCX, MAX et
PDF multipages.
Blank.tif est un
fichier vide destiné
à l’option
d’enregistrement
Un fichier après
chaque page
blanche.
Sélectionnez cette
option pour afficher
une vignette du fichier
sélectionné. Elle n’est
pas disponible
lorsque plusieurs
fichiers sont
sélectionnés.
Cliquez sur Évolué
pour afficher la
partie inférieure de la
fenêtre, et sur
Standard pour la
masquer.
Permet d’ajouter des
fichiers à partir de
plusieurs dossiers et
de contrôler avec
précision leur ordre
d’intégration.
Utilisez ces flèches pour modifier l’ordre des fichiers.
Lorsque vous intégrez un fichier avec le bouton Ajouter, il est placé en fin de
liste. Pour insérer un fichier à un emplacement différent, contrastez un
fichier dans la liste : le nouveau fichier sera ajouté immédiatement en dessous
du fichier contrasté le plus bas.
Avec OmniPage Pro Office, il est possible d’importer des fichiers depuis des
serveurs FTP ou depuis des sources Microsoft SharePoint ou ODMA.
La largeur ou la hauteur minimale que peuvent avoir les fichiers image est de
50 pixels. La largeur ou la hauteur maximale est de 71 cm. Pour connaître
toutes les limites en pixels, reportez-vous à l’aide en ligne.
Définition de la source des images de page59
Importer des documents à partir d’un scanner
Pour bénéficier de cette fonction, vous devez disposer d’un scanner pris en
charge, opérationnel et correctement configuré dans OmniPage Pro. Voir
« Configuration d’un scanner pour une utilisation avec OmniPage Pro »,
page 15. Le programme offre plusieurs modes de numérisation que vous
choisissez en fonction des deux facteurs suivants :
◆le type de graphique souhaité dans le document de sortie ;
◆le mode qui produira la reconnaissance la plus précise.
Numériser en noir et blanc
Sélectionnez cette option pour numériser vos documents en noir et blanc.
Cette option ne convient pas aux documents dont vous voulez conserver la
couleur en sortie ou dont vous souhaitez obtenir des photographies en noir
et blanc : (celles-ci nécessitent la numérisation en niveaux de gris). Pour de
meilleurs résultats de reconnaissance, utilisez cette option pour un texte noir
net sur fond blanc ou clair. La rapidité de numérisation et de traitement,
ainsi que le moindre espace disque occupé représentent les deux principaux
avantages de ce mode de numérisation par rapport aux deux autres.
Numériser en niveaux de gris
Sélectionnez cette option pour numériser vos documents en niveaux de gris.
Ce réglage convient notamment aux photographies en noir et blanc. Pour de
meilleurs résultats de reconnaissance, utilisez cette option pour les pages
présentant un contraste variable ou réduit (peu de différence entre les zones
claires et sombres) et un fond en couleur ou en dégradé.
Numériser en couleur
Sélectionnez cette option pour numériser vos documents en couleur. Elle
s’applique uniquement aux scanners couleur. Cette option est
particulièrement adaptée si vous souhaitez conserver les graphiques, le texte
et les fonds en couleur dans le document de sortie. La numérisation en
couleur offre une meilleure précision d’OCR que le mode en niveaux de gris
(pour une résolution donnée), mais exige des délais plus importants et une
plus grande quantité de mémoire et d’espace disque.
Luminosité et contraste
Les réglages de luminosité et de contraste influent considérablement sur la
précision de l’OCR. Vous définissez ces paramètres dans l’onglet Scanner de
la boîte de dialogue Options ou dans l’interface de votre scanner. Le
diagramme ci-dessous illustre le réglage de luminosité optimal. Dès le
60Traitement des documents
Chapitre 3
chargement d’une image, vérifiez son aspect. Si les caractères sont épais et
collés, augmentez la luminosité ; si les caractères apparaissent fins et partiels,
réduisez-la. Une fois les modifications requises effectuées, renumérisez la
page.
Inacceptable
Tolé ra bl e
Bonne
Optimale
Bonne
Tolé ra bl e
Inacceptable
Numériser avec un chargeur ADF
La meilleure méthode pour numériser des documents multipages est de faire
appel à un chargeur de feuilles automatique (ADF). Placez les pages dans
l’ordre requis dans le chargeur. Si vous souhaitez enregistrer votre document
dans plusieurs fichiers de sortie à l’aide de l’option Créer un fichier après chaque page blanche, insérez également des pages blanches dans la pile. Voir
« Enregistrement des résultats de l’OCR », page 98.
Si le document à traiter comporte un nombre de pages excédant la capacité
du chargeur ADF, sélectionnez l’option Demander automatiquement la suite des pages dans l’onglet Traitement de la boîte de dialogue Options. Une boîte
de dialogue vous invite à recharger l’ADF et signale la fin de la numérisation.
Un chargeur ADF accepte également la numérisation de pages recto verso. Si
votre scanner ne gère pas ce genre d’opération automatiquement,
Définition de la source des images de page61
sélectionnez l’option Numériser pages recto verso (onglet Scanner de la boîte
de dialogue Options). Cette option permet de numériser le document en
quelques passes en séparant les pages paires des pages impaires.
OmniPage Pro se charge de la fusion de l’ensemble des pages.
Numériser sans chargeur ADF
Même si vous ne disposez pas d’un chargeur ADF, vous pouvez utiliser votre
scanner à plat pour numériser efficacement des documents multipages à
l’aide de l’interface de numérisation d’OmniPage. Sélectionnez l’option
Numériser les pages automatiquement (onglet Scanner de la boîte de dialogue
Options) et définissez une valeur de pause en secondes. Ainsi le scanner
effectue les passes de numérisation automatiquement, en marquant une
pause de durée spécifiée entre chaque numérisation pour vous permettre de
charger la page suivante. Une boîte de dialogue vous donne la possibilité de
raccourcir ou de prolonger cette pause et de signaler la numérisation de la
dernière page.
Pour numériser deux pages à la fois d’un livre, sélectionnez Rechercher les doubles pages (onglet Traitement de la boîte de dialogue Options). Le
programme divise les images entrantes en deux pages et les corrige
indépendamment.
Définition de la mise en page du document
Avant de commencer la reconnaissance d’un document, OmniPage Pro vous
demande de décrire la mise en page de celui-ci dans le but de faciliter le
traçage automatique des zones. Cette fonction s’applique également en cas de
traitement automatique, à moins que vous n’ayez spécifié un gabarit ne
contenant aucune zone ou fond à valeur Traiter. Lors d’un traitement
manuel, le traçage de zones automatique est parfois activé. Reportez-vous à la
rubrique Activation du tracé de zones automatique de l’aide en ligne. Pour
décrire le document original, vous disposez des options suivantes :
Automatique
Choisissez cette option pour laissez à OmniPage Pro le soin d’effectuer le
découpage en zones automatique. Le programme détermine si l’élément est
du texte en colonnes, un graphique, du texte à reconnaître ou un tableau à
conserver. Choisissez l’option Automatique si le document contient des
62Traitement des documents
Chapitre 3
pages dont la mise en page est hétérogène ou de type inconnu. Sélectionnez
cette option pour une page à colonnes multiples et comportant un tableau, et
pour toutes pages comportant plus d’un tableau.
Colonne unique sans tableau
Choisissez cette option si les pages du document contiennent une seule
colonne de texte et aucun tableau, comme c’est le cas des circulaires et pages
de livre. Sélectionnez cette option pour une page dont les mots et nombres
sont agencés en colonnes et si vous ne souhaitez pas les placer dans un
tableau ni les séparer en plusieurs colonnes distinctes. Cette option permet la
détection des graphiques.
Colonnes multiples sans tableau
Choisissez cette option si certaines de vos pages contiennent du texte en
colonnes que vous souhaitez disposer sans colonnes ou dans des colonnes
distinctes (correspondant à la mise en page originale). Les colonnes peuvent
être conservées dans le document de sortie avec cadres (si l’option True Page
est sélectionnée au moment de l’exportation) ou sans cadres (si l’option Pages
en continu est activée). En cas de données tabulaires, celles-ci seront le plus
probablement traitées comme une colonne unique. Cette option permet la
détection des graphiques.
Colonne unique avec tableau
Choisissez cette option si vos pages contiennent une seule colonne de texte et
un tableau. La fonction de traçage de zones automatique n’essaie pas
d’identifier des colonnes mais de détecter un tableau et de le placer dans une
grille dans l’éditeur de texte. Vous pouvez spécifier par la suite si vous
souhaitez exporter le document sous la forme de grille ou de colonnes de
texte séparées par tabulation. Cette option permet la détection des
graphiques.
Feuille de calcul
Choisissez cette option si l’intégralité de la page se présente sous la forme
d’un tableau que vous souhaitez exporter dans une feuille de calcul ou en
tant que tableau unique. Les colonnes uniques et les graphiques ne sont pas
détectés.
Personnalisé
Choisissez cette option pour contrôler au maximum le déroulement du
traçage de zones automatique. Vous pouvez configurer la détection de
colonnes, de graphiques et/ou de tableaux. Sélectionnez les réglages requis
dans l’onglet OCR de la boîte de dialogue Options.
Définition de la mise en page du document63
Gabarit
Choisissez un fichier de gabarit de zones si vous souhaitez appliquer une
valeur de fond, avec ses zones et propriétés, à toutes les pages importées. Les
zones de gabarit sont également appliquées à la page actuelle, en
remplacement des zones existantes, ainsi qu’aux pages préexistantes sans
zones au moment de leur (nouvelle) reconnaissance. Voir « Utilisation des
gabarits de zones », page 73.
Si le découpage en zones automatique produit des résultats inattendus,
utilisez le traitement manuel pour redéfinir les zones sur les pages
individuelles et relancer leur reconnaissance.
Zones et fonds
Les zones définissent les sections de la page destinées à être traitées ou
ignorées. Elles peuvent prendre une forme rectangulaire ou irrégulière (avec
des côtés verticaux et horizontaux). Les images de page d’un document
possèdent une valeur de fond : Traiter ou Ignorer (cette dernière étant la plus
répandue). Vous pouvez utiliser les outils indiqués pour modifier les valeurs
de fond. Vous pouvez également utiliser les outils indiqués pour tracer des
zones sur les fonds de page :
Fonds
Zones
Tr a i t e r
Traiter Ignorer Texte Tableau Graphique
Tr ai te r – le document est découpé automatiquement en zones (dans les
zones ou les fonds de type Traiter) lors de son envoi pour reconnaissance.
Ignorer – les zones (dans les zones et fonds de type Ignorer) sont exclues du
traitement. Le texte n’est pas reconnu et aucune image n’est transférée.
Découpage en zones automatique
Le découpage en zones automatique permet au programme de détecter les
éléments de page (blocs de texte, en-têtes, images et autres) et de les inclure
dans une zone. OmniPage attribue des types et des propriétés à ces zones. Le
découpage en zones automatique s’applique aux pages entières dans le cas
d’un traitement automatique, sauf si vous avez chargé un gabarit. Un flux de
64Traitement des documents
Ignorer
Chapitre 3
travail peut contenir une étape de découpage en zones automatique. Vous
pouvez également spécifier le découpage en zones automatique dans le cadre
d’un traitement manuel, en procédant comme suit :
Découper automatiquement une page entière en zones
Importez une page ; celle-ci s’affiche avec un fond de type Traiter. Ne tracez
aucune zone et vérifiez dans la liste déroulante de description de la mise en
page qu’aucun gabarit de zones n’est chargé. Cliquez sur le bouton Exécuter
l’OCR. Vous pouvez sélectionner plusieurs pages sans zones afin de les
découper automatiquement et de les reconnaître.
Découper automatiquement en zones une partie de page
Importez une page ; celle-ci s’affiche avec un fond de type Traiter. Tracez une
zone. La valeur de fond passe à Ignorer. Tracez les zones Texte, Tableau ou
Graphique afin de délimiter manuellement les zones de type voulu. Tracez les
zones à valeur Traiter afin de délimiter les zones à affecter du traitement
automatique. À l’issue de la reconnaissance, les zones à valeur Traiter seront
remplacées par une ou plusieurs zones Texte, Tableau ou Graphique.
Découper automatiquement un fond de page en zones
Importez une page ; celle-ci s’affiche avec un fond de type Traiter. Tracez une
zone. La valeur de fond passe à Ignorer. Tracez les zones Texte, Tableau ou
Graphique afin de délimiter manuellement les zones de type voulu. Cliquez
sur l’outil Fond à valeur Traiter (voir illustration) afin de définir un fond de
ce type. Tracez des zones à valeur Ignorer sur les parties inutiles de la page. À
l’issue de la reconnaissance, la page réapparaît : elle comprend un fond à
valeur Ignorer et de nouvelles zones encadrant tous les éléments du fond.
Traçage de zones manuel
Cette section présente d’abord deux exemples relatifs aux zones et aux fonds,
décrit ensuite les types de zone, et enfin, indique les méthodes à appliquer
pour tracer et utiliser les zones. Pour ces exemples, les nombres renvoient au
tableau de la page suivante.
Zones et fonds65
Avant la
reconnaissance :
Tracer des zones sur un fond à valeur Ignorer :
Après la
reconnaissance :
Le fond conserve la
valeur Ignorer.
Tracer des zones sur un fond à valeur Traiter :
La zone 4
correspond
à un groupe
de zones,
permettant
en
l’occurrence
de gérer
trois
colonnes de
texte et une
photo.
Avant la
reconnaissance :
Après la
reconnaissance :
La valeur de fond
passe à Ignorer.
La zone 6 est
incluse dans le
fond.
Les zones
figurant dans
la partie
gauche de la
page ont été
créées
automatiquem
ent.
NuméroTypeRésultat
1Zone TexteL’OCR est exécuté et génère le texte.
2Zone TableauL’OCR est exécuté et le texte est placé dans
3Zone GraphiqueL’image est incorporée dans la page
4Zone à valeur
Traiter
5Fond à valeur
Traiter
6Zone à valeur
Ignorer
7Fond à valeur
Ignorer
une grille de tableau.
reconnue.
Le découpage en zones automatique crée
une ou plusieurs zones, leur attribue un type
et en traite le contenu.
Aucun résultat
66Traitement des documents
Chapitre 3
Les zones tracées automatiquement et les zones de gabarit ont des bordures
pleines :
Les zones tracées manuellement et les zones modifiées ont des bordures en
pointillés :
Aucun ordre de lecture n’est attribué aux zones. Vous pouvez réordonner les
éléments reconnus dans l’éditeur de texte. Voir « Édition du texte et des
images », page 88. Le chapitre 4 présente le traçage de zones « en direct ».
Voir « Édition en direct », page 91.
Types et propriétés de zone
Chaque zone est affectée d’un type, et les zones comportant du texte peuvent
également présenter un paramètre de contenu de zone : alphanumérique ou
numérique. Le type et le contenu d’une zone représentent les « propriétés de
la zone ». Pour modifier les propriétés d’une zone, cliquez dessus avec le
bouton droit pour afficher son menu contextuel et effectuez les sélections
souhaitées. Pour changer les propriétés de plusieurs zones simultanément,
sélectionnez le groupe de zones requis (combinaison Maj.+clic) avant de
choisir les nouvelles valeurs.
La barre d’outils Image propose cinq outils de traçage de zones (un pour
chaque type). Le type d’une zone est indiqué par l’icône placée dans son
angle supérieur gauche, ainsi que par la couleur de cette icône et celle de la
bordure de la zone. La liste ci-après indique les outils et les couleurs
disponibles :
Zone à valeur Traiter (bleu)
Cet outil permet de tracer une zone à valeur Traiter, afin de définir une
section qui sera soumise au traçage de zones automatique. À l’issue de la
reconnaissance, cette zone est remplacée par une ou plusieurs zones dont les
types sont déterminés automatiquement. Vous tracez normalement les zones
à valeur Traiter sur un fond à valeur Ignorer. Tracez une zone à valeur Traiter
pour entourer les colonnes de texte à traiter automatiquement. Le texte sera
affiché sous une seule colonne dans le mode Aucun formatage et Conserver
le formatage polices/paragraphes de l’éditeur de texte, mais les colonnes
seront conservées en mode True Page.
Zones et fonds67
Zone à valeur Ignorer (olive)
Cet outil permet de tracer une zone à valeur Ignorer, afin de définir une
section à ne pas transférer vers l’éditeur de texte. La fonction de découpage
en zones automatique omet ces zones pendant le traitement. Pour exclure
une section donnée d’un grand nombre de pages (par exemple, un en-tête ou
les numéros de page), placez une zone à valeur Ignorer dans un gabarit. Vous
tracez normalement les zones à valeur Ignorer sur un fond à valeur Traiter.
Zone Texte (marron)
Cet outil permet de tracer une zone Texte sur un bloc de texte unique. Le
contenu des zones est assimilé à un enchaînement de texte, sans aucune
colonne. Pour assurer le traitement automatique des colonnes de texte,
entourez-les d’une zone à valeur Traiter.
Zone Tableau (bleu)
Utilisez ce type pour traiter le contenu de la zone en tant que tableau. Les
grilles du tableau peuvent être détectées automatiquement ou placées
manuellement (voir la section suivante). Les zones de type Tableau doivent
être rectangulaires. L’éditeur de texte affiche le tableau dans une grille
éditable. Pour la plupart des types de fichier de sortie, vous pouvez exporter
le tableau sous la forme de grille ou de colonnes de texte séparées par
tabulation.
Zone Graphique (vert)
Utilisez ce type pour entourer une illustration, un diagramme, un dessin, une
signature et tout autre élément que vous souhaitez transmettre à l’éditeur de
texte en tant qu’image incorporée plutôt que texte reconnu. Les images
incorporées peuvent être exportées avec le document vers les applications
cibles supportant les graphiques.
68Traitement des documents
Les zones Texte et Tableau sont affectées d’un réglage de contenu. Le contenu
alphanumérique valide tous les caractères nécessaires pour votre sélection
linguistique. Le résultat de la reconnaissance d’une zone numérique comporte
uniquement des nombres et leur ponctuation. Toute lettre est ignorée. Le menu
contextuel de la zone vous permet de modifier ce réglage.
Pour afficher le menu contextuel correspondant à l’ensemble de l’image, cliquez
avec le bouton droit en dehors de toute zone. Les commandes de ce menu
permettent d’effectuer un zoom avant et arrière, et de faire pivoter l’image. La
rotation d’une image supprime toutes ses zones tracées.
Chapitre 3
Gestion des zones
La barre d’outils Image propose des outils d’édition des zones. Un des ces
outils est toujours sélectionné ; pour modifier la sélection en cours, cliquez
sur un autre outil. Certains de ces outils sont groupés. Dans ce cas, seul le
dernier outil sélectionné dans le groupe est visible. Pour sélectionner un outil
visible, cliquez dessus. Pour sélectionner un outil masqué, positionnez la
souris sur le triangle placé dans l’angle inférieur droit de l’outil visible,
appuyez sur le bouton de la souris et maintenez-le enfoncé jusqu’à ce que
d’autres outils apparaissent, puis cliquez sur l’outil voulu.
Tracer une zone unique
Sélectionnez l’outil de traçage de zone du type
voulu, puis cliquez et faites glisser le curseur.
Dans ces exemples, cette procédure est illustrée
par le déplacement de la flèche de A vers B. Vous
pouvez aussi effectuer ce mouvement de l’angle
supérieur gauche vers l’angle inférieur droit.
Vous pouvez uniquement tracer des zones rectangulaires ; les zones tracées (à
l’exception des zones Tableau) peuvent être converties en zones irrégulières.
Pour redimensionner une zone, sélectionnez-la (en cliquant dessus), amenez
le curseur sur un côté ou un angle, activez une poignée et amenez-la à
l’emplacement voulu. Elle ne peut pas recouvrir une autre zone.
Créer une zone irrégulière par addition
Tracez une zone recouvrant partiellement une autre zone du même type :
Zone existante
Nouvelle zone
Zone résultante
Zones et fonds69
Joindre deux zones du même type
Tracez une zone recouvrant une autre zone du même type.
Zones
existantes
Nouvelle
zone
Zone
résultante
Créer une zone irrégulière par soustraction
Tracez une zone recouvrant une autre zone du même type que le fond (dans
cet exemple, un fond à valeur Ignorer).
Zone
existante
sur un
fond à
valeur
Ignorer
Nouvelle
zone à
valeur
Ignorer
Zone
résultante
Diviser une zone
Tracez une zone divisant une autre zone du même type que le fond (dans cet
exemple, un fond à valeur Traiter).
Zones Texte
existantes
sur un fond
à valeur
Traiter
70Traitement des documents
Nouvelle
zone à
valeur
Traiter
Zones
résultantes
Les formes de zone suivantes sont interdites :
Chapitre 3
Retrait le
long de
la partie
inférieure
Retrait le long
de la partie
supérieure
Avec trou
Pour agrandir une zone plus rapidement qu’au moyen des poignées de
redimensionnement, entourez cette zone d’une zone du même type. La plus
petite des zones est remplacée par la plus grande. Pour remplacer un groupe
de zones (quel que soit le type) par une zone unique, entourez ces zones
d’une zone plus grande du type voulu. Les zones plus petites sont toutes
remplacées par la plus grande.
Lorsque la nouvelle zone tracée recouvre partiellement une zone existante
d’un type différent, une superposition complète ne se produit pas ; la
nouvelle zone remplace seulement la partie recouverte de la zone existante.
Pour plus de détails, reportez-vous à la rubrique Tracer des zones manuellement de l’aide en ligne.
Définition rapide de zones
Cette fonction vous permet de définir rapidement des zones manuelles.
Activez le curseur de sélection de zones, puis déplacez le curseur sur l’image
de page. Des parties ombrées apparaissent. Elles indiquent les zones détectées
automatiquement. Cliquez deux fois sur chaque partie ombrée pour la
transformer en zone. La définition rapide des zones est utile si vous souhaitez
traiter uniquement certaines parties d’une page. Pour des annonces classées,
par exemple, il vous suffit de cliquer deux fois sur les annonces qui vous
intéressent. La reste de la page sera ignoré.
Gestion des grilles du tableau dans l’image
À l’issue d’un traitement en mode automatique, OmniPage Pro peut placer
des zones de type Tableau sur la page traitée. Ces zones comportent une
icône de zone Tableau dans leur angle supérieur gauche. Vous pouvez
modifier le type affecté à une zone rectangulaire via son menu contextuel.
Vous pouvez également tracer des zones de type Tableau, mais elles doivent
toujours être rectangulaires.
Gestion des grilles du tableau dans l’image71
La création ou le déplacement des lignes de séparation verticales et
horizontales d’un tableau permet de déterminer l’emplacement de la grille
lors du placement du tableau dans l’éditeur de texte. Vous pouvez tracer ou
redimensionner une zone Tableau (à condition de conserver sa forme
rectangulaire) pour éliminer les colonnes ou les rangées inutiles des bords
extérieurs d’un tableau.
Chaque fois que la page actuelle comporte une zone de type Tableau, les cinq
outils de gestion de tableau de la barre d’outils Image deviennent actifs. Si
l’outil voulu n’est pas visible, cliquez sur le triangle placé dans l’angle
inférieur droit de l’outil visible pour afficher tous les outils, puis cliquez sur
l’outil voulu.
Utilisez les outils de tableau et leurs curseurs comme suit :
Insérer séparation de rangées
Cliquez sur cet outil puis sur l’emplacement dans la zone Tableau où vous
souhaitez placer une séparation de rangées. Évitez de placer des séparations
qui divisent un texte.
Insérer séparation de colonnes
Cliquez sur cet outil puis sur l’emplacement dans la zone Tableau où vous
souhaitez placer une séparation de colonnes.
Déplacer séparation
Cliquez sur cet outil et placez le curseur sur la séparation de rangées ou de
colonnes requise. Le curseur prend la forme d’une flèche double. Faites
glisser la séparation dans la direction souhaitée (sans dépasser les limites des
séparations voisines). Évitez de placer des séparations qui divisent un texte.
Supprimer séparation
Cliquez sur cet outil puis sur la séparation individuelle de rangée ou de
colonne à supprimer. Cette opération est utile pour éliminer une séparation
mal placée ou pour modifier l’apparence du tableau dans le document final.
Ainsi, vous pouvez regrouper deux colonnes de données en une seule en
supprimant leur trait de séparation.
Insérer/Supprimer les séparations
Cliquez sur cet outil, puis sur son icône de curseur à l’intérieur d’une zone
Tableau sans séparations. Les séparations sont détectées et placées
automatiquement. Pour les éliminer, placez le curseur dans un tableau avec
séparations et cliquez sur cet outil.
72Traitement des documents
Chapitre 3
Pour placer, déplacer ou supprimer une séparation dans la cellule actuelle
uniquement, utilisez la combinaison Ctrl+clic.
Vous pouvez spécifier le formatage de lignes pour les bordures et les grilles de
tableau à partir d’un menu contextuel. Vous disposerez de davantage
d’options d’édition des bordures et de fond dans l’éditeur de texte à l’issue de
la reconnaissance.
Utilisation des gabarits de zones
Un fichier de gabarit contient une valeur de fond de page, un groupe de
zones et leurs propriétés. Pour appliquer les zones d’un gabarit lors de la
reconnaissance, chargez un fichier de gabarit de zones via la liste déroulante
du bouton de description de la mise en page ou à l’aide du menu Outils.
Vous pouvez charger les gabarits créés par d’autres utilisateurs sur un
emplacement du réseau.
Lorsque vous chargez un gabarit, son fond et ses zones sont insérées :
◆Sur la page actuelle (les zones déjà insérées sont remplacées)
◆Sur toutes les pages importées par la suite
◆Sur les pages préexistantes envoyées pour (nouvelle) reconnaissance
sans aucune zone
En mode de traitement manuel, vous pouvez afficher et modifier les zones de
gabarit dans les deux premiers cas avant la reconnaissance.
En mode de traitement automatique, vous ne pouvez afficher et modifier les
zones de gabarit qu’après la reconnaissance.
En traitement par flux de travail, une étape de chargement d’un gabarit peut
être suivie par une étape de tracé manuel de zones. Vous pouvez ainsi afficher
les zones du gabarit afin de les modifier ou d’en ajouter avant de lancer la
reconnaissance.
Les gabarits acceptent les zones et les fonds à valeur Ignorer et Traiter. Par
conséquent, ils peuvent être très utiles pour définir les parties de la page
destinées au traitement à l’aide du découpage en zones automatique et les
parties à ignorer. Pendant la reconnaissance, vous pouvez remplacer les zones
ou les fonds à valeur Traiter par un groupe de zones plus petites, auxquelles
seront attribués des types de zones spécifiques.
Utilisation des gabarits de zones73
Enregistrer un gabarit de zones
Sélectionnez une valeur de fond et définissez les zones d’une page. Vérifiez
l’emplacement et les propriétés de ces zones. Cliquez sur Gabarit de zones
dans le menu Outils. Dans la boîte de dialogue affichée, sélectionnez
sur la page]
et cliquez sur Enregistrer ; entrez le nom voulu et le cas échéant,
[zones
un chemin d’accès différent. Sélectionnez un emplacement du réseau sur
lequel installer le fichier de gabarit que vous souhaitez partager. Cliquez sur
OK. Le nouveau gabarit de zones reste chargé.
Modifier un gabarit de zones
Chargez un gabarit et importez une image au moyen d’un traitement
manuel. Le zones de gabarit apparaissent sur l’image. Modifiez les zones et/
ou les propriétés selon vos besoins. Ouvrez la boîte de dialogue Fichiers de
gabarit de zones. Le gabarit actuel est sélectionné. Cliquez sur Enregistrer
puis sur Fermer.
Décharger un gabarit de zones
Sélectionnez une option non associée à un gabarit dans la liste déroulante de
description de la mise en page du document. Les zones du gabarit ne sont pas
supprimées de la page actuelle ou des pages existantes, mais le gabarit n’est
plus configuré pour utilisation lors des futurs traitements. Vous pouvez
également ouvrir la boîte de dialogue Fichiers de gabarit de zones,
sélectionner
[néant] et cliquer sur le bouton Définir comme actuel. Dans ce
cas, l’option de description de la mise en page reprend la valeur
Automatique.
Remplacer un gabarit de zones
Sélectionnez un autre gabarit dans la liste déroulante de description de la
mise en page, ou ouvrez la boîte de dialogue Fichiers de gabarit de zones,
sélectionnez le gabarit souhaité et cliquez sur le bouton Définir comme
actuel. Les zones du nouveau gabarit sont également appliquées à la page
actuelle, en remplacement des zones existantes ; elles s’appliquent également
comme indiqué ci-dessus.
Supprimer un gabarit de zones
Ouvrez la boîte de dialogue Fichiers de gabarit de zones. Sélectionnez un
gabarit et cliquez sur le bouton Supprimer. Notez que les zones déjà créées à
l’aide de ce gabarit ne sont pas supprimées. Les gabarits de zones peuvent
uniquement être supprimés depuis le système d’exploitation.
74Traitement des documents
Chapitre 3
Incorporer un gabarit de zones à un fichier OPD
Chargez le gabarit, puis cliquez sur le bouton Enregistrer dans la barre
d’outils Standard et sélectionnez le type de fichier Document OmniPage
(étendu). Si le fichier OPD est transféré vers un autre emplacement, le
gabarit est également transféré. Lorsque le fichier OPD étendu est ouvert
ultérieurement, le gabarit de zones inclus est affiché dans la boîte de dialogue
Gabarit de zones avec la mention
[incorporé]. Il peut être enregistré dans un
fichier de gabarit sous un nouveau nom, à un nouvel emplacement.
Les gabarits de zones sont disponibles en mode Direct OCR ainsi que dans
l’Assistant Flux de travail, et peuvent être utilisés lors de la création de travaux
Batch Manager.
Utilisation des gabarits de zones75
76Traitement des documents
Chapitre 4
Vérification et édition
Les résultats de la reconnaissance sont placés dans l’éditeur de texte. Il peut
s’agir d’un texte reconnu, de tableaux et de graphiques incorporés. L’éditeur
aux capacités d’affichage fidèle (« WYSIWYG ») offre les fonctions
énumérées ci-dessous et décrites en détail dans le présent chapitre :
◆Modes d’affichage de l’éditeur de texte
◆Vérification des résultats de l’OCR
◆Vérification du texte reconnu
◆Dictionnaires utilisateur
◆Langues
◆Apprentissage
◆Édition du texte et des images
◆Édition en direct
◆Lecture du texte à voix haute
Manuel d’utilisation d’OmniPage Pro77
Modes d’affichage de l’éditeur de texte
L’éditeur de texte affiche le texte reconnu et, en fonction de vos réglages,
signale les mots qui ont été considérés comme douteux pendant la
reconnaissance, en les soulignant d’une ligne ondulée.
◆Vert – Mots absents du dictionnaire : La reconnaissance est sûre,
mais ces mots ne se trouvent dans aucun dictionnaire actif
(standard, utilisateur ou spécialisé).
◆Bleu – Mots comportant un caractère douteux : Ces mots
contiennent des caractères non reconnus ; ils peuvent également
figurer dans un dictionnaire, mais contiennent des caractères pour
lesquels la reconnaissance n’est pas aussi sûre.
◆Rouge – Mots douteux : Ces mots, vraisemblablement absents du
dictionnaire, contiennent au moins un caractère douteux. Le
problème peut cependant être imputable à une autre raison.
Vous pouvez activer ou désactiver les marques des mots absents du
dictionnaire dans l’onglet Vérification de la boîte de dialogue Options. Les
marques peuvent être affichées ou masquées selon les options sélectionnées
dans l’onglet Éditeur de texte de cette même boîte. Vous pouvez également
afficher ou masquer les caractères non imprimables et les indicateurs d’entête et de bas de page. L’onglet Éditeur de texte permet aussi de définir l’unité
de mesure du programme et de configurer le retour à la ligne automatique
dans tous les modes de l’éditeur de texte, à l’exception du mode Sans
Formatage.
78Vérification et édition
OmniPage Pro 14 peut afficher les pages selon trois niveaux de formatage.
Pour passer d’un niveau à l’autre, sélectionnez l’un des trois boutons présents
dans l’angle inférieur gauche de l’éditeur de texte ou utilisez le menu
Affichage. Les graphiques et les tableaux sont compatibles avec tous les
modes disponibles. Les modes de l’éditeur disponibles présentent les
caractéristiques suivantes :
Aucun formatage
Pour afficher le texte en une seule colonne alignée à gauche et appliquer un
seul style et corps de police, tout en conservant les sauts de ligne de l’original.
La plupart des boutons et des boîtes de dialogue de formatage sont désactivés.
Les règles ne sont pas affichées. Ce mode s’avère généralement utile pour la
vérification et l’édition du texte.
Chapitre 4
Conserver le formatage polices/paragraphes
Pour afficher le texte en une seule colonne et appliquer des styles de police et
de paragraphe. La règle horizontale est affichée. Ce mode s’avère
généralement utile pour la vérification et l’édition du texte et des styles
utilisés.
Tru e Pa ge
Le mode True Page
document original. Les styles de caractère et de paragraphe sont conservés et
tous les éléments de page, y compris les colonnes, sont placés dans des blocs
et des cadres. L’ordre de lecture peut être indiqué par des flèches (voir à partir
de la page 88).
Le niveau de formatage pour l’exportation est choisi séparément au moment
de l’exportation.
®
permet de conserver au maximum le formatage du
Vérification des résultats de l’OCR
À l’issue de la reconnaissance d’une page, les résultats de l’opération
apparaissent dans l’éditeur de texte. La vérification démarre
automatiquement si l’option correspondante a été activée dans l’onglet
Vérification de la boîte de dialogue Options. Vous pouvez également lancer
manuellement la vérification à n’importe quel moment. Procédez comme
suit :
1. Cliquez sur l’outil Vérifier l’OCR dans la barre d’outils Standard ou
choisissez Vérifier l’OCR dans le menu Outils.
2. La vérification démarre au début du document, mais omet le texte déjà
vérifié. Si un mot douteux est détecté, la boîte de dialogue Vérification
de l’OCR affiche ce mot dans son contexte, assorti de l’image originale
correspondante.
Vérification des résultats de l’OCR79
Raison pour laquelle
le mot est marqué.
Fenêtre d’édition :
Le mot marqué est
affiché en couleur
(rouge, bleu ou vert).
Cette fenêtre affiche la
partie correspondante
dans l’image
originale. Cliquez
dedans pour agrandir
ou réduire l’affichage.
L’image du mot
douteux est
contrastée.
Si le mot comporte
un tiret, les deux
parties du mot
apparaissent.
Pour
redimensionner
la boîte de
dialogue, faites
glisser un angle
ou le bord
inférieur.
3. Si le mot reconnu est correct, cliquez sur Ignorer ou Ignorer tout pour
passer au mot douteux suivant. Cliquez sur Ajouter pour l’ajouter au
dictionnaire utilisateur actuel et passer au mot douteux suivant.
4. Si le mot reconnu est erroné, tapez la version correcte dans la fenêtre
d’édition ou sélectionnez une suggestion du dictionnaire. Cliquez sur
Remplacer ou Remplacer tout pour valider votre correction et passer au
mot douteux suivant. Cliquez sur Ajouter pour ajouter le mot corrigé au
dictionnaire utilisateur actuel et passer au mot douteux suivant.
80Vérification et édition
5. Au fur et à mesure que les mots douteux affichés dans l’éditeur de texte
sont vérifiés, les marques de couleur les accompagnant disparaissent.
Lors de la vérification, vous pouvez passer à la fenêtre de l’éditeur de
texte pour y effectuer les corrections requises. Pour relancer la
vérification, utilisez le bouton Reprendre. Cliquez sur Page prête pour
passer à la page suivante ou sur Fermer pour arrêter la vérification avant
d’atteindre la fin du document.
OmniPage Pro 14 Office permet de vérifier les documents « à la voix ». Voir
« Reconnaissance vocale », page 129. Les suggestions proposées par le
module de vérification sont numérotées. Prononcez le numéro
correspondant à la suggestion que vous souhaitez accepter.
Chapitre 4
La vignette de toute page entièrement vérifiée porte l’icône de vérification
dans le gestionnaire de documents.
Si vous avez masqué les marques dans l’éditeur de texte au lancement de la
vérification ou activé l’option Rechercher prochain mot douteux, les marques
apparaissent et restent affichées après la vérification.
Si l’option Marquer les mots absents des dictionnaires est désactivée dans l’onglet
Vérification de la boîte de dialogue Options, la vérification signale uniquement les
mots marqués en rouge ou en bleu, mais non les mots absents des dictionnaires.
Cette fonction est utile pour les pages qui contiennent un fort pourcentage de mots
absents des dictionnaires, par exemple, des catalogues de produits avec codes et des
bibliographies avec noms propres.
L’option Revérifier la page actuelle du menu Outils permet de lancer une nouvelle
vérification orthographique sur une page déjà vérifiée. Vous pouvez ainsi contrôler
les mots qui ont été tapés ou collés dans l’éditeur de texte après la vérification.
Cette fonction s’applique même si l’option Marquer les mots absents des dictionnaires
est désactivée dans l’onglet Vérification.
Vérification du texte reconnu
Une fois la reconnaissance d’une page effectuée, vous pouvez comparer tout
élément du texte reconnu avec la partie correspondante de l’image originale
afin de contrôler la précision de l’opération. Procédez comme suit :
Action requiseSéquence utilisée
Activer le vérificateurF9 ou outil Vérificateur
Désactiver le vérificateurÉchap, F9 ou outil Vérificateur
Activer/désactiver temporairement le
vérificateur
Afficher le vérificateur jusqu’au prochain
appui sur une touche
Zoom avantAlt + Num + ou cliquer dans le vérificateur
Zoom arrièreAlt + Num – ou cliquer dans le vérificateur
Définir le mode du vérificateur :
dynamique ou ancré/flottant
Contexte dynamique (faire défiler
3 valeurs)
F8 : appuyer et maintenir la touche
enfoncée
Double-cliquer sur le mot
Alt + Num /
Alt + Num *
Vérification du texte reconnu81
Passez de
flottant à ancré
(et inversement)
Éditeur de texte
L’outil Vérificateur se trouve dans la barre d’outils de formatage. Vous
pouvez également l’activer/le désactiver à partir du menu Outils. Placez le
curseur sur la fenêtre du vérificateur pour afficher sa barre d’outils. Utilisez
cet outil pour effectuer les opérations suivantes :
Barre d’outils
du vérificateur :
Zoom avant/
arrière
Outil Vérificateur (activé/désactivé)
Pour activer le mode flottant ou
ancré (rétablissement du dernier
mode activé)
Mode dynamique
Quel niveau de contexte pour le
vérificateur dynamique ?
• Un mot
• Trois mots (le mot actuel + le mot
précédent et le mot suivant)
• Ligne d’image complète
82Vérification et édition
Il est conseillé de vérifier l’OCR et contrôler le texte reconnu avant de procéder à
une édition importante. Si vous coupez et collez de grands fragments de texte, les
liens entre les mots et l’image originale peuvent être perdus.
Une autre manière de contrôler les résultats de l’OCR consiste à utiliser le module
de synthèse vocale d’OmniPage Pro afin d’obtenir une lecture à voix haute du texte
reconnu. La lecture peut porter sur les lettres, les mots, les lignes ou les phrases ou
s’effectuer sur l’ensemble de la page. Reportez-vous à la section « Lecture du texte à
voix haute », page 92.
Chapitre 4
Dictionnaires utilisateur
OmniPage Pro est livré avec des dictionnaires en plusieurs langues qui
facilitent la reconnaissance et peuvent proposer des suggestions pendant la
vérification de l’OCR. Ces dictionnaires intégrés peuvent être remplacés par
des dictionnaires créés par l’utilisateur. Vous pouvez enregistrer plusieurs
dictionnaires utilisateur, mais ne pouvez charger qu’un seul dictionnaire à la
fois. Le dictionnaire Personnalisé est le dictionnaire utilisateur par défaut de
Microsoft Word.
Ouvrir un dictionnaire utilisateur
Cliquez sur Ajouter dans la boîte de dialogue Vérification de l’OCR (aucun
dictionnaire utilisateur n’étant chargé), ou ouvrez la boîte de dialogue Fichiers
de dictionnaire utilisateur à partir du menu Outils et cliquez sur Nouveau. Un
message vous demande de nommer le dictionnaire.
Charger ou décharger un dictionnaire utilisateur
Réalisez ces opérations depuis l’onglet OCR de la boîte de dialogue Options
ou à partir de la boîte de dialogue Fichiers de dictionnaire utilisateur. Pour le
chargement, sélectionnez un fichier dictionnaire ; pour le déchargement,
sélectionnez
les répertoires concernés.
[néant]. Pour sélectionner vos fichiers dictionnaires, parcourez
Éditer ou supprimer un dictionnaire utilisateur
Pour ajouter des mots à un dictionnaire utilisateur, chargez-le et cliquez sur
Ajouter dans la boîte de dialogue Vérification de l’OCR. Vous pouvez
ajouter et supprimer des mots en cliquant sur Édition dans la boîte de
dialogue Fichiers de dictionnaire utilisateur. Lors de l’édition d’un
dictionnaire utilisateur, vous pouvez optimiser l’opération d’ajout de
nouveaux mots en important la liste des mots requis à partir d’un fichier
texte standard. Chaque mot doit être placé sur une ligne séparée et il ne doit
être ni précédé ni suivi d’aucun signe de ponctuation. Le bouton Supprimer
vous permet de supprimer le dictionnaire utilisateur sélectionné de la liste.
Pour incorporer un dictionnaire utilisateur à un document OmniPage,
chargez-le et enregistrez-le au format Document OmniPage (étendu).
Lorsque vous chargez un fichier OPD auquel un dictionnaire utilisateur a été
incorporé, ce dernier apparaît dans la liste des dictionnaires utilisateur
disponibles, avec la mention
sous un nouveau nom.
[incorporé]. Vous pouvez l’éditer et l’enregistrer
Dictionnaires utilisateur83
Langues
OmniPage Pro peut reconnaître plus de 110 langues dans trois alphabets :
latin, grec et cyrillique. La liste des langues prises en charge est disponible
dans l’onglet OCR de la boîte de dialogue Options. Cette liste distingue les
langues disposant d’un dictionnaire. Vous trouverez également la liste de ces
langues sur le site Web de ScanSoft.
En plus des dictionnaires utilisateur, le programme propose, pour certaines
langues, des dictionnaires spécialisés (dans l’immédiat, domaines médical,
juridique et financier). Reportez-vous à la liste et effectuez les sélections
voulues dans l’onglet OCR de la boîte de dialogue Options.
Le programme identifie la langue utilisée pour les textes reconnus et l’affiche dans
la barre d’état. Ces sélections de langue sont exportées avec le document. Pour
modifier la langue du texte sélectionné, utilisez la commande Sélectionner langue
du menu Outils. Cette option n’a aucune incidence sur les langues de
reconnaissance spécifiées.
Apprentissage
L’apprentissage correspond à la procédure permettant de modifier les
solutions d’OCR attribuées aux caractères de l’image. Cette fonction est utile
pour les documents présentant une dégradation uniforme ou un type de
police inhabituel dans la totalité de leur contenu. Elle ne produit pas d’aussi
bons résultats dans les documents présentant des déformations ponctuelles et
variées. L’exemple ci-dessous s’appuie sur les différentes impressions de la
lettre «g»:
84Vérification et édition
Les deux premiers exemples n’exigent pas l’apprentissage, car les formes de la
lettre « g » utilisées sont normales et le programme peut les traiter sans
problème. Le troisième exemple pourrait bénéficier de l’apprentissage, parce
que la forme de la lettre « g » utilisée est inhabituelle et que toutes les instances
de celle-ci dans le texte auront probablement le même aspect. Le quatrième
exemple ne convient pas à l’utilisation de l’apprentissage, étant donné que la
Chapitre 4
première instance de la lettre « g » est partiellement imprimée et qu’il est peu
probable que cette forme se répète dans le document.
OmniPage Pro 14 propose deux types d’apprentissage : manuel et
automatique (via IntelliTrain). Les données provenant des deux types
d’apprentissage sont combinées et vous pouvez les enregistrer dans un fichier
d’apprentissage.
Lorsque vous fermez une page pour laquelle des données d’apprentissage ont
été générées, le programme vous demande de spécifier la manière de les
appliquer aux autres pages existantes du document.
Apprentissage manuel
Pour lancer un apprentissage manuel, placez le point d’insertion devant le
caractère à ajouter ; vous pouvez aussi sélectionner un groupe de caractères
(un mot maximum) et choisir Nouveau caractère dans le menu Outils ou le
menu contextuel. Une vue agrandie des caractères à ajouter s’affiche, assortie
de la solution d’OCR actuelle. Remplacez-la par la solution voulue et cliquez
sur OK. Le programme accepte cet apprentissage et examine le reste de la
page. S’il trouve des mots susceptibles d’être modifiés, il les affiche dans la
boîte de dialogue Vérification de l’apprentissage. Vous devrez recommencer
l’apprentissage des mots incorrects avant de valider la liste.
Pour plus de détails sur les boîtes de dialogue Nouveau caractère et
Vérification de l’apprentissage, reportez-vous à l’aide contextuelle ou à la
rubrique Apprentissage manuel de l’aide en ligne et à ses rubriques connexes.
IntelliTrain
IntelliTrain représente une nouvelle forme d’apprentissage automatisé,
capable de mémoriser les corrections effectuées par l’utilisateur lors de la
vérification de l’OCR. Lorsque vous effectuez une modification, IntelliTrain
retient la forme du caractère concernée et la correction apportée. Par la suite
le module parcourt le document à la recherche des formes de caractère
Apprentissage85
OmniPage Pro interprète
ce mot en tant que
intcrnationalc.
Lors de la vérification,
vous l’avez remplacé par
internationale.
similaires, notamment parmi les mots douteux, et évalue la pertinence de la
correction de l’utilisateur.
Le module IntelliTrain peut être activé et désactivé via l’onglet OCR de la
boîte de dialogue Options.
L’illustration ci-dessous explique le fonctionnement d’IntelliTrain. Cet
exemple porte sur les lettres « c » et « e ». Avec certaines polices et dans
certaines conditions de numérisation, la ligne horizontale de la lettre e risque
de devenir très fine et d’entraîner des erreurs de reconnaissance,
qu’IntelliTrain se chargera de corriger.
IntelliTrain retient la
forme et la corrige :
Cette lettre n’est
e
pas un « c »,
mais un « e ».
IntelliTrain remplace :
contcnu par contenu
souvcnt par souvent
Asic par Asie
et ainsi de suite.
86Vérification et édition
IntelliTrain conserve les données d’apprentissage générées par l’opération et
les ajoute, le cas échéant, à l’apprentissage manuel que vous avez effectué.
Vous pouvez les enregistrer dans un fichier d’apprentissage pour réutilisation
avec des documents similaires.
Chapitre 4
Fichiers d’apprentissage
Si vous souhaitez que le programme vous demande d’enregistrer les données
d’apprentissage non sauvegardées à la fermeture d’un document, sélectionnez
l’option correspondante dans l’onglet Vérification de la boîte de dialogue
Options. Les données d’apprentissage non enregistrées sont stockées dans un
document OmniPage. Si vous n’enregistrez pas le document dans un fichier
OPD, tout apprentissage non enregistré est éliminé lorsque vous fermez le
document. Pour incorporer un fichier d’apprentissage à un fichier OPD,
chargez-le et enregistrez le fichier au format Document OmniPage (étendu).
Vous pouvez enregistrer des données d’apprentissage dans un fichier, ainsi
que charger, éditer et décharger des fichiers d’apprentissage via la boîte de
dialogue Fichiers d’apprentissage. Ouvrez cette fenêtre à partir de l’onglet
Vérification de la boîte de dialogue Options ou depuis le menu Outils. Le
programme propose un emplacement par défaut, mais vous pouvez spécifier
un chemin différent, sur un réseau local, par exemple, afin de partager vos
fichiers d’apprentissage avec d’autres utilisateurs.
Cette mention apparaît
lorsque vous chargez un
fichier OPD dans lequel un
fichier d’apprentissage a
été incorporé. Vous pouvez
l’éditer et l’enregistrer sous
un nouveau nom.
Pour l’enregistrer sous
un nouveau nom,
sélectionnez-le, cliquez sur
Enregistrer et entrez le
nouveau nom.
Sélectionnez cette entrée
pour décharger un
fichier d’apprentissage.
Cliquez sur cette
option pour éditer
le fichier
d’apprentissage
dans la boîte de
dialogue
Modification du
fichier
d’apprentissage.
Ce bouton permet
aussi d’enregistrer de
nouvelles données
d’apprentissage dans
le fichier chargé. Ce
fichier est le suivant :
<Nom de fichier>
[modifié]
Des données d’apprentissage non enregistrées peuvent être éditées dans la
boîte de dialogue Modification du fichier d’apprentissage ; un astérisque
s’affiche dans la barre de titre à la place du nom de fichier. Les données ne
sont pas sauvegardées à la fermeture de la boîte de dialogue Modification du
fichier d’apprentissage. Enregistrez-les dans la boîte de dialogue Fichiers
d’apprentissage.
Apprentissage87
Vous pouvez également éditer un fichier d’apprentissage ; dans ce cas, son
nom apparaît dans la barre de titre. Si des données d’apprentissage non
enregistrées ont été ajoutées au fichier, son nom est accompagné d’un
astérisque. Les données d’apprentissage non enregistrées et modifiées sont
sauvegardées à la fermeture de la boîte de dialogue.
La boîte de dialogue Modification du fichier d’apprentissage affiche des
cadres comportant une forme de caractère et la solution d’OCR qui lui est
assignée. Cliquez sur un cadre pour le sélectionner. Vous pouvez ensuite le
supprimer à l’aide de la touche Suppr ou modifier la solution proposée. Pour
passer au cadre précédant ou suivant, utilisez les touches fléchées.
Vous éditez des données
d’apprentissage non
enregistrées.
Ce cadre est grisé car il a
été supprimé. Pour annuler
sa suppression, resélectionnez-le et appuyez sur la
touche Suppr. Les caractères marqués en tant que
supprimés ne sont effacés
qu’à la fermeture de la
boîte de dialogue.
Cliquez deux fois sur
un cadre ou appuyez
sur Entrée pour
modifier la solution
d’OCR associée.
Tapez la nouvelle
solution dans la zone
de texte qui s’affiche
et appuyez sur
Entrée. Les
assignations
Ce cadre est sélectionné. La partie supérieure
affiche la forme provenant de l’image. La
partie inférieure affiche la solution d’OCR
proposée.
modifiées
apparaissent en
rouge.
Édition du texte et des images
L’éditeur de texte d’OmniPage Pro est doté de capacités d’affichage fidèles
(« WYSIWYG »), et ses fonctions d’édition sont très proches des possibilités
offertes par les applications de traitement de texte les plus courantes.
Édition de caractères
Les modes de l’éditeur autres que le mode Sans Formatage permettent de
modifier le type, le corps et les attributs (gras, italique, souligné) de la police
appliqués au texte sélectionné. Utilisez la barre d’outils de formatage ou la
boîte de dialogue Police accessible par le biais du menu Format. (Cette boîte
de dialogue offre également les options d’indice, d’exposant et de texte/fond
de couleur.)
88Vérification et édition
Chapitre 4
En mode Aucun formatage, vous pouvez utiliser la barre d’outils de
formatage pour spécifier un seul type et une seule taille de police à appliquer
à l’ensemble du document. Ce réglage n’est pas utilisé pour l’exportation, ni
transmis aux autres modes ; ceux-ci gardent leurs anciens paramètres.
Ouvrez la boîte de dialogue Mappage des polices (via l’onglet OCR de la
boîte de dialogue Options) avant d’effectuer la reconnaissance pour spécifier
les polices à utiliser dans les textes affichés dans l’éditeur de texte.
Édition de paragraphes
Les modes de l’éditeur autres que le mode Sans Formatage permettent de
modifier l’alignement des paragraphes sélectionnés et de les formater avec des
puces. Utilisez la barre d’outils de formatage ou la boîte de dialogue
Paragraphe accessible depuis le menu Format. Cette boîte de dialogue
permet de modifier le retrait, l’interligne et l’espacement des paragraphes.
Grâce à la règle horizontale de l’éditeur de texte, vous pouvez définir les
emplacements de retrait et de tabulation en toute facilité. Les options de
tabulation évoluées peuvent être spécifiées dans la boîte de dialogue
Tabulations (accessible depuis le menu Format). Les paragraphes numérotés
et les listes à puces peuvent être détectés et édités.
Styles de paragraphe
Les styles de paragraphe présents dans un document sont détectés
automatiquement pendant la reconnaissance. Une liste des styles est créée et
présentée dans une boîte de sélection dans la partie gauche de la barre
d’outils de formatage. Cette liste permet d’attribuer un style aux paragraphes
sélectionnés. Pour renommer/modifier un style ou pour définir un nouveau
style, utilisez la boîte de dialogue Style (accessible depuis le menu Format).
Lors de l’enregistrement d’un document dans un fichier, vous pouvez
exporter également ses styles de paragraphe. Cette option est disponible
uniquement si l’application cible supporte les styles de paragraphe.
Graphiques
Pour éditer des zones graphiques dans OmniPage Pro, votre ordinateur doit
être équipé d’un éditeur d’image. Choisissez la commande Éditer l’image
dans le menu Outils. Cette sélection active l’éditeur d’image associé au
format BMP sur votre système Windows et charge le graphique. Modifiez le
graphique, puis fermez l’éditeur d’image pour réintégrer le graphique dans
l’éditeur de texte. Ne modifiez pas la taille, la résolution ou le type de
graphique, car ces actions empêchent la réintégration.
Édition du texte et des images89
Ta bl ea ux
Les tableaux s’affichent dans l’éditeur de texte sous forme de grilles. Pour
modifier un tableau, placez le curseur dans une zone de type Tableau ; il
change d’aspect et vous pouvez déplacer les traits de la grille. Vous pouvez
également utiliser les règles de l’éditeur de texte. Modifiez l’emplacement du
texte dans les cellules d’un tableau à l’aide des boutons d’alignement de la
barre d’outils de formatage et des commandes de tabulation de la règle. Lors
de l’enregistrement du document dans certains types de fichiers spécifiques,
vous pouvez exporter les tableaux en tant que grilles ou colonnes séparées par
des tabulations ou par des espaces.
Hyperliens
Les adresses de courrier électronique et celles des pages Web peuvent être
détectées et placées en tant que liens dans le texte reconnu. Pour éditer un
lien existant ou en créer un nouveau, choisissez Hyperlien dans le menu
Format. Ce nouveau lien peut renvoyer à une page Web ou à un fichier. Pour
supprimer un lien, utilisez le menu contextuel. La détection des hyperliens
peut être activée et désactivée via l’onglet Traitement de la boîte de dialogue
Options.
Édition dans True Page
Les éléments de page sont placés dans des blocs de texte, de tableau et
d’image, correspondant généralement aux zones Texte, Tableau et Graphique
dans l’image. Cliquez dans un élément pour afficher la bordure du bloc ; la
couleur est identique dans les zones correspondantes. La rubrique True Pa ge
de l’aide en ligne propose des détails sur les opérations décrites ci-après.
90Vérification et édition
Les cadres ont des bordures grises et contiennent au moins un bloc. Ils sont
placés lorsqu’une bordure visible est détectée dans une image. Vous pouvez
définir les bordures et les dégradés d’un cadre et d’un tableau au moyen du
menu contextuel ou de la commande Tableau du menu Format. Pour
spécifier le dégradé d’un bloc de texte, utilisez le menu contextuel. Pour
afficher un menu contextuel, cliquez avec le bouton droit de la souris dans
un élément autre qu’un mot marqué.
Les zones multicolonnes présentent des bordures roses et contiennent au
moins un bloc. Détectées automatiquement, elles indiquent le texte qui sera
traité comme un enchaînement de colonnes au moment de l’exportation
avec le niveau de formatage Pages en continu. Les menus contextuels
permettent de dégrouper les cadres et les zones multicolonnes afin de
modifier leurs éléments. Vous pouvez aussi grouper les éléments en cadres ou
en zones multicolonnes.
Chapitre 4
L’ ordre de lecture peut être affiché et modifié. Pour visualiser les flèches
indiquant cet ordre, cliquez sur l’outil Afficher ordre de lecture dans la barre
d’outils de formatage. Cliquez de nouveau pour supprimer les flèches.
Pour remplacer la barre d’outils de formatage par un groupe de boutons de
réagencement, cliquez sur l’outil Changer l’ordre de lecture. Leur utilisation
est décrite dans l’aide contextuelle et dans la rubrique Ordre de lecture de
l’aide en ligne. L’ordre est modifié dans les fenêtres Aucun formatage et
Conserver le formatage polices/paragraphes. Ce changement modifie le
mode de déplacement du curseur dans la page, lorsque le document est
exporté au format True Page.
Édition en direct
Cette fonction vous permet de modifier une page reconnue par un nouveau
découpage de zones, sans devoir traiter une nouvelle fois la page entière.
Lorsque l’édition en direct est activée, les changements de zone (suppression,
définition, redimensionnement, changement de type) s’appliquent
immédiatement à la page reconnue. De même, lorsque vous modifiez des
éléments dans la fenêtre True Page de l’éditeur de texte, les changements
effectués sont répercutés sur les zones de la page. Vous pouvez aussi utiliser le
découpage en zones « en direct » sur les pages non reconnues.
Deux outils liés de la barre d’outils Image contrôlent le découpage en zones
en direct. L’un de ces outils est toujours actif lorsque aucune reconnaissance
n’est en cours.
Cliquez sur ce bouton pour activer l’édition en direct. La couleur rouge
indique qu’aucune modification de découpage en zones n’est stockée.
Cliquez sur ce bouton pour désactiver l’édition en direct. Les modifications
apportées au découpage en zones sont stockées et l’outil affiche la couleur
verte. Pour appliquer ces modifications, effectuez l’une des opérations
suivantes :
Cliquez sur l’outil d’édition en direct doté de la couleur
verte. Les modifications apportées au découpage en zones
sont répercutées dans l’éditeur de texte.
Cliquez sur le bouton Exécuter l’OCR pour reconnaître
la page entière, avec les changements de zone.
Édition en direct91
Pour plus de détails sur le traitement des changements dans le cadre du
découpage de zones en direct, ainsi que sur leur effet dans les fenêtres de
l’éditeur de texte, reportez-vous à la rubrique Traitement en direct dans l’aide
en ligne.
Lecture du texte à voix haute
La fonction de lecture du texte reconnu RealSpeakTM de ScanSoft est avant
tout destinée aux personnes malvoyantes ; toutefois, elle peut également
faciliter les processus de vérification de l’OCR et de contrôle du texte
reconnu à tout utilisateur d’OmniPage Pro. La lecture à voix haute est
contrôlée par les mouvements du point d’insertion dans l’éditeur de texte
(via la souris ou le clavier).
Modalités de lectureTouches utilisées
Un seul caractère à la fois, lecture avant ou arrière
Mot actuelCtrl + Cinq du bloc numérique (1)
Mot suivant vers la droiteCtrl + flèche Droite
Mot suivant vers la gaucheCtrl + flèche Gauche
Une lignePlacez le point d’insertion dans la ligne
Ligne suivanteFlèche Bas
Ligne précédenteFlèche Haut
Phrase actuelleCtrl + Cinq du bloc numérique (2)
Depuis le point d’insertion jusqu’à la fin de la phrase Ctrl + Cinq du bloc numérique (6)
Depuis le début de la phrase jusqu’au point
d’insertion
Page actuelleCtrl + Cinq du bloc numérique (3)
Depuis le début de la page actuelle jusqu’au point
d’insertion
Depuis le point d’insertion jusqu’à la fin de la page
actuelle
Page précédente, suivante ou la page de votre
choix
Caractères saisis
Flèche Droite ou Gauche. Les noms de lettre,
de nombre et de signe de ponctuation sont
prononcés.
Ctrl + Cinq du bloc numérique (4)
Ctrl + Début
Ctrl + Fin
Ctrl + PgPrec, PgSuiv ou boutons de navigation
Chaque caractère saisi est prononcé
individuellement, y compris les signes de
ponctuation.
92Vérification et édition
Chapitre 4
La fonction de synthèse vocale est activée ou désactivée via la commande
Mode synthèse vocale du menu Outils ou via la touche F5. Le sous-menu
Réglages de synthèse vocale… permet de sélectionner le type de voix
(masculine ou féminine dans une langue donnée) et de configurer le débit et
le volume de la lecture. Vous devez vous assurer que la langue sélectionnée
correspond au texte que vous souhaitez écouter.
Les trois touches principales utilisées pour la lecture à voix haute sont
regroupées sur le bloc numérique.
+
1 2 3
Pour lire
le mot
actuel
Pour lire
la phrase
actuelle
Pour lire
la page
actuelle
Vous disposez également des séquences clavier suivantes :
Action requiseSéquence utilisée
Interrompre/ReprendreCtrl + Cinq du bloc numérique (5)
Augmenter le débitCtrl + Signe plus du bloc numérique (+)
Réduire le débitCtrl + Signe moins du bloc numérique (-)
Rétablir le débitCtrl + Astérisque du bloc numérique (*)
Le programme RealSpeak devrait être proposé dans les langues suivantes :
français, anglais (britannique et américain), allemand, hollandais, italien,
espagnol, portugais (du Brésil) et suédois. Pour obtenir les dernières
informations à ce sujet, consultez le fichier ReadMe/LisezMoi. Tous les
modules de synthèse vocale sont installés si vous avez choisi de procéder à
une installation complète du produit. Si vous avez réalisé une installation
personnalisée, vous pouvez sélectionner les langues des moteurs de synthèse
vocale que vous souhaitez installer. Si vous souhaitez obtenir la lecture à voix
haute d’un texte rédigé dans une langue pour laquelle vous n’avez pas installé
le moteur de synthèse vocale, vous serez invité à installer le module requis
sans interrompre votre session OmniPage, si vous disposez du CD du
programme. Vous pouvez également utiliser la fonction Ajout/Suppression
de programmes du Panneau de configuration.
Lecture du texte à voix haute93
Les modules RealSpeak sont également utilisés pour enregistrer le texte d’un
document dans un fichier audio au format Wave. Pour ce faire, sélectionnez
Enregistrer dans un fichier depuis la liste déroulante Exporter les résultats, et
choisissez Filtre audio Wave en tant que type de fichier. Cliquez sur Options
de filtre pour sélectionner la voix et la langue, et configurer le débit de
lecture.
94Vérification et édition
Chapitre 5
Enregistrement et
exportation
Après avoir importé au moins une image dans un document, vous pouvez
procéder à l’exportation des images acquises vers un fichier. À l’issue de la
reconnaissance d’au moins une page, vous pouvez exporter les résultats de
l’OCR (une seule page, les pages sélectionnées ou le document entier) vers
l’application cible de votre choix à l’aide d’une des méthodes suivantes :
enregistrement du document dans un fichier, copie du document dans le
Presse-papiers ou ajout du document à un e-mail en tant que pièce jointe.
Vous pouvez également enregistrer le fichier en tant que document
OmniPage.
Ce chapitre traite les sujets suivants :
◆Enregistrement d’un document OmniPage
◆Bouton Exporter les résultats
◆Enregistrement des images originales
◆Enregistrement des résultats de l’OCR
• Sélection d’un niveau de formatage
• Sélection d’options de filtre
• Utilisation de filtres multiples
• Enregistrement d’un document au format PDF
• Conversion de documents PDF
◆Copie des pages dans le Presse-papiers
◆Ajout de pages à un e-mail comme pièce jointe
◆Autres destinations d’exportation
Manuel d’utilisation d’OmniPage Pro95
Le document étant conservé dans OmniPage Pro après l’exportation, vous
pouvez enregistrer, copier ou envoyer ses pages à plusieurs reprises en
appliquant, le cas échéant, différents niveaux de formatage, types de fichiers,
noms ou emplacements. Vous pouvez également y ajouter de nouvelles
pages, relancer l’OCR des pages traitées ou modifier le texte reconnu.
Dans le cas du traitement automatique ou si vous exécutez des travaux Batch
Manager, vous devez spécifier la première destination d’enregistrement avant
d’entamer le processus. À l’issue de la reconnaissance (ou de la vérification,
selon vos réglages) de la dernière page disponible, la boîte de dialogue
d’exportation s’affiche.
Vous pouvez configurer l’exportation pour toute période pendant laquelle le
programme n’est pas occupé. Si vous essayez d’exporter un document
comportant des pages non reconnues, un message vous demande si vous
souhaitez procéder d’abord à leur reconnaissance. Si vous sélectionnez
l’option Non, seuls les résultats de l’OCR des pages reconnues sont exportés.
Si vous avez modifié des zones sur des pages reconnues, le programme vous
demande de relancer l’OCR des pages concernées avant l’exportation.
Un flux de travail peut contenir une ou plusieurs étapes d’enregistrement,
vers des destinations différentes (vers un fichier et comme pièce jointe à un email, par exemple). Un travail Batch Manager doit contenir au moins une
étape d’enregistrement. Voir chapitre 6, « Flux de travail ».
Enregistrement d’un document OmniPage
Si vous souhaitez retraiter un document dans OmniPage Pro lors d’une
session ultérieure, enregistrez-le en tant que document OmniPage. Ce format
représente un type de fichier de sortie permettant de sauvegarder l’image
originale, ainsi que les résultats de l’OCR, les réglages et les données
d’apprentissage. Voir « Documents OmniPage », page 36.
96Enregistrement et exportation
Chapitre 5
Bouton Exporter les résultats
L’exportation s’effectue en utilisant le bouton 3 de la boîte à outils
OmniPage. Ce bouton répertorie les destinations d’exportation disponibles.
Une icône de ces destinations apparaît sur la gauche. Les trois dernières
destinations apparaissent uniquement dans la version Office
d’OmniPage Pro 14. Certaines destinations apparaissent uniquement si un
accès à celles-ci a été détecté sur l’ordinateur. Sélectionnez la destination
souhaitée, puis cliquez sur le bouton Exporter les résultats pour lancer
l’exportation. Vous pouvez également la lancer en utilisant le menu
Tr a i t e m e n t .
Enregistrement des images originales
Les images originales d’un document peuvent être enregistrées sur disque
sous différents types de fichiers. Voir « Types de fichier pour l’ouverture et
l’enregistrement des images », page 138.
1. Choisissez la commande Enregistrer dans un fichier dans la liste
déroulante Exporter les résultats. Dans la boîte de dialogue qui apparaît,
sélectionnez Image dans Enregistrer sous.
2. Sélectionnez un dossier et un type de fichier. Indiquez le nom du fichier.
3. Sélectionnez l’enregistrement de l’image de zone choisie uniquement, de
l’image actuelle, des images de pages sélectionnées ou de toutes les
images du document. Dans le cas de zones ou de pages multiples, vous
pouvez placer l’ensemble des images dans un seul fichier image
multipage, à condition de spécifier le type de fichier TIFF, MAX, DCX
ou PDF Image uniquement. Sinon, chaque image est placée dans un
fichier séparé. OmniPage Pro ajoute des suffixes numériques aux noms
de fichiers fournis afin de générer des noms uniques.
Bouton Exporter les résultats97
4. Cliquez sur la commande Options de filtre si vous souhaitez définir un
mode d’enregistrement spécifique (noir et blanc, niveaux de gris, couleur
ou Tel que), une résolution maximale ou d’autres réglages. Pour les
fichiers TIFF, cette option permet également de définir la méthode de
compression.
5. Cliquez sur OK pour enregistrer la ou les images selon les réglages
spécifiés. Les zones et le texte reconnu ne sont pas enregistrés.
Pour afficher la taille et la résolution d’une image de page, placez le curseur sur sa
vignette dans la fenêtre d’image. Pour afficher ou masquer l’affichage de cette
fenêtre, utilisez le menu contextuel qui apparaît.
Vous pouvez enregistrer vos documents dans cinq versions du format PDF. Deux
de ces versions permettent d’enregistrer les images originales, tandis que les autres
enregistrent les résultats de l’OCR. Pour plus d’informations, reportez-vous aux
sections suivantes.
Vous pouvez enregistrer vos images dans plusieurs types de fichiers ou enregistrer
les images avec les pages reconnues, en une seule étape d’enregistrement. Voir
« Utilisation de filtres multiples », page 103.
Enregistrement des résultats de l’OCR
Les images reconnues d’un document peuvent être enregistrées sur disque
sous différents types de fichiers. Voir « Types de fichier pour l’enregistrement
des résultats de l’OCR », page 140.
1. Choisissez Exporter les résultats dans le menu Fichier ou cliquez sur le
bouton Exporter les résultats dans la boîte à outils OmniPage, avec
l’option Enregistrer dans un fichier sélectionnée dans sa liste déroulante.
98Enregistrement et exportation
Sélectionnez cette
option en premier
lieu. Elle
déterminera les
autres options
disponibles.
Cochez cette case
pour ouvrir
automatiquement
le fichier enregistré
dans l’application
cible.
Sélections
possibles :
Toutes les pages
Page actuelle
Pages
sélectionnées
Sélectionnez les
pages au moyen
des vignettes ou
dans le
gestionnaire de
documents.
Chapitre 5
2. La boîte de dialogue Enregistrer dans un fichier apparaît. Sélectionnez
Texte dans Enregistrer sous.
Sélectionnez
cette option
pour afficher
et modifier les
options de
sortie du type
de fichier
actuel.
Sélections possibles :
Regrouper les pages en un seul fichier
Créer un fichier par page
Créer un fichier après chaque page blanche
Créer un fichier par image
3. Sélectionnez un emplacement de dossier et un type de fichier pour votre
document. Sélectionnez tout ou partie des pages d’un document.
Sélectionnez également les options du fichier et le niveau de formatage
du document. Voir « Sélection d’un niveau de formatage », page 100.
4. Indiquez le nom du fichier. Cliquez sur Options de filtre si vous
souhaitez définir des paramètres spécifiques d’exportation. Voir
« Sélection d’options de filtre », page 102.
5. Cliquez sur OK. Le document est enregistré sur disque selon les réglages
spécifiés. Si l’option Enregistrer et lancer est activée, le fichier exporté
apparaît dans son application cible, c.-à-d. l’application associée à ce
Enregistrement des résultats de l’OCR99
type de fichier dans Windows ou dans les options d’enregistrement
évoluées pour le filtre du type de fichier sélectionné.
Les graphiques, les grilles de tableaux et les autres propriétés sont enregistrés dans le
document uniquement si le type de fichier sélectionné les prend en charge, et s’ils
sont configurés pour la conservation dans les paramètres évolués (Options de filtre)
du type de fichier actuel.
Si plusieurs fichiers d’exportation sont créés, OmniPage Pro ajoute des suffixes
numériques aux noms de fichiers fournis afin de générer des noms uniques.
Si, lors de l’importation des fichiers image, vous activez l’option Créer un fichier après chaque page blanche, vous pouvez placer des pages blanches dans le document.
Voir « Importer des fichiers image », page 58.
Si vous activez l’option Créer un fichier par image, aucun nom de fichier n’est
requis. Le nom du fichier de sortie est obtenu à partir du fichier d’entrée qui l’a
généré ; seule l’extension change.
Sélection d’un niveau de formatage
Le niveau de formatage pour l’exportation est défini au moment de
l’opération, dans la boîte de dialogue Enregistrer sous, Copier dans le Pressepapiers ou Envoyer dans un e-mail. Trois de ces niveaux correspondent aux
fenêtres de formatage du même nom dans l’éditeur de texte. Cependant, le
niveau à appliquer pour l’enregistrement ne dépend pas de la fenêtre de
formatage affichée dans l’éditeur de texte. Lors de l’exportation vers un
fichier ou un e-mail, spécifiez d’abord un type de fichier. Cette sélection
détermine en effet les niveaux de formatage mis à votre disposition. Vous
trouverez un récapitulatif dans un tableau du chapitre 7. Voir « Types de
fichier pour l’enregistrement des résultats de l’OCR », page 140.
Les niveaux de formatage sont les suivants :
Aucun formatage
Pour afficher le texte en une seule colonne avec alignement à gauche, dans un
seul style et corps de police. Les éléments graphiques et les tableaux ne sont
pas supportés pour l’exportation vers des fichiers de type Texte ou Unicode.
Vous pouvez exporter le texte brut vers pratiquement tout type de fichier et
application cible ; dans ce cas, vous pouvez conserver les éléments
graphiques, les tableaux et les puces.
100Enregistrement et exportation
Loading...
+ hidden pages
You need points to download manuals.
1 point = 1 manual.
You can buy points or you can get point for every manual you upload.