Le logiciel présenté dans ce manuel est fourni sous licence et son utilisation et sa
copie sont soumises aux termes de la licence.
REMARQUEIMPORTANTE
Nuance Communications, Inc. fournit cette publication « telle quelle », sans aucune
garantie d’aucune sorte, ni expresse ni implicite, y compris mais non seulement,
aucune garantie implicite de qualité commerciale ou d’adéquation à un usage
particulier. Certains états et certaines juridictions n’autorisant pas l’exclusion de
garanties expresses ou implicites dans certains types de transaction, il est possible
que la déclaration ci-dessus ne vous concerne pas. Par ailleurs, Nuance se réserve le
droit de réviser cette publication et d’en modifier le contenu sans être tenu d’avertir
quiconque de ces révisions ou modifications.
MARQUESCOMMERCIALES
Nuance, ScanSoft, OmniPage, PaperPort, True Page, Direct OCR, Logical Form Recognition et
RealSpeak sont des marques commerciales ou des marques commerciales déposées de
Nuance Communications, Inc., aux États-Unis et/ou dans d’autres pays. Tous les
autres noms de sociétés ou de produits cités peuvent être des marques de leurs
propriétaires respectifs.
LICENCES/NOTICESDEPRODUITSTIERS
Veuillez vous reporter à la fin de ce guide pour obtenir les reconnaissances/notices de
produits tiers.
Nuance Communications, Inc.
1 Wayside Road
Burlington, MA 01803-4609
États-Unis
Nuance Communications International BVBA
Siège social international
Guldensporenpark 32
Building D
BE-9820 Merelbeke
Belgique
T ABLEDESMATIÈRES
BIENVENUE5
Nouvelles fonctions d’OmniPage 17 8
INSTALLATIONETCONFIGURATION13
Environnement requis 13
Installation d’OmniPage 15
Configuration d’un scanner pour utilisation
avec OmniPage 16
Lancement d’OmniPage 19
Enregistrement du logiciel 20
Activation d’OmniPage 21
Désinstallation du logiciel 21
UTILISATIOND'OMNIPAGE23
Documents OmniPage 23
Bureau OmniPage et modes d’affichage 24
Principales étapes de l’OCR 33
Utilisation d'OmniPage avec PaperPort 34
TRAITEMENTDESDOCUMENTS36
Méthodes de traitement 36
Définition de la source des images de page 41
Définition de la mise en page du document 49
Prétraitement des images 51
Zones et fonds 58
VÉRIFICATIONETÉDITION68
Affichage et niveaux de formatage de l'éditeur 68
Vérification des résultats de l’OCR 69
Vérification du texte reconnu 71
Manuel d'utilisation d'OmniPage 17 3
Table de caractères 71
Dictionnaires utilisateur 72
Langues 74
Apprentissage 77
Édition du texte et des images 80
Édition en direct 82
Marquage et biffure de texte 83
Lecture du texte à voix haute 85
Création et édition de formulaires 86
ENREGISTREMENTETEXPORTATION91
Enregistrement et exportation 92
Enregistrement des images originales 92
Enregistrement des résultats de l’OCR 93
Création de fichiers PDF depuis d'autres applications 100
Ajout de pages à un e-mail comme pièce jointe 101
Envoi vers un lecteur Kindle 102
Autres destinations d’exportation 103
FLUXDETRAVAIL105
Assistant Flux de travail 109
Batch Manager 112
Création d’un travail 113
Surveillance de dossiers 119
Surveillance de boîtes de réception 120
Traitement par détection de codes à barres 121
Assistant File-it 124
INFORMATIONSTECHNIQUES126
Dépannage 126
Types de fichier pris en charge 132
INDEX133
Table des matières4
Bienvenue
Nous vous remercions de la confiance que vous portez à notre
logiciel de reconnaissance OmniPage
ci-dessous est destinée à vous présenter le programme et à faciliter
son utilisation.
Manuel de l’utilisateur
Le présent manuel fournit des informations relatives aux principes
d'utilisation d'OmniPage 17 : procédures d’installation et de
configuration, description des commandes et zones de travail
disponibles, instructions de réalisation de différentes tâches,
méthodes de personnalisation et de gestion de traitement et
diverses informations techniques. Les descriptions fournies dans le
présent manuel se basent sur le système d’exploitation Windows
TM
.
Vista
Conformément à la politique environnementale de Nuance, ce
manuel est uniquement disponible au format PDF. Pour obtenir une
copie au format standard, nous vous recommandons d’imprimer
deux pages par feuille en recto verso.
®
17. La documentation citée
Ce manuel présuppose que vous maîtrisez les principes de travail
dans l’environnement Microsoft Windows. Pour tous détails sur cet
environnement (utilisation des boîtes de dialogue, des menus
déroulants et contextuels, des barres de défilement, de la fonction
Glisser-déplacer, etc.), reportez-vous à la documentation Windows
correspondante.
Bienvenue 5
Vous devriez également connaître le fonctionnement de votre
scanner et de son logiciel. Avant de procéder à la configuration du
scanner avec OmniPage 17, assurez-vous qu’il est installé et qu’il
fonctionne correctement. Reportez-vous, si nécessaire, à la
documentation du scanner.
Guides d'apprentissage
Les guides d’apprentissage sont disponibles dans le menu Aide.
Conçus pour vous permettre d’exploiter au plus vite le programme,
ces mini-guides offrent une présentation concise des opérations les
plus courantes que vous pouvez réaliser avec OmniPage, comme par
exemple l’importation de documents, la retouche d’images, la
définition de zones, la reconnaissance, l’édition, la vérification, et
bien plus encore !
Aide électronique
L'aide contient des informations sur les fonctions, les paramètres et
les procédures d’OmniPage. Elle inclut également un glossaire
exhaustif, assorti d'un index alphabétique et d'une table des
matières. Le système d'aide HTML a été conçu pour garantir une
consultation aisée et rapide. Le système d’aide est disponible dès
l’installation du logiciel.
Le module d’aide contextuelle très complet assure une
assistance suffisante pour vous permettre d’accomplir au
plus vite les opérations requises. Pour y accéder, appuyez
sur la touche F1 depuis n’importe quelle boîte de dialogue. Si la boîte
de dialogue sur laquelle vous souhaitez obtenir de l’aide dispose
d’un bouton Aide, cliquez sur celui-ci.
Bienvenue 6
Fichier Notes de version
Ce fichier contient des informations de dernière minute sur
OmniPage. Il est vivement recommandé de le consulter avant
d’utiliser le logiciel. Pour ouvrir ce fichier au format HTML, vous
pouvez, à la fin de l'installation d'OmniPage, sélectionner l'option
Notes de version, ou, à tout moment, choisir la commande
correspondante dans le menu Aide.
Informations sur la numérisation et renseignements
divers
Le site Web de Nuance® (www.nuance.fr) fournit des informations
actualisées sur le programme. La section « Scanner Guide » (en
anglais) (http://www.nuance.com/scannerguide/) contient des
données régulièrement mises à jour et relatives aux scanners pris en
charge et à d’autres questions y afférentes. Nuance effectue des tests
sur les 25 modèles les plus utilisés. Pour accéder au site Web de
Nuance, vous pouvez, à la fin de l’installation d’OmniPage 17,
sélectionner l’option d’accès au site Web, ou, choisir à tout moment
la commande correspondante dans le menu Aide.
Notes techniques
Le site Web de Nuance (www.nuance.fr) propose des notes
techniques concernant les problèmes les plus courants relatifs à
l’utilisation d’OmniPage 17. Ces pages Web peuvent également
inclure des conseils sur l’installation et le dépannage du logiciel.
Bienvenue 7
Nouvelles fonctions d’OmniPage 17
Si vous utilisiez auparavant la version 16, vous bénéficiez des
innovations suivantes. Cliquez sur les liens pour obtenir plus
d’informations.
•Reconnaissance des langues asiatiques : les services
d’OCR sont désormais disponibles pour le japonais, le
coréen, le chinois simplifié et le chinois traditionnel ; ils
prennent en charge le texte horizontal et vertical, ainsi que
le texte anglais incorporé. Les résultats obtenus peuvent
être affichés et contrôlés dans l’éditeur de texte. Voir
« Reconnaissance des langues asiatiques », page 74.
•Texte vertical non asiatique : la détection automatique
du texte vertical dans deux rotations fonctionne à
l’intérieur des cellules de tableaux et partout sur les pages
PDF ou XPS, ainsi que dans certains autres types de
fichiers image. De nouveaux outils permettent de tracer
manuellement des zones de texte vertical. Le texte s’affiche
verticalement et peut être modifié dans l’éditeur de texte,
®
avec le niveau de formatage True Page
d’autres niveaux de formatage, le texte s’affiche
horizontalement. Voir « Traçage automatique des zones »,
page 59 et « Types et propriétés de zone », page 60.
•Chargeur express : à l’instar de l’Explorateur Windows,
cet outil permet d’afficher le système de fichiers dans l’une
des fenêtres d’OmniPage, de conserver les fichiers à l’écran
pendant que vous travaillez et de sélectionner rapidement
les fichiers à charger. Une boîte de dialogue dotée d’une
fonction de verrouillage permet de compiler une liste de
fichiers avant de procéder au chargement. Utilisé en mode
Conversion rapide, le Chargeur express accélère le
chargement des fichiers et permet un traitement « en un
. Si vous utilisez
Nouvelles fonctions d’OmniPage 17 8
clic » : chargement > reconnaissance > enregistrement. Voir
« Importation de fichiers avec le Chargeur express »,
page 43.
•Prise en charge étendue des systèmes de gestion de
contenus : de nouveaux liens vers Hummingbird
OpenText et iManage Interwoven sont disponibles. Avec
SharePoint, les informations relatives au serveur, à la
connexion et au mot de passe ne doivent être saisies qu’une
seule fois par session et sont ensuite fournies lors de toutes
les sessions ultérieures.
•Prise en charge améliorée d’Office 2007 : les boutons
Direct OCR apparaissent désormais dans un onglet
Nuance OCR distinct, et non plus au côté des autres
compléments.
•Traitement par lots optimisé : Batch Manager ignore
automatiquement les fichiers qui ne peuvent pas être
traités (et notamment les fichiers bloqués en raison d’une
demande de mot de passe), sans pour autant interrompre le
flux de travail. La fenêtre Résultats du travail répertorie les
fichiers exclus du traitement.
•Exécution : la vitesse de lancement du programme est
accrue et les performances enregistrent des progrès
considérables sur les ordinateurs multi-cœurs. Les
ordinateurs quadri-cœurs sont désormais pris en charge.
•Association des flux de travail aux boutons du scanner :
les fonctions et flux de travail d’OmniPage peuvent être
associés aux boutons du scanner de façon à permettre le
lancement du prétraitement, de la reconnaissance et du
stockage des documents depuis le scanner. Voir
« Numérisation vers OmniPage et utilisation des flux de
travail », page 48.
Nouvelles fonctions d’OmniPage 17 9
•Exportation vers Kindle : le nouvel Assistant Kindle vous
permet de créer des flux de travail pour envoyer les
résultats d’OCR vers un compte Kindle hébergé sur le site
Amazon, et de les afficher ensuite sur l’appareil Kindle
associé à ce compte. Voir « Envoi vers un lecteur Kindle »,
page 102.
•Autres améliorations : les améliorations apportées au
prétraitement des images garantissent une parfaite
reproduction de la mise en page et une meilleure précision
globale, notamment pour les fichiers XPS et les
conversions entre différents formats de documents. Le
chargement d’images HD Photo (JPEG XR) est désormais
pris en charge. L’intégration à Microsoft Word, Excel et
PowerPoint a été améliorée. Des fichiers PDF linéarisés
peuvent être créés ; ils sont optimisés pour un affichage
plus rapide sur le Web. L’option de description de la mise
en page Formulaire est désormais disponible en mode
Conversion rapide.
Nouvelles fonctions d’OmniPage 16
Si vous utilisiez auparavant la version 15, vous bénéficiez également
des innovations suivantes :
•Choix entre trois interfaces : Classique (identique à celle
d’OmniPage 15), Flexible et Conversion rapide (regroupant
toutes les commandes principales au sein d’un seul volet).
Pour plus d’informations, reportez-vous au chapitre 3,
page 24.
•Travail sur plusieurs documents : les interfaces Classique
ou Flexible vous permettent de travailler simultanément
sur plusieurs documents ouverts.
Nouvelles fonctions d’OmniPage 17 10
•Traitement de photos numériques : de nouveaux
algorithmes spécifiques assurent l’OCR de photos
numériques. Pour plus d’informations, reportez-vous au
chapitre 3, page 42.
•Compatibilité avec les programmes 2007 : OmniPage est
compatible avec les dernières versions des programmes
Word et Excel de la suite Office 2007 (formats DOCX et
XLSX), et propose également des liens avec SharePoint
2007 et Outlook 2007.
•Améliorations PDF : prise en charge du format PDF
version 1.6, vitesse de traitement accrue, précision
supérieure, qualité de sortie améliorée et technologie de
haute compression MRC pour certains types de PDF.
•Prise en charge de documents juridiques : OmniPage
assure une reconnaissance de haute qualité des documents
de nature juridique.
•Menus contextuels personnalisables dans l'Explorateur
Windows : conversion directe de fichiers image ou de PDF
vers les programmes Windows les plus courants,
traitement à l’aide de flux de travail personnalisés, ou
utilisation d’un assistant pour des conversions simples et
rapides.
•Améliorations globales : traitement plus rapide,
conservation améliorée des mises en page des documents
générés (correspondances des polices, détection des
tableaux, etc.), et nouvel Assistant Flux de travail plus
intuitif.
Nouvelles fonctions d’OmniPage 17 11
Fonctionnalités clés spécifiques à OmniPage Professional.
•Extraction de données de formulaires remplis : vos flux
de travail peuvent comporter une étape permettant
l’extraction de données de formulaires remplis, et leur
exportation vers des bases de données. Ces formulaires
peuvent être des formulaires PDF actifs, des formulaires
statiques dans divers formats d’images, ou des formulaires
papier numérisés.
•Marquage et biffure de texte : des sections de texte
peuvent être mises en surbrillance, barrées ou biffées
(noircies, donc illisibles) dans l’éditeur de texte. La biffure
s’avère très pratique pour des documents à caractère
juridique ou contenant des informations confidentielles
(des contrats, par exemple).
•Assistant File-it : un outil efficace pour créer et utiliser
des flux de travail invoqués par des pages de garde sur
lesquelles sont imprimés des codes à barres. Avec ces flux
de travail, une simple pression d’un bouton de votre
scanner permet de numériser, de traiter et d’archiver
automatiquement vos documents papier.
Pour obtenir la liste complète des fonctionnalités, et connaître les
différences entre les différentes versions d’OmniPage, reportez-vous
à l’aide.
Cette icône, utilisée tout au long de ce manuel, signale les
fonctions disponibles uniquement dans OmniPage
Professional 17.
OmniPage 17 est disponible dans différentes versions d’entreprise,
adaptées à une utilisation en réseau. OmniPage est également
disponible dans différentes versions SE (Special Edition), réservées
à certains fabricants de scanners et autres revendeurs sélectionnés.
Les fonctionnalités offertes par ces versions peuvent varier en
fonction des besoins des fournisseurs.
Nouvelles fonctions d’OmniPage 17 12
Installation et configuration
Ce chapitre contient les informations nécessaires à l'installation et
au lancement d'OmniPage.
Environnement requis
Vous trouverez ci-dessous la configuration système minimale
requise pour l’installation et l’exécution du programme :
•Ordinateur équipé d’un processeur Intel
équivalent. Processeur double-cœur ou quadri-cœur
recommandé.
•Windows
cadencé à 400 MHz ou Windows
ou 64 bits (SP1) avec un processeur cadencé à 1 GHz.
•256 Mo de mémoire vive (RAM), 1 Go recommandé pour
des performances avancées.
•230 Mo d’espace disque disponible destiné aux fichiers
d’application et d’exemple, plus 70 Mo d’espace disponible
lors de l’installation. De plus :
®
XP 32 bits (Service Pack 3) avec un processeur
•175 Mo pour l’ensemble des modules Nuance
RealSpeak
américain RealSpeak
module RealSpeak
autres langues)
•95 Mo pour Nuance PDF Create (disponible
uniquement dans OmniPage Professional 17)
•150 Mo pour PaperPort
dans OmniPage Professional 17)
®
(80 Mo pour le module Anglais
®
Solo, plus 9 à 11 Mo par
®
Solo supplémentaire pour les
®
®
Pentium® III ou
®
VistaTM 32 bits (SP1)
(disponible uniquement
Chapitre 1 Installation et configuration 13
•Moniteur couleurs 1024x768 pixels avec affichage couleurs
en 16 bits ou carte vidéo supérieure.
•Carte son et haut-parleur pour la lecture « à voix haute »
des textes reconnus.
•Lecteur de CD-ROM pour l'installation ou accès à Internet
•Appareil photo d'une résolution minimale de 2 millions de
pixels pour la capture de texte. Pour plus d’informations,
consultez l’aide en ligne.
•Scanner compatible avec le pilote approprié (si vous
prévoyez de numériser des documents). Consultez le
Scanner Guide, disponible sur le site Web de Nuance
(www.nuance.com), pour connaître la liste des scanners
pris en charge.
•Accès à Internet requis pour l'activation et
l’enregistrement du produit, la mise à jour de la base de
données des scanners et la réception de mises à jour
automatiques du programme.
•Pour traiter des documents en japonais, chinois ou coréen,
vous devez installer la prise en charge des langues
d'Extrême-Orient sur votre système d'exploitation
(Panneau de configuration > Options régionales et
linguistiques).
•Pour enregistrer aux formats DOCX et XPSX (formats
Word et Excel de Microsoft Office 2007), ou pour charger
et enregistrer des fichiers XPS (XML Paper Specification),
Microsoft .NET Framework 3.0 devra être installé sur votre
ordinateur. Vous trouverez un lien vers la page de
téléchargement de Microsoft dans les notes de version ou
dans la boîte de dialogue « À propos de » du programme, si
l'option est activée sous Options > Général. Vous pouvez
également cliquer sur la bulle d’aide OmniPage .Net
Framework.
Chapitre 1 Environnement requis 14
Installation d’OmniPage
Pour vous guider dans l’installation, OmniPage 17 affiche des
instructions sur chaque écran.
Avant de lancer l’installation d’OmniPage, respectez les points
suivants :
•Fermez les applications actives, en particulier les logiciels
antivirus.
•Ouvrez une session avec les privilèges d'administrateur.
•Si votre système dispose d’une version antérieure
d’OmniPage ou que vous effectuez une mise à niveau à
partir d'une version de démonstration ou d’une édition
limitée d'OmniPage, le programme d’installation vous
demandera l’autorisation de désinstaller le logiciel
existant.
Pour installer OmniPage :
1.Téléchargez le fichier du programme, puis choisissez Exécuter,
ou insérez le CD-ROM d'OmniPage dans votre lecteur de CDROM. En principe, le programme d’installation démarre
automatiquement. Si ce n’est pas le cas, ouvrez l’Explorateur
Windows, cliquez sur l’icône du lecteur de CD-ROM, puis
cliquez deux fois sur le fichier de programme
2.Choisissez la langue d’installation souhaitée. Lisez et acceptez
l’accord de licence, puis entrez le numéro de série figurant sur
l'e-mail que vous avez reçu ou sur la pochette du CD
d’installation du produit.
3.Choisissez de procéder à une installation complète ou
personnalisée. Si vous choisissez Installation complète, tous les
modules de synthèse vocale RealSpeak
modules sont au nombre de 9). Choisissez Installation
personnalisée pour sélectionner de manière individuelle les
composants que vous souhaitez installer. Pour choisir de ne pas
installer un module, cliquez sur la flèche pointant vers le bas
située à côté de son nom, puis sélectionnez « Cette fonction ne
sera pas installée ».
Autorun.exe.
TM
seront installées (ces
Chapitre 1 Installati on d’OmniPage 15
4.Suivez les instructions qui s’affichent à l’écran pour installer le
logiciel. Tous les fichiers nécessaires à la numérisation sont
copiés automatiquement lors de l’installation.
L'installation de Nuance PDF Create 5 démarre à la fin de
l'installation d'OmniPage, sauf si l'option correspondante a été
désélectionnée dans le programme d'installation d'OmniPage
Professional. Les conversions entre différents formats de documents
nécessitent que PDF Create soit installé.
OmniPage Professional inclut également le programme de gestion
de documents Nuance PaperPort
configuration système spécifique, doit être installé séparément.
®
. Ce dernier, associé à une
Configuration d’un scanner pour utilisation
avec OmniPage
Tous les fichiers nécessaires à la configuration et à la prise en charge
du scanner sont copiés automatiquement lors de l'installation du
programme. Le scanner n’est toutefois pas configuré au moment de
l'installation. Avant de numériser des documents à l’aide
d’OmniPage 17, vous devrez vérifier que votre scanner est installé
correctement, avec le pilote approprié, et tester son
fonctionnement. Les pilotes du scanner ne sont pas fournis avec
OmniPage.
L’installation et la configuration d’un scanner s’effectuent
par l’intermédiaire de l’Assistant de configuration de
scanner. Vous pouvez lancer celui-ci en suivant la
procédure ci-dessous. Cet Assistant apparaît également la
première fois que vous tentez de lancer une numérisation. Procédez
comme suit :
•Choisissez Démarrer > Tous les programmes > Nuance >
OmniPage 17 > Assistant de configuration de scanner
ou cliquez sur le bouton Configuration de l'onglet Scanner
de la boîte de dialogue Options
Chapitre 1 Configuration d’un scanner... 16
ou choisissez Numériser dans la zone de liste déroulante
Importer page(s) de la boîte à outils et cliquez sur le
bouton Importer page(s).
•L'Assistant de configuration de scanner s’affiche. Si vous
êtes connecté à Internet, la première fenêtre vous invite à
mettre à jour la base de données des pilotes de scanners
livrée avec le programme. Cliquez sur Oui ou sur Non, puis
sur Suivant.
•Choisissez Sélectionner et tester un scanner ou un appareil
photo numérique et cliquez sur Suivant. Si un seul scanner
est installé, il apparaît avec l’ensemble des scanners
précédemment configurés avec OmniPage. Si le scanner
que vous souhaitez utiliser ne figure pas dans cette liste,
cliquez sur Ajouter un scanner... .
•Une liste présentant l’ensemble des pilotes de scanners
détectés apparaît. Cette liste peut contenir des
périphériques de réseau. Sélectionnez un périphérique,
puis cliquez sur OK. Pour installer un second périphérique,
exécutez à nouveau l’Assistant.
•L’Assistant indique si le modèle de scanner choisi est
associé à des réglages de configuration dans la base de
données des scanners. Si tel est le cas, vous n’aurez pas
besoin de tester votre scanner. Dans le cas contraire, nous
vous recommandons de le tester. Cliquez sur Suivant.
•Si vous avez choisi de ne pas tester votre scanner, cliquez
sur Terminé. Dans le cas contraire, cliquez sur Suivant
pour tester la connexion au scanner. Si la connexion
s’effectue correctement, un menu de tests complémentaires
apparaît. Sélectionnez les tests que vous souhaitez
effectuer. Nous vous recommandons d’effectuer un test
élémentaire.
•OmniPage utilise par défaut sa propre interface de
numérisation, accessible via l’onglet Scanner de la boîte de
dialogue Options. Si vous préférez utiliser l’interface de
votre scanner, cliquez sur Réglages avancés... et choisissez
Chapitre 1 Configuration d’un scanner... 17
cette option. Choisissez Éditeur de conseils... puis
Modifier les conseils uniquement si vous êtes un utilisateur
expérimenté ou si vous avez été invité à effectuer cette
opération par le service de support technique.
•Cliquez sur Suivant pour lancer les tests. Pour réaliser un
test élémentaire, placez une page dans votre scanner.
L’Assistant procédera à la numérisation en utilisant le
logiciel du fabricant du scanner. Cliquez sur Suivant.
L'interface utilisateur native de votre scanner s'affiche.
•Cliquez sur Numériser pour lancer la numérisation de la
page de test.
•Si nécessaire, cliquez sur Image manquante... ou sur
Mauvaise orientation... et effectuez les sélections
appropriées.
•Si l'image affichée dans la fenêtre est correcte, cliquez sur
Suivant.
•Effectuez les tests restants, en suivant les instructions qui
apparaissent à l’écran.
•Lorsque l’ensemble des tests requis ont été effectués avec
succès, l’Assistant vous en informe et vous demande de
cliquer sur Terminé.
•Vous venez de configurer votre scanner en vue de son
utilisation avec OmniPage 17 !
Pour modifier les réglages du scanner par la suite ou pour configurer
ou supprimer un autre scanner, ouvrez de nouveau l'Assistant de
configuration de scanner depuis le menu Démarrer de Windows ou
depuis l’onglet Scanner de la boîte de dialogue Options.
Pour tester et dépanner un scanner qui ne fonctionne pas
correctement, lancez l'Assistant de configuration de scanner et
sélectionnez Tester un scanner ou un appareil photo numérique,
puis suivez la procédure décrite ci-dessus ou reportez-vous aux
instructions communiquées par le service de support technique.
Pour sélectionner un autre scanner à utiliser par défaut, ouvrez
l’Assistant pour afficher la liste des scanners configurés.
Chapitre 1 Configuration d’un scanner... 18
Sélectionnez le scanner que vous souhaitez utiliser par défaut, puis
refermez l’Assistant en cliquant sur Terminé.
Pour obtenir les réglages les plus récents pour votre scanner, ouvrez
l’Assistant, demandez le téléchargement de la base de données la
plus récente, choisissez Utiliser les paramètres actuels avec le
périphérique actuel, cliquez sur Suivant, puis sur Terminé.
Lancement d’OmniPage
Pour lancer OmniPage 17, effectuez l'une des opérations suivantes :
•Dans la barre des tâches de Windows, choisissez
Démarrer > Tous les programmes > Nuance > OmniPage 17 >
OmniPage [Professional] 17.
• Cliquez deux fois sur l’icône OmniPage située
dans le dossier d’installation d’OmniPage ou sur
le bureau de Windows (si vous l’y avez placée).
• Cliquez deux fois sur l’icône ou le nom de fichier
d’un document OmniPage (OPD) pour le charger.
Reportez-vous à la section « Documents
OmniPage » du chapitre suivant.
•Cliquez avec le bouton droit sur l’icône ou sur le nom d’un
ou de plusieurs fichiers image pour afficher un menu
contextuel. Pointez sur Ouvrir avec... OmniPage. Les
images sont alors chargées dans le programme.
Lorsque vous ouvrez l’application, l’écran d’accueil du programme,
puis la fenêtre de sélection de l’interface s’affichent. OmniPage
dispose de trois interfaces standard. Pour plus d'informations,
reportez-vous à la section « Bureau OmniPage et modes d'affichage »
du chapitre suivant. Cette section présente les principales zones de
travail du programme.
Vous pouvez également exécuter le programme avec une interface
limitée :
Chapitre 1 Lancement d’OmniPage 19
•Utilisez le programme Batch Manager. Dans la barre des
tâches de Windows, choisissez Démarrer > Tous les
programmes > Nuance > OmniPage 17 > OmniPage Batch
Manager. Reportez-vous au chapitre Flux de travail.
•Dans une application déclarée dans Direct OCR™,
choisissez Acquérir du texte dans le menu Fichier.
Reportez-vous à la section « Configuration de Direct
OCR » dans le chapitre Traitement des documents.
•Cliquez avec le bouton droit sur l’icône ou le nom d’un ou
de plusieurs fichiers image dans l'Explorateur Windows
pour afficher un menu contextuel. Dans ce menu, pointez
sur OmniPage 17, puis choisissez un format d’exportation,
ou sélectionnez un flux de travail, ou cliquez sur Assistant
Convertir maintenant. Les fichiers seront traités
conformément aux instructions du flux de travail
sélectionné. Reportez-vous au chapitre Flux de travail.
•Cliquez sur l’icône de l’Agent OmniPage dans la
barre des tâches. Dans le menu contextuel qui s’affiche,
sélectionnez un flux de travail pour démarrer le
programme et exécuter le flux de travail.
•Pour ajouter des services d’OCR, utilisez OmniPage17 avec
PaperPort, le produit de gestion de documents de Nuance.
Reportez-vous à la section « Utilisation d'OmniPage avec
PaperPort » du chapitre Utilisation d'OmniPage.
Enregistrement du logiciel
L’Assistant d’enregistrement de Nuance est lancé à la fin de
l’installation du logiciel. Assurez-vous d’être connecté à Internet.
L’enregistrement s’effectue via un formulaire électronique facile à
remplir (moins de cinq minutes). Une fois le formulaire rempli,
cliquez sur Envoyer. Si vous n’enregistrez pas votre copie du logiciel
pendant son installation, le programme vous invitera régulièrement
à accomplir cette formalité. Vous pouvez vous connecter au site
Chapitre 1 Enregistrement du logiciel 20
www.nuance.fr pour procéder à l’enregistrement en ligne de votre
produit. Cliquez sur Support, puis dans l'écran de support
principal, choisissez Enregistrer dans la colonne de gauche. Pour
plus de détails sur l’utilisation de vos données d’enregistrement,
reportez-vous à la clause relative à la politique de confidentialité de
Nuance.
Activation d’OmniPage
Vous serez invité à activer votre logiciel à la fin de l’installation.
Assurez-vous de disposer d’une connexion à Internet. Si le numéro
de série du logiciel est stocké au bon endroit et qu’il a été saisi
correctement, aucune interaction n’est requise de votre part.
Aucune information personnelle ne sera transmise. Si vous n’activez
pas immédiatement le logiciel à la fin de l’installation, vous serez
invité à le faire à chaque démarrage du programme. Si vous n’activez
pas OmniPage 17, vous ne pourrez lancer le programme que cinq
fois. Nous vous recommandons de procéder à l’activation
automatique du logiciel.
Désinstallation du logiciel
Certains problèmes peuvent être résolus en désinstallant puis en
réinstallant OmniPage. Le programme de désinstallation
d’OmniPage ne supprime pas les fichiers contenant des résultats de
reconnaissance ou les fichiers créés par l’utilisateur, à savoir :
Fichiers de gabarit de zones (*.zon)
Fichiers de retouche automatique d’images (*.ipp)
Fichiers d’apprentissage (*.otn)
Dictionnaires utilisateur (*.ud)
Documents OmniPage (*.opd)
Fichiers de travail (*.opj)
Fichiers de flux de travail (*.xwf)
Chapitre 1 Activation d’OmniPage 21
Pour désinstaller le programme, vous devez ouvrir une session avec
les privilèges d'administrateur.
Pour désinstaller ou réinstaller OmniPage :
•Fermez OmniPage.
•Dans la barre des tâches de Windows, cliquez sur
Démarrer, choisissez Panneau de configuration, puis
Désinstaller un programme (versions antérieures de
Windows : cliquez deux fois sur Ajout/suppression de
programmes).
•Sélectionnez OmniPage puis cliquez sur Désinstaller
(versions antérieures de Windows : Supprimer).
•Dans la boîte de dialogue qui apparaît alors, cliquez sur
Oui pour confirmer la suppression du programme.
•Cliquez sur Oui pour redémarrer votre ordinateur
immédiatement ou sur Non pour le redémarrer
ultérieurement.
•Suivez les instructions jusqu'à la fin de la procédure.
Lorsque vous désinstallez OmniPage, le lien avec votre scanner est
automatiquement désinstallé. Si vous réinstallez le logiciel, vous
devez à nouveau configurer votre scanner en vue de son utilisation
avec OmniPage. Tous les modules RealSpeak installés en même
temps que le programme sont également désinstallés.
Avec OmniPage 17 Professional, Nuance PDF Create 5 et PaperPort
doivent être désinstallés séparément.
Chapitre 1 Désinstallation du logiciel 22
Utilisation d'OmniPage
OmniPage 17 utilise la technologie de reconnaissance optique de
caractères (OCR) pour transformer les informations contenues
dans vos documents numérisés ou fichiers image en données
électroniques éditables par vos applications habituelles.
Outre le texte, OmniPage peut reconnaître les éléments et
caractéristiques suivants de vos documents :
Éléments graphiques
Éléments de formulaires
texte, etc.)
Informations de formatage du texte
Mise en page
en-têtes, emplacement des éléments graphiques).
(disposition des colonnes, formats des tableaux,
Documents dans OmniPage
Dans OmniPage, un document comporte une ou plusieurs pages,
chacune d’elles constituée par une image importée. Après la
reconnaissance, le document comportera également le texte
reconnu correspondant à ses images (affichable via l’éditeur de
texte) et éventuellement des graphiques, des tableaux ou des
éléments de formulaire.
(photos, logos)
(cases à cocher, boutons radio, champs de
(caractères et paragraphes)
Documents OmniPage
Un document OmniPage (.opd) contient l'image de page
originale (éventuellement prétraitée), ainsi que les zones
tracées sur celle-ci. Après la reconnaissance, un
fichier OPD comporte également le résultat de l'OCR.
Chapitre 2 Utilisation d'OmniPage 23
Un document OmniPage (fichier OPD) peut contenir différents
éléments incorporés : dictionnaire utilisateur, fichier
d’apprentissage, fichier de gabarit de zones ou fichier de modèle de
retouche d’images. S’il génère des fichiers beaucoup plus
volumineux, ce format améliore la portabilité et facilite l’échange
des fichiers OPD. Pour incorporer un fichier, ouvrez la boîte
correspondante depuis le menu Outils, sélectionnez le fichier désiré,
puis cliquez sur Incorporer. Utilisez le bouton Extraire pour
enregistrer localement une copie d’un fichier incorporé au sein d’un
fichier OPD que vous avez reçu.
Lors de l’ouverture d’un document OmniPage, ses réglages sont
appliqués, remplaçant les paramètres du programme.
Bureau OmniPage et modes d’affichage
OmniPage propose trois interfaces distinctes, pour un confort
d’utilisation optimal en fonction de la tâche que vous devez réaliser.
•Mode Classique – Ce mode reprend l’interface des
versions précédentes du programme.
•Mode Flexible – Ce mode d’affichage présente les volets
de fonctions empilés dans une vue mise en onglets, pour un
gain d’espace optimal.
•Mode Conversion rapide – Cette interface est conçue
pour réaliser rapidement des conversions de documents,
sans qu’aucune connaissance approfondie du programme
soit requise. Les options de conversion les plus
importantes sont clairement présentées à l’écran.
Utilisez les commandes du menu Fenêtre pour passer d’une
interface à une autre, et pour enregistrer un mode d’affichage
personnalisé (voir ci-dessous). Au démarrage d’une nouvelle
Chapitre 2 Bureau OmniPage et modes d’affichage 24
session, le mode d’affichage et la disposition actifs lors de la dernière
fermeture du programme sont utilisés.
Volets du programme
OmniPage se compose de sept volets qui peuvent être ancrés (sous
forme d’onglets ou en mosaïque), flottants, redimensionnés, réduits
ou restaurés individuellement : Vignettes, Image de page, Éditeur de
texte, Gestionnaire de documents, Chargeur express, État du flux
de travail et Aide. Pour déplacer un volet, double-cliquez sur sa
barre de titre ou son onglet. Pour restaurer le volet flottant dans sa
position ancrée précédente, double-cliquez sur sa barre de titre.
Pour l’ancrer à un nouvel emplacement, faites-le glisser en direction
d’un bord. Un rectangle violet signale la position d’ancrage ;
relâchez le bouton de la souris pour ancrer le volet. Pour déplacer un
volet flottant sans affichage de l’ancrage, faites-le glisser tout en
maintenant la touche Ctrl enfoncée. Pour afficher toutes les
positions d’ancrage possibles (mosaïque et onglets) les unes à la
suite des autres, faites glisser le volet sur la fenêtre principale
d’OmniPage, en maintenant le bouton gauche enfoncé et en
appuyant plusieurs fois sur la barre espace. Lorsqu’un rectangle
violet apparaît à la position qui vous convient, relâchez le bouton de
la souris.
Mode Classique
En mode Classique, le bureau OmniPage par défaut est composé de
quatre zones de travail affichées en mosaïque et séparées par des
barres de fractionnement : le gestionnaire de documents, l’éditeur
de texte et les volets Image de page et Vignettes. Le volet Image de
page est muni de la barre d’outils Image, et le volet Éditeur de texte
de la barre d’outils Formatage.
Chapitre 2 Bureau Om niPage et modes d’affichage 25
Barre d’outils Standard Barre d’outils Formatage
Image
de page
Éditeur
de texte
Gestionnaire
de documents
Barre d’outils
Image
Boîte à outils
OmniPage
Vignettes
Boîte à outils OmniPage : La boîte à outils d’OmniPage vous
permet de gérer toutes les étapes du traitement.
Volet Vignettes : Ce volet affiche les vignettes des pages de votre
document.
Gestionnaire de documents : Ce volet fournit un résumé
d'informations sur un document sous la forme d'un tableau. Chaque
rangée donne des informations sur une page. Les colonnes
présentent des statistiques ou des informations d’état pour chaque
page, et (quand cela est nécessaire) les totaux du document.
Image de page : Ce volet affiche l'image de la page actuelle, et
indique les zones tracées sur celle-ci. Lorsqu’une page est affichée, la
barre d’outils Image est disponible.
Éditeur de texte : Ce volet affiche les résultats d'OCR de la page en
cours de traitement.
Chapitre 2 Bureau Om niPage et modes d’affichage 26
Vous pouvez réorganiser les volets à votre guise : verticalement ou
horizontalement. Pour ouvrir les volets Chargeur express, État du
flux de travail ou Aide, utilisez le menu Fenêtre. Les volets peuvent
être réduits ou fermés, mais ne peuvent pas être organisés sous
forme d’onglets. Pour restaurer le mode Classique par défaut,
choisissez Réinitialiser vue actuelle dans le menu Fenêtre.
Mode Flexible
Sélectionnez ce mode d’affichage pour optimiser l’espace de travail
d’OmniPage en fonction de la tâche que vous devez réaliser. Par
défaut, tous les volets apparaissent. Dans ce mode, cinq onglets sont
affichés : Image de page (y compris Vignettes), Éditeur de texte,
Chargeur express, État du flux de travail et Aide. Le gestionnaire de
documents apparaît dans un volet horizontal, situé en bas de la zone
de travail. Vous pouvez détacher, déplacer, réduire, grouper ou
fermer les volets, selon la procédure décrite ci-dessus. Faites glisser
un onglet vers la zone de travail pour obtenir un affichage en
mosaïque semblable au mode Classique. Faites-le glisser de nouveau
vers la barre des onglets pour rétablir les onglets, ou utilisez la barre
espace selon la procédure décrite ci-dessus. Si les volets sont
groupés, le texte de l'onglet indique le volet actif. Pour restaurer le
mode Flexible par défaut, choisissez Réinitialiser vue actuelle dans
le menu Fenêtre.
À l’instar de l’Explorateur Windows, le Chargeur express est un
outil qui permet d’afficher et gérer les fichiers. Il peut rester ouvert
pendant la session, permettant ainsi de sélectionner et regrouper
rapidement les fichiers (reportez-vous au chapitre
3, page 43).
Chapitre 2 Bureau Om niPage et modes d’affichage 27
Cas de figure possibles :
Espace de travail optimal (travail sur un seul écran)
Chargez un document. Dans le menu
Fenêtre, sélectionnez les volets avec
lesquels vous souhaitez travailler. Faites
glisser chacun de ces volets derrière le
volet actif, jusqu’à ce qu’ils prennent la
forme d’onglets. De la même façon, vous
pouvez ancrer l’aide pour ne pas avoir à
manipuler deux fenêtres distinctes.
Manipulation des résultats de reconnaissance (travail sur un
seul écran)
Chargez un document, puis lancez sa
reconnaissance. Refermez tous les
volets, à l’exception du gestionnaire de
documents et de l’éditeur de texte.
Affichez ces deux volets
horizontalement, sur toute la largeur de
l’écran, réduisez la hauteur du
gestionnaire de documents, et ancrez-le
dans la partie supérieure ou inférieure de la fenêtre. Vous pouvez
dès lors passer les pages en revue, en cliquant deux fois dessus dans
le gestionnaire de documents, et inspecter les résultats de
reconnaissance dans l’éditeur de texte. Les informations fournies
par le gestionnaire de documents (nombre de mots douteux et de
caractères de rejet) vous aideront à repérer rapidement les pages qui
posent problème.
Chapitre 2 Bureau Om niPage et modes d’affichage 28
Traitement de documents volumineux (travail sur deux écrans)
Chargez le document sur lequel vous
souhaitez travailler. Déplacez le volet
Vignettes sur votre second moniteur, et
affichez-le en plein écran pour disposer
d’une large vue de votre document, et
disposer d’un maximum de place pour la
manipulation des vignettes.
Vérification (travail sur deux écrans)
Placez le volet Image de page sur un
écran, et l’éditeur de texte sur l’autre.
Vous disposerez ainsi d’un espace
optimal pour vos travaux d’édition et de
vérification.
Disponible à tout moment, le volet Image
de page vous permet de vérifier la
reconnaissance de vos pages, d’y tracer des zones à la volée et d’en
éditer le texte.
Les cas de figure présentés ci-dessus ne sont que des
exemples des possibilités offertes par le mode Flexible.
Mode Conversion rapide
Le mode Conversion rapide vous permet de réaliser rapidement la
reconnaissance et l’enregistrement de vos documents. Vous pouvez
uniquement accéder au mode Conversion rapide lorsqu’aucun
document n’est ouvert. De plus, ce mode d’affichage ne permet de ne
Chapitre 2 Bureau Om niPage et modes d’affichage 29
Options du mode Conversion rapide : source du
document et mise en page, format de sortie, niveau
de formatage, dossier de sortie et nom de fichier,
options d’enregistrement, intervalle de pages
Image de page
Barre d’outils
Conversion
rapide
Boutons de
traitement
Titre du volet
Image de page
Options
du mode
Conversion
rapide et
onglet
(fermé) du
Chargeur
express
travailler que sur un seul document d’entrée et de sortie à la fois.
L’illustration ci-dessous affiche la disposition par défaut.
Par défaut, le Chargeur express apparaît dans un onglet dont
l’affichage alterne avec celui du volet Options du mode Conversion
rapide. Un volet Aide peut être ajouté, mais aucun autre volet n’est
disponible dans ce mode d'affichage. Vous pouvez modifier les
onglets pour séparer les volets et les réduire, comme dans les autres
modes d’affichage.
Après le chargement d’un fichier, nous vous recommandons de le
convertir avant de procéder au chargement du fichier suivant.
Lorsque la conversion d’une image est terminée, vous n’avez pas
besoin de fermer cette image ; il vous suffit de charger un nouveau
fichier.
En mode Conversion rapide, le Chargeur express offre une
fonctionnalité supplémentaire : le traitement « en un clic ». Ouvrez
Chapitre 2 Bureau Om niPage et modes d’affichage 30
le sous-menu Chargeur express dans le menu Traitement et
sélectionnez Charger des fichiers ou Importer et convertir. Cette
dernière option permet de sélectionner plusieurs fichiers qui sont
chargés, reconnus et enregistrés à l’aide des paramètres en cours.
Pour cela, vous devez définir les noms des fichiers de sortie, de façon
à ce qu’ils soient identiques aux noms des fichiers source. Pour plus
d’informations, reportez-vous au chapitre
En mode Conversion rapide, le volet Image intègre la barre d’outils
Conversion rapide, qui offre un accès aux opérations de traitement
des images les plus utiles. Pour accéder aux fonctionnalités
avancées, et notamment l’enregistrement des fichiers image, les
outils SET, le traçage de zones en direct, la réorganisation des zones
et le traçage manuel de zones pour le texte vertical, utilisez un autre
mode d’affichage.
3, page 43 et à l’aide.
Modes d’affichage personnalisés
Pour créer un mode d’affichage personnalisé, disposez les volets et
les barres d’outils selon vos besoins, puis sélectionnez Fenêtre >
Modes d’affichage personnalisés > Gérer. Cliquez sur Ajouter et
donnez un nom à votre mode d’affichage. Vos modes d’affichage
sont accessibles dans le sous-menu Modes d’affichage
personnalisés. Le mode actuellement utilisé est indiqué par une case
à cocher. Les modes d’affichage personnalisés ne permettent pas de
rétablir l’affichage par défaut.
Changement de mode d’affichage
Pour changer de mode d’affichage, utilisez le menu Fenêtre. Les
volets sont affichés ou masqués et organisés de la même façon que
lors de la dernière utilisation du mode d’affichage choisi. La
rubrique d’aide affichée ne varie pas en fonction du mode
d’affichage. Le Chargeur express mémorise l’emplacement des
Chapitre 2 Bureau Om niPage et modes d’affichage 31
fichiers, quel que soit le mode d’affichage, et le volet État du flux de
travail continue d’afficher des informations sur le dernier flux de
travail exécuté. Au redémarrage du programme, l’aide affiche la
rubrique de bienvenue et le Chargeur express le dossier par défaut ;
le volet État du flux de travail est vide.
Barres d'outils
Le programme dispose de onze barres d'outils principales. Le menu
Affichage permet de les afficher, de les masquer et de les
personnaliser. La barre d'état, affichée au bas de la fenêtre du
programme, affiche une description de chacun des outils
sélectionnés.
Barre d’outils Standard : Permet d'effectuer les opérations de base
d'OmniPage.
Barre d’outils Image : Permet d'effectuer les opérations sur les
images, les zones et les tableaux. Parmi ces outils, trois groupes
peuvent être manipulés séparément (mini barres d’outils) :
•Barre d’outils Zones : Pour le traçage de zones.
•Barre d’outils Rotation : Pour la rotation de pages.
•Barre d’outils Tableau : Pour l’insertion, le déplacement et
la suppression de séparateurs de lignes et de colonnes.
Barre d’outils Formatage : Permet de formater le texte reconnu
dans l'éditeur de texte.
Barre d’outils du vérificateur : Permet de contrôler l'emplacement
et l'aspect du vérificateur.
Barre d'outils de réagencement : Permet de modifier l'ordre des
éléments dans les pages reconnues.
Barre d’outils Marquage de texte : Permet de marquer et de biffer
du texte.
Chapitre 2 Bureau Om niPage et modes d’affichage 32
Barre d’outils Conception de formulaires : Permet de créer des
éléments de formulaire.
Barre d’outils Réorganisation de formulaires : Permet de
réorganiser et d'aligner les éléments de formulaire.
Dans chacun des modes d’affichage, les barres d’outils peuvent être
déplacées et personnalisées selon vos besoins, y compris en cas
d’utilisation de deux écrans.
Les barres d’outils Conception de formulaires,
Réorganisation de formulaires et Marquage de texte
(reportez-vous au chapitre 4, page 83 pour plus
d’informations) ne sont disponibles que dans OmniPage
Professional 17.
Principales étapes de l’OCR
OmniPage propose trois modes de traitement des documents :
automatique, manuel ou par flux de travail. Ces trois modes
impliquent globalement les mêmes étapes principales :
Importer des images de document dans OmniPage.
Vous pouvez numériser un document papier (avec ou
sans chargeur de feuilles automatique) ou charger un
ou plusieurs fichiers image.
Exécuter l’OCR pour obtenir du texte éditable. À l’issue
de la reconnaissance, vous pouvez détecter et corriger
les erreurs éventuelles à l’aide du module de
vérification de l’OCR et éditer le document dans
l’éditeur de texte.
Exporter le document vers la destination de votre
choix. Une fois le document reconnu, vous pouvez
l’enregistrer dans un fichier (en spécifiant le nom et le
type voulus), le copier dans le Presse-papiers, l’envoyer comme
Chapitre 2 Principales étapes de l’OCR 33
pièce jointe à un e-mail ou le publier. Un même document peut être
enregistré plusieurs fois avec différents réglages d’emplacement, de
type de fichier, de formatage, etc., selon vos besoins.
Avec OmniPage, vous pouvez choisir l'une des méthodes de
traitement suivantes : automatique, manuel, combiné ou par flux de
travail. Vous pouvez lancer le processus de reconnaissance à partir
d'autres applications en utilisant la fonction Direct OCR
d'OmniPage, ou différer son lancement en planifiant son exécution à
une heure précise.
Les différents modes de traitement sont décrits dans le chapitre
suivant, ainsi que dans l'aide du programme.
Réglages
Les réglages OmniPage sont regroupés dans la boîte de
dialogue Options. Vous pouvez y accéder depuis la barre
d'outils Standard ou le menu Outils. Dans cette boîte de dialogue,
utilisez l'aide contextuelle pour obtenir des informations détaillées
sur chacune des options disponibles.
Utilisation d'OmniPage avec PaperPort
PaperPort® est un puissant logiciel de gestion de
documents papier édité par Nuance. Ce
programme permet de lier vos pages aux
applications appropriées. Ces pages peuvent
comporter des graphiques et/ou du texte. Si
PaperPort est présent sur un ordinateur doté
d'OmniPage, les services d’OCR de ce dernier
viennent compléter les fonctionnalités de
PaperPort. Pour choisir un programme d'OCR,
cliquez avec le bouton droit sur le lien PaperPort
d'application de texte, sélectionnez Préférences,
puis spécifiez OmniPage 17 en tant que programme d'OCR à utiliser.
Chapitre 2 Utilisation d'OmniPage avec PaperPort 34
À l’instar de Direct OCR, vous pouvez spécifier les réglages d’OCR
de votre choix.
PaperPort
offre la solution la plus simple et la plus rapide pour toute
personne qui souhaite transformer des documents papier en fichiers
numériques faciles à gérer, à retrouver et à manipuler. PaperPort
peut dialoguer avec des scanners, des imprimantes multifonction et
des photocopieurs numériques en réseau pour transformer des
documents papier en fichiers numériques. Par ailleurs, PaperPort
propose un système de dossiers clair et pratique.
Grâce aux vignettes affichées sur le bureau PaperPort, vous pouvez
réaliser visuellement le classement, la récupération et la
manipulation des documents numérisés : fichiers Word, feuilles de
calcul, fichiers PDF et photos numériques. Les outils d'édition de
PaperPort transforment avec succès l'aspect de vos documents
numérisés, alors que les outils d'annotation permettent d'ajouter
vos commentaires à toute image numérisée afin de les mettre en
valeur.
PaperPort est inclus dans la version Professional
d’OmniPage. Pour obtenir plus d’informations sur cette
application, reportez-vous à la documentation de
PaperPort. PaperPort doit être installé et désinstallé
séparément.
Chapitre 2 Utilisation d'OmniPage avec PaperPort 35
Traitement des documents
Ce chapitre décrit les modes de traitement des documents
disponibles sous OmniPage et fournit des détails sur les principales
étapes des procédures impliquées :
Méthodes de traitement
Avec OmniPage, vous pouvez choisir l'une des méthodes de
traitement suivantes :
Automatique
Une solution simple et efficace de traiter un
document consiste à laisser OmniPage s'en
charger pour vous. Sélectionnez les réglages
dans la boîte de dialogue Options et les commandes dans la boîte à
outils OmniPage, puis cliquez sur Lancer. OmniPage soumet chaque
page à toutes les étapes du traitement, si possible effectuant
plusieurs opérations en parallèle. Sous ce mode, le logiciel se charge
également de tracer les zones.
Manuel
Le traitement manuel vous assure un contrôle
plus précis du traitement de votre document.
Vous pouvez traiter chaque page
individuellement avec différents réglages. Le
programme s’arrête à chaque étape du
traitement : acquisition des images, réalisation
de l’OCR et exportation. Vous pouvez ainsi
tracer des zones manuellement ou modifier les langues de
Chapitre 3 Traitement des documents 36
reconnaissance. Pour lancer une étape, cliquez sur l'un des trois
boutons correspondants dans la boîte à outils OmniPage.
1.Utilisez le premier bouton pour importer des images.
2.Tracez manuellement les zones dans les pages dont vous ne
voulez traiter qu'une partie ou pour lesquelles vous voulez
fournir des instructions de zones précises. Appliquez la valeur
Ignorer aux fonds ou aux zones que vous voulez exclure du
traitement. Appliquez la valeur Traiter aux fonds ou aux zones
pour lesquels vous voulez définir le traçage automatique des
zones.
3.Utilisez le deuxième bouton pour lancer la reconnaissance des
pages.
4.Effectuez vos travaux de vérification et d’édition, selon vos
besoins.
5.Utilisez le troisième bouton pour enregistrer les résultats de
votre travail.
Lors du traitement manuel, toutes les pages affichées sont
automatiquement sélectionnées par défaut. Un simple clic suffit
ainsi pour reconnaître le contenu de toutes les nouvelles pages. Ce
réglage par défaut peut être modifié via l'onglet Traitement de la
boîte de dialogue Options.
Traitement combiné
Vous pouvez traiter un document automatiquement, puis afficher le
résultat obtenu dans l'éditeur de texte. Si la qualité de l'ensemble du
document est bonne et que seules certaines pages sont
insatisfaisantes, vous pouvez passer au traitement manuel pour
modifier les réglages et relancer la reconnaissance des pages
incorrectes. Vous pouvez aussi importer les images manuellement,
tracer des zones sur tout ou partie d'entre elles, puis appliquer à
toutes les pages le traitement automatique en appuyant sur le
bouton Lancer et en choisissant de traiter les pages existantes.
Chapitre 3 Méthodes de trait ement 37
Flux de travail
Un flux de travail se compose d’une série d’étapes et
de réglages s’y rapportant. Ils incluent
généralement, mais pas obligatoirement, une étape
de reconnaissance. Son déroulement peut ne pas se conformer au
schéma de traitement traditionnel (« 1-2-3 »). Les flux de travail
sont répertoriés dans la liste déroulante Flux de travail. Celle-ci
comprend un certain nombre de flux de travail proposés par le
système, en plus de ceux que vous avez créés. Les flux de travail
vous permettent de gérer plus efficacement les tâches récurrentes.
Les différentes étapes et leurs réglages y sont prédéfinis. Vous
pouvez placer l’icône Agent OmniPage dans votre barre de tâches.
Le menu contextuel associé répertorie vos flux de travail. Cliquez
sur un flux de travail pour lancer OmniPage et exécuter ce flux.
L'Assistant Flux de travail vous guide tout au long de la création de
vos flux de travail. Il propose une série d’étapes et les réglages qui y
sont associés. Après avoir défini une étape, cliquez sur Suivant pour
en ajouter de nouvelles. L’Assistant vous assiste, si besoin, lors du
traitement automatique. Reportez-vous à la section « Assistant
Flux de travail » du chapitre
6, page 109 .
Traitement différé
Le module OmniPage Batch Manager permet de différer
la reconnaissance automatique des documents (par
exemple, à une heure où vous n'utilisez pas votre
ordinateur). La gestion et l’exécution des travaux
s’effectuent dans Batch Manager.
allumé au moment du lancement d’un travail différé, mais vous pouvez
l’éteindre entre le moment où le travail est créé dans Batch Manager et
l’heure à laquelle débute le traitement planifié. Si le travail en question
implique une numérisation, votre scanner doit être allumé au moment
du démarrage du travail et les pages correspondantes doivent être
placées dans le chargeur ADF.
L’ordinateur doit simplement être
Chapitre 3 Méthodes de trait ement 38
Lorsque vous sélectionnez l’option Créer un travail, l'Assistant
Travail puis l'Assistant Flux de travail apparaissent. La sélection
d’options et de réglages est légèrement modifiée dans le second
assistant. La première fenêtre de l'Assistant Travail vous permet de
définir le type et le nom du travail. Dans les fenêtres suivantes, vous
pouvez spécifier une heure de lancement, la répétition du travail ou
les instructions spécifiques de surveillance des dossiers.
Un travail intègre un flux de travail pour lequel des instructions de
planification ont été définies. Reportez-vous à la section « Batch
Manager » du chapitre
6, page 112.
Traitement à partir d’autres applications
La fonction Direct OCR™ permet de faire appel aux services OCR
d’OmniPage à partir des applications suivantes : Microsoft
Office XP ou supérieur, Corel WordPerfect 12 ou X3. Avant de
pouvoir utiliser cette fonction, vous devez activer l’option Activer
Direct OCR sous Outils > Options > Général. Ensuite, deux boutons
ajoutés à l’onglet Nuance OCR d’Office 2007 ou à une barre d’outils
OmniPage permettent d’accéder aux services d’OCR.
Configuration de Direct OCR
Démarrez l’application à lier à OmniPage. Lancez OmniPage, ouvrez
la boîte de dialogue Options, puis l’onglet Général et sélectionnez
Activer Direct OCR.
Dans l’application cible, utilisez le bouton Configuration
d’acquisition du texte de la barre d’outils OmniPage (dans Office
2007, ouvrez l’onglet Nuance OCR). Sélectionnez les options de
votre choix dans les volets suivants :
•OCR : langues, dictionnaires, mise en page, polices.
•Traitement : prétraitement des images, options
d’ouverture des PDF, conservation de la mise en page.
Chapitre 3 Méthodes de trait ement 39
•Format de sortie : définition d’un niveau de formatage.
•Direct OCR : traçage manuel ou automatique des zones,
activation ou désactivation de la vérification, source de
l’image.
•Scanner : configuration ou modification des paramètres du
scanner.
Les réglages effectués s’appliquent à l’ensemble des opérations
futures de Direct OCR jusqu'à leur éventuelle modification ; ils ne
sont pas pris en compte si vous utilisez OmniPage sans Direct OCR.
Utilisation de Direct OCR
1.Démarrez l’application et ouvrez un document. Pour importer
dans le document les résultats des pages numérisées, placez
celles-ci correctement dans le scanner.
2.Utilisez le bouton Configuration d’acquisition du texte de
la barre d’outils OmniPage ou la même commande dans le menu
Fichier de l’application cible (ou l’onglet Nuance OCR dans
Office 2007) pour vérifier et modifier, si nécessaire, les
paramètres de reconnaissance ; le volet Direct OCR vous
permet de spécifier si l’entrée provient du scanner, d’un fichier
image ou d'un appareil photo numérique.
3.Utilisez le bouton Acquérir le texte de la barre d’outils
OmniPage ou la même commande dans le menu Fichier (dans
Office 2007, utilisez l’onglet Nuance OCR) pour acquérir des
images à partir de la source spécifiée.
4.Si vous avez sélectionné l’option Définir les zones automatiquement
dans l’onglet Direct OCR de la boîte de dialogue Options ou
dans la fenêtre Configuration d'acquisition du texte, la
reconnaissance est lancée immédiatement.
5.Si vous n’avez pas sélectionné l’option Définir les zones
automatiquement, le programme vous propose de tracer des zones
Chapitre 3 Méthodes de trait ement 40
manuellement sur chaque image de page. Cliquez sur le bouton
Exécuter l’OCR pour poursuivre la reconnaissance.
6.Si la fonction de vérification a été activée, cette opération suit
l’OCR. Le texte reconnu est ensuite inséré dans votre
application à l’emplacement du curseur, avec le niveau de
formatage spécifié grâce à la commande Configuration
d’acquisition du texte du volet Format de sortie.
Définition de la source des images de page
Les images peuvent provenir des trois sources suivantes : fichiers
image, appareil photo numérique et scanner. Il existe
essentiellement deux types de scanner : à plat et à alimentation
feuille à feuille. Pour faciliter la numérisation des documents
multipages, un scanner peut être équipé d’un chargeur automatique
(ADF). Les images des documents numérisés peuvent être soit
exportées directement dans OmniPage, soit enregistrées avec le
logiciel du scanner, dans un format de fichier image utilisable dans
OmniPage.
Importation de fichiers image
Vous pouvez créer un fichier image à partir de votre scanner, ou le
recevoir par e-mail ou par fax. La liste des types de fichiers image
compatibles avec OmniPage 17 est très étendue. Sélectionnez
Charger des fichiers dans la liste déroulante Importer page(s).
Spécifiez les fichiers dans la boîte de dialogue Charger des fichiers.
Celle-ci apparaît lorsque vous démarrez le traitement automatique.
Lors d’un traitement manuel, cliquez sur le bouton Importer
page(s) ou utilisez la commande appropriée du menu Traitement.
Les réglages évolués, proposés dans la partie inférieure de la boîte de
dialogue, peuvent être affichés ou masqués selon vos préférences.
Chapitre 3 Définition de la source des images de page 41
La largeur ou la hauteur minimale des fichiers image est de
16 x 16 pixels. La largeur ou la hauteur maximale est de 8 400 pixels
(71 cm/28 pouces pour une résolution comprise entre 201 à
600 ppp). Pour connaître toutes les limites en pixels, reportez-vous
à l’aide.
Vous pouvez définir le mode d’ouverture des fichiers PDF sous
Outils > Options > Traitement : affichage de la couche de texte ou
ouverture en tant qu’image, importation des informations des
balises pour conserver la mise en page et utilisation des polices du
PDF ou des polices système mappées.
Avec OmniPage Professional 17, il est possible d’importer
des fichiers depuis des serveurs FTP ou depuis des sources
Microsoft SharePoint 2003 et 2007, Hummingbird,
iManage ou depuis un système de gestion documentaire
compatible ODMA.
Importation de photos numériques
Vous pouvez importer des photos de documents en vue
de leur reconnaissance dans OmniPage. Assurez-vous
tout d’abord que le pilote de votre appareil photo est
installé correctement. Raccordez ensuite votre appareil photo, puis
téléchargez vos images. Sélectionnez Charger des photos
numériques dans la liste déroulante Importer page(s). Avec cette
méthode, les traitements suivants sont automatiquement exécutés :
redressement 3D, amélioration de la résolution et redressement des
lignes de texte. Vous pouvez également procéder à un redressement
3D manuel. Pour plus d’informations, reportez-vous à la section
« Outils de retouche d’images » ci-après dans ce chapitre.
Pour importer des photos numériques contenant du texte à l’aide de
Direct OCR ou de PaperPort, activez la case à cocher Charger en
tant que photo numérique. Les améliorations citées précédemment
seront automatiquement appliquées.
Chapitre 3 Définition de la source des images de page 42
Pour obtenir des conseils sur la manipulation de photos
numériques, reportez-vous aux Guides d’apprentissage et à l'aide.
Importation de fichiers avec le Chargeur express
Cet outil permet d’accéder à une interface semblable à celle de
l’Explorateur Windows dans une fenêtre d’OmniPage. Dans les
modes Flexible et Conversion rapide, le Chargeur express apparaît
par défaut. Sélectionnez Chargeur express dans le menu Fenêtre
pour l’ajouter au mode Classique ou pour l’afficher ou le masquer
dans les autres modes. Cet outil vous permet de parcourir
l’ensemble de votre système de fichiers et de sélectionner
efficacement les fichiers que vous souhaitez charger dans
OmniPage. Choisissez Traitement > Chargeur express > Dossier pour
afficher les fichiers sous forme de listes, de vignettes, de mosaïques,
d’icônes (organisées à votre guise) ou de façon détaillée, comme
vous en avez l’habitude dans l’Explorateur Windows. Le Chargeur
peut rester affiché pendant que vous travaillez.
Pour lancer le Chargeur express, accédez au menu Traitement. Au
lieu de sélectionner des fichiers et les envoyer directement dans
OmniPage, vous pouvez choisir l’option Fenêtre de la file pour
afficher une boîte de dialogue dotée d’une fonction de verrouillage.
Activez le verrouillage pour compiler et réorganiser une liste de
fichiers (même en provenance de différents dossiers). Le
verrouillage s’applique à tous les fichiers collectés pour être ajoutés
au document ouvert. Lorsque la liste est finalisée, désactivez le
verrouillage pour démarrer le chargement. Si le verrouillage est
désactivé dès le début, les fichiers sont uniquement répertoriés si
leur sélection est effectuée plus rapidement qu’OmniPage ne peut
les charger. Dans la pratique, vous pouvez charger quelques fichiers,
lancer la reconnaissance et, pendant que cette opération est en
cours, compiler le reste de la liste d’entrée.
Si vous activez la commande de menu Afficher/Masquer automatiquement la fenêtre de la file, la fenêtre apparaît chaque fois que
Chapitre 3 Définition de la source des images de page 43
des fichiers sont en attente de chargement, et se ferme dès que la
liste est vide.
Le Chargeur express peut être utilisé dans les modes Classique et
Flexible pour compiler des fichiers pour plusieurs documents.
Activez le verrouillage, activez le document 1 et collectez les
fichiers. Activez ensuite le document 2 et collectez les fichiers
correspondants, et ainsi de suite. Lorsque vous avez terminé,
désactivez le verrouillage. Chaque document possède son propre
verrou, mais le menu Traitement dispose des options Verrouiller tout
et Déverrouiller tout qui permettent de verrouiller ou libérer tous les
fichiers de tous les documents. Vous pouvez supprimer les fichiers
sélectionnés à l’aide de l’option Supprimer, ou supprimer tous les
fichiers de la liste du document en cours à l’aide des options
Supprimer tout ou Effacer du menu Traitement. Choisissez l’option
Vider tout pour supprimer tous les fichiers de tous les documents
ouverts. Reportez-vous au didacticiel de l’aide consacré au
chargement de fichiers pour plusieurs documents.
Le Chargeur express est disponible sous la forme d’un volet dans le
mode Conversion rapide. Le menu Traitement possède deux
commandes spécifiques au mode Conversion rapide.
•Importer et convertir permet un traitement « en un clic » :
les fichiers sont chargés, traités par un programme d’OCR
et enregistrés selon les paramètres actuellement définis.
Dans ce seul cas, plusieurs fichiers peuvent être
sélectionnés en mode Conversion rapide, et un document
de sortie est créé pour chaque fichier d’entrée. Avant de
commencer, sélectionnez Identique au nom de fichier source
sous l’en-tête Nom de fichier en sortie.
•Charger des fichiers charge les fichiers sans effectuer de
procédure de reconnaissance, comme dans les autres
modes d’affichage. En mode Conversion rapide, cette
option permet de charger un seul fichier à la fois. Le
Chapitre 3 Définition de la source des images de page 44
traitement doit être achevé avant qu’un nouveau fichier
d’entrée puisse être sélectionné. Dans ce cas, la fenêtre de
la file et son verrou ne sont d’aucune utilité.
Le Chargeur express peut traiter les photos numériques. Pour cela,
définissez le paramètre correspondant dans le volet Options du
mode Conversion rapide avant de démarrer le Chargeur express. Si
l’importation est définie sur Numériser, ce paramètre est
temporairement ignoré et les pages sont chargées comme des
images normales (ne provenant pas d’un appareil photo
numérique).
Toutes les fonctionnalités de l’Explorateur Windows sont
disponibles dans le Chargeur express. Par exemple, vous pouvez
également sélectionner des fichiers et utiliser l’élément de menu
contextuel OmniPage 17 pour les envoyer vers MS Excel, MS Word,
PDF, RTF, un fichier au format texte et WordPerfect. Les
paramètres existants sont utilisés et les fichiers générés sont placés,
par défaut, dans le dossier d’entrée. Utilisez l’Assistant Convertir
maintenant pour accéder aux paramètres de base et déterminer, par
exemple, si les résultats doivent ou non être affichés dans
l’application cible. Cet Assistant vous permet d’effectuer des
conversions immédiates ou d’ouvrir l’Assistant Flux de travail pour
accéder à tous les paramètres, ce qui permet notamment de modifier
le nom et l’emplacement des fichiers cibles. Cet élément de menu
contextuel permet également d’afficher tous les flux de travail
comportant un fichier image en entrée.
Importation de documents à partir d’un scanner
Pour bénéficier de cette fonction, vous devez disposer d’un scanner
compatible, opérationnel et correctement configuré en vue d’une
utilisation avec OmniPage 17. Le programme offre plusieurs modes
Chapitre 3 Définition de la source des images de page 45
de numérisation que vous choisissez en fonction des deux facteurs
suivants :
•le type de graphique souhaité dans le document de sortie ;
•le mode qui produira la reconnaissance la plus précise.
Numériser en noir et blanc
Sélectionnez cette option pour lancer une numérisation
en noir et blanc. La rapidité de numérisation et de
traitement ainsi que le moindre espace disque occupé
représentent les deux principaux avantages de ce mode
de numérisation par rapport aux deux autres.
Numériser en niveaux de gris
Sélectionnez cette option pour lancer une numérisation
en niveaux de gris. Pour de meilleurs résultats de
reconnaissance, utilisez cette option pour les pages
présentant un contraste variable ou réduit (peu de
différence entre les zones claires et sombres) et un fond
en couleur ou en dégradé.
Numériser en couleur
Sélectionnez cette option pour lancer une numérisation
en couleur. Cette option n’est disponible que si vous
disposez d’un scanner couleur. Elle est particulièrement
adaptée si vous souhaitez conserver les graphiques, le
texte et les fonds en couleur dans le document de sortie.
La numérisation en couleur offre une meilleure précision
d’OCR que le mode en niveaux de gris, mais exige un
temps de traitement plus long et une plus grande
quantité de mémoire et d’espace disque.
Chapitre 3 Définition de la source des images de page 46
Luminosité et contraste
Le réglage de la luminosité et du contraste joue un rôle important
dans la précision de l'OCR. Vous définissez ces paramètres dans
l’onglet Scanner de la boîte de dialogue Options ou par
l’intermédiaire de l'interface de votre scanner. Dès le chargement
d’une image, vérifiez son aspect. Si les caractères sont gras et
compacts, augmentez la luminosité. Si les caractères sont fins et
tronqués, assombrissez l’image. Une fois les modifications requises
effectuées, renumérisez la page. Si la qualité de la numérisation vous
paraît toujours décevante, ouvrez l'image numérisée dans la fenêtre
Retouche d'une image et éditez-la à l'aide des différents outils
proposés.
Numérisation avec un chargeur automatique (ADF)
La meilleure méthode pour numériser des documents de plusieurs
pages est d’utiliser un chargeur automatique. Placez les pages dans
l’ordre requis dans le chargeur. Un chargeur ADF accepte également
la numérisation de pages recto verso. Les scanners dotés de
fonctions recto verso assurent un traitement automatique des
pages.
Numérisation sans chargeur automatique
Même si vous ne disposez pas d’un chargeur automatique,
l’interface de numérisation d’OmniPage vous permet de numériser
efficacement des documents multipages à l’aide de votre scanner à
plat. Sélectionnez l’option Numériser les pages automatiquement (onglet
Scanner de la boîte de dialogue Options) et définissez une valeur de
pause en secondes. Ainsi le scanner effectue les passes de
numérisation automatiquement, en marquant une pause de durée
spécifiée entre chaque numérisation pour vous permettre de charger
la page suivante.
Chapitre 3 Définition de la source des images de page 47
Numérisation vers OmniPage et utilisation des flux
de travail
Accédez à Outils > Options > Scanners pour choisir l’action exécutée
lorsque vous appuyez sur un bouton de votre scanner local. Il peut
s’agir d’une simple numérisation avec chargement des images dans
OmniPage. Il est également possible de sélectionner un flux de
travail de numérisation parmi ceux déjà créés, ou d’activer
l’affichage d’un message invitant à sélectionner un flux de travail
chaque fois que vous appuyez sur ce bouton. Utilisez le bouton
Panneau de configuration pour associer OmniPage à un événement
de scanner (pression exercée sur un bouton du scanner). Lorsque
vous appuyez sur ce bouton, OmniPage démarre, exécute le flux de
travail et envoie les résultats vers la cible définie, avec ou sans votre
intervention.
Avec OmniPage Professional, cette fonctionnalité peut également
être utilisée pour lancer des flux de travail invoqués par codes à
barres (reportez-vous au chapitre
6, page 114).
Conversion de documents
Outre des fichiers image, OmniPage Professional 17
permet d’ouvrir des documents créés dans des
programmes de traitement de texte et d’autres
applications similaires. (fichiers .doc, .xls, .ppt, .rtf, .wpd, etc.).
Cliquez sur le bouton Charger des fichiers dans la boîte à outils
OmniPage ou sélectionnez Charger des fichiers dans le sous-menu
Importer page(s) du menu Fichier. Dans la boîte de dialogue qui
apparaît, choisissez Documents. Lorsque vous avez terminé,
choisissez votre format d’enregistrement parmi l’un des nombreux
types de fichiers proposés. Pour réaliser ces conversions, Nuance
PDF Create doit être installé.
Chapitre 3 Définition de la source des images de page 48
Définition de la mise en page du document
Avant de commencer la reconnaissance d’un document, OmniPage
vous demande de décrire la mise en page de celui-ci dans le but de
faciliter le traçage automatique des zones. Cette fonction s’applique
également en cas de traitement automatique, à moins que vous
n’ayez spécifié un gabarit ne contenant aucune zone ou fond à
valeur Traiter. Lors d’un traitement manuel, le traçage de zones
automatique est parfois activé. Reportez-vous à la rubrique
Activation du traçage de zones automatique de l’aide en ligne. Pour décrire
le document original, vous disposez des options suivantes :
Automatique
Choisissez cette option pour laisser le programme prendre
toutes les décisions concernant la définition des zones. Le
programme détermine si l’élément est du texte en colonnes,
un graphique, du texte à reconnaître ou un tableau à
conserver.
Colonne unique sans tableau
Choisissez ce réglage si vos pages contiennent une seule
colonne de texte et aucun tableau. Ce type de mise en page
est employé généralement dans les livres et les lettres
commerciales.
Colonnes multiples sans tableau
Choisissez cette option si certaines de vos pages contiennent
du texte en colonnes que vous souhaitez disposer sans
colonnes ou dans des colonnes distinctes (correspondant à la
mise en page originale).
Chapitre 3 Définition de la mise en page du document 49
Colonne unique avec tableau
Choisissez cette option si vos pages contiennent une seule
colonne de texte et un tableau.
Feuille de calcul
Choisissez cette option si l'intégralité de la page se présente
sous la forme d'un tableau que vous souhaitez exporter dans
une feuille de calcul ou en tant que tableau unique.
Formulaire
Choisissez cette option si l'intégralité de la page se présente
sous la forme d'un formulaire dont vous souhaitez
reconnaître automatiquement les éléments. À l'issue de la
reconnaissance, vous pouvez modifier les propriétés des
éléments de formulaire, ajouter de nouveaux éléments ou
modifier la mise en page du formulaire. Cette option n'est
disponible qu'avec OmniPage Professional 17.
Document juridique
Choisissez cette option pour reconnaître des documents
juridiques. Les en-têtes sont détectés et supprimés
automatiquement, et vous devez indiquer si vous souhaitez
conserver ou pas les numéros de ligne.
Personnalisé
Choisissez cette option pour contrôler au maximum le
déroulement du traçage de zones automatique. Vous pouvez
désactiver ou forcer la détection de colonnes, de graphiques
et/ou de tableaux. Sélectionnez les réglages requis dans
l'onglet OCR de la boîte de dialogue Options.
Chapitre 3 Définition de la mise en page du document 50
Gabarit
Choisissez un fichier de gabarit de zones si vous souhaitez
appliquer une valeur de fond, avec ses zones et propriétés, à
toutes les pages importées. Les zones définies par le gabarit
sont appliquées à la page actuelle, et remplacent les zones
existantes.
Si le traçage automatique des zones produit des résultats
inattendus, utilisez le traitement manuel pour redéfinir les zones
sur les pages individuelles et relancer leur reconnaissance.
Prétraitement des images
Afin d'optimiser le processus d’OCR, vous pouvez utiliser les outils
de retouche pour améliorer la qualité de vos images avant de
procéder à leur découpage en zones et à leur reconnaissance. Pour
ouvrir la fenêtre Retouche d'une image, cliquez sur le bouton SET Retoucher l'image dans la barre d'outils Image, ou choisissez
Retoucher l'image dans le menu Outils. Vous pouvez également
intégrer à vos flux de travail un processus de retouche d'images en
choisissant l'étape Retoucher les images.
L'image primaire est utilisée en tant qu'entrée pour le processus de
retouche d'images.
Il existe trois types d'image :
Image originale : Image générée par numérisation ou incorporée
dans un fichier électronique avant son importation dans le
programme.
Image primaire : État de l'image originale une fois chargée dans
OmniPage. Cette image peut avoir été modifiée par des opérations
de prétraitement automatiques ou manuelles.
Image OCR : Image en noir et blanc dérivée de l'image primaire,
optimisée pour une reconnaissance optimale.
Chapitre 3 Prétraitement des images 51
Certains outils affectent l'image primaire, tandis que d'autres
Inacceptable
Tolérable
Bonne
Optimale
Bonne
Tolérable
Inacceptable
s'appliquent à l'image OCR. Déterminez avec précision le type
d'image qui sera modifié par le processus.
Le réglage de la luminosité et du contraste joue un rôle important
dans la précision de l'OCR. Vous définissez ces paramètres dans
l’onglet Scanner de la boîte de dialogue Options ou par
l’intermédiaire de l'interface de votre scanner. Le diagramme cidessous illustre le réglage de luminosité optimal. Dès le chargement
d’une image, vérifiez son aspect. Si les caractères sont gras et
compacts, augmentez la luminosité. Si les caractères sont fins et
tronqués, assombrissez l’image. Utilisez l'outil Luminosité de
l'OCR pour optimiser l'image.
Chapitre 3 Prétraitement des images 52
Outils de retouche d'images
Les outils de retouche d'images permettent également d'éditer des
images afin de les enregistrer en tant que fichiers image. Attention :
certains de ces outils affectent uniquement les images primaires,
tandis que d'autres s'appliquent aux fichiers utilisés pour l'OCR (ou
images OCR). Dans la fenêtre Retouche d'une image, cliquez sur le
bouton Image primaire/OCR pour visualiser l'état actuel des deux
images.
La fenêtre Retouche d’une image se compose de deux volets.
L’image de départ apparaît dans le volet de gauche. Vos
modifications sont affichées dans le volet d’aperçu de droite.
Lorsque vous cliquez sur Appliquer les modifications, l’image de
droite apparaît dans le volet de gauche et devient la nouvelle image
de départ que vous pouvez continuer à éditer.
Les outils suivants sont disponibles dans la barre d’outils ; leurs
fonctions sont détaillées ci-dessous :
P – Affecte uniquement l’image primaire.
O – Affecte uniquement l’image OCR.
PO – Peut être appliqué à l’image primaire ou à l’image OCR (ou aux
deux).
P+O – Une même action est appliquée à l’image primaire et à l’image
OCR.
P/O – Affecte les deux images.
IE – S’applique uniquement aux images entières.
ZO – Peut être appliqué à certaines zones des images.
Pointeur (F5) - Le pointeur est un outil neutre qui permet de
réaliser différentes actions (comme sélectionner une couleur
de remplissage ou la ligne de redressement d’une image) selon
les circonstances. PO.
Chapitre 3 Prétraitement des images 53
Zoom (F6) - Cliquez sur cet outil, puis utilisez le bouton
gauche de la souris pour agrandir l'image ou le bouton droit
pour la réduire. Vous pouvez également utiliser la roulette de
la souris pour agrandir ou réduire l'image à votre gré, y
compris dans la vue inactive. Dans la vue active, les boutons
« + » et « - » ont la même fonction. P+O. IE.
Sélectionner une zone (F7) - Cliquez sur cet outil, puis
sélectionnez un autre outil applicable sur une zone de page
(portant la mention ZON) et dessinez les contours de votre
sélection. Par défaut, les outils de retouche d'images
s'appliquent à la page entière. Il existe trois modes de
sélection (accessibles via le menu Affichage) : Normal, Additif
et Soustractif. PO. ZO.
Image primaire/OCR - Cet outil permet de basculer entre
l'affichage de l'image primaire et de l'image OCR dans la vue
active. Les images primaires sont associées à n'importe quel
mode image. En revanche, les images OCR (version noir et
blanc des images primaires) sont générées uniquement pour la
reconnaissance. P/O. IE.
Synchroniser les vues - Cliquez sur cet outil pour appliquer à
la vue inactive un facteur de zoom et une position de
défilement identiques à ceux définis pour la vue active. Pour
synchroniser de façon dynamique la vue inactive avec la vue
active, choisissez la commande Maintenir la synchronisation
dans le menu Affichage. PO. IE.
Les outils SET suivants vous permettent de modifier le contenu de
votre image :
Luminosité et contraste - Cet outil permet d'ajuster la
luminosité et le contraste de toute ou partie de l'image
primaire. Utilisez les glissières situées dans la partie inférieure
de la fenêtre pour atteindre le résultat escompté. P. ZO.
Chapitre 3 Prétraitement des images 54
Teinte > Saturation > Clarté - Cliquez sur cet outil, puis
utilisez les glissières pour modifier la teinte, la saturation et la
clarté de l'image primaire. P. ZO.
Découper - Pour n’utiliser qu’une partie de l’image, cliquez
sur l’outil Sélectionner une zone, puis sélectionnez l’outil
Découper et la zone de l’image que vous souhaitez conserver.
Le reste de l’image sera alors supprimé. P+O. IE > ZO
Rotation - Utilisez cet outil pour faire pivoter (de 90, 180 ou
270 degrés) et/ou retourner l'image. P+O. IE.
Nettoyer - Cet outil permet de supprimer les parasites de
l'image. L’outil de nettoyage opère sur l’image OCR à quatre
niveaux. Vous pouvez également l'utiliser pour inverser le
nettoyage et renforcer le contour des lettres. Pour ce faire, il
vous suffit de cocher la case Inverser le nettoyage. O. ZO.
Luminosité d’OCR - Cet outil permet de définir la luminosité
et le contraste de l'image OCR. Reportez-vous au diagramme
du réglage de luminosité optimal à la section « Prétraitement
des images » ci-avant. O. ZO.
Ignorer couleur - Cliquez sur cet outil et sélectionnez Rouge,
Vert ou Bleu ou choisissez une couleur dans l'image primaire à
l'aide de l'outil Sélectionner une zone. Les sections de l'image
numérisée dans cette couleur deviendront transparentes. Cet
outil s'applique à l'image OCR. P/O. IE.
Résolution - Utilisez cet outil pour réduire la résolution de
l'image primaire, indiquée en pourcentages. Notez qu'il est
impossible de définir une résolution supérieure à celle de
l'image originale. P. IE.
Redresser - Certaines pages peuvent avoir été numérisées de
travers. Dans ce cas, l'outil Redresser vous permet de redresser
manuellement les lignes de texte. Une option de redressement
Chapitre 3 Prétraitement des images 55
automatique est également disponible dans l'onglet Traitement de
la boîte de dialogue Options. P+O. IE.
Redressement 3D - Utilisez cet outil pour supprimer la
distorsion de perspective sur des images provenant d’un
appareil photo numérique. Utilisez cet outil pour vérifier les
résultats de redressement 3D automatique, ou pour procéder à
un redressement 3D manuel après une étape Charger des
fichiers. P+O. IE.
Remplir - Utilisez cet outil pour appliquer une couleur à
l’image ou à une partie de l’image. PO. ZO.
Le redressement 3D fonctionne par l’alignement d’une image sur
une grille de référence. Il vous suffit d’étirer manuellement cette
grille pour que les coordonnées de l’image soient modifiées en
conséquence. Reportez-vous à l’illustration suivante pour plus
d’informations (Avant > Après Redressement 3D).
Historique des retouches apportées aux images
L'historique de la fenêtre Retouche d'une image vous permet de
valider ou d'annuler (individuellement ou globalement) les
modifications apportées à vos images. Les modifications apportées à
l'image originale apparaissent dans l'aperçu correspondant.
Toutefois, elles ne deviennent effectives que lorsque vous cliquez
sur le bouton Appliquer les modifications, situé en regard de la liste
Chapitre 3 Prétraitement des images 56
de l'historique. Les modifications qui n'ont pas été ajoutées dans
l'historique à l'aide du bouton Appliquer ne seront pas validées.
Pour vérifier le résultat d'une action, cliquez deux fois dessus dans
la liste de l'historique.
Pour ignorer les modifications que vous avez effectuées à l'aide d'un
outil donné et que vous n'avez pas encore appliquées, sélectionnez
l'action appropriée dans la liste puis cliquez sur le bouton
Réinitialiser.
Pour restaurer l'image à son état d'origine, cliquez sur le bouton
Ignorer toutes les modifications.
Enregistrement et application de modèles de
retouche automatique
Si vous devez retoucher de la même manière un certain nombre
d'images similaires, vous pouvez créer une liste d'actions de
retouche qui seront appliquées à la totalité des images.
Pour créer et enregistrer un modèle de retouche automatique
d'images, affichez un fichier image dans la fenêtre Retouche d'une
image, réalisez les actions de prétraitement souhaitées, puis
ajoutez-les dans l'historique en cliquant sur le bouton Appliquer.
Choisissez ensuite la commande Enregistrer le modèle de retouche
automatique dans le menu Fichier. Sélectionnez le dossier de
destination de votre choix, puis enregistrez le fichier modèle
(associé à l'extension .ipp).
Pour appliquer à une autre image les modifications définies dans le
fichier modèle, ouvrez la nouvelle image dans la fenêtre Retouche
d'une image, puis choisissez Charger un modèle de retouche
automatique dans le menu Fichier.
Chapitre 3 Prétraitement des images 57
Intégration d'un processus de retouche d'images à un
flux de travail
Pour intégrer un processus de retouche à un flux de
travail, choisissez l'icône appropriée dans l'Assistant
Flux de travail. Vous avez le choix entre les options
suivantes :
Afficher les images en vue d'une retouche manuelle - Lors de
l'exécution d'un flux de travail, chaque image chargée sera affichée
en vue d’une retouche manuelle.
Appliquer un modèle de retouche automatique - Un modèle de
retouche enregistré sera automatiquement appliqué à l'image traitée
par le flux de travail.
Appliquer un modèle de retouche automatique et afficher les
images - Le flux de travail appliquera le modèle de retouche
sélectionné et l'image sera affichée pour permettre d’éventuelles
retouches supplémentaires.
Zones et fonds
Les zones définissent les sections de la page destinées à être traitées
ou ignorées. Elles peuvent prendre une forme rectangulaire ou
irrégulière (avec des côtés verticaux et horizontaux). Les images de
page d'un document possèdent une valeur de fond : Traiter ou
Ignorer (cette dernière étant la plus répandue). Vous pouvez utiliser
les outils indiqués pour modifier les valeurs de fond. Les outils
indiqués dans la section Types et propriétés de zone (voir cidessous) sont également disponibles pour tracer des zones sur des
fonds de page.
Traiter – Le document est découpé automatiquement en zones
(dans les zones ou les fonds de type Traiter) lors de son envoi pour
reconnaissance.
Chapitre 3 Zones et fonds 58
Ignorer – Les zones (dans les zones et fonds de type Ignorer) sont
exclues du traitement. Le texte n'est pas reconnu et aucune image
n'est transférée.
Traçage automatique des zones
Le traçage automatique des zones permet au programme de détecter
les éléments de page (blocs de texte, en-têtes, images et autres) et
de les inclure dans une zone.
Le traçage automatique des zones peut s'appliquer à toute la page
ou à une partie seulement. Les zones tracées automatiquement et les
zones de gabarit ont des bordures pleines ; les zones tracées
manuellement et les zones modifiées ont des bordures en pointillés.
Traçage automatique de zones sur un fond de page
Importez une page. Celle-ci s'affiche avec un fond de type
Traiter. Tracez une zone. La valeur de fond passe à Ignorer.
Tracez les zones Texte, Tableau ou Graphique afin de délimiter
manuellement les zones de type voulu. Cliquez sur l'outil Fond à
valeur Traiter (voir illustration) afin de définir un fond de ce type.
Tracez des zones à valeur Ignorer sur les parties inutiles de la page.
À l'issue de la reconnaissance, la page réapparaît : elle comprend un
fond à valeur Ignorer et de nouvelles zones encadrant tous les
éléments du fond.
Traçage automatique des zones de texte vertical
Si la langue de reconnaissance est définie sur le japonais, le coréen
ou le chinois, le traçage automatique des zones détecte les zones de
texte et identifie l’orientation du texte. Le texte asiatique vertical
apparaît horizontalement dans l’éditeur de texte, mais peut être
exporté verticalement (reportez-vous au chapitre 4, page 74).
Le traçage automatique des zones détecte le texte vertical rédigé
dans des langues non asiatiques à l’intérieur des cellules de tableaux
Chapitre 3 Zones et fonds 59
et partout sur les pages PDF ou XPS. La détection sur plusieurs
lignes est alors possible.
Pour les fichiers PDF et XPS constitués uniquement d’images et
tous les autres fichiers de numérisation ou fichiers image en entrée,
la détection automatique fonctionne dans les conditions suivantes :
•Une seule ligne de texte doit être présente
•Le texte doit se trouver à droite ou à gauche d’un
diagramme ou d’une image ou
•Le texte doit se trouver sur le bord gauche ou droit de la
page et ne doit pas s’étendre sur toute la hauteur de la page.
Le texte vertical placé à l’extérieur des tableaux peut être découpé
manuellement en zones, en suivant la procédure ci-dessous. Le
traitement de plusieurs lignes verticales est ainsi optimisé.
Le texte vertical peut être affiché et édité avec un curseur vertical
dans l'éditeur de texte, dans le niveau de formatage True Page. Avec
les autres niveaux de formatage, le texte apparaît horizontalement.
Types et propriétés de zone
Chaque zone est affectée à un type et les zones comportant du texte
peuvent également présenter un paramètre de contenu de zone :
alphanumérique ou numérique. Le type et le contenu d'une zone
représentent les « propriétés de la zone ». Pour modifier les
propriétés d’une zone, cliquez dessus avec le bouton droit pour
afficher son menu contextuel et effectuez les sélections souhaitées.
Pour changer les propriétés de plusieurs zones simultanément,
sélectionnez le groupe de zones requis (combinaison Maj.+clic)
avant de choisir les nouvelles valeurs.
La barre d'outils Image propose des outils de traçage de zones (un
pour chaque type).
Chapitre 3 Zones et fonds 60
Zone Traiter
Cet outil permet de tracer une zone à valeur Traiter, afin de
définir une section qui sera soumise au traçage de zones
automatique. À l'issue de la reconnaissance, cette zone est
remplacée par une ou plusieurs zones dont les types sont
déterminés automatiquement.
Zone Ignorer
Cet outil permet de tracer une zone à valeur Ignorer, afin de
définir une section à ne pas transférer vers l'éditeur de texte.
Zone Texte
Cet outil permet de tracer une zone Texte. sur un bloc de
texte unique. Le contenu des zones est assimilé à un
enchaînement de texte, sans aucune colonne. La zone Texte
permet d’insérer du texte en caractères latins, grecs et
cyrilliques, ainsi que des textes horizontaux en langue
asiatique.
Zone Texte asiatique vertical
Cet outil permet de tracer des zones Texte afin d’y insérer du
texte vertical en japonais ou en chinois. Ces zones doivent
être de forme rectangulaire.
Zone Texte vertical et pivoté vers la gauche
Cet outil permet de tracer des zones Texte afin d’y insérer du
texte vertical pivoté vers la gauche (langues non asiatiques
uniquement). Les zones doivent être de forme rectangulaire.
Zone Texte vertical et pivoté vers la droite
Cet outil permet de tracer des zones Texte pour insérer du
texte vertical pivoté vers la droite (langues non asiatiques
uniquement). Les zones doivent être de forme rectangulaire.
Chapitre 3 Zones et fonds 61
Zone Tableau
Utilisez ce type pour traiter le contenu de la zone en tant que
tableau. Les grilles du tableau peuvent être détectées
automatiquement ou placées manuellement. Les zones
Tableau doivent être de forme rectangulaire. Le texte vertical
placé à l’intérieur des tableaux ne peut pas être découpé
manuellement en zones ; il peut être détecté
automatiquement dans les tableaux à cellules.
Zone Graphique
Utilisez ce type pour entourer une illustration, un
diagramme, un dessin, une signature et tout autre élément
que vous souhaitez transmettre à l’éditeur de texte en tant
qu’image incorporée plutôt que texte reconnu.
Zone Formulaire
Utilisez ce type pour délimiter une zone de votre document
contenant des éléments de formulaire, tels qu'une case à
cocher, un bouton radio, un champ de texte ou tout autre
élément que vous souhaitez transmettre à l'éditeur de texte
en tant qu'élément de formulaire. Ensuite, dans le niveau de
formatage True Page, modifiez la mise en page du formulaire
ainsi que les propriétés de ses éléments. Les zones
Formulaire ne sont prises en charge qu'avec OmniPage
Professional 17.
Manipulation de zones
La barre d’outils Image propose des outils
d’édition de zones. Pour plus de commodités, des
groupes d’outils peuvent être détachés sous la
forme de mini barres d’outils flottantes. Un de
ces outils est toujours sélectionné ; pour modifier la sélection en
cours, cliquez sur un autre outil. Certains de ces outils sont groupés.
En cas d’ancrage comme outil unique, seul le dernier outil
Chapitre 3 Zones et fonds 62
sélectionné du groupe est visible. Pour sélectionner un outil visible,
cliquez dessus.
Pour tracer une zone unique, sélectionnez l'outil de traçage de zone
de type voulu, puis cliquez à l'emplacement requis et faites glisser le
curseur dans la direction souhaitée.
Pour redimensionner une zone, sélectionnez-la (en cliquant
dessus), amenez le curseur sur un côté ou un angle, activez une
poignée et amenez-la à l'emplacement voulu. La zone
redimensionnée ne peut pas recouvrir une autre zone.
Pour créer une zone irrégulière par addition, tracez une zone
recouvrant partiellement une autre zone du même type.
Pour regrouper deux zones du même type, tracez une zone
recouvrant une autre zone du même type (dans l'illustration
suivante, les zones tracées figurent à gauche, tandis que la zone
résultante apparaît à droite).
Pour créer une zone irrégulière par soustraction, tracez une zone
recouvrant une autre zone du même type que le fond.
Pour diviser une zone, tracez une zone de division du même type
que le fond.
Pour obtenir des exemples d’illustration de traçage de zones,
reportez-vous à l’aide.
Lorsque la nouvelle zone tracée recouvre partiellement une zone
existante d'un type différent, une superposition complète ne se
produit pas ; la nouvelle zone remplace seulement la partie
recouverte de la zone existante.
Chapitre 3 Zones et fonds 63
Les types de zones suivants sont interdits :
Le traçage rapide de zones vous permet de définir rapidement des
zones manuelles. Activez le curseur de sélection de zones, puis
déplacez le curseur sur l’image de page. Des parties ombrées
apparaissent. Elles indiquent les zones détectées automatiquement.
Cliquez deux fois sur chaque partie ombrée pour la transformer en
zone.
Gestion des grilles du tableau dans l’image
À l’issue d’un traitement en mode automatique, OmniPage
peut placer des zones de type Tableau sur la page traitée.
Ces zones comportent une icône de zone Tableau dans leur
angle supérieur gauche. Vous pouvez modifier le type
affecté à une zone rectangulaire via son menu contextuel.
Vous pouvez également tracer des zones de type Tableau,
mais elles doivent toujours être rectangulaires.
La création ou le déplacement des lignes de séparation
verticales et horizontales d'un tableau permet de
déterminer l’emplacement de la grille lors du placement du
tableau dans l’éditeur de texte. Vous pouvez tracer ou
redimensionner une zone Tableau (à condition de
conserver sa forme rectangulaire) pour éliminer les
colonnes ou les rangées inutiles des bords extérieurs d'un
tableau.
Les outils de tableau vous permettent d'insérer, de déplacer et de
supprimer des séparations de rangées et de colonnes. Cliquez sur
l'outil Insérer/Supprimer les séparations pour détecter
Chapitre 3 Zones et fonds 64
automatiquement des séparations dans un tableau et créer de
nouvelles séparations.
Vous pouvez spécifier le formatage de lignes pour les bordures et les
grilles de tableau à partir d'un menu contextuel. Vous disposerez de
davantage d'options d'édition des bordures et de fond dans l'éditeur
de texte à l'issue de la reconnaissance.
Utilisation de gabarits de zones
Un fichier de gabarit contient une valeur de fond de page, un groupe
de zones et leurs propriétés. Pour appliquer les zones d'un gabarit
lors de la reconnaissance, chargez un fichier de gabarit de zone via la
liste déroulante du bouton de description de la mise en page ou à
l'aide du menu Outils. Vous pouvez charger les gabarits créés par
d’autres utilisateurs et stockés sur un emplacement du réseau.
Lorsque vous chargez un gabarit, son fond et ses zones sont
appliqués dans les pages de différentes manières :
•Dans la page actuelle, les zones du gabarit remplaçant les
zones présentes dans la page.
•Dans les pages importées par la suite.
•Sur les pages préexistantes envoyées pour (nouvelle)
reconnaissance sans aucune zone
Dans les deux premiers cas, le traitement manuel permet de
consulter et modifier les zones tracées à l'aide du gabarit avant la
reconnaissance.
En traitement automatique, les zones tracées à l'aide du gabarit
peuvent être consultées et modifiées seulement après la
reconnaissance.
En traitement par flux de travail, utilisez l'étape Définir des zones
sur des images qui combine une étape de chargement d'un gabarit et
une étape de traçage manuel de zones. Pour utiliser un gabarit de
zone, cliquez sur le bouton Ajouter dans la fenêtre appropriée de
Chapitre 3 Zones et fonds 65
l'Assistant Flux de travail, puis sélectionnez le fichier de gabarit de
zones souhaité. Choisissez ensuite si vous souhaitez afficher les
images en vue du traçage manuel des zones, appliquer le gabarit de
zone ou appliquer le gabarit de zone et afficher les images.
Les gabarits acceptent les zones et les fonds à valeur Ignorer et
Traiter. Par conséquent, ils peuvent être très utiles pour définir les
parties de la page destinées au traitement à l'aide du traçage
automatique des zones et les parties à ignorer. Pendant la
reconnaissance, vous pouvez remplacer les zones ou les fonds à
valeur Traiter par un groupe de zones plus petites, auxquelles
seront attribués des types de zones spécifiques.
Enregistrement d’un gabarit de zones
Sélectionnez une valeur de fond et préparez les zones de la page.
Vérifiez l'emplacement et les propriétés de ces zones. Cliquez sur
Gabarit de zones dans le menu Outils. Dans la boîte de dialogue
affichée, sélectionnez
entrez le nom voulu et, le cas échéant, un chemin d’accès différent.
Sélectionnez un emplacement du réseau sur lequel installer le
fichier de gabarit que vous souhaitez partager. Cliquez sur OK. Le
nouveau gabarit de zone reste chargé.
[zones sur la page] et cliquez sur Enregistrer ;
Modification d’un gabarit de zones
Chargez un gabarit et importez une image au moyen d'un
traitement manuel. Les zones de gabarit apparaissent sur l'image.
Modifiez les zones et/ou les propriétés selon vos besoins. Ouvrez la
boîte de dialogue Fichiers de gabarit de zones. Le gabarit actuel est
sélectionné. Cliquez sur Enregistrer puis sur Fermer.
Déchargement d’un gabarit de zones
Dans la liste Description de la mise en page, sélectionnez un élément
autre qu’un gabarit. Les zones du gabarit ne sont pas supprimées de
la page actuelle ou des pages existantes, mais le gabarit n'est plus
configuré pour utilisation lors des futurs traitements. Vous pouvez
Chapitre 3 Zones et fonds 66
également ouvrir la boîte de dialogue Fichiers de gabarit de zones,
sélectionner
Dans ce cas, l'option de description de la mise en page reprend la
valeur Automatique.
[aucun] et cliquer sur le bouton Définir comme actuel.
Remplacement d’un gabarit par un autre
Sélectionnez un autre gabarit dans la liste Description de la mise en
page, ou ouvrez la boîte de dialogue Fichiers de gabarit de zones,
sélectionnez le gabarit souhaité et cliquez sur le bouton Définir
comme actuel. Les zones définies par le nouveau gabarit sont
appliquées à la page actuelle, et remplacent les zones existantes.
Ces zones sont appliquées comme décrit précédemment.
Suppression d’un gabarit de zones
Ouvrez la boîte de dialogue Fichiers de gabarit de zones.
Sélectionnez un gabarit et cliquez sur le bouton Supprimer. Les
zones déjà créées à l'aide de ce gabarit ne sont pas supprimées. Les
gabarits de zones peuvent uniquement être supprimés depuis le
système d’exploitation.
Incorporation d’un gabarit de zones au sein d’un fichier
OPD
Ouvrez un document, puis sélectionnez Gabarits de zones dans le
menu Outils. Sélectionnez le fichier que vous souhaitez incorporer,
puis cliquez sur Incorporer. Enregistrez ensuite votre document au
format OPD. Ainsi, si votre fichier OPD est déplacé vers un autre
emplacement, le gabarit sera transféré avec votre fichier. Lorsque le
fichier OPD est ouvert ultérieurement, le gabarit de zone incorporé
sera affiché dans la boîte de dialogue Gabarit de zones avec la
mention
gabarit sous un nouveau nom, à un nouvel emplacement.
[incorporé]. Il pourra être enregistré dans un fichier de
Chapitre 3 Zones et fonds 67
Vérification et édition
Les résultats de la reconnaissance sont affichés dans l’éditeur de
texte. Il peut s'agir d'un texte reconnu, de tableaux, de formulaires
et de graphiques incorporés. L'éditeur aux capacités d'affichage
fidèle (« WYSIWYG ») fait l’objet d’une description détaillée dans
le présent chapitre. Le traitement des textes asiatiques diffère
quelque peu de celui des autres langues. Voir « Reconnaissance des
langues asiatiques », page 74.
Affichage et niveaux de formatage de
l'éditeur
L’éditeur de texte affiche le texte reconnu et, en fonction de vos
réglages, signale les mots qui ont été considérés comme « douteux »
pendant la reconnaissance, en les soulignant d'une ligne ondulée
rouge. Dans le module de vérification de l'OCR, ces mots sont
affichés en rouge.
Un mot est considéré comme « douteux » s'il ne figure dans aucun
des dictionnaires actifs (standard, utilisateur ou spécialisés) ou s'il
figure dans le dictionnaire actif mais qu'il n'a pas été correctement
identifié à l'issue du processus d'OCR. Les caractères douteux sont
signalés par une mise en surbrillance jaune, à la fois dans l'éditeur de
texte et dans le module de vérification de l'OCR.
Vous pouvez activer ou désactiver les marques des mots absents du
dictionnaire dans l’onglet Vérification de la boîte de dialogue
Options. Les marques peuvent être affichées ou masquées selon les
options sélectionnées dans l’onglet Éditeur de texte de cette même
boîte. Vous pouvez également afficher ou masquer les caractères
Chapitre 4 Vérification et édition 68
non imprimables et les indicateurs d’en-tête et de bas de page.
L’onglet Éditeur de texte permet également de définir l'unité de
mesure du programme et de configurer le retour à la ligne
automatique dans tous les niveaux de formatage de l’éditeur de
texte, à l’exception du niveau Texte brut.
OmniPage 17 peut afficher les pages selon trois niveaux de
formatage. Pour passer d'un niveau à l'autre, sélectionnez l'un des
trois boutons présents dans l’angle inférieur gauche de l’éditeur de
texte ou utilisez le menu Affichage.
Texte brut
Pour afficher le texte en une seule colonne alignée à gauche et
appliquer un seul style et corps de police, tout en conservant les
sauts de ligne de l’original.
Texte formaté
Pour afficher le texte en conservant les formats de caractères et
de paragraphes, mais en supprimant les mises en colonnes.
True Page
True Page® permet de conserver au maximum le formatage du
document original. Les styles de caractère et de paragraphe
sont conservés. L'ordre de lecture peut être indiqué par des
flèches.
Vérification des résultats de l’OCR
À l’issue de la reconnaissance d’une page, les résultats de l’opération
apparaissent dans l’éditeur de texte. La vérification démarre
automatiquement si l’option correspondante a été activée dans
l’onglet Vérification de la boîte de dialogue Options. Vous pouvez
également lancer manuellement la vérification à n’importe quel
moment. Procédez comme suit :
Chapitre 4 Vérification des résultats de l’OCR 69
1.Cliquez sur l'outil Vérifier l’OCR dans la barre d’outils
Standard ou choisissez Vérifier l’OCR dans le menu Outils.
2.La vérification démarre au début du document, mais omet le
texte déjà vérifié. Si un mot douteux est détecté, la boîte de
dialogue Vérification de l’OCR affiche ce mot dans son
contexte, assorti de l'image originale correspondante. Les
caractères douteux sont signalés par une mise en surbrillance
jaune. La description suivante : « Mot douteux » ou « Mot
absent des dictionnaires » s'affiche.
3.Si le mot reconnu est correct, cliquez sur Ignorer ou Ignorer
tout pour passer au mot douteux suivant. Cliquez sur Ajouter
pour l’ajouter au dictionnaire utilisateur actuel et passer au mot
douteux suivant.
4.Si le mot reconnu est erroné, tapez la version correcte dans la
fenêtre d'édition ou sélectionnez une suggestion du
dictionnaire. Cliquez sur Remplacer ou Remplacer tout pour
valider votre correction et passer au mot douteux suivant.
Cliquez sur Ajouter pour ajouter le mot corrigé au dictionnaire
utilisateur actuel et passer au mot douteux suivant.
5.Au fur et à mesure que les mots douteux affichés dans l’éditeur
de texte sont vérifiés, les marques de couleur les accompagnant
disparaissent. Lors de la vérification, vous pouvez passer au
volet de l’éditeur de texte pour y effectuer les corrections
requises. Pour relancer la vérification, utilisez le bouton
Reprendre. Cliquez sur Page prête pour passer à la page
suivante ou sur Fermer pour arrêter la vérification avant
d’atteindre la fin du document.
Chapitre 4 Vérification des résultats de l’OCR 70
6.La vignette de toute page entièrement vérifiée porte l'icône de
Zoom avant/arrière
Quel niveau de contexte pour le
vérificateur dynamique ?
•Un mot
• Trois mots (le mot actuel + le mot
précédent et le mot suivant)
• Ligne d'image complète
vérification dans le gestionnaire de documents.
Sélectionnez Revérifier la page actuelle... dans le menu Outils
pour relancer la vérification de la page.
Vérification du texte reconnu
Lorsque la reconnaissance est terminée, vous pouvez en évaluer la
précision en comparant les différentes parties du texte reconnu avec
les parties correspondantes de l'image originale.
L'outil Vérificateur se trouve dans la barre d'outils de
formatage. Vous pouvez également l’activer/le désactiver à
partir du menu Outils. Placez le curseur sur le volet du
vérificateur pour afficher sa barre d'outils. Utilisez cet outil
pour effectuer les opérations suivantes :
Pour activer le vérificateur, cliquez sur l'outil Vérificateur ou
appuyez sur F9. Pour le désactiver, cliquez à nouveau sur l'outil
Vérificateur ou appuyez une nouvelle fois sur F9. Vous pouvez
également appuyer sur la touche Échap.
Pour obtenir la liste complète des raccourcis clavier disponibles
avec le vérificateur, consultez l'aide en ligne.
Chapitre 4 Vérification du texte reconnu 71
Table de caractères
La table de caractères est une barre d'outils « ancrable »
très utile lors de la vérification. Elle sert principalement à :
•insérer, lors de la vérification et de l'édition de texte, des
caractères qui sont absents ou difficilement accessibles sur
le clavier. La table de caractères s'apparente à cet égard à la
table de caractères système ;
•afficher tous les caractères validés dans les langues de
reconnaissance actuellement sélectionnées.
Pour ouvrir la table de caractères, cliquez sur le bouton
correspondant dans la barre d'outils Formatage ou sélectionnez
Table de caractères dans le menu Affichage, puis cliquez sur
Afficher.
Dans le sous-menu Table de caractères, vous pouvez également
choisir ne n'afficher que les caractères récents, ou différents jeux de
caractères (par défaut, seuls deux sont affichés). Les caractères
asiatiques ne sont pas pris en charge.
Vous pouvez également ouvrir la table de caractères en procédant
comme suit :
•Sélectionnez Outils > Options, puis cliquez sur l’onglet
OCR. Cliquez sur le bouton Caractères supplémentaires
pour sélectionner les caractères à inclure lors de la
vérification. Vous pouvez également modifier le caractère
de rejet via la table de caractères.
•Sélectionnez Nouveau caractère dans le menu Outils.
Cliquez sur le bouton (...), situé en regard du champ
Corriger.
•Dans l'éditeur de texte, sélectionnez Nouveau caractère
dans le menu contextuel d'un mot douteux ou absent des
dictionnaires.
Chapitre 4 Table de caractères 72
Dictionnaires utilisateur
OmniPage est livré avec des dictionnaires en plusieurs langues qui
facilitent la reconnaissance et peuvent proposer des suggestions
pendant la vérification de l'OCR. Ces dictionnaires intégrés peuvent
être remplacés par des dictionnaires créés par l’utilisateur. Vous
pouvez enregistrer plusieurs dictionnaires utilisateur, mais ne
pouvez charger qu'un seul dictionnaire à la fois. Le dictionnaire
Personnalisé est le dictionnaire utilisateur par défaut de Microsoft
Word.
Lancement d’un dictionnaire utilisateur
Cliquez sur le bouton Ajouter de la boîte de dialogue Vérification de
l'OCR (aucun dictionnaire utilisateur n'étant chargé), ou ouvrez la
boîte de dialogue Fichiers de dictionnaire utilisateur à partir du menu
Outils et cliquez sur Nouveau.
Chargement ou déchargement d’un dictionnaire utilisateur
Réalisez ces opérations depuis l’onglet OCR de la boîte de dialogue
Options ou à partir de la boîte de dialogue Fichiers de dictionnaire
utilisateur.
Édition ou suppression d’un dictionnaire utilisateur
Pour ajouter des mots à un dictionnaire utilisateur, chargez votre
dictionnaire puis cliquez sur le bouton Ajouter dans la boîte de
dialogue Vérification de l’OCR. Vous pouvez ajouter et supprimer des
mots en cliquant sur Édition dans la boîte de dialogue Fichiers de
dictionnaire utilisateur. Vous pouvez également importer des mots à
partir des dictionnaires utilisateur OmniPage (*.ud). Lors de l’édition
d’un dictionnaire utilisateur, vous pouvez optimiser l’opération
d’ajout de nouveaux mots en important la liste des mots requis à
partir d’un fichier texte standard. Chaque mot doit être placé sur une
ligne séparée et il ne doit être ni précédé ni suivi d'aucun signe de
ponctuation. Le bouton Supprimer vous permet de supprimer le
dictionnaire utilisateur sélectionné de la liste.
Chapitre 4 Dictionnaires utilisateur 73
Pour incorporer un dictionnaire utilisateur à un document
OmniPage : chargez votre document, sélectionnez Outils >
Dictionnaire utilisateur, sélectionnez le dictionnaire utilisateur que
vous souhaitez incorporer à votre document, cliquez sur Incorporer,
donnez un nom à votre dictionnaire, puis cliquez sur OK. Pour
terminer, enregistrez votre fichier au format Document OmniPage.
Langues
OmniPage peut reconnaître plus de 120 langues dans de nombreux
alphabets : latin, grec, cyrillique, chinois, japonais et coréen. La liste
complète des langues prises en charge est disponible dans l'onglet
OCR de la boîte de dialogue Options. Cette liste distingue les
langues disposant d’un dictionnaire. Vous trouverez également la
liste de ces langues sur le site Web de Nuance.
En plus des dictionnaires utilisateur, le programme propose, pour
certaines langues, des dictionnaires spécialisés (dans l'immédiat,
domaines médical et juridique). Reportez-vous à la liste et effectuez
les sélections voulues dans l’onglet OCR de la boîte de dialogue
Options.
Reconnaissance des langues asiatiques
Quatre langues basées sur des alphabets asiatiques sont prises en
charge, à savoir : le japonais, le coréen, le chinois traditionnel et le
chinois simplifié. Pour les textes écrits dans ces langues, la taille de
police idéale est de 12 points numérisés avec une résolution de
300 ppp, ce qui génère des caractères d'environ 48 x 48 pixels. La
taille minimale des caractères est de 30 x 30 pixels, ce qui
correspond à une taille de police de 10,5 points numérisés à 300 ppp.
Si votre texte comporte des caractères plus petits, nous vous
recommandons d'utiliser une résolution de numérisation de
400 ppp. Les textes asiatiques être lus horizontalement (de gauche
à droite) ou verticalement (de haut en bas et de droite à gauche). Les
Chapitre 4 Langues 74
systèmes d'exploitation pris en charge par OmniPage 17 peuvent
gérer les langues asiatiques, à condition que la prise en charge des
langues d'Extrême-Orient ait été sélectionnée durant l'installation
du système. Si tel n'est pas le cas, vous devez l'ajouter en
sélectionnant Panneau de configuration > Options régionales et
linguistiques > Langues > Prise en charge de langues
supplémentaires > Installer les fichiers pour les langues d'ExtrêmeOrient. Vous devrez peut-être insérer un disque système Windows.
Les quatre langues asiatiques sont répertoriées dans la liste
alphabétique des langues prises en charge disponible dans l'onglet
OCR de la boîte de dialogue Options. Ne sélectionnez qu'une seule
de ces langues à la fois et évitez toute sélection multiple avec
d'autres langues. L'OCR des langues asiatiques peut reconnaître de
courts passages de texte en anglais, sans que cette langue n'ait été
configurée de façon explicite. Toutefois, cette possibilité ne
s'applique pas aux passages plus longs ou aux autres langues
occidentales. Les textes japonais et chinois comportent
généralement une orientation verticale, mais il est possible d'y
insérer un texte anglais comportant une orientation différente. Le
programme gère cette différence d'orientation en appliquant aux
caractères anglais reconnus une rotation vers la droite.
L'option Vérifier les choix de langues, située en regard de la liste des
langues, active la détection automatique des langues et vous avertit
si la langue détectée est différente de la langue paramétrée. Cette
option identifie quatre catégories de langues au niveau des pages :
japonais, chinois, coréen et non asiatique. Elle ne permet pas de
distinguer le chinois traditionnel du chinois simplifié, ni les langues
non asiatiques entre elles. La catégorie non asiatique signifie
qu’aucun caractère japonais, chinois ou coréen n'a été détecté. Cette
vérification ayant lieu lors du prétraitement de l'image, la langue de
reconnaissance requise doit être définie avant le chargement de
l'image.
Chapitre 4 Langues 75
Les options de mise en page et de traçage automatique des zones
sont recommandées pour les pages en langue asiatique. Tous les
éléments de texte détectés seront ainsi placés dans des zones de
texte. Si vous choisissez une langue de reconnaissance asiatique,
l'OCR des caractères asiatiques sera exécuté dans ces zones. Il
détectera et transmettra automatiquement l'orientation du texte et
pourra gérer les zones mixtes de la page comportant à la fois du
texte horizontal et vertical.
Toutefois, l'outil de traçage des zones vous permet de forcer la
reconnaissance des caractères asiatiques verticaux en procédant au
traçage manuel des zones. Utilisez cet outil pour tracer des zones
rectangulaires. Pour tracer manuellement des zones dans un texte
asiatique horizontal, utilisez le type de zone Texte habituel.
N'utilisez pas les deux autres outils Texte vertical sur des textes
asiatiques. Le fait de tracer une zone verticale sur des caractères
asiatiques n'active pas automatiquement l'OCR de la langue
asiatique ou la détection automatique de la langue.
Les images de texte provenant d'appareils photo numériques sont
acceptées pour les langues asiatiques. Toutefois, l'algorithme de
redressement 3D automatique risque de ne pas fonctionner, surtout
pour les textes orientés verticalement. Utilisez de préférence la
commande de chargement d'image standard et effectuez un
redressement 3D manuel à l'aide de l'outil SET approprié, le cas
échéant. En règle générale, les outils SET peuvent être utilisés sur
les images de texte asiatique.
Les pages asiatiques reconnues apparaissent dans l'éditeur de texte,
à condition que votre système prenne en charge les langues
d'Extrême-Orient, avec une orientation horizontale. Il n'est pas utile
de spécifier des polices asiatiques dans l'onglet OCR de la boîte de
dialogue Options, une police par défaut étant automatiquement
appliquée (généralement
Arial Unicode MS). Vous pouvez choisir
toute autre police compatible avec les langues asiatiques installée
Chapitre 4 Langues 76
sur votre système, via l'éditeur de texte. L'éditeur prend en charge
l'affichage et la vérification du texte ; il est recommandé de choisir le
niveau de formatage Texte formaté. L'édition et la vérification
orthographique à grande échelle sont optimisées dans l'application
cible. Les options de vérification, les fonctions d'apprentissage et les
dictionnaires ne sont pas pris en charge pour les textes asiatiques.
Par conséquent, avant de lancer l'OCR sur une page comportant des
caractères asiatiques, désactivez les options de marquage des mots
absents du dictionnaire, de vérification automatique et d'activation
d'IntelliTrain dans l'onglet Vérification de la boîte de dialogue
Options. Assurez-vous également qu'aucun fichier d'apprentissage
n'est chargé. Les textes asiatiques peuvent être biffés, soit par
sélection directe, soit via l'utilisation de la fonction de recherche.
L'étape du flux de travail permettant l'extraction de données de
formulaire ne doit pas être appliquée aux pages asiatiques.
Les filtres de sortie pour les textes asiatiques sont généralement
RTF, Microsoft Word, PDF avec recherches ou XPS. L'orientation
du texte sera celle détectée durant le prétraitement. Les
modifications apportées dans l'éditeur de texte (pour du texte
horizontal) seront exportées vers du texte vertical, le cas échéant.
Des filtres Texte brut sont disponibles (TXT Unicode, Bloc-notes),
mais avec une orientation de texte toujours horizontale.
Apprentissage
L'apprentissage correspond à la procédure permettant de modifier
les solutions d'OCR attribuées aux caractères de l'image. Cette
fonction est utile pour les documents présentant une dégradation
uniforme ou un type de police inhabituel dans la totalité de leur
contenu. OmniPage 17 propose deux types d'apprentissage : manuel
et automatique (via IntelliTrain). Les données provenant des deux
types d'apprentissage sont combinées et vous pouvez les enregistrer
dans un fichier d'apprentissage.
Chapitre 4 Apprentissage 77
Lorsque vous fermez une page pour laquelle des données
d'apprentissage ont été générées, le programme vous demande de
spécifier la manière de les appliquer aux autres pages existantes du
document.
Apprentissage manuel
Pour lancer un apprentissage manuel, placez le point d'insertion
devant le caractère à ajouter ; vous pouvez aussi sélectionner un
groupe de caractères (un mot maximum) et choisir Nouveau
caractère dans le menu Outils ou le menu contextuel. Une vue
agrandie des caractères à ajouter s'affiche, assortie de la solution
d'OCR actuelle. Remplacez-la par la solution voulue et cliquez sur
OK. Le programme accepte cet apprentissage et examine le reste de
la page. S'il trouve des mots susceptibles d’être modifiés, il les
affiche dans la boîte de dialogue Vérification de l'apprentissage.
Vous devrez recommencer l'apprentissage des mots incorrects avant
de valider la liste.
IntelliTrain
IntelliTrain est une forme d'apprentissage automatisé, capable de
mémoriser les corrections effectuées par l'utilisateur lors de la
vérification de l'OCR. Lorsque vous effectuez une modification,
IntelliTrain retient la forme du caractère concernée et la correction
apportée. Par la suite, le module parcourt le document à la recherche
des formes de caractères similaires, notamment parmi les mots
douteux, et évalue la pertinence de la correction de l'utilisateur.
Le module IntelliTrain peut être activé et désactivé via l’onglet
Vérification de la boîte de dialogue Options. IntelliTrain conserve
les données d'apprentissage générées par l'opération et les ajoute, le
cas échéant, à l'apprentissage manuel que vous avez effectué. Vous
pouvez les enregistrer dans un fichier d'apprentissage pour
réutilisation avec des documents similaires.
Chapitre 4 Apprentissage 78
Pour obtenir des exemples d'utilisation avec IntelliTrain, reportezvous à l'aide.
Fichiers d’apprentissage
Lorsque vous refermez un document, ou que vous basculez vers un
autre document, alors que des données d’apprentissage n’ont pas été
enregistrées, une boîte de dialogue s’affiche, vous invitant à le faire.
Pour incorporer un fichier d’apprentissage à un fichier OPD,
chargez-le (Outils > Fichier d’apprentissage), cliquez sur Incorporer
puis enregistrez le fichier au format Document OmniPage.
Vous pouvez enregistrer des données d’apprentissage dans un
fichier, ainsi que charger, éditer et décharger des fichiers
d’apprentissage via la boîte de dialogue Fichiers d’apprentissage.
Des données d’apprentissage non enregistrées peuvent être éditées
dans la boîte de dialogue Modification du fichier d’apprentissage ;
un astérisque s’affiche dans la barre de titre à la place du nom de
fichier. Enregistrez-les dans la boîte de dialogue Fichiers
d'apprentissage.
Vous pouvez également éditer un fichier d’apprentissage ; dans ce
cas, son nom apparaît dans la barre de titre. Si des données
d’apprentissage non enregistrées ont été ajoutées au fichier, son
nom est accompagné d’un astérisque. Les données d’apprentissage
non enregistrées et modifiées sont sauvegardées à la fermeture de la
boîte de dialogue.
La boîte de dialogue Modification du fichier d'apprentissage affiche
des cadres comportant une forme de caractère et la solution d’OCR
qui lui est assignée. Cliquez sur un cadre pour le sélectionner. Vous
pouvez ensuite le supprimer à l’aide de la touche Suppr ou modifier
la solution proposée. Pour passer au cadre précédant ou suivant,
utilisez les touches fléchées.
Chapitre 4 Apprentissage 79
Édition du texte et des images
Vous éditez
des données
d’apprentiss
age non
enregistrées.
Ce cadre a
été supprimé.
Pour annuler
sa suppression,
resélectionnezle et appuyez
sur la touche
Suppr.
Ce cadre est
sélectionné.
En haut : la forme de l'image.
En bas : la solution OCR.
Cliquez deux fois sur le
cadre ou appuyez sur
Entrée pour modifier la
solution d’OCR associée.
L'éditeur de texte d'OmniPage est doté de capacités d’affichage
fidèles (« WYSIWYG »), et ses fonctions d’édition sont très proches
des possibilités offertes par les applications de traitement de texte
les plus courantes.
Édition d’attributs de caractère
Tous les niveaux d'affichage de l'éditeur autres que le niveau Texte
brut permettent de modifier le type, le corps et les attributs (gras,
italique, souligné) de la police appliqués au texte sélectionné.
Édition d’attributs de paragraphe
Tous les niveaux d'affichage de l'éditeur autres que le niveau Texte
brut permettent de modifier l'alignement des paragraphes
sélectionnés et de les formater avec des puces.
Styles de paragraphe
Les styles de paragraphe présents dans un document sont détectés
automatiquement pendant la reconnaissance. Une liste des styles est
créée et présentée dans une boîte de sélection dans la partie gauche de
Chapitre 4 Édition du texte et des images 80
la barre d’outils de formatage. Cette liste permet d’attribuer un style
aux paragraphes sélectionnés.
Graphiques
Pour éditer des zones graphiques, votre ordinateur doit être équipé
d’un éditeur d’image. Choisissez la commande Éditer l’image avec
dans le menu Format. Vous pouvez, si vous le souhaitez, utiliser
l’éditeur d’image associé au format BMP sur votre système Windows
et charger le graphique. Vous pouvez également utiliser la commande
Choisir un programme... pour sélectionner un autre programme qui
deviendra l'éditeur d'images par défaut. Modifiez le graphique, puis
fermez l’éditeur d’image pour réintégrer le graphique dans l'éditeur
de texte. Ne modifiez pas la taille, la résolution ou le type de
graphique, car ces actions empêchent la réintégration. Les images
peuvent également être modifiées avant la reconnaissance à l'aide des
outils de retouche d'images.
Tableaux
Les tableaux s’affichent dans l’éditeur de texte sous forme de grilles.
Pour modifier un tableau, placez le curseur dans une zone de type
Tableau ; il change d'aspect et vous pouvez déplacer les traits de la
grille. Vous pouvez également utiliser les règles de l’éditeur de texte.
Modifiez l’emplacement du texte dans les cellules d'un tableau à
l’aide des boutons d’alignement de la barre d’outils de formatage et
des commandes de tabulation de la règle.
Hyperliens
Les adresses de courrier électronique et celles des pages Web peuvent
être détectées et placées en tant que liens dans le texte reconnu. Pour
éditer un lien existant ou en créer un nouveau, choisissez Hyperlien
dans le menu Format.
Édition dans le niveau de formatage True Page
Les éléments de page sont placés dans des blocs de texte, de tableau
et d'image, correspondant généralement aux zones Texte, Tableau et
Graphique de l'image. Cliquez dans un élément pour afficher la
Chapitre 4 Édition du texte et des images 81
bordure du bloc ; la couleur est identique dans les zones
correspondantes. La rubrique
sur les opérations décrites ci-après.
Les cadres ont des bordures grises et contiennent au moins un bloc.
Ils sont placés lorsqu'une bordure visible est détectée dans une
image. Vous pouvez définir les bordures et les dégradés d'un cadre
et d'un tableau au moyen du menu contextuel ou de la commande
Tableau du menu Format. Pour spécifier le dégradé d'un bloc de
texte, utilisez le menu contextuel.
Les zones multicolonnes présentent des bordures orange et
contiennent au moins un bloc. Détectées automatiquement, elles
indiquent le texte qui sera traité comme un enchaînement de
colonnes au moment de l'exportation avec le niveau de formatage
Pages avec enchaînements.
L'ordre de lecture peut être affiché et modifié. Pour visualiser
les flèches indiquant cet ordre, cliquez sur l'outil Afficher
ordre de lecture dans la barre d'outils de formatage. Cliquez
de nouveau pour supprimer les flèches.
Pour remplacer la barre d'outils de formatage par un groupe
de boutons de réagencement, cliquez sur l'outil Changer
l’ordre de lecture. L'ordre est modifié dans les niveaux de
formatage Texte brut et Texte formaté. Ce changement
modifie le mode de déplacement du curseur dans la page,
lorsque le document est exporté au format True Page.
True Page
de l'aide propose des détails
Édition en direct
Cette fonction vous permet de modifier une page reconnue par un
nouveau traçage de zones, sans devoir traiter une nouvelle fois la
page entière. Lorsque l'édition en direct est activée, les changements
de zone (suppression, définition, redimensionnement, changement
de type) s'appliquent immédiatement à la page reconnue. De même,
Chapitre 4 Édition en direct 82
lorsque vous modifiez des éléments dans le niveau de formatage
True Page de l'éditeur de texte, les changements effectués sont
répercutés sur les zones de la page.
Deux outils liés de la barre d'outils Image contrôlent le traçage en
zones en direct. L'un de ces outils est toujours actif lorsque aucune
reconnaissance n'est en cours.
Cliquez sur ce bouton pour activer l'édition en direct. La
couleur rouge indique qu'aucune modification de traçage de
zones n’est stockée.
Cliquez sur ce bouton pour désactiver l'édition en direct. Les
modifications apportées au traçage de zones sont stockées et
l'outil affiche la couleur verte. Pour appliquer ces
modifications, effectuez l'une des opérations suivantes :
Cliquez sur l'outil d’édition en direct doté de la couleur verte.
Les modifications de traçage de zones récupérées sont
appliquées dans l'éditeur de texte.
Cliquez sur le bouton Exécuter l’OCR pour reconnaître
la page entière, avec les changements de zone.
Pour plus de détails sur le traitement des changements dans le cadre
du traçage de zones en direct, ainsi que sur leur effet dans l'éditeur de
texte, reportez-vous à la rubrique
Traitement en direct
dans l'aide.
Marquage et biffure de texte
La barre d’outils Marquage de texte
propose des outils permettant de marquer
(mise en surbrillance ou effet barré), et de
biffer du texte. Pour afficher cette barre
d’outils, sélectionnez la commande
correspondante du menu Affichage. Vous
pouvez ancrer ou déplacer cette barre
d’outils sur votre espace de travail. Chaque outil correspond à une
Chapitre 4 Marquage et biffure de texte 83
commande du menu Formatage ou du menu contextuel de l’éditeur
de texte.
Les biffures permettent de noircir des informations confidentielles
afin de les rendre totalement illisibles et introuvables lors des
recherches. Pour marquer et biffer manuellement du texte, cliquez
sur l’outil Marquer pour biffure et utilisez votre curseur pour
sélectionner les sections de texte à biffer. Ces sections ne sont pas
biffées immédiatement, mais apparaissent en surbrillance grise.
Lorsque vous êtes prêt, cliquez sur l’outil Biffer le document. Dans la
boîte de dialogue qui apparaît alors, choisissez d’appliquer vos
biffures sur une copie du document (plus sûr) ou directement sur le
document actuel. Si vous choisissez de biffer une copie du
document, la copie et l’original restent ouverts dans OmniPage, en
vue de leur enregistrement.
ATTENTION : Si vous choisissez de biffer votre document original,
vous ne pourrez plus récupérer les informations que vous avez
biffées.
Vous pouvez également rechercher et biffer du texte sur l’ensemble
de votre document. Sélectionnez la commande Chercher et marquer
du texte du menu Édition pour afficher la boîte de dialogue
Chercher, remplacer et marquer du texte. Entrez le texte que vous
souhaitez marquer pour biffure, puis cliquez sur Suivant. Passez en
revue toutes les occurrences de ce texte dans votre document, et
choisissez de les biffer directement ou uniquement de les marquer
pour biffure. Dans ce dernier cas, vous pourrez appliquer vos
biffures en cliquant sur le bouton Fermer et biffer le document dans
la boîte de dialogue Marquer du texte, ou sur le bouton Biffer le
document de la barre d’outils Marquage de texte.
De la même manière, vous pourrez mettre en surbrillance ou barrer
du texte, soit en le sélectionnant, soit en le recherchant dans votre
document.
Chapitre 4 Marquage et biffure de texte 84
Lecture du texte à voix haute
La fonction de lecture du texte reconnu RealSpeak® de Nuance est
avant tout destinée aux personnes malvoyantes ; toutefois, elle peut
également faciliter les processus de vérification de l’OCR et de
contrôle du texte reconnu à tout utilisateur d’OmniPage. La lecture
à voix haute est contrôlée par les mouvements du point d’insertion
dans l’éditeur de texte (via la souris ou le clavier).
Modalités de lectureTouches utilisées
Un seul caractère à la fois, lecture
avant ou arrière
Mot actuelCtrl + Cinq du bloc numérique (1)
Mot suivant vers la droiteCtrl + flèche Droite
Mot suivant vers la gaucheCtrl + flèche Gauche
Une lignePlacez le point d’insertion dans la ligne
Ligne suivanteFlèche Bas
Ligne précédenteFlèche Haut
Phrase actuelleCtrl + Cinq du bloc numérique (2)
Depuis le point d’insertion jusqu’à la
fin de la phrase
Depuis le début de la phrase
jusqu’au point d'insertion
Page actuelleCtrl + Cinq du bloc numérique (3)
Depuis le début de la page actuelle
jusqu’au point d'insertion
Depuis le point d’insertion jusqu’à la
fin de la page actuelle
Flèche Droite ou Gauche. Les noms de
lettre, de nombre et de signe de
ponctuation sont prononcés.
Ctrl + Cinq du bloc numérique (6)
Ctrl + Cinq du bloc numérique (4)
Ctrl + Début
Ctrl + Fin
Chapitre 4 Lecture du texte à voix haute 85
Page précédente, suivante ou la
page de votre choix
Ctrl + PgPréc, PgSuiv ou boutons de
navigation
Caractères saisis
Chaque caractère saisi est prononcé
individuellement.
La fonction de synthèse vocale est activée ou désactivée via la
commande Mode synthèse vocale du menu Outils ou via la
touche F10. Le sous-menu Réglages de synthèse vocale… permet de
sélectionner le type de voix (masculine ou féminine dans une langue
donnée) et de configurer le débit et le volume de la lecture. Vous
devez vous assurer que la langue sélectionnée correspond au texte
que vous souhaitez écouter.
Vous disposez également des séquences clavier suivantes :
Action requiseSéquence utilisée
Interrompre/ReprendreCtrl + Cinq du bloc numérique (5)
Augmenter le débitCtrl + Signe plus du bloc numérique (+)
Réduire le débitCtrl + Signe moins du bloc numérique (-)
Rétablir le débitCtrl + Astérisque du bloc numérique (*)
Tous les modules de synthèse vocale sont installés si vous avez
choisi de procéder à une installation complète du programme. Si
vous avez réalisé une installation personnalisée, vous pouvez
sélectionner les langues des moteurs de synthèse vocale que vous
souhaitez installer.
Création et édition de formulaires
Vous pouvez importer dans OmniPage Professional 17 des
formulaires papier ou des formulaires électroniques
statiques (généralement distribués au format PDF dans les
environnements de bureau), afin de reconnaître et de
modifier leur contenu et/ ou leur mise en page dans le niveau de
Chapitre 4 Création et édition de formulaires 86
formatage True Page. Tracez manuellement des zones afin de
délimiter les parties de l'image du formulaire qui vous intéressent
préalablement à la reconnaissance. Vous pouvez également choisir
une mise en page de type Formulaire, puis apporter les
modifications de votre choix à l'aide des barres d'outils Conception
de formulaires et Réorganisation de formulaires. Le formulaire
remplissable généré peut être enregistré dans l’un des formats
suivants : PDF, RTF ou XSN (format Microsoft Office
InfoPath 2003). Les formulaires statiques peuvent être enregistrés
au format HTML. OmniPage Professional 17 utilise la technologie
TM
Logical Form Recognition
pour créer des formulaires
remplissables depuis des formulaires statiques.
OmniPage prend en charge la création et l'édition de formulaires,
mais les outils disponibles ne sont pas conçus pour leur remplissage.
Barre d'outils Conception de formulaires
Cette barre d'outils ancrable, affichée dans l'éditeur de texte, vous
permet de créer des éléments de formulaire à l'aide des outils
suivants :
Sélection :
redimensionner des éléments de formulaire.
Texte :
formulaire, comme par exemple des titres, des libellés et des entêtes.
Ligne :
en page : cliquez dessus et tracez les lignes afin de délimiter les
différentes sections de votre formulaire.
Rectangle :
dans votre formulaire.
Graphique :
de votre formulaire qui seront traitées comme des éléments
graphiques.
Cet outil permet de sélectionner, de déplacer ou de
Cet outil permet d'insérer des textes fixes dans votre
Cet outil sert principalement à la conception de la mise
Cliquez sur cet outil pour ajouter des rectangles
Cliquez sur cet outil pour sélectionner des zones
Chapitre 4 Création et édition de formulaires 87
Zone de texte :
remplissables. Il s’agit de champs dans lesquels les utilisateurs
devront saisir du texte.
Bande à peigne :
composés de cases, qui servent généralement à saisir des
informations dont le format est connu, telles que des codes
postaux.
Case à cocher :
cases à cocher. Ce type d'élément de formulaire est
généralement utilisé pour les questions de type Oui/Non ou à
choix multiples.
Texte entouré :
cocher (voir ci-dessus) : l'outil Texte entouré permet de créer
des éléments qui apparaissent entourés lorsqu’ils sont
sélectionnés.
Tableau :
formulaire.
Vous pouvez également créer des éléments de formulaire en
cliquant avec le bouton droit sur un élément de formulaire existant
dans un formulaire reconnu, puis en choisissant la commande
Insérer un élément de formulaire dans le menu contextuel qui
apparaît.
Cet outil permet de créer des champs de texte
Cet outil permet de créer des champs de texte
Cliquez sur cet outil, puis tracez à votre gré les
Ce type d'élément s'utilise comme les cases à
Cet outil permet d'insérer des tableaux dans votre
Barre d'outils Réorganisation de formulaires
Cette barre d'outils permet d'aligner les éléments de formulaire ou
de définir l'élément qui recouvrira un autre en cas de
chevauchement. Cette dernière fonction est très utile si vous
souhaitez créer un fond graphique pour votre formulaire.
Pour définir l'ordre de recouvrement des éléments
qui se chevauchent, utilisez les boutons Amener au premier-plan et Envoyer en arrière-plan.
Chapitre 4 Création et édition de formulaires 88
Pour aligner les éléments de formulaire sélectionnés sur leur bord
droit/gauche ou supérieur/inférieur, ou sur le centre de chaque
élément
horizontalement - utilisez les outils d'alignement
horizontal,
verticalement - utilisez les outils d'alignement
vertical.
Les commandes de la barre d'outils de réorganisation du formulaire
sont également accessibles via le menu contextuel de chaque
élément de formulaire.
Modification des propriétés des éléments de
formulaire
Pour modifier un élément de formulaire, sélectionnez-le puis cliquez
avec le bouton droit pour afficher le menu contextuel
correspondant. Vous pouvez modifier l'apparence ou les propriétés
de tous les éléments de formulaire. Pour ce faire, utilisez les
commandes suivantes :
Apparence de l'élément de formulaire - Utilisez les onglets
Bordures, Dégradé et Ombre pour concevoir l'aspect des éléments
de votre formulaire, en procédant de la même façon que dans une
application d'édition de texte.
Propriétés de l'élément de formulaire - Cette commande vous
permet d'afficher les propriétés d'un élément, comme sa taille, sa
position et son nom. Les propriétés affichées varient de façon
dynamique en fonction du type d'élément sélectionné.
Chapitre 4 Création et édition de formulaires 89
Extraction de données de formulaires
Vos flux de travail peuvent comporter une étape
d’extraction de données de formulaires. Ces données
peuvent être extraites depuis un large éventail d’éléments,
parmi lesquels des champs de texte remplissables, des cases
à cocher ou des boutons d’options.
Pour créer un flux de travail comprenant une étape d’extraction de
données d’un formulaire :
•Définissez la source de votre formulaire, ainsi que les
paramètres de traitement associés. Les fichiers en entrée
peuvent être des PDF image, des formulaires PDF, des
fichiers image et des formulaires papier numérisés à l’aide
d’un scanner.
•Remplacez l’étape de reconnaissance par l’étape Extraire
des données de formulaire. Sélectionnez le formulaire PDF
actif devant servir de modèle de reconnaissance. Il peut
s’agir d’un formulaire vierge ou rempli, composé d’une ou
de plusieurs pages. OmniPage se basera sur ce formulaire
pour déterminer l’emplacement et le type des éléments à
reconnaître.
•Clôturez votre flux de travail par une étape
d’enregistrement.
OmniPage extraira les données des formulaires en entrée, en se
basant sur le modèle que vous aurez défini. Vous pourrez choisir
d’exporter les résultats de reconnaissance sous la forme d’un fichier
de valeurs séparées par des virgules (*.csv), prêt à être chargé dans
un tableur.
Lors de la définition d’un flux de travail, l’étape Extraire des
données de formulaire ne peut être suivie que d’étapes
d’enregistrement.
Chapitre 4 Création et édition de formulaires 90
Enregistrement et
exportation
Après avoir importé au moins une image dans un document, vous
pouvez procéder à l’exportation de l'image acquise vers un fichier.
Après avoir reconnu au moins une page, vous pouvez exporter les
résultats de la reconnaissance. Si vous avez exécuté l'OCR sur
plusieurs pages, vous pouvez enregistrer une seule page, des pages
sélectionnées ou le document entier en sélectionnant les options
Enregistrer dans un fichier, Copier dans le Presse-papiers ou
Envoyer dans un e-mail. Vous pouvez également enregistrer le
fichier en tant que document OmniPage. OmniPage offre une prise
en charge exhaustive des applications et formats d’Office 2007, à
condition que Microsoft .NET Framework 3.0 soit installé sur votre
système.
Le document étant conservé dans OmniPage après l'exportation,
vous pouvez enregistrer, copier ou envoyer ses pages à plusieurs
reprises en appliquant, le cas échéant, différents niveaux de
formatage, types de fichiers, noms ou emplacements. Vous pouvez
également y ajouter de nouvelles pages, relancer l’OCR des pages
traitées ou modifier le texte reconnu.
Dans le cas d’un traitement automatique ou si vous exécutez des
travaux Batch Manager, vous devez spécifier la destination
d'enregistrement avant d'entamer le processus.
Un flux de travail peut contenir une ou plusieurs étapes
d’enregistrement, vers des destinations différentes (vers un fichier
et comme pièce jointe à un e-mail, par exemple). Un travail Batch
Manager doit contenir au moins une étape d’enregistrement.
Reportez-vous au chapitre 6, page 112, « Flux de travail ».
Chapitre 5 Enregistrement et exportation 91
Enregistrement et exportation
Si vous souhaitez retraiter un document dans OmniPage lors d’une
session ultérieure, enregistrez-le en tant que document OmniPage.
Il s’agit d’un type de fichier de sortie spécial. Il permet d’enregistrer
les images d’origine accompagnées des résultats de la
reconnaissance, des réglages du document et des données
d'apprentissage.
L’exportation s’effectue en utilisant le bouton 3 de la boîte à outils
OmniPage. Ce bouton répertorie les destinations d’exportation
disponibles. Certaines destinations apparaissent uniquement si un
accès à celles-ci a été détecté sur l'ordinateur. Sélectionnez la
destination souhaitée, puis cliquez sur le bouton Exporter les
résultats pour lancer l’exportation. Vous pouvez également la lancer
en utilisant le menu Traitement.
Enregistrement des images originales
Les images originales d’un document peuvent être enregistrées sur
disque sous différents types de fichiers et être éventuellement
retouchées à l'aide des outils de retouche d'images.
1.Choisissez la commande Enregistrer dans un fichier dans la
liste déroulante Exporter les résultats. Dans la boîte de dialogue
qui apparaît, sélectionnez Image dans Enregistrer sous.
2.Sélectionnez un dossier et un type de fichier. Indiquez le nom
du fichier.
3.Sélectionnez l'enregistrement de l'image de zone choisie
uniquement, de l'image actuelle, des images de pages
sélectionnées ou de toutes les images du document. Dans le cas
Chapitre 5 Enregistrement et exportation 92
de zones ou de pages multiples, vous pouvez placer l’ensemble
des images dans un seul fichier image multipage, à condition de
spécifier le type de fichier TIFF, MAX, DCX, JB2, XPS ou PDF
Image uniquement. Sinon, chaque image est placée dans un
fichier séparé. OmniPage ajoute des suffixes numériques aux
noms de fichiers fournis afin de générer des noms uniques.
4.Cliquez sur la commande Options si vous souhaitez définir un
mode d’enregistrement spécifique (noir et blanc, niveaux de
gris, couleur ou Tel que), une résolution maximale ou d’autres
réglages. Pour les fichiers TIFF, cette option permet également
de définir la méthode de compression.
5.Cliquez sur OK pour enregistrer la ou les images selon les
réglages spécifiés. Les zones et le texte reconnu ne sont pas
enregistrés.
Enregistrement des résultats de l’OCR
Les images reconnues d’un document peuvent être enregistrées sur
disque sous différents types de fichiers.
1.Choisissez Exporter les résultats dans le menu Fichier ou
cliquez sur le bouton Exporter les résultats dans la boîte à
outils OmniPage, avec l’option Enregistrer dans un fichier
sélectionnée dans sa liste déroulante.
2.La boîte de dialogue Enregistrer dans un fichier apparaît.
Sélectionnez Texte dans Enregistrer comme.
3.Sélectionnez un emplacement de dossier et un type de fichier
pour votre document. Sélectionnez tout ou partie des pages
d’un document. Sélectionnez également les options du fichier,
les options d'attribution des noms ainsi que le niveau de
formatage du document. Reportez-vous à la section « Sélection
d'un niveau de formatage » sur cette page.
Chapitre 5 Enregistrement des résultats de l’OCR 93
4.Indiquez le nom du fichier. Cliquez sur Options… si vous
souhaitez définir des paramètres spécifiques d’exportation.
Reportez-vous à la section « Sélection d'options de filtre » plus
loin dans ce chapitre.
5.Cliquez sur OK. Le document est enregistré sur disque, selon
les réglages spécifiés. Si l'option Afficher le fichier généré est
activée, le fichier exporté apparaît dans son application cible
(l'application associée à ce type de fichier dans Windows ou
dans les options d'enregistrement évoluées pour le filtre du type
de fichier sélectionné).
Sélection d’un niveau de formatage
Le niveau de formatage pour l'exportation est défini au moment de
l’opération, dans la boîte de dialogue Enregistrer sous, Copier dans
le Presse-papiers ou Envoyer dans un e-mail. Trois de ces niveaux
correspondent aux fenêtres de formatage du même nom dans
l'éditeur de texte. Cependant, le niveau à appliquer pour
l'enregistrement ne dépend pas de la fenêtre de formatage affichée
dans l'éditeur de texte. Lors de l'exportation vers un fichier ou un
e-mail, spécifiez d'abord un type de fichier. Cette sélection
détermine en effet les niveaux de formatage mis à votre disposition.
Les niveaux de formatage sont les suivants :
Texte brut
Exporte le texte en une colonne unique, dans un seul
style et corps de police et avec l'alignement à gauche.
Les éléments graphiques et les tableaux ne sont pas
supportés pour l'exportation vers des fichiers de type
Texte ou Unicode. Vous pouvez exporter le texte brut
vers pratiquement tout type de fichier et application
cible ; dans ce cas, vous pouvez conserver les éléments
graphiques, les tableaux et les puces.
Chapitre 5 Enregistrement des résultats de l’OCR 94
Texte formaté
Exporte un texte sans colonnes, tout en conservant
ses caractéristiques originales de polices et de
paragraphes, ainsi que les graphiques et tableaux.
Cette option est disponible pour la plupart des types
de fichier.
Pages avec enchaînements
Permet de conserver la mise en page du document
original (y compris la disposition en colonnes). Si
possible, les colonnes et les retraits, et non les cadres
ou les blocs de texte, sont utilisés pour assurer
l’enchaînement du texte d’une colonne à une autre, ce
qui n’est pas possible lorsque des cadres de texte sont
utilisés.
True Page
Permet de conserver la mise en page du document
original (y compris la disposition en colonnes). Les
cadres et les blocs de texte, d’image et de tableau sont
utilisés. Cette option concerne uniquement les
applications cibles supportant ce type d’opération. Le
formatage True Page constitue la seule sélection
possible pour l'exportation XML et pour les
exportations PDF, à l'exception du type PDF édité.
Feuille de calcul
Exporte les résultats de la reconnaissance sous forme
tabulaire, appropriée pour les tableurs. Chaque page
du document est placée sur une feuille distincte.
En cas d’exportation de vos résultats vers Microsoft Excel, l’option
Feuille de calcul est appropriée pour l’enregistrement de tableaux
occupant des pages entières. Privilégiez le format Texte formaté si
Chapitre 5 Enregistrement des résultats de l’OCR 95
votre document contient des tableaux de plus petite taille. Dans ce
cas, chaque tableau détecté sera placé sur une feuille indépendante,
et tous les éléments n’appartenant pas à des tableaux seront placés
sur une feuille séparée, appelée Index, avec des hyperliens pointant
vers les feuilles correspondantes.
Sélection d’options de filtre
En sélectionnant le bouton Options… dans une boîte de dialogue
d’enregistrement, vous pouvez contrôler l’exportation avec
précision. Une boîte de dialogue portant le nom du filtre associé au
type de fichier actuel apparaît. Elle propose une série d'options
adaptées à ce type de fichier. En premier lieu, confirmez ou modifiez
le niveau de formatage ; ces données déterminent les autres options
affichées. Sélectionnez ensuite les options voulues. Vous trouverez
la description de ces opérations dans l'aide.
Pour que les modifications s'appliquent aux futures exportations
effectuées à l'aide du filtre choisi, cochez l'option Modifications permanentes. Si cette option n'est pas sélectionnée, les modifications
seront appliquées à l'exportation en cours uniquement et ne seront
pas mémorisées pour de futures utilisations. Vous pouvez modifier
et enregistrer les paramètres d'exportation (sans enregistrer un
document), en choisissant Outils > Préférences d'enregistrement...
Utilisation de filtres multiples
Les filtres multiples vous permettent d’exporter les fichiers vers
plusieurs types de fichiers en une seule étape. Sélectionnez Multiple
dans la boîte de dialogue d’enregistrement :
Pour élaborer votre propre filtre multiple, ouvrez la boîte de
dialogue Préférences d’enregistrement depuis le menu Outils.
Choisissez l'option Filtres multiples, puis sélectionnez un filtre et
Chapitre 5 Enregistrement des résultats de l’OCR 96
cliquez sur Créer à partir de... . Une copie du filtre sélectionné est
créée. Vous pouvez la modifier librement, sans que cela n'affecte le
filtre original.
Le nouveau filtre apparaît dans la liste. Sélectionnez-le puis cliquez
sur Options... afin de spécifier les réglages s'y rapportant. La liste de
tous les filtres de texte apparaît, suivie de tous les filtres d'image.
Cochez les filtres de votre choix. Vous pouvez désigner des sousdossiers pour chaque type de fichier.
Vous pouvez enregistrer des pages avec différents niveaux de
formatage ou options de fichier dans les différents types de fichiers,
en fonction de celles définies dans les filtres simples. Certaines
options d’enregistrement, cependant, ne sont pas disponibles
lorsque l’on utilise des filtres multiples :
Enregistrer un document OmniPage
Utilisez un flux de travail s’exécutant en deux étapes ou effectuez
deux enregistrements distincts.
Enregistrement vers deux destinations
Par exemple, vous ne pouvez pas utiliser un filtre multiple pour
enregistrer un document dans un fichier et l’envoyer à la fois par email. Utilisez un flux de travail s’exécutant en deux étapes ou
effectuez deux enregistrements distincts.
Enregistrement de différentes sélections de pages
Vous ne pouvez pas enregistrer différentes sélections de pages dans
différents types de fichiers, car une seule sélection de pages peut
exister au moment de l’enregistrement. Pour la même raison, un flux
de travail unique ne peut pas être utilisé. Effectuez deux
enregistrements séparés ou utilisez deux flux de travail.
Chapitre 5 Enregistrement des résultats de l’OCR 97
Enregistrement d’un document au format PDF
Lors de l’enregistrement au format PDF (Portable Document
Format), vous avez le choix entre cinq options. Les quatre premières
options se présentent comme des filtres de texte. La dernière est
classée comme un filtre d’image.
PDF (standard) :
Les pages sont exportées telles qu’elles apparaissent dans l'éditeur
de texte dans le niveau de formatage True Page. Ce fichier PDF peut
être affiché et faire l’objet de recherches dans un programme
d’affichage PDF, et édité dans un éditeur PDF.
PDF édité :
Utilisez cette option si vous avez apporté d'importantes
modifications aux résultats de reconnaissance. Vous disposez de
trois options pour le niveau de formatage, dont True Page. Le fichier
PDF peut être affiché et modifié, et faire l’objet de recherches de
texte.
PDF – Image avec recherche (précédemment « PDF avec image
sur texte ») :
Le fichier PDF peut uniquement être affiché. Il ne peut faire l’objet
d’aucune modification dans un éditeur PDF. Chaque image de page
exportée est associée à un fichier texte sous-jacent, qui rend
possible l’exécution de recherches de texte. Ainsi, les mots trouvés
lors des recherches sont mis en surbrillance sur l’image.
PDF avec substitution d'image :
Format semblable au format « PDF standard », sauf que les mots
contenant des caractères de rejet ou des caractères douteux sont
recouverts d’images, ce qui assure un affichage identique au
document original. Le fichier PDF peut être affiché et modifié, et
faire l’objet de recherches de texte.
Chapitre 5 Enregistrement des résultats de l’OCR 98
PDF Image (précédemment « PDF avec image uniquement ») :
Les images originales sont exportées. Le fichier PDF peut être
affiché, mais le texte ne peut être ni modifié dans un éditeur PDF, ni
faire l’objet de recherches.
En plus des formats PDF décrits précédemment, vous pouvez
définir d’autres paramètres pour configurer votre sortie PDF en
sélectionnant Options :
PDF 1.6
Ce format offre des fonctionnalités avancées en matière de sécurité,
d’annotation et d’incorporation de pièces jointes.
PDF/A
Ce format sert à créer des fichiers compatibles PDF/A, qui
s'afficheront de façon identique quel que soit l'environnement
informatique utilisé et resteront lisibles au fil des futures évolutions
technologiques.
PDF balisé
Ce format ajoute des balises aux fichiers PDF, afin de préserver leur
structure originale. Ces balises définissent notamment l’ordre de
lecture logique du document et la structure des tableaux.
PDF MRC
Ce format utilise une technologie de haute compression unique,
offrant le compromis idéal entre qualité d’affichage et taille des
fichiers. Cette technologie peut être utilisée avec des PDF Image ou
Image avec recherche, en couleur ou en niveaux de gris.
PDF linéarisé
Ce format permet de créer des fichiers PDF optimisés pour un
chargement et un affichage rapides lorsqu'ils sont intégrés dans des
pages Web.
Chapitre 5 Enregistrement des résultats de l’OCR 99
Protection par mot de passe
Avec OmniPage Professional, vous pouvez définir un type et un
niveau de chiffrement, ainsi qu'un mot de passe d'ouverture et/ou de
permissions pour les fichiers PDF.
Un choix d'options moins étendu est disponible pour
l'enregistrement des fichiers au format XPS, à condition que
Microsoft .NET Framework 3.0 soit installé sur votre système.
Conversion de documents PDF
Pour extraire le texte d’un fichier PDF, chargez votre PDF dans
OmniPage, lancez sa reconnaissance, puis enregistrez les résultats
dans l’un des formats Texte.
Un large éventail de formats de conversion est directement
accessible depuis le menu contextuel de fichiers PDF : Word, Excel,
RTF, WordPerfect ou Texte. Pour disposer d’options
complémentaires, utilisez l’Assistant Convertir maintenant.
Création de fichiers PDF depuis d'autres
applications
Nuance PDF Create, livré avec OmniPage Professional, permet de
générer des fichiers PDF standard (également appelés « PDF
normaux ») depuis toute application dotée d'une commande
d'impression installée sur votre système. Pour ce faire, sélectionnez
Fichier > Imprimer, puis sélectionnez ScanSoft PDF Create!.
Modifiez les paramètres selon vos besoins, cliquez sur OK, puis
indiquez le nom et l'emplacement du fichier PDF cible. Si vous avez
sélectionné l'option Afficher le fichier PDF généré, le fichier sera
automatiquement ouvert dans votre visionneuse PDF par défaut.
Chapitre 5 Création de fichiers PDF... 100
Loading...
+ hidden pages
You need points to download manuals.
1 point = 1 manual.
You can buy points or you can get point for every manual you upload.