SCANSOFT Omnipage User Manual 17 [fr]

Page 1

Manuel de l’utilisateur

Page 2

AVIS JURIDIQUES

Copyright © 2009 Nuance Communications, Inc. Tous droits réservés. Aucune partie de cette publication ne peut être transmise, transcrite, reproduite ou stockée dans un système de récupération de données, ni traduite dans une langue ou un langage informatique sous quelque forme ou par quelque moyen que ce soit (mécanique, électronique, magnétique, optique, chimique, manuel, etc.) sans l'accord préalable écrit de Nuance Communications, Inc., 1 Wayside Road, Burlington, Massachusetts 01803-4609, USA.

Le logiciel présenté dans ce manuel est fourni sous licence et son utilisation et sa copie sont soumises aux termes de la licence.

REMARQUE IMPORTANTE

Nuance Communications, Inc. fournit cette publication « telle quelle », sans aucune garantie d’aucune sorte, ni expresse ni implicite, y compris mais non seulement, aucune garantie implicite de qualité commerciale ou d’adéquation à un usage particulier. Certains états et certaines juridictions n’autorisant pas l’exclusion de garanties expresses ou implicites dans certains types de transaction, il est possible que la déclaration ci-dessus ne vous concerne pas. Par ailleurs, Nuance se réserve le droit de réviser cette publication et d’en modifier le contenu sans être tenu d’avertir quiconque de ces révisions ou modifications.

MARQUES COMMERCIALES

Nuance, ScanSoft, OmniPage, PaperPort, True Page, Direct OCR, Logical Form Recognition et RealSpeak sont des marques commerciales ou des marques commerciales déposées de

Nuance Communications, Inc., aux États-Unis et/ou dans d’autres pays. Tous les autres noms de sociétés ou de produits cités peuvent être des marques de leurs propriétaires respectifs.

LICENCES/NOTICES DE PRODUITS TIERS

Veuillez vous reporter à la fin de ce guide pour obtenir les reconnaissances/notices de produits tiers.

Nuance Communications, Inc.

1 Wayside Road Burlington, MA 01803-4609 États-Unis

Nuance Communications International BVBA Siège social international

Guldensporenpark 32 Building D BE-9820 Merelbeke Belgique

Page 3

T ABLE DES MATIÈRES

BIENVENUE 5

Nouvelles fonctions d’OmniPage 17 8

INSTALLATION ET CONFIGURATION 13

Environnement requis 13 Installation d’OmniPage 15 Configuration d’un scanner pour utilisation

avec OmniPage 16 Lancement d’OmniPage 19 Enregistrement du logiciel 20 Activation d’OmniPage 21 Désinstallation du logiciel 21

UTILISATION D'OMNIPAGE 23

Documents OmniPage 23 Bureau OmniPage et modes d’affichage 24 Principales étapes de l’OCR 33 Utilisation d'OmniPage avec PaperPort 34

TRAITEMENT DES DOCUMENTS 36

Méthodes de traitement 36 Définition de la source des images de page 41 Définition de la mise en page du document 49 Prétraitement des images 51 Zones et fonds 58

VÉRIFICATION ET ÉDITION 68

Affichage et niveaux de formatage de l'éditeur 68 Vérification des résultats de l’OCR 69 Vérification du texte reconnu 71

Manuel d'utilisation d'OmniPage 17 3

Page 4

Table de caractères 71 Dictionnaires utilisateur 72 Langues 74 Apprentissage 77 Édition du texte et des images 80 Édition en direct 82 Marquage et biffure de texte 83 Lecture du texte à voix haute 85 Création et édition de formulaires 86

ENREGISTREMENT ET EXPORTATION 91

Enregistrement et exportation 92 Enregistrement des images originales 92 Enregistrement des résultats de l’OCR 93 Création de fichiers PDF depuis d'autres applications 100 Ajout de pages à un e-mail comme pièce jointe 101 Envoi vers un lecteur Kindle 102 Autres destinations d’exportation 103

FLUX DE TRAVAIL 105

Assistant Flux de travail 109 Batch Manager 112 Création d’un travail 113 Surveillance de dossiers 119 Surveillance de boîtes de réception 120 Traitement par détection de codes à barres 121 Assistant File-it 124

INFORMATIONS TECHNIQUES 126

Dépannage 126 Types de fichier pris en charge 132

INDEX 133

Table des matières 4

Page 5

Bienvenue

Nous vous remercions de la confiance que vous portez à notre logiciel de reconnaissance OmniPage

ci-dessous est destinée à vous présenter le programme et à faciliter son utilisation.

Manuel de l’utilisateur

Le présent manuel fournit des informations relatives aux principes d'utilisation d'OmniPage 17 : procédures d’installation et de configuration, description des commandes et zones de travail disponibles, instructions de réalisation de différentes tâches, méthodes de personnalisation et de gestion de traitement et diverses informations techniques. Les descriptions fournies dans le présent manuel se basent sur le système d’exploitation Windows

Vista Conformément à la politique environnementale de Nuance, ce

manuel est uniquement disponible au format PDF. Pour obtenir une copie au format standard, nous vous recommandons d’imprimer deux pages par feuille en recto verso.

17. La documentation citée

Ce manuel présuppose que vous maîtrisez les principes de travail dans l’environnement Microsoft Windows. Pour tous détails sur cet environnement (utilisation des boîtes de dialogue, des menus déroulants et contextuels, des barres de défilement, de la fonction Glisser-déplacer, etc.), reportez-vous à la documentation Windows correspondante.

Bienvenue 5

Page 6

Vous devriez également connaître le fonctionnement de votre scanner et de son logiciel. Avant de procéder à la configuration du scanner avec OmniPage 17, assurez-vous qu’il est installé et qu’il fonctionne correctement. Reportez-vous, si nécessaire, à la documentation du scanner.

Guides d'apprentissage

Les guides d’apprentissage sont disponibles dans le menu Aide. Conçus pour vous permettre d’exploiter au plus vite le programme, ces mini-guides offrent une présentation concise des opérations les plus courantes que vous pouvez réaliser avec OmniPage, comme par exemple l’importation de documents, la retouche d’images, la définition de zones, la reconnaissance, l’édition, la vérification, et bien plus encore !

Aide électronique

L'aide contient des informations sur les fonctions, les paramètres et les procédures d’OmniPage. Elle inclut également un glossaire exhaustif, assorti d'un index alphabétique et d'une table des matières. Le système d'aide HTML a été conçu pour garantir une consultation aisée et rapide. Le système d’aide est disponible dès l’installation du logiciel.

Le module d’aide contextuelle très complet assure une assistance suffisante pour vous permettre d’accomplir au plus vite les opérations requises. Pour y accéder, appuyez

sur la touche F1 depuis n’importe quelle boîte de dialogue. Si la boîte de dialogue sur laquelle vous souhaitez obtenir de l’aide dispose d’un bouton Aide, cliquez sur celui-ci.

Bienvenue 6

Page 7

Fichier Notes de version

Ce fichier contient des informations de dernière minute sur OmniPage. Il est vivement recommandé de le consulter avant d’utiliser le logiciel. Pour ouvrir ce fichier au format HTML, vous pouvez, à la fin de l'installation d'OmniPage, sélectionner l'option Notes de version, ou, à tout moment, choisir la commande correspondante dans le menu Aide.

Informations sur la numérisation et renseignements divers

Le site Web de Nuance® (www.nuance.fr) fournit des informations actualisées sur le programme. La section « Scanner Guide » (en anglais) (http://www.nuance.com/scannerguide/) contient des données régulièrement mises à jour et relatives aux scanners pris en charge et à d’autres questions y afférentes. Nuance effectue des tests sur les 25 modèles les plus utilisés. Pour accéder au site Web de Nuance, vous pouvez, à la fin de l’installation d’OmniPage 17, sélectionner l’option d’accès au site Web, ou, choisir à tout moment la commande correspondante dans le menu Aide.

Notes techniques

Le site Web de Nuance (www.nuance.fr) propose des notes techniques concernant les problèmes les plus courants relatifs à l’utilisation d’OmniPage 17. Ces pages Web peuvent également inclure des conseils sur l’installation et le dépannage du logiciel.

Bienvenue 7

Page 8

Nouvelles fonctions d’OmniPage 17

Si vous utilisiez auparavant la version 16, vous bénéficiez des innovations suivantes. Cliquez sur les liens pour obtenir plus d’informations.

• Reconnaissance des langues asiatiques : les services

d’OCR sont désormais disponibles pour le japonais, le coréen, le chinois simplifié et le chinois traditionnel ; ils prennent en charge le texte horizontal et vertical, ainsi que le texte anglais incorporé. Les résultats obtenus peuvent être affichés et contrôlés dans l’éditeur de texte. Voir « Reconnaissance des langues asiatiques », page 74.

• Texte vertical non asiatique : la détection automatique

du texte vertical dans deux rotations fonctionne à l’intérieur des cellules de tableaux et partout sur les pages PDF ou XPS, ainsi que dans certains autres types de fichiers image. De nouveaux outils permettent de tracer manuellement des zones de texte vertical. Le texte s’affiche verticalement et peut être modifié dans l’éditeur de texte,

avec le niveau de formatage True Page d’autres niveaux de formatage, le texte s’affiche horizontalement. Voir « Traçage automatique des zones », page 59 et « Types et propriétés de zone », page 60.

• Chargeur express : à l’instar de l’Explorateur Windows,

cet outil permet d’afficher le système de fichiers dans l’une des fenêtres d’OmniPage, de conserver les fichiers à l’écran pendant que vous travaillez et de sélectionner rapidement les fichiers à charger. Une boîte de dialogue dotée d’une fonction de verrouillage permet de compiler une liste de fichiers avant de procéder au chargement. Utilisé en mode Conversion rapide, le Chargeur express accélère le chargement des fichiers et permet un traitement « en un

. Si vous utilisez

Nouvelles fonctions d’OmniPage 17 8

Page 9

clic » : chargement > reconnaissance > enregistrement. Voir « Importation de fichiers avec le Chargeur express », page 43.

• Prise en charge étendue des systèmes de gestion de

contenus : de nouveaux liens vers Hummingbird

OpenText et iManage Interwoven sont disponibles. Avec SharePoint, les informations relatives au serveur, à la connexion et au mot de passe ne doivent être saisies qu’une seule fois par session et sont ensuite fournies lors de toutes les sessions ultérieures.

• Prise en charge améliorée d’Office 2007 : les boutons

Direct OCR apparaissent désormais dans un onglet Nuance OCR distinct, et non plus au côté des autres compléments.

• Traitement par lots optimisé : Batch Manager ignore

automatiquement les fichiers qui ne peuvent pas être traités (et notamment les fichiers bloqués en raison d’une demande de mot de passe), sans pour autant interrompre le flux de travail. La fenêtre Résultats du travail répertorie les fichiers exclus du traitement.

• Exécution : la vitesse de lancement du programme est

accrue et les performances enregistrent des progrès considérables sur les ordinateurs multi-cœurs. Les ordinateurs quadri-cœurs sont désormais pris en charge.

• Association des flux de travail aux boutons du scanner :

les fonctions et flux de travail d’OmniPage peuvent être associés aux boutons du scanner de façon à permettre le lancement du prétraitement, de la reconnaissance et du stockage des documents depuis le scanner. Voir « Numérisation vers OmniPage et utilisation des flux de travail », page 48.

Nouvelles fonctions d’OmniPage 17 9

Page 10

• Exportation vers Kindle : le nouvel Assistant Kindle vous

permet de créer des flux de travail pour envoyer les résultats d’OCR vers un compte Kindle hébergé sur le site Amazon, et de les afficher ensuite sur l’appareil Kindle associé à ce compte. Voir « Envoi vers un lecteur Kindle », page 102.

• Autres améliorations : les améliorations apportées au

prétraitement des images garantissent une parfaite reproduction de la mise en page et une meilleure précision globale, notamment pour les fichiers XPS et les conversions entre différents formats de documents. Le chargement d’images HD Photo (JPEG XR) est désormais pris en charge. L’intégration à Microsoft Word, Excel et PowerPoint a été améliorée. Des fichiers PDF linéarisés peuvent être créés ; ils sont optimisés pour un affichage plus rapide sur le Web. L’option de description de la mise en page Formulaire est désormais disponible en mode Conversion rapide.

Nouvelles fonctions d’OmniPage 16

Si vous utilisiez auparavant la version 15, vous bénéficiez également des innovations suivantes :

• Choix entre trois interfaces : Classique (identique à celle

d’OmniPage 15), Flexible et Conversion rapide (regroupant toutes les commandes principales au sein d’un seul volet). Pour plus d’informations, reportez-vous au chapitre 3, page 24.

• Travail sur plusieurs documents : les interfaces Classique

ou Flexible vous permettent de travailler simultanément sur plusieurs documents ouverts.

Nouvelles fonctions d’OmniPage 17 10

Page 11

• Traitement de photos numériques : de nouveaux

algorithmes spécifiques assurent l’OCR de photos numériques. Pour plus d’informations, reportez-vous au chapitre 3, page 42.

• Compatibilité avec les programmes 2007 : OmniPage est

compatible avec les dernières versions des programmes Word et Excel de la suite Office 2007 (formats DOCX et XLSX), et propose également des liens avec SharePoint 2007 et Outlook 2007.

• Améliorations PDF : prise en charge du format PDF

version 1.6, vitesse de traitement accrue, précision supérieure, qualité de sortie améliorée et technologie de haute compression MRC pour certains types de PDF.

• Prise en charge de documents juridiques : OmniPage

assure une reconnaissance de haute qualité des documents de nature juridique.

• Menus contextuels personnalisables dans l'Explorateur

Windows : conversion directe de fichiers image ou de PDF

vers les programmes Windows les plus courants, traitement à l’aide de flux de travail personnalisés, ou utilisation d’un assistant pour des conversions simples et rapides.

• Améliorations globales : traitement plus rapide,

conservation améliorée des mises en page des documents générés (correspondances des polices, détection des tableaux, etc.), et nouvel Assistant Flux de travail plus intuitif.

Nouvelles fonctions d’OmniPage 17 11

Page 12

Fonctionnalités clés spécifiques à OmniPage Professional.

• Extraction de données de formulaires remplis : vos flux

de travail peuvent comporter une étape permettant l’extraction de données de formulaires remplis, et leur exportation vers des bases de données. Ces formulaires peuvent être des formulaires PDF actifs, des formulaires statiques dans divers formats d’images, ou des formulaires papier numérisés.

• Marquage et biffure de texte : des sections de texte

peuvent être mises en surbrillance, barrées ou biffées (noircies, donc illisibles) dans l’éditeur de texte. La biffure s’avère très pratique pour des documents à caractère juridique ou contenant des informations confidentielles (des contrats, par exemple).

• Assistant File-it : un outil efficace pour créer et utiliser

des flux de travail invoqués par des pages de garde sur lesquelles sont imprimés des codes à barres. Avec ces flux de travail, une simple pression d’un bouton de votre scanner permet de numériser, de traiter et d’archiver automatiquement vos documents papier.

Pour obtenir la liste complète des fonctionnalités, et connaître les différences entre les différentes versions d’OmniPage, reportez-vous à l’aide.

Cette icône, utilisée tout au long de ce manuel, signale les fonctions disponibles uniquement dans OmniPage Professional 17.

OmniPage 17 est disponible dans différentes versions d’entreprise, adaptées à une utilisation en réseau. OmniPage est également disponible dans différentes versions SE (Special Edition), réservées à certains fabricants de scanners et autres revendeurs sélectionnés. Les fonctionnalités offertes par ces versions peuvent varier en fonction des besoins des fournisseurs.

Nouvelles fonctions d’OmniPage 17 12

Page 13

Installation et configuration

Ce chapitre contient les informations nécessaires à l'installation et au lancement d'OmniPage.

Environnement requis

Vous trouverez ci-dessous la configuration système minimale requise pour l’installation et l’exécution du programme :

• Ordinateur équipé d’un processeur Intel

équivalent. Processeur double-cœur ou quadri-cœur recommandé.

• Windows

cadencé à 400 MHz ou Windows ou 64 bits (SP1) avec un processeur cadencé à 1 GHz.

• 256 Mo de mémoire vive (RAM), 1 Go recommandé pour

des performances avancées.

• 230 Mo d’espace disque disponible destiné aux fichiers

d’application et d’exemple, plus 70 Mo d’espace disponible lors de l’installation. De plus :

XP 32 bits (Service Pack 3) avec un processeur

• 175 Mo pour l’ensemble des modules Nuance

RealSpeak américain RealSpeak module RealSpeak

autres langues)

• 95 Mo pour Nuance PDF Create (disponible

uniquement dans OmniPage Professional 17)

• 150 Mo pour PaperPort

dans OmniPage Professional 17)

(80 Mo pour le module Anglais

Solo, plus 9 à 11 Mo par

Solo supplémentaire pour les

Pentium® III ou

VistaTM 32 bits (SP1)

(disponible uniquement

Chapitre 1 Installation et configuration 13

Page 14

• Moniteur couleurs 1024x768 pixels avec affichage couleurs

en 16 bits ou carte vidéo supérieure.

• Carte son et haut-parleur pour la lecture « à voix haute »

des textes reconnus.

• Lecteur de CD-ROM pour l'installation ou accès à Internet

requis pour le téléchargement.

• Souris (ou périphérique équivalent) compatible Windows.

• Appareil photo d'une résolution minimale de 2 millions de

pixels pour la capture de texte. Pour plus d’informations, consultez l’aide en ligne.

• Scanner compatible avec le pilote approprié (si vous

prévoyez de numériser des documents). Consultez le Scanner Guide, disponible sur le site Web de Nuance

(www.nuance.com), pour connaître la liste des scanners

pris en charge.

• Accès à Internet requis pour l'activation et

l’enregistrement du produit, la mise à jour de la base de données des scanners et la réception de mises à jour automatiques du programme.

• Pour traiter des documents en japonais, chinois ou coréen,

vous devez installer la prise en charge des langues d'Extrême-Orient sur votre système d'exploitation (Panneau de configuration > Options régionales et linguistiques).

• Pour enregistrer aux formats DOCX et XPSX (formats

Word et Excel de Microsoft Office 2007), ou pour charger et enregistrer des fichiers XPS (XML Paper Specification), Microsoft .NET Framework 3.0 devra être installé sur votre ordinateur. Vous trouverez un lien vers la page de téléchargement de Microsoft dans les notes de version ou dans la boîte de dialogue « À propos de » du programme, si l'option est activée sous Options > Général. Vous pouvez également cliquer sur la bulle d’aide OmniPage .Net Framework.

Chapitre 1 Environnement requis 14

Page 15

Installation d’OmniPage

Pour vous guider dans l’installation, OmniPage 17 affiche des instructions sur chaque écran.

Avant de lancer l’installation d’OmniPage, respectez les points suivants :

• Fermez les applications actives, en particulier les logiciels

antivirus.

• Ouvrez une session avec les privilèges d'administrateur.

• Si votre système dispose d’une version antérieure

d’OmniPage ou que vous effectuez une mise à niveau à partir d'une version de démonstration ou d’une édition limitée d'OmniPage, le programme d’installation vous demandera l’autorisation de désinstaller le logiciel existant.

Pour installer OmniPage :

1. Téléchargez le fichier du programme, puis choisissez Exécuter,

ou insérez le CD-ROM d'OmniPage dans votre lecteur de CDROM. En principe, le programme d’installation démarre automatiquement. Si ce n’est pas le cas, ouvrez l’Explorateur Windows, cliquez sur l’icône du lecteur de CD-ROM, puis cliquez deux fois sur le fichier de programme

2. Choisissez la langue d’installation souhaitée. Lisez et acceptez

l’accord de licence, puis entrez le numéro de série figurant sur l'e-mail que vous avez reçu ou sur la pochette du CD d’installation du produit.

3. Choisissez de procéder à une installation complète ou

personnalisée. Si vous choisissez Installation complète, tous les modules de synthèse vocale RealSpeak modules sont au nombre de 9). Choisissez Installation personnalisée pour sélectionner de manière individuelle les composants que vous souhaitez installer. Pour choisir de ne pas installer un module, cliquez sur la flèche pointant vers le bas située à côté de son nom, puis sélectionnez « Cette fonction ne sera pas installée ».

Autorun.exe.

seront installées (ces

Chapitre 1 Installati on d’OmniPage 15

Page 16

4. Suivez les instructions qui s’affichent à l’écran pour installer le

logiciel. Tous les fichiers nécessaires à la numérisation sont copiés automatiquement lors de l’installation.

L'installation de Nuance PDF Create 5 démarre à la fin de l'installation d'OmniPage, sauf si l'option correspondante a été désélectionnée dans le programme d'installation d'OmniPage Professional. Les conversions entre différents formats de documents nécessitent que PDF Create soit installé.

OmniPage Professional inclut également le programme de gestion de documents Nuance PaperPort

configuration système spécifique, doit être installé séparément.

. Ce dernier, associé à une

Configuration d’un scanner pour utilisation avec OmniPage

Tous les fichiers nécessaires à la configuration et à la prise en charge du scanner sont copiés automatiquement lors de l'installation du programme. Le scanner n’est toutefois pas configuré au moment de l'installation. Avant de numériser des documents à l’aide d’OmniPage 17, vous devrez vérifier que votre scanner est installé correctement, avec le pilote approprié, et tester son fonctionnement. Les pilotes du scanner ne sont pas fournis avec OmniPage.

L’installation et la configuration d’un scanner s’effectuent par l’intermédiaire de l’Assistant de configuration de scanner. Vous pouvez lancer celui-ci en suivant la

procédure ci-dessous. Cet Assistant apparaît également la première fois que vous tentez de lancer une numérisation. Procédez comme suit :

• Choisissez Démarrer > Tous les programmes > Nuance >

OmniPage 17 > Assistant de configuration de scanner ou cliquez sur le bouton Configuration de l'onglet Scanner

de la boîte de dialogue Options

Chapitre 1 Configuration d’un scanner... 16

Page 17

ou choisissez Numériser dans la zone de liste déroulante Importer page(s) de la boîte à outils et cliquez sur le bouton Importer page(s).

• L'Assistant de configuration de scanner s’affiche. Si vous

êtes connecté à Internet, la première fenêtre vous invite à mettre à jour la base de données des pilotes de scanners livrée avec le programme. Cliquez sur Oui ou sur Non, puis sur Suivant.

• Choisissez Sélectionner et tester un scanner ou un appareil

photo numérique et cliquez sur Suivant. Si un seul scanner est installé, il apparaît avec l’ensemble des scanners précédemment configurés avec OmniPage. Si le scanner que vous souhaitez utiliser ne figure pas dans cette liste,

cliquez sur Ajouter un scanner... .

• Une liste présentant l’ensemble des pilotes de scanners

détectés apparaît. Cette liste peut contenir des périphériques de réseau. Sélectionnez un périphérique, puis cliquez sur OK. Pour installer un second périphérique, exécutez à nouveau l’Assistant.

• L’Assistant indique si le modèle de scanner choisi est

associé à des réglages de configuration dans la base de données des scanners. Si tel est le cas, vous n’aurez pas besoin de tester votre scanner. Dans le cas contraire, nous vous recommandons de le tester. Cliquez sur Suivant.

• Si vous avez choisi de ne pas tester votre scanner, cliquez

sur Terminé. Dans le cas contraire, cliquez sur Suivant pour tester la connexion au scanner. Si la connexion s’effectue correctement, un menu de tests complémentaires apparaît. Sélectionnez les tests que vous souhaitez effectuer. Nous vous recommandons d’effectuer un test élémentaire.

• OmniPage utilise par défaut sa propre interface de

numérisation, accessible via l’onglet Scanner de la boîte de dialogue Options. Si vous préférez utiliser l’interface de votre scanner, cliquez sur Réglages avancés... et choisissez

Chapitre 1 Configuration d’un scanner... 17

Page 18

cette option. Choisissez Éditeur de conseils... puis Modifier les conseils uniquement si vous êtes un utilisateur expérimenté ou si vous avez été invité à effectuer cette opération par le service de support technique.

• Cliquez sur Suivant pour lancer les tests. Pour réaliser un

test élémentaire, placez une page dans votre scanner. L’Assistant procédera à la numérisation en utilisant le logiciel du fabricant du scanner. Cliquez sur Suivant. L'interface utilisateur native de votre scanner s'affiche.

• Cliquez sur Numériser pour lancer la numérisation de la

page de test.

• Si nécessaire, cliquez sur Image manquante... ou sur

Mauvaise orientation... et effectuez les sélections appropriées.

• Si l'image affichée dans la fenêtre est correcte, cliquez sur

Suivant.

• Effectuez les tests restants, en suivant les instructions qui

apparaissent à l’écran.

• Lorsque l’ensemble des tests requis ont été effectués avec

succès, l’Assistant vous en informe et vous demande de cliquer sur Terminé.

• Vous venez de configurer votre scanner en vue de son

utilisation avec OmniPage 17 !

Pour modifier les réglages du scanner par la suite ou pour configurer ou supprimer un autre scanner, ouvrez de nouveau l'Assistant de configuration de scanner depuis le menu Démarrer de Windows ou depuis l’onglet Scanner de la boîte de dialogue Options.

Pour tester et dépanner un scanner qui ne fonctionne pas correctement, lancez l'Assistant de configuration de scanner et sélectionnez Tester un scanner ou un appareil photo numérique, puis suivez la procédure décrite ci-dessus ou reportez-vous aux instructions communiquées par le service de support technique.

Pour sélectionner un autre scanner à utiliser par défaut, ouvrez l’Assistant pour afficher la liste des scanners configurés.

Chapitre 1 Configuration d’un scanner... 18

Page 19

Sélectionnez le scanner que vous souhaitez utiliser par défaut, puis refermez l’Assistant en cliquant sur Terminé.

Pour obtenir les réglages les plus récents pour votre scanner, ouvrez l’Assistant, demandez le téléchargement de la base de données la plus récente, choisissez Utiliser les paramètres actuels avec le périphérique actuel, cliquez sur Suivant, puis sur Terminé.

Lancement d’OmniPage

Pour lancer OmniPage 17, effectuez l'une des opérations suivantes :

• Dans la barre des tâches de Windows, choisissez

Démarrer > Tous les programmes > Nuance > OmniPage 17 > OmniPage [Professional] 17.

• Cliquez deux fois sur l’icône OmniPage située

dans le dossier d’installation d’OmniPage ou sur le bureau de Windows (si vous l’y avez placée).

• Cliquez deux fois sur l’icône ou le nom de fichier

d’un document OmniPage (OPD) pour le charger. Reportez-vous à la section « Documents OmniPage » du chapitre suivant.

• Cliquez avec le bouton droit sur l’icône ou sur le nom d’un

ou de plusieurs fichiers image pour afficher un menu contextuel. Pointez sur Ouvrir avec... OmniPage. Les images sont alors chargées dans le programme.

Lorsque vous ouvrez l’application, l’écran d’accueil du programme, puis la fenêtre de sélection de l’interface s’affichent. OmniPage dispose de trois interfaces standard. Pour plus d'informations, reportez-vous à la section « Bureau OmniPage et modes d'affichage » du chapitre suivant. Cette section présente les principales zones de travail du programme.

Vous pouvez également exécuter le programme avec une interface limitée :

Chapitre 1 Lancement d’OmniPage 19

Page 20

• Utilisez le programme Batch Manager. Dans la barre des

tâches de Windows, choisissez Démarrer > Tous les programmes > Nuance > OmniPage 17 > OmniPage Batch Manager. Reportez-vous au chapitre Flux de travail.

• Dans une application déclarée dans Direct OCR™,

choisissez Acquérir du texte dans le menu Fichier. Reportez-vous à la section « Configuration de Direct OCR » dans le chapitre Traitement des documents.

• Cliquez avec le bouton droit sur l’icône ou le nom d’un ou

de plusieurs fichiers image dans l'Explorateur Windows pour afficher un menu contextuel. Dans ce menu, pointez sur OmniPage 17, puis choisissez un format d’exportation, ou sélectionnez un flux de travail, ou cliquez sur Assistant Convertir maintenant. Les fichiers seront traités conformément aux instructions du flux de travail sélectionné. Reportez-vous au chapitre Flux de travail.

• Cliquez sur l’icône de l’Agent OmniPage dans la

barre des tâches. Dans le menu contextuel qui s’affiche, sélectionnez un flux de travail pour démarrer le programme et exécuter le flux de travail.

• Pour ajouter des services d’OCR, utilisez OmniPage17 avec

PaperPort, le produit de gestion de documents de Nuance. Reportez-vous à la section « Utilisation d'OmniPage avec PaperPort » du chapitre Utilisation d'OmniPage.

Enregistrement du logiciel

L’Assistant d’enregistrement de Nuance est lancé à la fin de l’installation du logiciel. Assurez-vous d’être connecté à Internet. L’enregistrement s’effectue via un formulaire électronique facile à remplir (moins de cinq minutes). Une fois le formulaire rempli, cliquez sur Envoyer. Si vous n’enregistrez pas votre copie du logiciel pendant son installation, le programme vous invitera régulièrement à accomplir cette formalité. Vous pouvez vous connecter au site

Chapitre 1 Enregistrement du logiciel 20

Page 21

www.nuance.fr pour procéder à l’enregistrement en ligne de votre

produit. Cliquez sur Support, puis dans l'écran de support principal, choisissez Enregistrer dans la colonne de gauche. Pour plus de détails sur l’utilisation de vos données d’enregistrement, reportez-vous à la clause relative à la politique de confidentialité de Nuance.

Activation d’OmniPage

Vous serez invité à activer votre logiciel à la fin de l’installation. Assurez-vous de disposer d’une connexion à Internet. Si le numéro de série du logiciel est stocké au bon endroit et qu’il a été saisi correctement, aucune interaction n’est requise de votre part. Aucune information personnelle ne sera transmise. Si vous n’activez pas immédiatement le logiciel à la fin de l’installation, vous serez invité à le faire à chaque démarrage du programme. Si vous n’activez pas OmniPage 17, vous ne pourrez lancer le programme que cinq fois. Nous vous recommandons de procéder à l’activation automatique du logiciel.

Désinstallation du logiciel

Certains problèmes peuvent être résolus en désinstallant puis en réinstallant OmniPage. Le programme de désinstallation d’OmniPage ne supprime pas les fichiers contenant des résultats de reconnaissance ou les fichiers créés par l’utilisateur, à savoir :

Fichiers de gabarit de zones (*.zon) Fichiers de retouche automatique d’images (*.ipp) Fichiers d’apprentissage (*.otn) Dictionnaires utilisateur (*.ud) Documents OmniPage (*.opd) Fichiers de travail (*.opj) Fichiers de flux de travail (*.xwf)

Chapitre 1 Activation d’OmniPage 21

Page 22

Pour désinstaller le programme, vous devez ouvrir une session avec les privilèges d'administrateur.

Pour désinstaller ou réinstaller OmniPage :

• Fermez OmniPage.

• Dans la barre des tâches de Windows, cliquez sur

Démarrer, choisissez Panneau de configuration, puis Désinstaller un programme (versions antérieures de Windows : cliquez deux fois sur Ajout/suppression de programmes).

• Sélectionnez OmniPage puis cliquez sur Désinstaller

(versions antérieures de Windows : Supprimer).

• Dans la boîte de dialogue qui apparaît alors, cliquez sur

Oui pour confirmer la suppression du programme.

• Cliquez sur Oui pour redémarrer votre ordinateur

immédiatement ou sur Non pour le redémarrer ultérieurement.

• Suivez les instructions jusqu'à la fin de la procédure.

Lorsque vous désinstallez OmniPage, le lien avec votre scanner est automatiquement désinstallé. Si vous réinstallez le logiciel, vous devez à nouveau configurer votre scanner en vue de son utilisation avec OmniPage. Tous les modules RealSpeak installés en même temps que le programme sont également désinstallés.

Avec OmniPage 17 Professional, Nuance PDF Create 5 et PaperPort doivent être désinstallés séparément.

Chapitre 1 Désinstallation du logiciel 22

Page 23

Utilisation d'OmniPage

OmniPage 17 utilise la technologie de reconnaissance optique de caractères (OCR) pour transformer les informations contenues dans vos documents numérisés ou fichiers image en données électroniques éditables par vos applications habituelles.

Outre le texte, OmniPage peut reconnaître les éléments et caractéristiques suivants de vos documents :

Éléments graphiques Éléments de formulaires

texte, etc.)

Informations de formatage du texte Mise en page

en-têtes, emplacement des éléments graphiques).

(disposition des colonnes, formats des tableaux,

Documents dans OmniPage

Dans OmniPage, un document comporte une ou plusieurs pages, chacune d’elles constituée par une image importée. Après la reconnaissance, le document comportera également le texte reconnu correspondant à ses images (affichable via l’éditeur de texte) et éventuellement des graphiques, des tableaux ou des éléments de formulaire.

(photos, logos)

(cases à cocher, boutons radio, champs de

(caractères et paragraphes)

Documents OmniPage

Un document OmniPage (.opd) contient l'image de page originale (éventuellement prétraitée), ainsi que les zones tracées sur celle-ci. Après la reconnaissance, un fichier OPD comporte également le résultat de l'OCR.

Chapitre 2 Utilisation d'OmniPage 23

Page 24

Un document OmniPage (fichier OPD) peut contenir différents éléments incorporés : dictionnaire utilisateur, fichier d’apprentissage, fichier de gabarit de zones ou fichier de modèle de retouche d’images. S’il génère des fichiers beaucoup plus volumineux, ce format améliore la portabilité et facilite l’échange des fichiers OPD. Pour incorporer un fichier, ouvrez la boîte correspondante depuis le menu Outils, sélectionnez le fichier désiré, puis cliquez sur Incorporer. Utilisez le bouton Extraire pour enregistrer localement une copie d’un fichier incorporé au sein d’un fichier OPD que vous avez reçu.

Lors de l’ouverture d’un document OmniPage, ses réglages sont appliqués, remplaçant les paramètres du programme.

Bureau OmniPage et modes d’affichage

OmniPage propose trois interfaces distinctes, pour un confort d’utilisation optimal en fonction de la tâche que vous devez réaliser.

• Mode Classique – Ce mode reprend l’interface des

versions précédentes du programme.

• Mode Flexible – Ce mode d’affichage présente les volets

de fonctions empilés dans une vue mise en onglets, pour un gain d’espace optimal.

• Mode Conversion rapide – Cette interface est conçue

pour réaliser rapidement des conversions de documents, sans qu’aucune connaissance approfondie du programme soit requise. Les options de conversion les plus importantes sont clairement présentées à l’écran.

Utilisez les commandes du menu Fenêtre pour passer d’une interface à une autre, et pour enregistrer un mode d’affichage personnalisé (voir ci-dessous). Au démarrage d’une nouvelle

Chapitre 2 Bureau OmniPage et modes d’affichage 24

Page 25

session, le mode d’affichage et la disposition actifs lors de la dernière fermeture du programme sont utilisés.

Volets du programme

OmniPage se compose de sept volets qui peuvent être ancrés (sous forme d’onglets ou en mosaïque), flottants, redimensionnés, réduits ou restaurés individuellement : Vignettes, Image de page, Éditeur de texte, Gestionnaire de documents, Chargeur express, État du flux de travail et Aide. Pour déplacer un volet, double-cliquez sur sa barre de titre ou son onglet. Pour restaurer le volet flottant dans sa position ancrée précédente, double-cliquez sur sa barre de titre. Pour l’ancrer à un nouvel emplacement, faites-le glisser en direction d’un bord. Un rectangle violet signale la position d’ancrage ; relâchez le bouton de la souris pour ancrer le volet. Pour déplacer un volet flottant sans affichage de l’ancrage, faites-le glisser tout en maintenant la touche Ctrl enfoncée. Pour afficher toutes les positions d’ancrage possibles (mosaïque et onglets) les unes à la suite des autres, faites glisser le volet sur la fenêtre principale d’OmniPage, en maintenant le bouton gauche enfoncé et en appuyant plusieurs fois sur la barre espace. Lorsqu’un rectangle violet apparaît à la position qui vous convient, relâchez le bouton de la souris.

Mode Classique

En mode Classique, le bureau OmniPage par défaut est composé de quatre zones de travail affichées en mosaïque et séparées par des barres de fractionnement : le gestionnaire de documents, l’éditeur de texte et les volets Image de page et Vignettes. Le volet Image de page est muni de la barre d’outils Image, et le volet Éditeur de texte de la barre d’outils Formatage.

Chapitre 2 Bureau Om niPage et modes d’affichage 25

Page 26

Barre d’outils Standard Barre d’outils Formatage

Image de page

Éditeur de texte

Gestionnaire de documents

Barre d’outils Image

Boîte à outils OmniPage

Vignettes

Boîte à outils OmniPage : La boîte à outils d’OmniPage vous permet de gérer toutes les étapes du traitement.

Volet Vignettes : Ce volet affiche les vignettes des pages de votre document.

Gestionnaire de documents : Ce volet fournit un résumé d'informations sur un document sous la forme d'un tableau. Chaque rangée donne des informations sur une page. Les colonnes présentent des statistiques ou des informations d’état pour chaque page, et (quand cela est nécessaire) les totaux du document.

Image de page : Ce volet affiche l'image de la page actuelle, et indique les zones tracées sur celle-ci. Lorsqu’une page est affichée, la barre d’outils Image est disponible.

Éditeur de texte : Ce volet affiche les résultats d'OCR de la page en cours de traitement.

Chapitre 2 Bureau Om niPage et modes d’affichage 26

Page 27

Vous pouvez réorganiser les volets à votre guise : verticalement ou horizontalement. Pour ouvrir les volets Chargeur express, État du flux de travail ou Aide, utilisez le menu Fenêtre. Les volets peuvent être réduits ou fermés, mais ne peuvent pas être organisés sous forme d’onglets. Pour restaurer le mode Classique par défaut, choisissez Réinitialiser vue actuelle dans le menu Fenêtre.

Mode Flexible

Sélectionnez ce mode d’affichage pour optimiser l’espace de travail d’OmniPage en fonction de la tâche que vous devez réaliser. Par défaut, tous les volets apparaissent. Dans ce mode, cinq onglets sont affichés : Image de page (y compris Vignettes), Éditeur de texte, Chargeur express, État du flux de travail et Aide. Le gestionnaire de documents apparaît dans un volet horizontal, situé en bas de la zone de travail. Vous pouvez détacher, déplacer, réduire, grouper ou fermer les volets, selon la procédure décrite ci-dessus. Faites glisser un onglet vers la zone de travail pour obtenir un affichage en mosaïque semblable au mode Classique. Faites-le glisser de nouveau vers la barre des onglets pour rétablir les onglets, ou utilisez la barre espace selon la procédure décrite ci-dessus. Si les volets sont groupés, le texte de l'onglet indique le volet actif. Pour restaurer le mode Flexible par défaut, choisissez Réinitialiser vue actuelle dans le menu Fenêtre.

À l’instar de l’Explorateur Windows, le Chargeur express est un outil qui permet d’afficher et gérer les fichiers. Il peut rester ouvert pendant la session, permettant ainsi de sélectionner et regrouper rapidement les fichiers (reportez-vous au chapitre

3, page 43).

Chapitre 2 Bureau Om niPage et modes d’affichage 27

Page 28

Cas de figure possibles :

Espace de travail optimal (travail sur un seul écran)

Chargez un document. Dans le menu Fenêtre, sélectionnez les volets avec lesquels vous souhaitez travailler. Faites glisser chacun de ces volets derrière le volet actif, jusqu’à ce qu’ils prennent la forme d’onglets. De la même façon, vous pouvez ancrer l’aide pour ne pas avoir à manipuler deux fenêtres distinctes.

Manipulation des résultats de reconnaissance (travail sur un seul écran)

Chargez un document, puis lancez sa reconnaissance. Refermez tous les volets, à l’exception du gestionnaire de documents et de l’éditeur de texte. Affichez ces deux volets horizontalement, sur toute la largeur de l’écran, réduisez la hauteur du gestionnaire de documents, et ancrez-le dans la partie supérieure ou inférieure de la fenêtre. Vous pouvez dès lors passer les pages en revue, en cliquant deux fois dessus dans le gestionnaire de documents, et inspecter les résultats de reconnaissance dans l’éditeur de texte. Les informations fournies par le gestionnaire de documents (nombre de mots douteux et de caractères de rejet) vous aideront à repérer rapidement les pages qui posent problème.

Chapitre 2 Bureau Om niPage et modes d’affichage 28

Page 29

Traitement de documents volumineux (travail sur deux écrans)

Chargez le document sur lequel vous souhaitez travailler. Déplacez le volet Vignettes sur votre second moniteur, et affichez-le en plein écran pour disposer d’une large vue de votre document, et disposer d’un maximum de place pour la manipulation des vignettes.

Vérification (travail sur deux écrans)

Placez le volet Image de page sur un écran, et l’éditeur de texte sur l’autre. Vous disposerez ainsi d’un espace optimal pour vos travaux d’édition et de vérification.

Disponible à tout moment, le volet Image de page vous permet de vérifier la reconnaissance de vos pages, d’y tracer des zones à la volée et d’en éditer le texte.

Les cas de figure présentés ci-dessus ne sont que des exemples des possibilités offertes par le mode Flexible.

Mode Conversion rapide

Le mode Conversion rapide vous permet de réaliser rapidement la reconnaissance et l’enregistrement de vos documents. Vous pouvez uniquement accéder au mode Conversion rapide lorsqu’aucun document n’est ouvert. De plus, ce mode d’affichage ne permet de ne

Chapitre 2 Bureau Om niPage et modes d’affichage 29

Page 30

Options du mode Conversion rapide : source du document et mise en page, format de sortie, niveau de formatage, dossier de sortie et nom de fichier, options d’enregistrement, intervalle de pages

Image de page

Barre d’outils Conversion rapide

Boutons de

traitement

Titre du volet Image de page

Options du mode Conversion rapide et onglet (fermé) du Chargeur express

travailler que sur un seul document d’entrée et de sortie à la fois. L’illustration ci-dessous affiche la disposition par défaut.

Par défaut, le Chargeur express apparaît dans un onglet dont l’affichage alterne avec celui du volet Options du mode Conversion rapide. Un volet Aide peut être ajouté, mais aucun autre volet n’est disponible dans ce mode d'affichage. Vous pouvez modifier les onglets pour séparer les volets et les réduire, comme dans les autres modes d’affichage.

Après le chargement d’un fichier, nous vous recommandons de le convertir avant de procéder au chargement du fichier suivant. Lorsque la conversion d’une image est terminée, vous n’avez pas besoin de fermer cette image ; il vous suffit de charger un nouveau fichier.

En mode Conversion rapide, le Chargeur express offre une fonctionnalité supplémentaire : le traitement « en un clic ». Ouvrez

Chapitre 2 Bureau Om niPage et modes d’affichage 30

Page 31

le sous-menu Chargeur express dans le menu Traitement et sélectionnez Charger des fichiers ou Importer et convertir. Cette dernière option permet de sélectionner plusieurs fichiers qui sont chargés, reconnus et enregistrés à l’aide des paramètres en cours. Pour cela, vous devez définir les noms des fichiers de sortie, de façon à ce qu’ils soient identiques aux noms des fichiers source. Pour plus d’informations, reportez-vous au chapitre

En mode Conversion rapide, le volet Image intègre la barre d’outils Conversion rapide, qui offre un accès aux opérations de traitement des images les plus utiles. Pour accéder aux fonctionnalités avancées, et notamment l’enregistrement des fichiers image, les outils SET, le traçage de zones en direct, la réorganisation des zones et le traçage manuel de zones pour le texte vertical, utilisez un autre mode d’affichage.

3, page 43 et à l’aide.

Modes d’affichage personnalisés

Pour créer un mode d’affichage personnalisé, disposez les volets et les barres d’outils selon vos besoins, puis sélectionnez Fenêtre > Modes d’affichage personnalisés > Gérer. Cliquez sur Ajouter et donnez un nom à votre mode d’affichage. Vos modes d’affichage sont accessibles dans le sous-menu Modes d’affichage personnalisés. Le mode actuellement utilisé est indiqué par une case à cocher. Les modes d’affichage personnalisés ne permettent pas de rétablir l’affichage par défaut.

Changement de mode d’affichage

Pour changer de mode d’affichage, utilisez le menu Fenêtre. Les volets sont affichés ou masqués et organisés de la même façon que lors de la dernière utilisation du mode d’affichage choisi. La rubrique d’aide affichée ne varie pas en fonction du mode d’affichage. Le Chargeur express mémorise l’emplacement des

Chapitre 2 Bureau Om niPage et modes d’affichage 31

Page 32

fichiers, quel que soit le mode d’affichage, et le volet État du flux de travail continue d’afficher des informations sur le dernier flux de travail exécuté. Au redémarrage du programme, l’aide affiche la rubrique de bienvenue et le Chargeur express le dossier par défaut ; le volet État du flux de travail est vide.

Barres d'outils

Le programme dispose de onze barres d'outils principales. Le menu Affichage permet de les afficher, de les masquer et de les personnaliser. La barre d'état, affichée au bas de la fenêtre du programme, affiche une description de chacun des outils sélectionnés.

Barre d’outils Standard : Permet d'effectuer les opérations de base d'OmniPage.

Barre d’outils Image : Permet d'effectuer les opérations sur les images, les zones et les tableaux. Parmi ces outils, trois groupes peuvent être manipulés séparément (mini barres d’outils) :

• Barre d’outils Zones : Pour le traçage de zones.

• Barre d’outils Rotation : Pour la rotation de pages.

• Barre d’outils Tableau : Pour l’insertion, le déplacement et

la suppression de séparateurs de lignes et de colonnes.

Barre d’outils Formatage : Permet de formater le texte reconnu dans l'éditeur de texte.

Barre d’outils du vérificateur : Permet de contrôler l'emplacement et l'aspect du vérificateur.

Barre d'outils de réagencement : Permet de modifier l'ordre des éléments dans les pages reconnues.

Barre d’outils Marquage de texte : Permet de marquer et de biffer du texte.

Chapitre 2 Bureau Om niPage et modes d’affichage 32

Page 33

Barre d’outils Conception de formulaires : Permet de créer des éléments de formulaire.

Barre d’outils Réorganisation de formulaires : Permet de réorganiser et d'aligner les éléments de formulaire.

Dans chacun des modes d’affichage, les barres d’outils peuvent être déplacées et personnalisées selon vos besoins, y compris en cas d’utilisation de deux écrans.

Les barres d’outils Conception de formulaires, Réorganisation de formulaires et Marquage de texte

(reportez-vous au chapitre 4, page 83 pour plus d’informations) ne sont disponibles que dans OmniPage Professional 17.

Principales étapes de l’OCR

OmniPage propose trois modes de traitement des documents : automatique, manuel ou par flux de travail. Ces trois modes impliquent globalement les mêmes étapes principales :

Importer des images de document dans OmniPage. Vous pouvez numériser un document papier (avec ou sans chargeur de feuilles automatique) ou charger un ou plusieurs fichiers image.

Exécuter l’OCR pour obtenir du texte éditable. À l’issue de la reconnaissance, vous pouvez détecter et corriger les erreurs éventuelles à l’aide du module de vérification de l’OCR et éditer le document dans

l’éditeur de texte.

Exporter le document vers la destination de votre choix. Une fois le document reconnu, vous pouvez

l’enregistrer dans un fichier (en spécifiant le nom et le

type voulus), le copier dans le Presse-papiers, l’envoyer comme

Chapitre 2 Principales étapes de l’OCR 33

Page 34

pièce jointe à un e-mail ou le publier. Un même document peut être enregistré plusieurs fois avec différents réglages d’emplacement, de type de fichier, de formatage, etc., selon vos besoins.

Avec OmniPage, vous pouvez choisir l'une des méthodes de traitement suivantes : automatique, manuel, combiné ou par flux de travail. Vous pouvez lancer le processus de reconnaissance à partir d'autres applications en utilisant la fonction Direct OCR d'OmniPage, ou différer son lancement en planifiant son exécution à une heure précise.

Les différents modes de traitement sont décrits dans le chapitre suivant, ainsi que dans l'aide du programme.

Réglages

Les réglages OmniPage sont regroupés dans la boîte de

dialogue Options. Vous pouvez y accéder depuis la barre d'outils Standard ou le menu Outils. Dans cette boîte de dialogue, utilisez l'aide contextuelle pour obtenir des informations détaillées sur chacune des options disponibles.

Utilisation d'OmniPage avec PaperPort

PaperPort® est un puissant logiciel de gestion de documents papier édité par Nuance. Ce programme permet de lier vos pages aux applications appropriées. Ces pages peuvent comporter des graphiques et/ou du texte. Si PaperPort est présent sur un ordinateur doté d'OmniPage, les services d’OCR de ce dernier viennent compléter les fonctionnalités de PaperPort. Pour choisir un programme d'OCR, cliquez avec le bouton droit sur le lien PaperPort d'application de texte, sélectionnez Préférences, puis spécifiez OmniPage 17 en tant que programme d'OCR à utiliser.

Chapitre 2 Utilisation d'OmniPage avec PaperPort 34

Page 35

À l’instar de Direct OCR, vous pouvez spécifier les réglages d’OCR de votre choix. PaperPort

offre la solution la plus simple et la plus rapide pour toute personne qui souhaite transformer des documents papier en fichiers numériques faciles à gérer, à retrouver et à manipuler. PaperPort peut dialoguer avec des scanners, des imprimantes multifonction et des photocopieurs numériques en réseau pour transformer des documents papier en fichiers numériques. Par ailleurs, PaperPort propose un système de dossiers clair et pratique. Grâce aux vignettes affichées sur le bureau PaperPort, vous pouvez réaliser visuellement le classement, la récupération et la manipulation des documents numérisés : fichiers Word, feuilles de calcul, fichiers PDF et photos numériques. Les outils d'édition de PaperPort transforment avec succès l'aspect de vos documents numérisés, alors que les outils d'annotation permettent d'ajouter vos commentaires à toute image numérisée afin de les mettre en valeur.

PaperPort est inclus dans la version Professional d’OmniPage. Pour obtenir plus d’informations sur cette application, reportez-vous à la documentation de PaperPort. PaperPort doit être installé et désinstallé séparément.

Chapitre 2 Utilisation d'OmniPage avec PaperPort 35

Page 36

Traitement des documents

Ce chapitre décrit les modes de traitement des documents disponibles sous OmniPage et fournit des détails sur les principales étapes des procédures impliquées :

Méthodes de traitement

Avec OmniPage, vous pouvez choisir l'une des méthodes de traitement suivantes :

Automatique

Une solution simple et efficace de traiter un document consiste à laisser OmniPage s'en

charger pour vous. Sélectionnez les réglages dans la boîte de dialogue Options et les commandes dans la boîte à outils OmniPage, puis cliquez sur Lancer. OmniPage soumet chaque page à toutes les étapes du traitement, si possible effectuant plusieurs opérations en parallèle. Sous ce mode, le logiciel se charge également de tracer les zones.

Manuel

Le traitement manuel vous assure un contrôle plus précis du traitement de votre document. Vous pouvez traiter chaque page individuellement avec différents réglages. Le programme s’arrête à chaque étape du traitement : acquisition des images, réalisation de l’OCR et exportation. Vous pouvez ainsi

tracer des zones manuellement ou modifier les langues de

Chapitre 3 Traitement des documents 36

Page 37

reconnaissance. Pour lancer une étape, cliquez sur l'un des trois boutons correspondants dans la boîte à outils OmniPage.

1. Utilisez le premier bouton pour importer des images.

2. Tracez manuellement les zones dans les pages dont vous ne

voulez traiter qu'une partie ou pour lesquelles vous voulez fournir des instructions de zones précises. Appliquez la valeur Ignorer aux fonds ou aux zones que vous voulez exclure du traitement. Appliquez la valeur Traiter aux fonds ou aux zones pour lesquels vous voulez définir le traçage automatique des zones.

3. Utilisez le deuxième bouton pour lancer la reconnaissance des

pages.

4. Effectuez vos travaux de vérification et d’édition, selon vos

besoins.

5. Utilisez le troisième bouton pour enregistrer les résultats de

votre travail.

Lors du traitement manuel, toutes les pages affichées sont automatiquement sélectionnées par défaut. Un simple clic suffit ainsi pour reconnaître le contenu de toutes les nouvelles pages. Ce réglage par défaut peut être modifié via l'onglet Traitement de la boîte de dialogue Options.

Traitement combiné

Vous pouvez traiter un document automatiquement, puis afficher le résultat obtenu dans l'éditeur de texte. Si la qualité de l'ensemble du document est bonne et que seules certaines pages sont insatisfaisantes, vous pouvez passer au traitement manuel pour modifier les réglages et relancer la reconnaissance des pages incorrectes. Vous pouvez aussi importer les images manuellement, tracer des zones sur tout ou partie d'entre elles, puis appliquer à toutes les pages le traitement automatique en appuyant sur le bouton Lancer et en choisissant de traiter les pages existantes.

Chapitre 3 Méthodes de trait ement 37

Page 38

Flux de travail

Un flux de travail se compose d’une série d’étapes et de réglages s’y rapportant. Ils incluent

généralement, mais pas obligatoirement, une étape de reconnaissance. Son déroulement peut ne pas se conformer au schéma de traitement traditionnel (« 1-2-3 »). Les flux de travail sont répertoriés dans la liste déroulante Flux de travail. Celle-ci comprend un certain nombre de flux de travail proposés par le système, en plus de ceux que vous avez créés. Les flux de travail vous permettent de gérer plus efficacement les tâches récurrentes. Les différentes étapes et leurs réglages y sont prédéfinis. Vous pouvez placer l’icône Agent OmniPage dans votre barre de tâches. Le menu contextuel associé répertorie vos flux de travail. Cliquez sur un flux de travail pour lancer OmniPage et exécuter ce flux.

L'Assistant Flux de travail vous guide tout au long de la création de vos flux de travail. Il propose une série d’étapes et les réglages qui y sont associés. Après avoir défini une étape, cliquez sur Suivant pour en ajouter de nouvelles. L’Assistant vous assiste, si besoin, lors du traitement automatique. Reportez-vous à la section « Assistant Flux de travail » du chapitre

6, page 109 .

Traitement différé

Le module OmniPage Batch Manager permet de différer la reconnaissance automatique des documents (par exemple, à une heure où vous n'utilisez pas votre

ordinateur). La gestion et l’exécution des travaux s’effectuent dans Batch Manager. allumé au moment du lancement d’un travail différé, mais vous pouvez l’éteindre entre le moment où le travail est créé dans Batch Manager et l’heure à laquelle débute le traitement planifié. Si le travail en question implique une numérisation, votre scanner doit être allumé au moment du démarrage du travail et les pages correspondantes doivent être placées dans le chargeur ADF.

L’ordinateur doit simplement être

Chapitre 3 Méthodes de trait ement 38

Page 39

Lorsque vous sélectionnez l’option Créer un travail, l'Assistant Travail puis l'Assistant Flux de travail apparaissent. La sélection d’options et de réglages est légèrement modifiée dans le second assistant. La première fenêtre de l'Assistant Travail vous permet de définir le type et le nom du travail. Dans les fenêtres suivantes, vous pouvez spécifier une heure de lancement, la répétition du travail ou les instructions spécifiques de surveillance des dossiers.

Un travail intègre un flux de travail pour lequel des instructions de planification ont été définies. Reportez-vous à la section « Batch Manager » du chapitre

6, page 112.

Traitement à partir d’autres applications

La fonction Direct OCR™ permet de faire appel aux services OCR d’OmniPage à partir des applications suivantes : Microsoft Office XP ou supérieur, Corel WordPerfect 12 ou X3. Avant de pouvoir utiliser cette fonction, vous devez activer l’option Activer Direct OCR sous Outils > Options > Général. Ensuite, deux boutons ajoutés à l’onglet Nuance OCR d’Office 2007 ou à une barre d’outils OmniPage permettent d’accéder aux services d’OCR.

Configuration de Direct OCR

Démarrez l’application à lier à OmniPage. Lancez OmniPage, ouvrez la boîte de dialogue Options, puis l’onglet Général et sélectionnez Activer Direct OCR.

Dans l’application cible, utilisez le bouton Configuration d’acquisition du texte de la barre d’outils OmniPage (dans Office 2007, ouvrez l’onglet Nuance OCR). Sélectionnez les options de votre choix dans les volets suivants :

• OCR : langues, dictionnaires, mise en page, polices.

• Traitement : prétraitement des images, options

d’ouverture des PDF, conservation de la mise en page.

Chapitre 3 Méthodes de trait ement 39

Page 40

• Format de sortie : définition d’un niveau de formatage.

• Direct OCR : traçage manuel ou automatique des zones,

activation ou désactivation de la vérification, source de l’image.

• Scanner : configuration ou modification des paramètres du

scanner.

Les réglages effectués s’appliquent à l’ensemble des opérations futures de Direct OCR jusqu'à leur éventuelle modification ; ils ne sont pas pris en compte si vous utilisez OmniPage sans Direct OCR.

Utilisation de Direct OCR

1. Démarrez l’application et ouvrez un document. Pour importer

dans le document les résultats des pages numérisées, placez celles-ci correctement dans le scanner.

2. Utilisez le bouton Configuration d’acquisition du texte de

la barre d’outils OmniPage ou la même commande dans le menu Fichier de l’application cible (ou l’onglet Nuance OCR dans Office 2007) pour vérifier et modifier, si nécessaire, les paramètres de reconnaissance ; le volet Direct OCR vous permet de spécifier si l’entrée provient du scanner, d’un fichier image ou d'un appareil photo numérique.

3. Utilisez le bouton Acquérir le texte de la barre d’outils

OmniPage ou la même commande dans le menu Fichier (dans Office 2007, utilisez l’onglet Nuance OCR) pour acquérir des images à partir de la source spécifiée.

4. Si vous avez sélectionné l’option Définir les zones automatiquement

dans l’onglet Direct OCR de la boîte de dialogue Options ou dans la fenêtre Configuration d'acquisition du texte, la reconnaissance est lancée immédiatement.

5. Si vous n’avez pas sélectionné l’option Définir les zones

automatiquement, le programme vous propose de tracer des zones

Chapitre 3 Méthodes de trait ement 40

Page 41

manuellement sur chaque image de page. Cliquez sur le bouton Exécuter l’OCR pour poursuivre la reconnaissance.

6. Si la fonction de vérification a été activée, cette opération suit

l’OCR. Le texte reconnu est ensuite inséré dans votre application à l’emplacement du curseur, avec le niveau de formatage spécifié grâce à la commande Configuration d’acquisition du texte du volet Format de sortie.

Définition de la source des images de page

Les images peuvent provenir des trois sources suivantes : fichiers image, appareil photo numérique et scanner. Il existe essentiellement deux types de scanner : à plat et à alimentation feuille à feuille. Pour faciliter la numérisation des documents multipages, un scanner peut être équipé d’un chargeur automatique (ADF). Les images des documents numérisés peuvent être soit exportées directement dans OmniPage, soit enregistrées avec le logiciel du scanner, dans un format de fichier image utilisable dans OmniPage.

Importation de fichiers image

Vous pouvez créer un fichier image à partir de votre scanner, ou le recevoir par e-mail ou par fax. La liste des types de fichiers image compatibles avec OmniPage 17 est très étendue. Sélectionnez Charger des fichiers dans la liste déroulante Importer page(s). Spécifiez les fichiers dans la boîte de dialogue Charger des fichiers. Celle-ci apparaît lorsque vous démarrez le traitement automatique. Lors d’un traitement manuel, cliquez sur le bouton Importer page(s) ou utilisez la commande appropriée du menu Traitement. Les réglages évolués, proposés dans la partie inférieure de la boîte de dialogue, peuvent être affichés ou masqués selon vos préférences.

Chapitre 3 Définition de la source des images de page 41

Page 42

La largeur ou la hauteur minimale des fichiers image est de 16 x 16 pixels. La largeur ou la hauteur maximale est de 8 400 pixels (71 cm/28 pouces pour une résolution comprise entre 201 à 600 ppp). Pour connaître toutes les limites en pixels, reportez-vous à l’aide.

Vous pouvez définir le mode d’ouverture des fichiers PDF sous Outils > Options > Traitement : affichage de la couche de texte ou ouverture en tant qu’image, importation des informations des balises pour conserver la mise en page et utilisation des polices du PDF ou des polices système mappées.

Avec OmniPage Professional 17, il est possible d’importer des fichiers depuis des serveurs FTP ou depuis des sources Microsoft SharePoint 2003 et 2007, Hummingbird, iManage ou depuis un système de gestion documentaire compatible ODMA.

Importation de photos numériques

Vous pouvez importer des photos de documents en vue de leur reconnaissance dans OmniPage. Assurez-vous

tout d’abord que le pilote de votre appareil photo est installé correctement. Raccordez ensuite votre appareil photo, puis téléchargez vos images. Sélectionnez Charger des photos numériques dans la liste déroulante Importer page(s). Avec cette méthode, les traitements suivants sont automatiquement exécutés : redressement 3D, amélioration de la résolution et redressement des lignes de texte. Vous pouvez également procéder à un redressement 3D manuel. Pour plus d’informations, reportez-vous à la section « Outils de retouche d’images » ci-après dans ce chapitre.

Pour importer des photos numériques contenant du texte à l’aide de Direct OCR ou de PaperPort, activez la case à cocher Charger en tant que photo numérique. Les améliorations citées précédemment seront automatiquement appliquées.

Chapitre 3 Définition de la source des images de page 42

Page 43

Pour obtenir des conseils sur la manipulation de photos numériques, reportez-vous aux Guides d’apprentissage et à l'aide.

Importation de fichiers avec le Chargeur express

Cet outil permet d’accéder à une interface semblable à celle de l’Explorateur Windows dans une fenêtre d’OmniPage. Dans les modes Flexible et Conversion rapide, le Chargeur express apparaît par défaut. Sélectionnez Chargeur express dans le menu Fenêtre pour l’ajouter au mode Classique ou pour l’afficher ou le masquer dans les autres modes. Cet outil vous permet de parcourir l’ensemble de votre système de fichiers et de sélectionner efficacement les fichiers que vous souhaitez charger dans OmniPage. Choisissez Traitement > Chargeur express > Dossier pour afficher les fichiers sous forme de listes, de vignettes, de mosaïques, d’icônes (organisées à votre guise) ou de façon détaillée, comme vous en avez l’habitude dans l’Explorateur Windows. Le Chargeur peut rester affiché pendant que vous travaillez.

Pour lancer le Chargeur express, accédez au menu Traitement. Au lieu de sélectionner des fichiers et les envoyer directement dans OmniPage, vous pouvez choisir l’option Fenêtre de la file pour afficher une boîte de dialogue dotée d’une fonction de verrouillage. Activez le verrouillage pour compiler et réorganiser une liste de fichiers (même en provenance de différents dossiers). Le verrouillage s’applique à tous les fichiers collectés pour être ajoutés au document ouvert. Lorsque la liste est finalisée, désactivez le verrouillage pour démarrer le chargement. Si le verrouillage est désactivé dès le début, les fichiers sont uniquement répertoriés si leur sélection est effectuée plus rapidement qu’OmniPage ne peut les charger. Dans la pratique, vous pouvez charger quelques fichiers, lancer la reconnaissance et, pendant que cette opération est en cours, compiler le reste de la liste d’entrée.

Si vous activez la commande de menu Afficher/Masquer automatiquement la fenêtre de la file, la fenêtre apparaît chaque fois que

Chapitre 3 Définition de la source des images de page 43

Page 44

des fichiers sont en attente de chargement, et se ferme dès que la liste est vide.

Le Chargeur express peut être utilisé dans les modes Classique et Flexible pour compiler des fichiers pour plusieurs documents. Activez le verrouillage, activez le document 1 et collectez les fichiers. Activez ensuite le document 2 et collectez les fichiers correspondants, et ainsi de suite. Lorsque vous avez terminé, désactivez le verrouillage. Chaque document possède son propre verrou, mais le menu Traitement dispose des options Verrouiller tout et Déverrouiller tout qui permettent de verrouiller ou libérer tous les fichiers de tous les documents. Vous pouvez supprimer les fichiers sélectionnés à l’aide de l’option Supprimer, ou supprimer tous les fichiers de la liste du document en cours à l’aide des options

Supprimer tout ou Effacer du menu Traitement. Choisissez l’option Vider tout pour supprimer tous les fichiers de tous les documents

ouverts. Reportez-vous au didacticiel de l’aide consacré au chargement de fichiers pour plusieurs documents.

Le Chargeur express est disponible sous la forme d’un volet dans le mode Conversion rapide. Le menu Traitement possède deux commandes spécifiques au mode Conversion rapide.

• Importer et convertir permet un traitement « en un clic » :

les fichiers sont chargés, traités par un programme d’OCR et enregistrés selon les paramètres actuellement définis. Dans ce seul cas, plusieurs fichiers peuvent être sélectionnés en mode Conversion rapide, et un document de sortie est créé pour chaque fichier d’entrée. Avant de commencer, sélectionnez Identique au nom de fichier source sous l’en-tête Nom de fichier en sortie.

• Charger des fichiers charge les fichiers sans effectuer de

procédure de reconnaissance, comme dans les autres modes d’affichage. En mode Conversion rapide, cette option permet de charger un seul fichier à la fois. Le

Chapitre 3 Définition de la source des images de page 44

Page 45

traitement doit être achevé avant qu’un nouveau fichier d’entrée puisse être sélectionné. Dans ce cas, la fenêtre de la file et son verrou ne sont d’aucune utilité.

Le Chargeur express peut traiter les photos numériques. Pour cela, définissez le paramètre correspondant dans le volet Options du mode Conversion rapide avant de démarrer le Chargeur express. Si l’importation est définie sur Numériser, ce paramètre est temporairement ignoré et les pages sont chargées comme des images normales (ne provenant pas d’un appareil photo numérique).

Toutes les fonctionnalités de l’Explorateur Windows sont disponibles dans le Chargeur express. Par exemple, vous pouvez également sélectionner des fichiers et utiliser l’élément de menu contextuel OmniPage 17 pour les envoyer vers MS Excel, MS Word, PDF, RTF, un fichier au format texte et WordPerfect. Les paramètres existants sont utilisés et les fichiers générés sont placés, par défaut, dans le dossier d’entrée. Utilisez l’Assistant Convertir maintenant pour accéder aux paramètres de base et déterminer, par exemple, si les résultats doivent ou non être affichés dans l’application cible. Cet Assistant vous permet d’effectuer des conversions immédiates ou d’ouvrir l’Assistant Flux de travail pour accéder à tous les paramètres, ce qui permet notamment de modifier le nom et l’emplacement des fichiers cibles. Cet élément de menu contextuel permet également d’afficher tous les flux de travail comportant un fichier image en entrée.

Importation de documents à partir d’un scanner

Pour bénéficier de cette fonction, vous devez disposer d’un scanner compatible, opérationnel et correctement configuré en vue d’une utilisation avec OmniPage 17. Le programme offre plusieurs modes

Chapitre 3 Définition de la source des images de page 45

Page 46

de numérisation que vous choisissez en fonction des deux facteurs suivants :

• le type de graphique souhaité dans le document de sortie ;

• le mode qui produira la reconnaissance la plus précise.

Numériser en noir et blanc

Sélectionnez cette option pour lancer une numérisation en noir et blanc. La rapidité de numérisation et de traitement ainsi que le moindre espace disque occupé représentent les deux principaux avantages de ce mode de numérisation par rapport aux deux autres.

Numériser en niveaux de gris

Sélectionnez cette option pour lancer une numérisation en niveaux de gris. Pour de meilleurs résultats de reconnaissance, utilisez cette option pour les pages présentant un contraste variable ou réduit (peu de différence entre les zones claires et sombres) et un fond en couleur ou en dégradé.

Numériser en couleur

Sélectionnez cette option pour lancer une numérisation en couleur. Cette option n’est disponible que si vous disposez d’un scanner couleur. Elle est particulièrement adaptée si vous souhaitez conserver les graphiques, le texte et les fonds en couleur dans le document de sortie. La numérisation en couleur offre une meilleure précision d’OCR que le mode en niveaux de gris, mais exige un temps de traitement plus long et une plus grande quantité de mémoire et d’espace disque.

Chapitre 3 Définition de la source des images de page 46

Page 47

Luminosité et contraste

Le réglage de la luminosité et du contraste joue un rôle important dans la précision de l'OCR. Vous définissez ces paramètres dans l’onglet Scanner de la boîte de dialogue Options ou par l’intermédiaire de l'interface de votre scanner. Dès le chargement d’une image, vérifiez son aspect. Si les caractères sont gras et compacts, augmentez la luminosité. Si les caractères sont fins et tronqués, assombrissez l’image. Une fois les modifications requises effectuées, renumérisez la page. Si la qualité de la numérisation vous paraît toujours décevante, ouvrez l'image numérisée dans la fenêtre Retouche d'une image et éditez-la à l'aide des différents outils proposés.

Numérisation avec un chargeur automatique (ADF)

La meilleure méthode pour numériser des documents de plusieurs pages est d’utiliser un chargeur automatique. Placez les pages dans l’ordre requis dans le chargeur. Un chargeur ADF accepte également la numérisation de pages recto verso. Les scanners dotés de fonctions recto verso assurent un traitement automatique des pages.

Numérisation sans chargeur automatique

Même si vous ne disposez pas d’un chargeur automatique, l’interface de numérisation d’OmniPage vous permet de numériser efficacement des documents multipages à l’aide de votre scanner à plat. Sélectionnez l’option Numériser les pages automatiquement (onglet Scanner de la boîte de dialogue Options) et définissez une valeur de pause en secondes. Ainsi le scanner effectue les passes de numérisation automatiquement, en marquant une pause de durée spécifiée entre chaque numérisation pour vous permettre de charger la page suivante.

Chapitre 3 Définition de la source des images de page 47

Page 48

Numérisation vers OmniPage et utilisation des flux de travail

Accédez à Outils > Options > Scanners pour choisir l’action exécutée lorsque vous appuyez sur un bouton de votre scanner local. Il peut s’agir d’une simple numérisation avec chargement des images dans OmniPage. Il est également possible de sélectionner un flux de travail de numérisation parmi ceux déjà créés, ou d’activer l’affichage d’un message invitant à sélectionner un flux de travail chaque fois que vous appuyez sur ce bouton. Utilisez le bouton Panneau de configuration pour associer OmniPage à un événement de scanner (pression exercée sur un bouton du scanner). Lorsque vous appuyez sur ce bouton, OmniPage démarre, exécute le flux de travail et envoie les résultats vers la cible définie, avec ou sans votre intervention.

Avec OmniPage Professional, cette fonctionnalité peut également être utilisée pour lancer des flux de travail invoqués par codes à barres (reportez-vous au chapitre

6, page 114).

Conversion de documents

Outre des fichiers image, OmniPage Professional 17

permet d’ouvrir des documents créés dans des

programmes de traitement de texte et d’autres

applications similaires. (fichiers .doc, .xls, .ppt, .rtf, .wpd, etc.). Cliquez sur le bouton Charger des fichiers dans la boîte à outils OmniPage ou sélectionnez Charger des fichiers dans le sous-menu Importer page(s) du menu Fichier. Dans la boîte de dialogue qui apparaît, choisissez Documents. Lorsque vous avez terminé, choisissez votre format d’enregistrement parmi l’un des nombreux types de fichiers proposés. Pour réaliser ces conversions, Nuance PDF Create doit être installé.

Chapitre 3 Définition de la source des images de page 48

Page 49

Définition de la mise en page du document

Avant de commencer la reconnaissance d’un document, OmniPage vous demande de décrire la mise en page de celui-ci dans le but de faciliter le traçage automatique des zones. Cette fonction s’applique également en cas de traitement automatique, à moins que vous n’ayez spécifié un gabarit ne contenant aucune zone ou fond à valeur Traiter. Lors d’un traitement manuel, le traçage de zones automatique est parfois activé. Reportez-vous à la rubrique Activation du traçage de zones automatique de l’aide en ligne. Pour décrire le document original, vous disposez des options suivantes :

Automatique

Choisissez cette option pour laisser le programme prendre toutes les décisions concernant la définition des zones. Le programme détermine si l’élément est du texte en colonnes, un graphique, du texte à reconnaître ou un tableau à conserver.

Colonne unique sans tableau

Choisissez ce réglage si vos pages contiennent une seule colonne de texte et aucun tableau. Ce type de mise en page est employé généralement dans les livres et les lettres commerciales.

Colonnes multiples sans tableau

Choisissez cette option si certaines de vos pages contiennent du texte en colonnes que vous souhaitez disposer sans colonnes ou dans des colonnes distinctes (correspondant à la mise en page originale).

Chapitre 3 Définition de la mise en page du document 49

Page 50

Colonne unique avec tableau

Choisissez cette option si vos pages contiennent une seule colonne de texte et un tableau.

Feuille de calcul

Choisissez cette option si l'intégralité de la page se présente sous la forme d'un tableau que vous souhaitez exporter dans une feuille de calcul ou en tant que tableau unique.

Formulaire

Choisissez cette option si l'intégralité de la page se présente sous la forme d'un formulaire dont vous souhaitez reconnaître automatiquement les éléments. À l'issue de la reconnaissance, vous pouvez modifier les propriétés des éléments de formulaire, ajouter de nouveaux éléments ou modifier la mise en page du formulaire. Cette option n'est disponible qu'avec OmniPage Professional 17.

Document juridique

Choisissez cette option pour reconnaître des documents juridiques. Les en-têtes sont détectés et supprimés automatiquement, et vous devez indiquer si vous souhaitez conserver ou pas les numéros de ligne.

Personnalisé

Choisissez cette option pour contrôler au maximum le déroulement du traçage de zones automatique. Vous pouvez désactiver ou forcer la détection de colonnes, de graphiques et/ou de tableaux. Sélectionnez les réglages requis dans l'onglet OCR de la boîte de dialogue Options.

Chapitre 3 Définition de la mise en page du document 50

Page 51

Gabarit

Choisissez un fichier de gabarit de zones si vous souhaitez appliquer une valeur de fond, avec ses zones et propriétés, à toutes les pages importées. Les zones définies par le gabarit sont appliquées à la page actuelle, et remplacent les zones existantes.

Si le traçage automatique des zones produit des résultats inattendus, utilisez le traitement manuel pour redéfinir les zones sur les pages individuelles et relancer leur reconnaissance.

Prétraitement des images

Afin d'optimiser le processus d’OCR, vous pouvez utiliser les outils de retouche pour améliorer la qualité de vos images avant de procéder à leur découpage en zones et à leur reconnaissance. Pour ouvrir la fenêtre Retouche d'une image, cliquez sur le bouton SET Retoucher l'image dans la barre d'outils Image, ou choisissez Retoucher l'image dans le menu Outils. Vous pouvez également intégrer à vos flux de travail un processus de retouche d'images en choisissant l'étape Retoucher les images.

L'image primaire est utilisée en tant qu'entrée pour le processus de retouche d'images.

Il existe trois types d'image : Image originale : Image générée par numérisation ou incorporée

dans un fichier électronique avant son importation dans le programme.

Image primaire : État de l'image originale une fois chargée dans OmniPage. Cette image peut avoir été modifiée par des opérations de prétraitement automatiques ou manuelles.

Image OCR : Image en noir et blanc dérivée de l'image primaire, optimisée pour une reconnaissance optimale.

Chapitre 3 Prétraitement des images 51

Page 52

Certains outils affectent l'image primaire, tandis que d'autres

Inacceptable

Tolérable

Bonne

Optimale

Bonne

Tolérable

Inacceptable

s'appliquent à l'image OCR. Déterminez avec précision le type d'image qui sera modifié par le processus.

Le réglage de la luminosité et du contraste joue un rôle important dans la précision de l'OCR. Vous définissez ces paramètres dans l’onglet Scanner de la boîte de dialogue Options ou par l’intermédiaire de l'interface de votre scanner. Le diagramme cidessous illustre le réglage de luminosité optimal. Dès le chargement d’une image, vérifiez son aspect. Si les caractères sont gras et compacts, augmentez la luminosité. Si les caractères sont fins et tronqués, assombrissez l’image. Utilisez l'outil Luminosité de l'OCR pour optimiser l'image.

Chapitre 3 Prétraitement des images 52

Page 53

Outils de retouche d'images

Les outils de retouche d'images permettent également d'éditer des images afin de les enregistrer en tant que fichiers image. Attention : certains de ces outils affectent uniquement les images primaires, tandis que d'autres s'appliquent aux fichiers utilisés pour l'OCR (ou images OCR). Dans la fenêtre Retouche d'une image, cliquez sur le bouton Image primaire/OCR pour visualiser l'état actuel des deux images.

La fenêtre Retouche d’une image se compose de deux volets. L’image de départ apparaît dans le volet de gauche. Vos modifications sont affichées dans le volet d’aperçu de droite. Lorsque vous cliquez sur Appliquer les modifications, l’image de droite apparaît dans le volet de gauche et devient la nouvelle image de départ que vous pouvez continuer à éditer.

Les outils suivants sont disponibles dans la barre d’outils ; leurs fonctions sont détaillées ci-dessous :

P – Affecte uniquement l’image primaire. O – Affecte uniquement l’image OCR. PO – Peut être appliqué à l’image primaire ou à l’image OCR (ou aux

deux). P+O – Une même action est appliquée à l’image primaire et à l’image

OCR. P/O – Affecte les deux images. IE – S’applique uniquement aux images entières. ZO – Peut être appliqué à certaines zones des images.

Pointeur (F5) - Le pointeur est un outil neutre qui permet de réaliser différentes actions (comme sélectionner une couleur de remplissage ou la ligne de redressement d’une image) selon les circonstances. PO.

Chapitre 3 Prétraitement des images 53

Page 54

Zoom (F6) - Cliquez sur cet outil, puis utilisez le bouton gauche de la souris pour agrandir l'image ou le bouton droit pour la réduire. Vous pouvez également utiliser la roulette de la souris pour agrandir ou réduire l'image à votre gré, y compris dans la vue inactive. Dans la vue active, les boutons « + » et « - » ont la même fonction. P+O. IE.

Sélectionner une zone (F7) - Cliquez sur cet outil, puis sélectionnez un autre outil applicable sur une zone de page (portant la mention ZON) et dessinez les contours de votre sélection. Par défaut, les outils de retouche d'images s'appliquent à la page entière. Il existe trois modes de sélection (accessibles via le menu Affichage) : Normal, Additif et Soustractif. PO. ZO.

Image primaire/OCR - Cet outil permet de basculer entre l'affichage de l'image primaire et de l'image OCR dans la vue active. Les images primaires sont associées à n'importe quel mode image. En revanche, les images OCR (version noir et blanc des images primaires) sont générées uniquement pour la reconnaissance. P/O. IE.

Synchroniser les vues - Cliquez sur cet outil pour appliquer à la vue inactive un facteur de zoom et une position de défilement identiques à ceux définis pour la vue active. Pour synchroniser de façon dynamique la vue inactive avec la vue active, choisissez la commande Maintenir la synchronisation dans le menu Affichage. PO. IE.

Les outils SET suivants vous permettent de modifier le contenu de votre image :

Luminosité et contraste - Cet outil permet d'ajuster la luminosité et le contraste de toute ou partie de l'image primaire. Utilisez les glissières situées dans la partie inférieure de la fenêtre pour atteindre le résultat escompté. P. ZO.

Chapitre 3 Prétraitement des images 54

Page 55

Teinte > Saturation > Clarté - Cliquez sur cet outil, puis utilisez les glissières pour modifier la teinte, la saturation et la clarté de l'image primaire. P. ZO.

Découper - Pour n’utiliser qu’une partie de l’image, cliquez sur l’outil Sélectionner une zone, puis sélectionnez l’outil Découper et la zone de l’image que vous souhaitez conserver. Le reste de l’image sera alors supprimé. P+O. IE > ZO

Rotation - Utilisez cet outil pour faire pivoter (de 90, 180 ou 270 degrés) et/ou retourner l'image. P+O. IE.

Nettoyer - Cet outil permet de supprimer les parasites de l'image. L’outil de nettoyage opère sur l’image OCR à quatre niveaux. Vous pouvez également l'utiliser pour inverser le nettoyage et renforcer le contour des lettres. Pour ce faire, il vous suffit de cocher la case Inverser le nettoyage. O. ZO.

Luminosité d’OCR - Cet outil permet de définir la luminosité et le contraste de l'image OCR. Reportez-vous au diagramme du réglage de luminosité optimal à la section « Prétraitement des images » ci-avant. O. ZO.

Ignorer couleur - Cliquez sur cet outil et sélectionnez Rouge, Vert ou Bleu ou choisissez une couleur dans l'image primaire à l'aide de l'outil Sélectionner une zone. Les sections de l'image numérisée dans cette couleur deviendront transparentes. Cet outil s'applique à l'image OCR. P/O. IE.

Résolution - Utilisez cet outil pour réduire la résolution de l'image primaire, indiquée en pourcentages. Notez qu'il est impossible de définir une résolution supérieure à celle de l'image originale. P. IE.

Redresser - Certaines pages peuvent avoir été numérisées de travers. Dans ce cas, l'outil Redresser vous permet de redresser manuellement les lignes de texte. Une option de redressement

Chapitre 3 Prétraitement des images 55

Page 56

automatique est également disponible dans l'onglet Traitement de la boîte de dialogue Options. P+O. IE.

Redressement 3D - Utilisez cet outil pour supprimer la distorsion de perspective sur des images provenant d’un appareil photo numérique. Utilisez cet outil pour vérifier les résultats de redressement 3D automatique, ou pour procéder à un redressement 3D manuel après une étape Charger des fichiers. P+O. IE.

Remplir - Utilisez cet outil pour appliquer une couleur à l’image ou à une partie de l’image. PO. ZO.

Le redressement 3D fonctionne par l’alignement d’une image sur une grille de référence. Il vous suffit d’étirer manuellement cette grille pour que les coordonnées de l’image soient modifiées en conséquence. Reportez-vous à l’illustration suivante pour plus d’informations (Avant > Après Redressement 3D).

Historique des retouches apportées aux images

L'historique de la fenêtre Retouche d'une image vous permet de valider ou d'annuler (individuellement ou globalement) les modifications apportées à vos images. Les modifications apportées à l'image originale apparaissent dans l'aperçu correspondant. Toutefois, elles ne deviennent effectives que lorsque vous cliquez sur le bouton Appliquer les modifications, situé en regard de la liste

Chapitre 3 Prétraitement des images 56

Page 57

de l'historique. Les modifications qui n'ont pas été ajoutées dans l'historique à l'aide du bouton Appliquer ne seront pas validées.

Pour vérifier le résultat d'une action, cliquez deux fois dessus dans la liste de l'historique.

Pour ignorer les modifications que vous avez effectuées à l'aide d'un outil donné et que vous n'avez pas encore appliquées, sélectionnez l'action appropriée dans la liste puis cliquez sur le bouton Réinitialiser.

Pour restaurer l'image à son état d'origine, cliquez sur le bouton Ignorer toutes les modifications.

Enregistrement et application de modèles de retouche automatique

Si vous devez retoucher de la même manière un certain nombre d'images similaires, vous pouvez créer une liste d'actions de retouche qui seront appliquées à la totalité des images.

Pour créer et enregistrer un modèle de retouche automatique d'images, affichez un fichier image dans la fenêtre Retouche d'une image, réalisez les actions de prétraitement souhaitées, puis ajoutez-les dans l'historique en cliquant sur le bouton Appliquer. Choisissez ensuite la commande Enregistrer le modèle de retouche automatique dans le menu Fichier. Sélectionnez le dossier de destination de votre choix, puis enregistrez le fichier modèle (associé à l'extension .ipp).

Pour appliquer à une autre image les modifications définies dans le fichier modèle, ouvrez la nouvelle image dans la fenêtre Retouche d'une image, puis choisissez Charger un modèle de retouche automatique dans le menu Fichier.

Chapitre 3 Prétraitement des images 57

Page 58

Intégration d'un processus de retouche d'images à un flux de travail

Pour intégrer un processus de retouche à un flux de travail, choisissez l'icône appropriée dans l'Assistant Flux de travail. Vous avez le choix entre les options suivantes :

Afficher les images en vue d'une retouche manuelle - Lors de l'exécution d'un flux de travail, chaque image chargée sera affichée en vue d’une retouche manuelle.

Appliquer un modèle de retouche automatique - Un modèle de retouche enregistré sera automatiquement appliqué à l'image traitée par le flux de travail.

Appliquer un modèle de retouche automatique et afficher les images - Le flux de travail appliquera le modèle de retouche sélectionné et l'image sera affichée pour permettre d’éventuelles retouches supplémentaires.

Zones et fonds

Les zones définissent les sections de la page destinées à être traitées ou ignorées. Elles peuvent prendre une forme rectangulaire ou irrégulière (avec des côtés verticaux et horizontaux). Les images de page d'un document possèdent une valeur de fond : Traiter ou Ignorer (cette dernière étant la plus répandue). Vous pouvez utiliser les outils indiqués pour modifier les valeurs de fond. Les outils indiqués dans la section Types et propriétés de zone (voir cidessous) sont également disponibles pour tracer des zones sur des fonds de page.

Traiter – Le document est découpé automatiquement en zones (dans les zones ou les fonds de type Traiter) lors de son envoi pour reconnaissance.

Chapitre 3 Zones et fonds 58

Page 59

Ignorer – Les zones (dans les zones et fonds de type Ignorer) sont exclues du traitement. Le texte n'est pas reconnu et aucune image n'est transférée.

Traçage automatique des zones

Le traçage automatique des zones permet au programme de détecter les éléments de page (blocs de texte, en-têtes, images et autres) et de les inclure dans une zone.

Le traçage automatique des zones peut s'appliquer à toute la page ou à une partie seulement. Les zones tracées automatiquement et les zones de gabarit ont des bordures pleines ; les zones tracées manuellement et les zones modifiées ont des bordures en pointillés.

Traçage automatique de zones sur un fond de page

Importez une page. Celle-ci s'affiche avec un fond de type

Traiter. Tracez une zone. La valeur de fond passe à Ignorer. Tracez les zones Texte, Tableau ou Graphique afin de délimiter manuellement les zones de type voulu. Cliquez sur l'outil Fond à valeur Traiter (voir illustration) afin de définir un fond de ce type. Tracez des zones à valeur Ignorer sur les parties inutiles de la page. À l'issue de la reconnaissance, la page réapparaît : elle comprend un fond à valeur Ignorer et de nouvelles zones encadrant tous les éléments du fond.

Traçage automatique des zones de texte vertical

Si la langue de reconnaissance est définie sur le japonais, le coréen ou le chinois, le traçage automatique des zones détecte les zones de texte et identifie l’orientation du texte. Le texte asiatique vertical apparaît horizontalement dans l’éditeur de texte, mais peut être exporté verticalement (reportez-vous au chapitre 4, page 74).

Le traçage automatique des zones détecte le texte vertical rédigé dans des langues non asiatiques à l’intérieur des cellules de tableaux

Chapitre 3 Zones et fonds 59

Page 60

et partout sur les pages PDF ou XPS. La détection sur plusieurs lignes est alors possible.

Pour les fichiers PDF et XPS constitués uniquement d’images et tous les autres fichiers de numérisation ou fichiers image en entrée, la détection automatique fonctionne dans les conditions suivantes :

• Une seule ligne de texte doit être présente

• Le texte doit se trouver à droite ou à gauche d’un

diagramme ou d’une image ou

• Le texte doit se trouver sur le bord gauche ou droit de la

page et ne doit pas s’étendre sur toute la hauteur de la page.

Le texte vertical placé à l’extérieur des tableaux peut être découpé manuellement en zones, en suivant la procédure ci-dessous. Le traitement de plusieurs lignes verticales est ainsi optimisé.

Le texte vertical peut être affiché et édité avec un curseur vertical dans l'éditeur de texte, dans le niveau de formatage True Page. Avec les autres niveaux de formatage, le texte apparaît horizontalement.

Types et propriétés de zone

Chaque zone est affectée à un type et les zones comportant du texte peuvent également présenter un paramètre de contenu de zone : alphanumérique ou numérique. Le type et le contenu d'une zone représentent les « propriétés de la zone ». Pour modifier les propriétés d’une zone, cliquez dessus avec le bouton droit pour afficher son menu contextuel et effectuez les sélections souhaitées. Pour changer les propriétés de plusieurs zones simultanément, sélectionnez le groupe de zones requis (combinaison Maj.+clic) avant de choisir les nouvelles valeurs.

La barre d'outils Image propose des outils de traçage de zones (un pour chaque type).

Chapitre 3 Zones et fonds 60

Page 61

Zone Traiter

Cet outil permet de tracer une zone à valeur Traiter, afin de définir une section qui sera soumise au traçage de zones automatique. À l'issue de la reconnaissance, cette zone est remplacée par une ou plusieurs zones dont les types sont

déterminés automatiquement.

Zone Ignorer

Cet outil permet de tracer une zone à valeur Ignorer, afin de définir une section à ne pas transférer vers l'éditeur de texte.

Zone Texte

Cet outil permet de tracer une zone Texte. sur un bloc de texte unique. Le contenu des zones est assimilé à un enchaînement de texte, sans aucune colonne. La zone Texte permet d’insérer du texte en caractères latins, grecs et cyrilliques, ainsi que des textes horizontaux en langue asiatique.

Zone Texte asiatique vertical

Cet outil permet de tracer des zones Texte afin d’y insérer du texte vertical en japonais ou en chinois. Ces zones doivent être de forme rectangulaire.

Zone Texte vertical et pivoté vers la gauche

Cet outil permet de tracer des zones Texte afin d’y insérer du texte vertical pivoté vers la gauche (langues non asiatiques uniquement). Les zones doivent être de forme rectangulaire.

Zone Texte vertical et pivoté vers la droite

Cet outil permet de tracer des zones Texte pour insérer du texte vertical pivoté vers la droite (langues non asiatiques uniquement). Les zones doivent être de forme rectangulaire.

Chapitre 3 Zones et fonds 61

Page 62

Zone Tableau

Utilisez ce type pour traiter le contenu de la zone en tant que tableau. Les grilles du tableau peuvent être détectées automatiquement ou placées manuellement. Les zones Tableau doivent être de forme rectangulaire. Le texte vertical placé à l’intérieur des tableaux ne peut pas être découpé manuellement en zones ; il peut être détecté automatiquement dans les tableaux à cellules.

Zone Graphique

Utilisez ce type pour entourer une illustration, un diagramme, un dessin, une signature et tout autre élément que vous souhaitez transmettre à l’éditeur de texte en tant qu’image incorporée plutôt que texte reconnu.

Zone Formulaire

Utilisez ce type pour délimiter une zone de votre document contenant des éléments de formulaire, tels qu'une case à cocher, un bouton radio, un champ de texte ou tout autre élément que vous souhaitez transmettre à l'éditeur de texte en tant qu'élément de formulaire. Ensuite, dans le niveau de formatage True Page, modifiez la mise en page du formulaire ainsi que les propriétés de ses éléments. Les zones Formulaire ne sont prises en charge qu'avec OmniPage Professional 17.

Manipulation de zones

La barre d’outils Image propose des outils d’édition de zones. Pour plus de commodités, des groupes d’outils peuvent être détachés sous la

forme de mini barres d’outils flottantes. Un de ces outils est toujours sélectionné ; pour modifier la sélection en cours, cliquez sur un autre outil. Certains de ces outils sont groupés. En cas d’ancrage comme outil unique, seul le dernier outil

Chapitre 3 Zones et fonds 62

Page 63

sélectionné du groupe est visible. Pour sélectionner un outil visible, cliquez dessus.

Pour tracer une zone unique, sélectionnez l'outil de traçage de zone de type voulu, puis cliquez à l'emplacement requis et faites glisser le curseur dans la direction souhaitée.

Pour redimensionner une zone, sélectionnez-la (en cliquant dessus), amenez le curseur sur un côté ou un angle, activez une poignée et amenez-la à l'emplacement voulu. La zone redimensionnée ne peut pas recouvrir une autre zone.

Pour créer une zone irrégulière par addition, tracez une zone recouvrant partiellement une autre zone du même type.

Pour regrouper deux zones du même type, tracez une zone recouvrant une autre zone du même type (dans l'illustration suivante, les zones tracées figurent à gauche, tandis que la zone résultante apparaît à droite).

Pour créer une zone irrégulière par soustraction, tracez une zone recouvrant une autre zone du même type que le fond.

Pour diviser une zone, tracez une zone de division du même type que le fond.

Pour obtenir des exemples d’illustration de traçage de zones, reportez-vous à l’aide.

Lorsque la nouvelle zone tracée recouvre partiellement une zone existante d'un type différent, une superposition complète ne se produit pas ; la nouvelle zone remplace seulement la partie recouverte de la zone existante.

Chapitre 3 Zones et fonds 63

Page 64

Les types de zones suivants sont interdits :

Le traçage rapide de zones vous permet de définir rapidement des zones manuelles. Activez le curseur de sélection de zones, puis déplacez le curseur sur l’image de page. Des parties ombrées apparaissent. Elles indiquent les zones détectées automatiquement. Cliquez deux fois sur chaque partie ombrée pour la transformer en zone.

Gestion des grilles du tableau dans l’image

À l’issue d’un traitement en mode automatique, OmniPage peut placer des zones de type Tableau sur la page traitée. Ces zones comportent une icône de zone Tableau dans leur angle supérieur gauche. Vous pouvez modifier le type affecté à une zone rectangulaire via son menu contextuel. Vous pouvez également tracer des zones de type Tableau, mais elles doivent toujours être rectangulaires.

La création ou le déplacement des lignes de séparation verticales et horizontales d'un tableau permet de déterminer l’emplacement de la grille lors du placement du tableau dans l’éditeur de texte. Vous pouvez tracer ou redimensionner une zone Tableau (à condition de conserver sa forme rectangulaire) pour éliminer les colonnes ou les rangées inutiles des bords extérieurs d'un tableau.

Les outils de tableau vous permettent d'insérer, de déplacer et de supprimer des séparations de rangées et de colonnes. Cliquez sur l'outil Insérer/Supprimer les séparations pour détecter

Chapitre 3 Zones et fonds 64

Page 65

automatiquement des séparations dans un tableau et créer de nouvelles séparations.

Vous pouvez spécifier le formatage de lignes pour les bordures et les grilles de tableau à partir d'un menu contextuel. Vous disposerez de davantage d'options d'édition des bordures et de fond dans l'éditeur de texte à l'issue de la reconnaissance.

Utilisation de gabarits de zones

Un fichier de gabarit contient une valeur de fond de page, un groupe de zones et leurs propriétés. Pour appliquer les zones d'un gabarit lors de la reconnaissance, chargez un fichier de gabarit de zone via la liste déroulante du bouton de description de la mise en page ou à l'aide du menu Outils. Vous pouvez charger les gabarits créés par d’autres utilisateurs et stockés sur un emplacement du réseau.

Lorsque vous chargez un gabarit, son fond et ses zones sont appliqués dans les pages de différentes manières :

• Dans la page actuelle, les zones du gabarit remplaçant les

zones présentes dans la page.

• Dans les pages importées par la suite.

• Sur les pages préexistantes envoyées pour (nouvelle)

reconnaissance sans aucune zone

Dans les deux premiers cas, le traitement manuel permet de consulter et modifier les zones tracées à l'aide du gabarit avant la reconnaissance.

En traitement automatique, les zones tracées à l'aide du gabarit peuvent être consultées et modifiées seulement après la reconnaissance.

En traitement par flux de travail, utilisez l'étape Définir des zones sur des images qui combine une étape de chargement d'un gabarit et une étape de traçage manuel de zones. Pour utiliser un gabarit de zone, cliquez sur le bouton Ajouter dans la fenêtre appropriée de

Chapitre 3 Zones et fonds 65

Page 66

l'Assistant Flux de travail, puis sélectionnez le fichier de gabarit de zones souhaité. Choisissez ensuite si vous souhaitez afficher les images en vue du traçage manuel des zones, appliquer le gabarit de zone ou appliquer le gabarit de zone et afficher les images.

Les gabarits acceptent les zones et les fonds à valeur Ignorer et Traiter. Par conséquent, ils peuvent être très utiles pour définir les parties de la page destinées au traitement à l'aide du traçage automatique des zones et les parties à ignorer. Pendant la reconnaissance, vous pouvez remplacer les zones ou les fonds à valeur Traiter par un groupe de zones plus petites, auxquelles seront attribués des types de zones spécifiques.

Enregistrement d’un gabarit de zones

Sélectionnez une valeur de fond et préparez les zones de la page. Vérifiez l'emplacement et les propriétés de ces zones. Cliquez sur Gabarit de zones dans le menu Outils. Dans la boîte de dialogue affichée, sélectionnez entrez le nom voulu et, le cas échéant, un chemin d’accès différent. Sélectionnez un emplacement du réseau sur lequel installer le fichier de gabarit que vous souhaitez partager. Cliquez sur OK. Le nouveau gabarit de zone reste chargé.

[zones sur la page] et cliquez sur Enregistrer ;

Modification d’un gabarit de zones

Chargez un gabarit et importez une image au moyen d'un traitement manuel. Les zones de gabarit apparaissent sur l'image. Modifiez les zones et/ou les propriétés selon vos besoins. Ouvrez la boîte de dialogue Fichiers de gabarit de zones. Le gabarit actuel est sélectionné. Cliquez sur Enregistrer puis sur Fermer.

Déchargement d’un gabarit de zones

Dans la liste Description de la mise en page, sélectionnez un élément autre qu’un gabarit. Les zones du gabarit ne sont pas supprimées de la page actuelle ou des pages existantes, mais le gabarit n'est plus configuré pour utilisation lors des futurs traitements. Vous pouvez

Chapitre 3 Zones et fonds 66

Page 67

également ouvrir la boîte de dialogue Fichiers de gabarit de zones, sélectionner Dans ce cas, l'option de description de la mise en page reprend la valeur Automatique.

[aucun] et cliquer sur le bouton Définir comme actuel.

Remplacement d’un gabarit par un autre

Sélectionnez un autre gabarit dans la liste Description de la mise en page, ou ouvrez la boîte de dialogue Fichiers de gabarit de zones, sélectionnez le gabarit souhaité et cliquez sur le bouton Définir comme actuel. Les zones définies par le nouveau gabarit sont appliquées à la page actuelle, et remplacent les zones existantes. Ces zones sont appliquées comme décrit précédemment.

Suppression d’un gabarit de zones

Ouvrez la boîte de dialogue Fichiers de gabarit de zones. Sélectionnez un gabarit et cliquez sur le bouton Supprimer. Les zones déjà créées à l'aide de ce gabarit ne sont pas supprimées. Les gabarits de zones peuvent uniquement être supprimés depuis le système d’exploitation.

Incorporation d’un gabarit de zones au sein d’un fichier OPD

Ouvrez un document, puis sélectionnez Gabarits de zones dans le menu Outils. Sélectionnez le fichier que vous souhaitez incorporer, puis cliquez sur Incorporer. Enregistrez ensuite votre document au format OPD. Ainsi, si votre fichier OPD est déplacé vers un autre emplacement, le gabarit sera transféré avec votre fichier. Lorsque le fichier OPD est ouvert ultérieurement, le gabarit de zone incorporé sera affiché dans la boîte de dialogue Gabarit de zones avec la mention gabarit sous un nouveau nom, à un nouvel emplacement.

[incorporé]. Il pourra être enregistré dans un fichier de

Chapitre 3 Zones et fonds 67

Page 68

Vérification et édition

Les résultats de la reconnaissance sont affichés dans l’éditeur de texte. Il peut s'agir d'un texte reconnu, de tableaux, de formulaires et de graphiques incorporés. L'éditeur aux capacités d'affichage fidèle (« WYSIWYG ») fait l’objet d’une description détaillée dans le présent chapitre. Le traitement des textes asiatiques diffère quelque peu de celui des autres langues. Voir « Reconnaissance des langues asiatiques », page 74.

Affichage et niveaux de formatage de l'éditeur

L’éditeur de texte affiche le texte reconnu et, en fonction de vos réglages, signale les mots qui ont été considérés comme « douteux » pendant la reconnaissance, en les soulignant d'une ligne ondulée rouge. Dans le module de vérification de l'OCR, ces mots sont affichés en rouge.

Un mot est considéré comme « douteux » s'il ne figure dans aucun des dictionnaires actifs (standard, utilisateur ou spécialisés) ou s'il figure dans le dictionnaire actif mais qu'il n'a pas été correctement identifié à l'issue du processus d'OCR. Les caractères douteux sont signalés par une mise en surbrillance jaune, à la fois dans l'éditeur de texte et dans le module de vérification de l'OCR.

Vous pouvez activer ou désactiver les marques des mots absents du dictionnaire dans l’onglet Vérification de la boîte de dialogue Options. Les marques peuvent être affichées ou masquées selon les options sélectionnées dans l’onglet Éditeur de texte de cette même boîte. Vous pouvez également afficher ou masquer les caractères

Chapitre 4 Vérification et édition 68

Page 69

non imprimables et les indicateurs d’en-tête et de bas de page. L’onglet Éditeur de texte permet également de définir l'unité de mesure du programme et de configurer le retour à la ligne automatique dans tous les niveaux de formatage de l’éditeur de texte, à l’exception du niveau Texte brut.

OmniPage 17 peut afficher les pages selon trois niveaux de formatage. Pour passer d'un niveau à l'autre, sélectionnez l'un des trois boutons présents dans l’angle inférieur gauche de l’éditeur de texte ou utilisez le menu Affichage.

Texte brut

Pour afficher le texte en une seule colonne alignée à gauche et appliquer un seul style et corps de police, tout en conservant les sauts de ligne de l’original.

Texte formaté

Pour afficher le texte en conservant les formats de caractères et de paragraphes, mais en supprimant les mises en colonnes.

True Page

True Page® permet de conserver au maximum le formatage du document original. Les styles de caractère et de paragraphe sont conservés. L'ordre de lecture peut être indiqué par des flèches.

Vérification des résultats de l’OCR

À l’issue de la reconnaissance d’une page, les résultats de l’opération apparaissent dans l’éditeur de texte. La vérification démarre automatiquement si l’option correspondante a été activée dans l’onglet Vérification de la boîte de dialogue Options. Vous pouvez également lancer manuellement la vérification à n’importe quel moment. Procédez comme suit :

Chapitre 4 Vérification des résultats de l’OCR 69

Page 70

1. Cliquez sur l'outil Vérifier l’OCR dans la barre d’outils

Standard ou choisissez Vérifier l’OCR dans le menu Outils.

2. La vérification démarre au début du document, mais omet le

texte déjà vérifié. Si un mot douteux est détecté, la boîte de dialogue Vérification de l’OCR affiche ce mot dans son contexte, assorti de l'image originale correspondante. Les caractères douteux sont signalés par une mise en surbrillance jaune. La description suivante : « Mot douteux » ou « Mot absent des dictionnaires » s'affiche.

3. Si le mot reconnu est correct, cliquez sur Ignorer ou Ignorer

tout pour passer au mot douteux suivant. Cliquez sur Ajouter pour l’ajouter au dictionnaire utilisateur actuel et passer au mot douteux suivant.

4. Si le mot reconnu est erroné, tapez la version correcte dans la

fenêtre d'édition ou sélectionnez une suggestion du dictionnaire. Cliquez sur Remplacer ou Remplacer tout pour valider votre correction et passer au mot douteux suivant. Cliquez sur Ajouter pour ajouter le mot corrigé au dictionnaire utilisateur actuel et passer au mot douteux suivant.

5. Au fur et à mesure que les mots douteux affichés dans l’éditeur

de texte sont vérifiés, les marques de couleur les accompagnant disparaissent. Lors de la vérification, vous pouvez passer au volet de l’éditeur de texte pour y effectuer les corrections requises. Pour relancer la vérification, utilisez le bouton Reprendre. Cliquez sur Page prête pour passer à la page suivante ou sur Fermer pour arrêter la vérification avant d’atteindre la fin du document.

Chapitre 4 Vérification des résultats de l’OCR 70

Page 71

6. La vignette de toute page entièrement vérifiée porte l'icône de

Zoom avant/arrière

Quel niveau de contexte pour le vérificateur dynamique ?

•Un mot

• Trois mots (le mot actuel + le mot précédent et le mot suivant)

• Ligne d'image complète

vérification dans le gestionnaire de documents. Sélectionnez Revérifier la page actuelle... dans le menu Outils pour relancer la vérification de la page.

Vérification du texte reconnu

Lorsque la reconnaissance est terminée, vous pouvez en évaluer la précision en comparant les différentes parties du texte reconnu avec les parties correspondantes de l'image originale.

L'outil Vérificateur se trouve dans la barre d'outils de formatage. Vous pouvez également l’activer/le désactiver à partir du menu Outils. Placez le curseur sur le volet du vérificateur pour afficher sa barre d'outils. Utilisez cet outil pour effectuer les opérations suivantes :

Pour activer le vérificateur, cliquez sur l'outil Vérificateur ou appuyez sur F9. Pour le désactiver, cliquez à nouveau sur l'outil Vérificateur ou appuyez une nouvelle fois sur F9. Vous pouvez également appuyer sur la touche Échap.

Pour obtenir la liste complète des raccourcis clavier disponibles avec le vérificateur, consultez l'aide en ligne.

Chapitre 4 Vérification du texte reconnu 71

Page 72

Table de caractères

La table de caractères est une barre d'outils « ancrable » très utile lors de la vérification. Elle sert principalement à :

• insérer, lors de la vérification et de l'édition de texte, des

caractères qui sont absents ou difficilement accessibles sur le clavier. La table de caractères s'apparente à cet égard à la table de caractères système ;

• afficher tous les caractères validés dans les langues de

reconnaissance actuellement sélectionnées.

Pour ouvrir la table de caractères, cliquez sur le bouton correspondant dans la barre d'outils Formatage ou sélectionnez Table de caractères dans le menu Affichage, puis cliquez sur Afficher.

Dans le sous-menu Table de caractères, vous pouvez également choisir ne n'afficher que les caractères récents, ou différents jeux de caractères (par défaut, seuls deux sont affichés). Les caractères asiatiques ne sont pas pris en charge.

Vous pouvez également ouvrir la table de caractères en procédant comme suit :

• Sélectionnez Outils > Options, puis cliquez sur l’onglet

OCR. Cliquez sur le bouton Caractères supplémentaires pour sélectionner les caractères à inclure lors de la vérification. Vous pouvez également modifier le caractère de rejet via la table de caractères.

• Sélectionnez Nouveau caractère dans le menu Outils.

Cliquez sur le bouton (...), situé en regard du champ Corriger.

• Dans l'éditeur de texte, sélectionnez Nouveau caractère

dans le menu contextuel d'un mot douteux ou absent des dictionnaires.

Chapitre 4 Table de caractères 72

Page 73

Dictionnaires utilisateur

OmniPage est livré avec des dictionnaires en plusieurs langues qui facilitent la reconnaissance et peuvent proposer des suggestions pendant la vérification de l'OCR. Ces dictionnaires intégrés peuvent être remplacés par des dictionnaires créés par l’utilisateur. Vous pouvez enregistrer plusieurs dictionnaires utilisateur, mais ne pouvez charger qu'un seul dictionnaire à la fois. Le dictionnaire Personnalisé est le dictionnaire utilisateur par défaut de Microsoft Word.

Lancement d’un dictionnaire utilisateur

Cliquez sur le bouton Ajouter de la boîte de dialogue Vérification de l'OCR (aucun dictionnaire utilisateur n'étant chargé), ou ouvrez la boîte de dialogue Fichiers de dictionnaire utilisateur à partir du menu Outils et cliquez sur Nouveau.

Chargement ou déchargement d’un dictionnaire utilisateur

Réalisez ces opérations depuis l’onglet OCR de la boîte de dialogue Options ou à partir de la boîte de dialogue Fichiers de dictionnaire utilisateur.

Édition ou suppression d’un dictionnaire utilisateur

Pour ajouter des mots à un dictionnaire utilisateur, chargez votre dictionnaire puis cliquez sur le bouton Ajouter dans la boîte de dialogue Vérification de l’OCR. Vous pouvez ajouter et supprimer des mots en cliquant sur Édition dans la boîte de dialogue Fichiers de dictionnaire utilisateur. Vous pouvez également importer des mots à partir des dictionnaires utilisateur OmniPage (*.ud). Lors de l’édition d’un dictionnaire utilisateur, vous pouvez optimiser l’opération d’ajout de nouveaux mots en important la liste des mots requis à partir d’un fichier texte standard. Chaque mot doit être placé sur une ligne séparée et il ne doit être ni précédé ni suivi d'aucun signe de ponctuation. Le bouton Supprimer vous permet de supprimer le dictionnaire utilisateur sélectionné de la liste.

Chapitre 4 Dictionnaires utilisateur 73

Page 74

Pour incorporer un dictionnaire utilisateur à un document OmniPage : chargez votre document, sélectionnez Outils > Dictionnaire utilisateur, sélectionnez le dictionnaire utilisateur que vous souhaitez incorporer à votre document, cliquez sur Incorporer, donnez un nom à votre dictionnaire, puis cliquez sur OK. Pour terminer, enregistrez votre fichier au format Document OmniPage.

Langues

OmniPage peut reconnaître plus de 120 langues dans de nombreux alphabets : latin, grec, cyrillique, chinois, japonais et coréen. La liste complète des langues prises en charge est disponible dans l'onglet OCR de la boîte de dialogue Options. Cette liste distingue les langues disposant d’un dictionnaire. Vous trouverez également la liste de ces langues sur le site Web de Nuance.

En plus des dictionnaires utilisateur, le programme propose, pour certaines langues, des dictionnaires spécialisés (dans l'immédiat, domaines médical et juridique). Reportez-vous à la liste et effectuez les sélections voulues dans l’onglet OCR de la boîte de dialogue Options.

Reconnaissance des langues asiatiques

Quatre langues basées sur des alphabets asiatiques sont prises en charge, à savoir : le japonais, le coréen, le chinois traditionnel et le chinois simplifié. Pour les textes écrits dans ces langues, la taille de police idéale est de 12 points numérisés avec une résolution de 300 ppp, ce qui génère des caractères d'environ 48 x 48 pixels. La taille minimale des caractères est de 30 x 30 pixels, ce qui correspond à une taille de police de 10,5 points numérisés à 300 ppp. Si votre texte comporte des caractères plus petits, nous vous recommandons d'utiliser une résolution de numérisation de 400 ppp. Les textes asiatiques être lus horizontalement (de gauche à droite) ou verticalement (de haut en bas et de droite à gauche). Les

Chapitre 4 Langues 74

Page 75

systèmes d'exploitation pris en charge par OmniPage 17 peuvent gérer les langues asiatiques, à condition que la prise en charge des langues d'Extrême-Orient ait été sélectionnée durant l'installation du système. Si tel n'est pas le cas, vous devez l'ajouter en sélectionnant Panneau de configuration > Options régionales et linguistiques > Langues > Prise en charge de langues supplémentaires > Installer les fichiers pour les langues d'ExtrêmeOrient. Vous devrez peut-être insérer un disque système Windows.

Les quatre langues asiatiques sont répertoriées dans la liste alphabétique des langues prises en charge disponible dans l'onglet OCR de la boîte de dialogue Options. Ne sélectionnez qu'une seule de ces langues à la fois et évitez toute sélection multiple avec d'autres langues. L'OCR des langues asiatiques peut reconnaître de courts passages de texte en anglais, sans que cette langue n'ait été configurée de façon explicite. Toutefois, cette possibilité ne s'applique pas aux passages plus longs ou aux autres langues occidentales. Les textes japonais et chinois comportent généralement une orientation verticale, mais il est possible d'y insérer un texte anglais comportant une orientation différente. Le programme gère cette différence d'orientation en appliquant aux caractères anglais reconnus une rotation vers la droite.

L'option Vérifier les choix de langues, située en regard de la liste des langues, active la détection automatique des langues et vous avertit si la langue détectée est différente de la langue paramétrée. Cette option identifie quatre catégories de langues au niveau des pages : japonais, chinois, coréen et non asiatique. Elle ne permet pas de distinguer le chinois traditionnel du chinois simplifié, ni les langues non asiatiques entre elles. La catégorie non asiatique signifie qu’aucun caractère japonais, chinois ou coréen n'a été détecté. Cette vérification ayant lieu lors du prétraitement de l'image, la langue de reconnaissance requise doit être définie avant le chargement de l'image.

Chapitre 4 Langues 75

Page 76

Les options de mise en page et de traçage automatique des zones sont recommandées pour les pages en langue asiatique. Tous les éléments de texte détectés seront ainsi placés dans des zones de texte. Si vous choisissez une langue de reconnaissance asiatique, l'OCR des caractères asiatiques sera exécuté dans ces zones. Il détectera et transmettra automatiquement l'orientation du texte et pourra gérer les zones mixtes de la page comportant à la fois du texte horizontal et vertical.

Toutefois, l'outil de traçage des zones vous permet de forcer la reconnaissance des caractères asiatiques verticaux en procédant au traçage manuel des zones. Utilisez cet outil pour tracer des zones rectangulaires. Pour tracer manuellement des zones dans un texte asiatique horizontal, utilisez le type de zone Texte habituel. N'utilisez pas les deux autres outils Texte vertical sur des textes asiatiques. Le fait de tracer une zone verticale sur des caractères asiatiques n'active pas automatiquement l'OCR de la langue asiatique ou la détection automatique de la langue.

Les images de texte provenant d'appareils photo numériques sont acceptées pour les langues asiatiques. Toutefois, l'algorithme de redressement 3D automatique risque de ne pas fonctionner, surtout pour les textes orientés verticalement. Utilisez de préférence la commande de chargement d'image standard et effectuez un redressement 3D manuel à l'aide de l'outil SET approprié, le cas échéant. En règle générale, les outils SET peuvent être utilisés sur les images de texte asiatique.

Les pages asiatiques reconnues apparaissent dans l'éditeur de texte, à condition que votre système prenne en charge les langues d'Extrême-Orient, avec une orientation horizontale. Il n'est pas utile de spécifier des polices asiatiques dans l'onglet OCR de la boîte de dialogue Options, une police par défaut étant automatiquement appliquée (généralement

Arial Unicode MS). Vous pouvez choisir

toute autre police compatible avec les langues asiatiques installée

Chapitre 4 Langues 76

Page 77

sur votre système, via l'éditeur de texte. L'éditeur prend en charge l'affichage et la vérification du texte ; il est recommandé de choisir le niveau de formatage Texte formaté. L'édition et la vérification orthographique à grande échelle sont optimisées dans l'application cible. Les options de vérification, les fonctions d'apprentissage et les dictionnaires ne sont pas pris en charge pour les textes asiatiques. Par conséquent, avant de lancer l'OCR sur une page comportant des caractères asiatiques, désactivez les options de marquage des mots absents du dictionnaire, de vérification automatique et d'activation d'IntelliTrain dans l'onglet Vérification de la boîte de dialogue Options. Assurez-vous également qu'aucun fichier d'apprentissage n'est chargé. Les textes asiatiques peuvent être biffés, soit par sélection directe, soit via l'utilisation de la fonction de recherche. L'étape du flux de travail permettant l'extraction de données de formulaire ne doit pas être appliquée aux pages asiatiques.

Les filtres de sortie pour les textes asiatiques sont généralement RTF, Microsoft Word, PDF avec recherches ou XPS. L'orientation du texte sera celle détectée durant le prétraitement. Les modifications apportées dans l'éditeur de texte (pour du texte horizontal) seront exportées vers du texte vertical, le cas échéant. Des filtres Texte brut sont disponibles (TXT Unicode, Bloc-notes), mais avec une orientation de texte toujours horizontale.

Apprentissage

L'apprentissage correspond à la procédure permettant de modifier les solutions d'OCR attribuées aux caractères de l'image. Cette fonction est utile pour les documents présentant une dégradation uniforme ou un type de police inhabituel dans la totalité de leur contenu. OmniPage 17 propose deux types d'apprentissage : manuel et automatique (via IntelliTrain). Les données provenant des deux types d'apprentissage sont combinées et vous pouvez les enregistrer dans un fichier d'apprentissage.

Chapitre 4 Apprentissage 77

Page 78

Lorsque vous fermez une page pour laquelle des données d'apprentissage ont été générées, le programme vous demande de spécifier la manière de les appliquer aux autres pages existantes du document.

Apprentissage manuel

Pour lancer un apprentissage manuel, placez le point d'insertion devant le caractère à ajouter ; vous pouvez aussi sélectionner un groupe de caractères (un mot maximum) et choisir Nouveau caractère dans le menu Outils ou le menu contextuel. Une vue agrandie des caractères à ajouter s'affiche, assortie de la solution d'OCR actuelle. Remplacez-la par la solution voulue et cliquez sur OK. Le programme accepte cet apprentissage et examine le reste de la page. S'il trouve des mots susceptibles d’être modifiés, il les affiche dans la boîte de dialogue Vérification de l'apprentissage. Vous devrez recommencer l'apprentissage des mots incorrects avant de valider la liste.

IntelliTrain

IntelliTrain est une forme d'apprentissage automatisé, capable de mémoriser les corrections effectuées par l'utilisateur lors de la vérification de l'OCR. Lorsque vous effectuez une modification, IntelliTrain retient la forme du caractère concernée et la correction apportée. Par la suite, le module parcourt le document à la recherche des formes de caractères similaires, notamment parmi les mots douteux, et évalue la pertinence de la correction de l'utilisateur.

Le module IntelliTrain peut être activé et désactivé via l’onglet Vérification de la boîte de dialogue Options. IntelliTrain conserve les données d'apprentissage générées par l'opération et les ajoute, le cas échéant, à l'apprentissage manuel que vous avez effectué. Vous pouvez les enregistrer dans un fichier d'apprentissage pour réutilisation avec des documents similaires.

Chapitre 4 Apprentissage 78

Page 79

Pour obtenir des exemples d'utilisation avec IntelliTrain, reportezvous à l'aide.

Fichiers d’apprentissage

Lorsque vous refermez un document, ou que vous basculez vers un autre document, alors que des données d’apprentissage n’ont pas été enregistrées, une boîte de dialogue s’affiche, vous invitant à le faire. Pour incorporer un fichier d’apprentissage à un fichier OPD, chargez-le (Outils > Fichier d’apprentissage), cliquez sur Incorporer puis enregistrez le fichier au format Document OmniPage.

Vous pouvez enregistrer des données d’apprentissage dans un fichier, ainsi que charger, éditer et décharger des fichiers d’apprentissage via la boîte de dialogue Fichiers d’apprentissage.

Des données d’apprentissage non enregistrées peuvent être éditées dans la boîte de dialogue Modification du fichier d’apprentissage ; un astérisque s’affiche dans la barre de titre à la place du nom de fichier. Enregistrez-les dans la boîte de dialogue Fichiers d'apprentissage.

Vous pouvez également éditer un fichier d’apprentissage ; dans ce cas, son nom apparaît dans la barre de titre. Si des données d’apprentissage non enregistrées ont été ajoutées au fichier, son nom est accompagné d’un astérisque. Les données d’apprentissage non enregistrées et modifiées sont sauvegardées à la fermeture de la boîte de dialogue.

La boîte de dialogue Modification du fichier d'apprentissage affiche des cadres comportant une forme de caractère et la solution d’OCR qui lui est assignée. Cliquez sur un cadre pour le sélectionner. Vous pouvez ensuite le supprimer à l’aide de la touche Suppr ou modifier la solution proposée. Pour passer au cadre précédant ou suivant, utilisez les touches fléchées.

Chapitre 4 Apprentissage 79

Page 80

Édition du texte et des images

Vous éditez des données d’apprentiss age non enregistrées.

Ce cadre a été supprimé. Pour annuler sa suppression, resélectionnezle et appuyez sur la touche Suppr.

Ce cadre est

sélectionné. En haut : la forme de l'image. En bas : la solution OCR.

Cliquez deux fois sur le cadre ou appuyez sur Entrée pour modifier la solution d’OCR associée.

L'éditeur de texte d'OmniPage est doté de capacités d’affichage fidèles (« WYSIWYG »), et ses fonctions d’édition sont très proches des possibilités offertes par les applications de traitement de texte les plus courantes.

Édition d’attributs de caractère

Tous les niveaux d'affichage de l'éditeur autres que le niveau Texte brut permettent de modifier le type, le corps et les attributs (gras, italique, souligné) de la police appliqués au texte sélectionné.

Édition d’attributs de paragraphe

Tous les niveaux d'affichage de l'éditeur autres que le niveau Texte brut permettent de modifier l'alignement des paragraphes sélectionnés et de les formater avec des puces.

Styles de paragraphe

Les styles de paragraphe présents dans un document sont détectés automatiquement pendant la reconnaissance. Une liste des styles est créée et présentée dans une boîte de sélection dans la partie gauche de

Chapitre 4 Édition du texte et des images 80

Page 81

la barre d’outils de formatage. Cette liste permet d’attribuer un style aux paragraphes sélectionnés.

Graphiques

Pour éditer des zones graphiques, votre ordinateur doit être équipé d’un éditeur d’image. Choisissez la commande Éditer l’image avec dans le menu Format. Vous pouvez, si vous le souhaitez, utiliser l’éditeur d’image associé au format BMP sur votre système Windows et charger le graphique. Vous pouvez également utiliser la commande Choisir un programme... pour sélectionner un autre programme qui deviendra l'éditeur d'images par défaut. Modifiez le graphique, puis fermez l’éditeur d’image pour réintégrer le graphique dans l'éditeur de texte. Ne modifiez pas la taille, la résolution ou le type de graphique, car ces actions empêchent la réintégration. Les images peuvent également être modifiées avant la reconnaissance à l'aide des outils de retouche d'images.

Tableaux

Les tableaux s’affichent dans l’éditeur de texte sous forme de grilles. Pour modifier un tableau, placez le curseur dans une zone de type Tableau ; il change d'aspect et vous pouvez déplacer les traits de la grille. Vous pouvez également utiliser les règles de l’éditeur de texte. Modifiez l’emplacement du texte dans les cellules d'un tableau à l’aide des boutons d’alignement de la barre d’outils de formatage et des commandes de tabulation de la règle.

Hyperliens

Les adresses de courrier électronique et celles des pages Web peuvent être détectées et placées en tant que liens dans le texte reconnu. Pour éditer un lien existant ou en créer un nouveau, choisissez Hyperlien dans le menu Format.

Édition dans le niveau de formatage True Page

Les éléments de page sont placés dans des blocs de texte, de tableau et d'image, correspondant généralement aux zones Texte, Tableau et Graphique de l'image. Cliquez dans un élément pour afficher la

Chapitre 4 Édition du texte et des images 81

Page 82

bordure du bloc ; la couleur est identique dans les zones correspondantes. La rubrique sur les opérations décrites ci-après.

Les cadres ont des bordures grises et contiennent au moins un bloc. Ils sont placés lorsqu'une bordure visible est détectée dans une image. Vous pouvez définir les bordures et les dégradés d'un cadre et d'un tableau au moyen du menu contextuel ou de la commande Tableau du menu Format. Pour spécifier le dégradé d'un bloc de texte, utilisez le menu contextuel.

Les zones multicolonnes présentent des bordures orange et contiennent au moins un bloc. Détectées automatiquement, elles indiquent le texte qui sera traité comme un enchaînement de colonnes au moment de l'exportation avec le niveau de formatage Pages avec enchaînements.

L'ordre de lecture peut être affiché et modifié. Pour visualiser les flèches indiquant cet ordre, cliquez sur l'outil Afficher ordre de lecture dans la barre d'outils de formatage. Cliquez de nouveau pour supprimer les flèches.

Pour remplacer la barre d'outils de formatage par un groupe de boutons de réagencement, cliquez sur l'outil Changer l’ordre de lecture. L'ordre est modifié dans les niveaux de formatage Texte brut et Texte formaté. Ce changement modifie le mode de déplacement du curseur dans la page, lorsque le document est exporté au format True Page.

True Page

de l'aide propose des détails

Édition en direct

Cette fonction vous permet de modifier une page reconnue par un nouveau traçage de zones, sans devoir traiter une nouvelle fois la page entière. Lorsque l'édition en direct est activée, les changements de zone (suppression, définition, redimensionnement, changement de type) s'appliquent immédiatement à la page reconnue. De même,

Chapitre 4 Édition en direct 82

Page 83

lorsque vous modifiez des éléments dans le niveau de formatage True Page de l'éditeur de texte, les changements effectués sont répercutés sur les zones de la page.

Deux outils liés de la barre d'outils Image contrôlent le traçage en zones en direct. L'un de ces outils est toujours actif lorsque aucune reconnaissance n'est en cours.

Cliquez sur ce bouton pour activer l'édition en direct. La couleur rouge indique qu'aucune modification de traçage de zones n’est stockée.

Cliquez sur ce bouton pour désactiver l'édition en direct. Les modifications apportées au traçage de zones sont stockées et l'outil affiche la couleur verte. Pour appliquer ces modifications, effectuez l'une des opérations suivantes :

Cliquez sur l'outil d’édition en direct doté de la couleur verte. Les modifications de traçage de zones récupérées sont appliquées dans l'éditeur de texte.

Cliquez sur le bouton Exécuter l’OCR pour reconnaître la page entière, avec les changements de zone.

Pour plus de détails sur le traitement des changements dans le cadre du traçage de zones en direct, ainsi que sur leur effet dans l'éditeur de texte, reportez-vous à la rubrique

Traitement en direct

dans l'aide.

Marquage et biffure de texte

La barre d’outils Marquage de texte propose des outils permettant de marquer (mise en surbrillance ou effet barré), et de biffer du texte. Pour afficher cette barre d’outils, sélectionnez la commande correspondante du menu Affichage. Vous pouvez ancrer ou déplacer cette barre

d’outils sur votre espace de travail. Chaque outil correspond à une

Chapitre 4 Marquage et biffure de texte 83

Page 84

commande du menu Formatage ou du menu contextuel de l’éditeur de texte.

Les biffures permettent de noircir des informations confidentielles afin de les rendre totalement illisibles et introuvables lors des recherches. Pour marquer et biffer manuellement du texte, cliquez sur l’outil Marquer pour biffure et utilisez votre curseur pour sélectionner les sections de texte à biffer. Ces sections ne sont pas biffées immédiatement, mais apparaissent en surbrillance grise. Lorsque vous êtes prêt, cliquez sur l’outil Biffer le document. Dans la boîte de dialogue qui apparaît alors, choisissez d’appliquer vos biffures sur une copie du document (plus sûr) ou directement sur le document actuel. Si vous choisissez de biffer une copie du document, la copie et l’original restent ouverts dans OmniPage, en vue de leur enregistrement.

ATTENTION : Si vous choisissez de biffer votre document original, vous ne pourrez plus récupérer les informations que vous avez biffées.

Vous pouvez également rechercher et biffer du texte sur l’ensemble de votre document. Sélectionnez la commande Chercher et marquer du texte du menu Édition pour afficher la boîte de dialogue Chercher, remplacer et marquer du texte. Entrez le texte que vous souhaitez marquer pour biffure, puis cliquez sur Suivant. Passez en revue toutes les occurrences de ce texte dans votre document, et choisissez de les biffer directement ou uniquement de les marquer pour biffure. Dans ce dernier cas, vous pourrez appliquer vos biffures en cliquant sur le bouton Fermer et biffer le document dans la boîte de dialogue Marquer du texte, ou sur le bouton Biffer le document de la barre d’outils Marquage de texte.

De la même manière, vous pourrez mettre en surbrillance ou barrer du texte, soit en le sélectionnant, soit en le recherchant dans votre document.

Chapitre 4 Marquage et biffure de texte 84

Page 85

Lecture du texte à voix haute

La fonction de lecture du texte reconnu RealSpeak® de Nuance est avant tout destinée aux personnes malvoyantes ; toutefois, elle peut également faciliter les processus de vérification de l’OCR et de contrôle du texte reconnu à tout utilisateur d’OmniPage. La lecture à voix haute est contrôlée par les mouvements du point d’insertion dans l’éditeur de texte (via la souris ou le clavier).

Modalités de lecture Touches utilisées

Un seul caractère à la fois, lecture avant ou arrière

Mot actuel Ctrl + Cinq du bloc numérique (1) Mot suivant vers la droite Ctrl + flèche Droite Mot suivant vers la gauche Ctrl + flèche Gauche Une ligne Placez le point d’insertion dans la ligne Ligne suivante Flèche Bas Ligne précédente Flèche Haut Phrase actuelle Ctrl + Cinq du bloc numérique (2) Depuis le point d’insertion jusqu’à la

fin de la phrase Depuis le début de la phrase

jusqu’au point d'insertion Page actuelle Ctrl + Cinq du bloc numérique (3) Depuis le début de la page actuelle

jusqu’au point d'insertion Depuis le point d’insertion jusqu’à la

fin de la page actuelle

Flèche Droite ou Gauche. Les noms de lettre, de nombre et de signe de ponctuation sont prononcés.

Ctrl + Cinq du bloc numérique (6)

Ctrl + Cinq du bloc numérique (4)

Ctrl + Début

Ctrl + Fin

Chapitre 4 Lecture du texte à voix haute 85

Page 86

Page précédente, suivante ou la page de votre choix

Ctrl + PgPréc, PgSuiv ou boutons de navigation

Caractères saisis

Chaque caractère saisi est prononcé individuellement.

La fonction de synthèse vocale est activée ou désactivée via la commande Mode synthèse vocale du menu Outils ou via la touche F10. Le sous-menu Réglages de synthèse vocale… permet de sélectionner le type de voix (masculine ou féminine dans une langue donnée) et de configurer le débit et le volume de la lecture. Vous devez vous assurer que la langue sélectionnée correspond au texte que vous souhaitez écouter.

Vous disposez également des séquences clavier suivantes :

Action requise Séquence utilisée

Interrompre/Reprendre Ctrl + Cinq du bloc numérique (5) Augmenter le débit Ctrl + Signe plus du bloc numérique (+) Réduire le débit Ctrl + Signe moins du bloc numérique (-) Rétablir le débit Ctrl + Astérisque du bloc numérique (*)

Tous les modules de synthèse vocale sont installés si vous avez choisi de procéder à une installation complète du programme. Si vous avez réalisé une installation personnalisée, vous pouvez sélectionner les langues des moteurs de synthèse vocale que vous souhaitez installer.

Création et édition de formulaires

Vous pouvez importer dans OmniPage Professional 17 des formulaires papier ou des formulaires électroniques statiques (généralement distribués au format PDF dans les environnements de bureau), afin de reconnaître et de

modifier leur contenu et/ ou leur mise en page dans le niveau de

Chapitre 4 Création et édition de formulaires 86

Page 87

formatage True Page. Tracez manuellement des zones afin de délimiter les parties de l'image du formulaire qui vous intéressent préalablement à la reconnaissance. Vous pouvez également choisir une mise en page de type Formulaire, puis apporter les modifications de votre choix à l'aide des barres d'outils Conception de formulaires et Réorganisation de formulaires. Le formulaire remplissable généré peut être enregistré dans l’un des formats suivants : PDF, RTF ou XSN (format Microsoft Office InfoPath 2003). Les formulaires statiques peuvent être enregistrés au format HTML. OmniPage Professional 17 utilise la technologie

Logical Form Recognition

pour créer des formulaires

remplissables depuis des formulaires statiques. OmniPage prend en charge la création et l'édition de formulaires,

mais les outils disponibles ne sont pas conçus pour leur remplissage.

Barre d'outils Conception de formulaires

Cette barre d'outils ancrable, affichée dans l'éditeur de texte, vous permet de créer des éléments de formulaire à l'aide des outils suivants :

Sélection :

redimensionner des éléments de formulaire.

Texte :

formulaire, comme par exemple des titres, des libellés et des entêtes.

Ligne :

en page : cliquez dessus et tracez les lignes afin de délimiter les différentes sections de votre formulaire.

Rectangle :

dans votre formulaire.

Graphique :

de votre formulaire qui seront traitées comme des éléments graphiques.

Cet outil permet de sélectionner, de déplacer ou de

Cet outil permet d'insérer des textes fixes dans votre

Cet outil sert principalement à la conception de la mise

Cliquez sur cet outil pour ajouter des rectangles

Cliquez sur cet outil pour sélectionner des zones

Chapitre 4 Création et édition de formulaires 87

Page 88

Zone de texte :

remplissables. Il s’agit de champs dans lesquels les utilisateurs devront saisir du texte.

Bande à peigne :

composés de cases, qui servent généralement à saisir des informations dont le format est connu, telles que des codes postaux.

Case à cocher :

cases à cocher. Ce type d'élément de formulaire est généralement utilisé pour les questions de type Oui/Non ou à choix multiples.

Texte entouré :

cocher (voir ci-dessus) : l'outil Texte entouré permet de créer des éléments qui apparaissent entourés lorsqu’ils sont sélectionnés.

Tableau :

formulaire.

Vous pouvez également créer des éléments de formulaire en cliquant avec le bouton droit sur un élément de formulaire existant dans un formulaire reconnu, puis en choisissant la commande Insérer un élément de formulaire dans le menu contextuel qui apparaît.

Cet outil permet de créer des champs de texte

Cliquez sur cet outil, puis tracez à votre gré les

Ce type d'élément s'utilise comme les cases à

Cet outil permet d'insérer des tableaux dans votre

Barre d'outils Réorganisation de formulaires

Cette barre d'outils permet d'aligner les éléments de formulaire ou de définir l'élément qui recouvrira un autre en cas de chevauchement. Cette dernière fonction est très utile si vous souhaitez créer un fond graphique pour votre formulaire.

Pour définir l'ordre de recouvrement des éléments qui se chevauchent, utilisez les boutons Amener au premier-plan et Envoyer en arrière-plan.

Chapitre 4 Création et édition de formulaires 88

Page 89

Pour aligner les éléments de formulaire sélectionnés sur leur bord droit/gauche ou supérieur/inférieur, ou sur le centre de chaque élément

horizontalement - utilisez les outils d'alignement horizontal,

verticalement - utilisez les outils d'alignement vertical.

Les commandes de la barre d'outils de réorganisation du formulaire sont également accessibles via le menu contextuel de chaque élément de formulaire.

Modification des propriétés des éléments de formulaire

Pour modifier un élément de formulaire, sélectionnez-le puis cliquez avec le bouton droit pour afficher le menu contextuel correspondant. Vous pouvez modifier l'apparence ou les propriétés de tous les éléments de formulaire. Pour ce faire, utilisez les commandes suivantes :

Apparence de l'élément de formulaire - Utilisez les onglets Bordures, Dégradé et Ombre pour concevoir l'aspect des éléments de votre formulaire, en procédant de la même façon que dans une application d'édition de texte.

Propriétés de l'élément de formulaire - Cette commande vous permet d'afficher les propriétés d'un élément, comme sa taille, sa position et son nom. Les propriétés affichées varient de façon dynamique en fonction du type d'élément sélectionné.

Chapitre 4 Création et édition de formulaires 89

Page 90

Extraction de données de formulaires

Vos flux de travail peuvent comporter une étape d’extraction de données de formulaires. Ces données peuvent être extraites depuis un large éventail d’éléments, parmi lesquels des champs de texte remplissables, des cases à cocher ou des boutons d’options.

Pour créer un flux de travail comprenant une étape d’extraction de données d’un formulaire :

• Définissez la source de votre formulaire, ainsi que les

paramètres de traitement associés. Les fichiers en entrée peuvent être des PDF image, des formulaires PDF, des fichiers image et des formulaires papier numérisés à l’aide d’un scanner.

• Remplacez l’étape de reconnaissance par l’étape Extraire

des données de formulaire. Sélectionnez le formulaire PDF actif devant servir de modèle de reconnaissance. Il peut s’agir d’un formulaire vierge ou rempli, composé d’une ou de plusieurs pages. OmniPage se basera sur ce formulaire pour déterminer l’emplacement et le type des éléments à reconnaître.

• Clôturez votre flux de travail par une étape

d’enregistrement.

OmniPage extraira les données des formulaires en entrée, en se basant sur le modèle que vous aurez défini. Vous pourrez choisir d’exporter les résultats de reconnaissance sous la forme d’un fichier de valeurs séparées par des virgules (*.csv), prêt à être chargé dans un tableur.

Lors de la définition d’un flux de travail, l’étape Extraire des données de formulaire ne peut être suivie que d’étapes d’enregistrement.

Chapitre 4 Création et édition de formulaires 90

Page 91

Enregistrement et exportation

Après avoir importé au moins une image dans un document, vous pouvez procéder à l’exportation de l'image acquise vers un fichier. Après avoir reconnu au moins une page, vous pouvez exporter les résultats de la reconnaissance. Si vous avez exécuté l'OCR sur plusieurs pages, vous pouvez enregistrer une seule page, des pages sélectionnées ou le document entier en sélectionnant les options Enregistrer dans un fichier, Copier dans le Presse-papiers ou Envoyer dans un e-mail. Vous pouvez également enregistrer le fichier en tant que document OmniPage. OmniPage offre une prise en charge exhaustive des applications et formats d’Office 2007, à condition que Microsoft .NET Framework 3.0 soit installé sur votre système.

Le document étant conservé dans OmniPage après l'exportation, vous pouvez enregistrer, copier ou envoyer ses pages à plusieurs reprises en appliquant, le cas échéant, différents niveaux de formatage, types de fichiers, noms ou emplacements. Vous pouvez également y ajouter de nouvelles pages, relancer l’OCR des pages traitées ou modifier le texte reconnu.

Dans le cas d’un traitement automatique ou si vous exécutez des travaux Batch Manager, vous devez spécifier la destination d'enregistrement avant d'entamer le processus.

Un flux de travail peut contenir une ou plusieurs étapes d’enregistrement, vers des destinations différentes (vers un fichier et comme pièce jointe à un e-mail, par exemple). Un travail Batch Manager doit contenir au moins une étape d’enregistrement. Reportez-vous au chapitre 6, page 112, « Flux de travail ».

Chapitre 5 Enregistrement et exportation 91

Page 92

Enregistrement et exportation

Si vous souhaitez retraiter un document dans OmniPage lors d’une session ultérieure, enregistrez-le en tant que document OmniPage. Il s’agit d’un type de fichier de sortie spécial. Il permet d’enregistrer les images d’origine accompagnées des résultats de la reconnaissance, des réglages du document et des données d'apprentissage.

L’exportation s’effectue en utilisant le bouton 3 de la boîte à outils OmniPage. Ce bouton répertorie les destinations d’exportation disponibles. Certaines destinations apparaissent uniquement si un accès à celles-ci a été détecté sur l'ordinateur. Sélectionnez la destination souhaitée, puis cliquez sur le bouton Exporter les résultats pour lancer l’exportation. Vous pouvez également la lancer en utilisant le menu Traitement.

Enregistrement des images originales

Les images originales d’un document peuvent être enregistrées sur disque sous différents types de fichiers et être éventuellement retouchées à l'aide des outils de retouche d'images.

1. Choisissez la commande Enregistrer dans un fichier dans la

liste déroulante Exporter les résultats. Dans la boîte de dialogue qui apparaît, sélectionnez Image dans Enregistrer sous.

2. Sélectionnez un dossier et un type de fichier. Indiquez le nom

du fichier.

3. Sélectionnez l'enregistrement de l'image de zone choisie

uniquement, de l'image actuelle, des images de pages sélectionnées ou de toutes les images du document. Dans le cas

Chapitre 5 Enregistrement et exportation 92

Page 93

de zones ou de pages multiples, vous pouvez placer l’ensemble des images dans un seul fichier image multipage, à condition de spécifier le type de fichier TIFF, MAX, DCX, JB2, XPS ou PDF Image uniquement. Sinon, chaque image est placée dans un fichier séparé. OmniPage ajoute des suffixes numériques aux noms de fichiers fournis afin de générer des noms uniques.

4. Cliquez sur la commande Options si vous souhaitez définir un

mode d’enregistrement spécifique (noir et blanc, niveaux de gris, couleur ou Tel que), une résolution maximale ou d’autres réglages. Pour les fichiers TIFF, cette option permet également de définir la méthode de compression.

5. Cliquez sur OK pour enregistrer la ou les images selon les

réglages spécifiés. Les zones et le texte reconnu ne sont pas enregistrés.

Enregistrement des résultats de l’OCR

Les images reconnues d’un document peuvent être enregistrées sur disque sous différents types de fichiers.

1. Choisissez Exporter les résultats dans le menu Fichier ou

cliquez sur le bouton Exporter les résultats dans la boîte à outils OmniPage, avec l’option Enregistrer dans un fichier sélectionnée dans sa liste déroulante.

2. La boîte de dialogue Enregistrer dans un fichier apparaît.

Sélectionnez Texte dans Enregistrer comme.

3. Sélectionnez un emplacement de dossier et un type de fichier

pour votre document. Sélectionnez tout ou partie des pages d’un document. Sélectionnez également les options du fichier, les options d'attribution des noms ainsi que le niveau de formatage du document. Reportez-vous à la section « Sélection d'un niveau de formatage » sur cette page.

Chapitre 5 Enregistrement des résultats de l’OCR 93

Page 94

4. Indiquez le nom du fichier. Cliquez sur Options… si vous

souhaitez définir des paramètres spécifiques d’exportation. Reportez-vous à la section « Sélection d'options de filtre » plus loin dans ce chapitre.

5. Cliquez sur OK. Le document est enregistré sur disque, selon

les réglages spécifiés. Si l'option Afficher le fichier généré est activée, le fichier exporté apparaît dans son application cible (l'application associée à ce type de fichier dans Windows ou dans les options d'enregistrement évoluées pour le filtre du type de fichier sélectionné).

Sélection d’un niveau de formatage

Le niveau de formatage pour l'exportation est défini au moment de l’opération, dans la boîte de dialogue Enregistrer sous, Copier dans le Presse-papiers ou Envoyer dans un e-mail. Trois de ces niveaux correspondent aux fenêtres de formatage du même nom dans l'éditeur de texte. Cependant, le niveau à appliquer pour l'enregistrement ne dépend pas de la fenêtre de formatage affichée dans l'éditeur de texte. Lors de l'exportation vers un fichier ou un e-mail, spécifiez d'abord un type de fichier. Cette sélection détermine en effet les niveaux de formatage mis à votre disposition.

Les niveaux de formatage sont les suivants :

Texte brut

Exporte le texte en une colonne unique, dans un seul style et corps de police et avec l'alignement à gauche. Les éléments graphiques et les tableaux ne sont pas supportés pour l'exportation vers des fichiers de type Texte ou Unicode. Vous pouvez exporter le texte brut vers pratiquement tout type de fichier et application cible ; dans ce cas, vous pouvez conserver les éléments graphiques, les tableaux et les puces.

Chapitre 5 Enregistrement des résultats de l’OCR 94

Page 95

Texte formaté

Exporte un texte sans colonnes, tout en conservant ses caractéristiques originales de polices et de paragraphes, ainsi que les graphiques et tableaux. Cette option est disponible pour la plupart des types de fichier.

Pages avec enchaînements

Permet de conserver la mise en page du document original (y compris la disposition en colonnes). Si possible, les colonnes et les retraits, et non les cadres ou les blocs de texte, sont utilisés pour assurer l’enchaînement du texte d’une colonne à une autre, ce qui n’est pas possible lorsque des cadres de texte sont utilisés.

True Page

Permet de conserver la mise en page du document original (y compris la disposition en colonnes). Les cadres et les blocs de texte, d’image et de tableau sont utilisés. Cette option concerne uniquement les applications cibles supportant ce type d’opération. Le formatage True Page constitue la seule sélection possible pour l'exportation XML et pour les exportations PDF, à l'exception du type PDF édité.

Feuille de calcul

Exporte les résultats de la reconnaissance sous forme tabulaire, appropriée pour les tableurs. Chaque page du document est placée sur une feuille distincte.

En cas d’exportation de vos résultats vers Microsoft Excel, l’option Feuille de calcul est appropriée pour l’enregistrement de tableaux occupant des pages entières. Privilégiez le format Texte formaté si

Chapitre 5 Enregistrement des résultats de l’OCR 95

Page 96

votre document contient des tableaux de plus petite taille. Dans ce cas, chaque tableau détecté sera placé sur une feuille indépendante, et tous les éléments n’appartenant pas à des tableaux seront placés sur une feuille séparée, appelée Index, avec des hyperliens pointant vers les feuilles correspondantes.

Sélection d’options de filtre

En sélectionnant le bouton Options… dans une boîte de dialogue d’enregistrement, vous pouvez contrôler l’exportation avec précision. Une boîte de dialogue portant le nom du filtre associé au type de fichier actuel apparaît. Elle propose une série d'options adaptées à ce type de fichier. En premier lieu, confirmez ou modifiez le niveau de formatage ; ces données déterminent les autres options affichées. Sélectionnez ensuite les options voulues. Vous trouverez la description de ces opérations dans l'aide.

Pour que les modifications s'appliquent aux futures exportations effectuées à l'aide du filtre choisi, cochez l'option Modifications permanentes. Si cette option n'est pas sélectionnée, les modifications seront appliquées à l'exportation en cours uniquement et ne seront pas mémorisées pour de futures utilisations. Vous pouvez modifier et enregistrer les paramètres d'exportation (sans enregistrer un document), en choisissant Outils > Préférences d'enregistrement...

Utilisation de filtres multiples

Les filtres multiples vous permettent d’exporter les fichiers vers plusieurs types de fichiers en une seule étape. Sélectionnez Multiple dans la boîte de dialogue d’enregistrement :

Pour élaborer votre propre filtre multiple, ouvrez la boîte de dialogue Préférences d’enregistrement depuis le menu Outils. Choisissez l'option Filtres multiples, puis sélectionnez un filtre et

Chapitre 5 Enregistrement des résultats de l’OCR 96

Page 97

cliquez sur Créer à partir de... . Une copie du filtre sélectionné est

créée. Vous pouvez la modifier librement, sans que cela n'affecte le filtre original.

Le nouveau filtre apparaît dans la liste. Sélectionnez-le puis cliquez sur Options... afin de spécifier les réglages s'y rapportant. La liste de tous les filtres de texte apparaît, suivie de tous les filtres d'image. Cochez les filtres de votre choix. Vous pouvez désigner des sousdossiers pour chaque type de fichier.

Vous pouvez enregistrer des pages avec différents niveaux de formatage ou options de fichier dans les différents types de fichiers, en fonction de celles définies dans les filtres simples. Certaines options d’enregistrement, cependant, ne sont pas disponibles lorsque l’on utilise des filtres multiples :

Enregistrer un document OmniPage

Utilisez un flux de travail s’exécutant en deux étapes ou effectuez deux enregistrements distincts.

Enregistrement vers deux destinations

Par exemple, vous ne pouvez pas utiliser un filtre multiple pour enregistrer un document dans un fichier et l’envoyer à la fois par email. Utilisez un flux de travail s’exécutant en deux étapes ou effectuez deux enregistrements distincts.

Enregistrement de différentes sélections de pages

Vous ne pouvez pas enregistrer différentes sélections de pages dans différents types de fichiers, car une seule sélection de pages peut exister au moment de l’enregistrement. Pour la même raison, un flux de travail unique ne peut pas être utilisé. Effectuez deux enregistrements séparés ou utilisez deux flux de travail.

Chapitre 5 Enregistrement des résultats de l’OCR 97

Page 98

Enregistrement d’un document au format PDF

Lors de l’enregistrement au format PDF (Portable Document Format), vous avez le choix entre cinq options. Les quatre premières options se présentent comme des filtres de texte. La dernière est classée comme un filtre d’image.

PDF (standard) :

Les pages sont exportées telles qu’elles apparaissent dans l'éditeur de texte dans le niveau de formatage True Page. Ce fichier PDF peut être affiché et faire l’objet de recherches dans un programme d’affichage PDF, et édité dans un éditeur PDF.

PDF édité :

Utilisez cette option si vous avez apporté d'importantes modifications aux résultats de reconnaissance. Vous disposez de trois options pour le niveau de formatage, dont True Page. Le fichier PDF peut être affiché et modifié, et faire l’objet de recherches de texte.

PDF – Image avec recherche (précédemment « PDF avec image sur texte ») :

Le fichier PDF peut uniquement être affiché. Il ne peut faire l’objet d’aucune modification dans un éditeur PDF. Chaque image de page exportée est associée à un fichier texte sous-jacent, qui rend possible l’exécution de recherches de texte. Ainsi, les mots trouvés lors des recherches sont mis en surbrillance sur l’image.

PDF avec substitution d'image :

Format semblable au format « PDF standard », sauf que les mots contenant des caractères de rejet ou des caractères douteux sont recouverts d’images, ce qui assure un affichage identique au document original. Le fichier PDF peut être affiché et modifié, et faire l’objet de recherches de texte.

Chapitre 5 Enregistrement des résultats de l’OCR 98

Page 99

PDF Image (précédemment « PDF avec image uniquement ») :

Les images originales sont exportées. Le fichier PDF peut être affiché, mais le texte ne peut être ni modifié dans un éditeur PDF, ni faire l’objet de recherches.

En plus des formats PDF décrits précédemment, vous pouvez définir d’autres paramètres pour configurer votre sortie PDF en sélectionnant Options :

PDF 1.6

Ce format offre des fonctionnalités avancées en matière de sécurité, d’annotation et d’incorporation de pièces jointes.

PDF/A

Ce format sert à créer des fichiers compatibles PDF/A, qui s'afficheront de façon identique quel que soit l'environnement informatique utilisé et resteront lisibles au fil des futures évolutions technologiques.

PDF balisé

Ce format ajoute des balises aux fichiers PDF, afin de préserver leur structure originale. Ces balises définissent notamment l’ordre de lecture logique du document et la structure des tableaux.

PDF MRC

Ce format utilise une technologie de haute compression unique, offrant le compromis idéal entre qualité d’affichage et taille des fichiers. Cette technologie peut être utilisée avec des PDF Image ou Image avec recherche, en couleur ou en niveaux de gris.

PDF linéarisé

Ce format permet de créer des fichiers PDF optimisés pour un chargement et un affichage rapides lorsqu'ils sont intégrés dans des pages Web.

Chapitre 5 Enregistrement des résultats de l’OCR 99

Page 100

Protection par mot de passe

Avec OmniPage Professional, vous pouvez définir un type et un niveau de chiffrement, ainsi qu'un mot de passe d'ouverture et/ou de permissions pour les fichiers PDF.

Un choix d'options moins étendu est disponible pour l'enregistrement des fichiers au format XPS, à condition que Microsoft .NET Framework 3.0 soit installé sur votre système.

Conversion de documents PDF

Pour extraire le texte d’un fichier PDF, chargez votre PDF dans OmniPage, lancez sa reconnaissance, puis enregistrez les résultats dans l’un des formats Texte.

Un large éventail de formats de conversion est directement accessible depuis le menu contextuel de fichiers PDF : Word, Excel, RTF, WordPerfect ou Texte. Pour disposer d’options complémentaires, utilisez l’Assistant Convertir maintenant.

Création de fichiers PDF depuis d'autres applications

Nuance PDF Create, livré avec OmniPage Professional, permet de générer des fichiers PDF standard (également appelés « PDF normaux ») depuis toute application dotée d'une commande d'impression installée sur votre système. Pour ce faire, sélectionnez Fichier > Imprimer, puis sélectionnez ScanSoft PDF Create!. Modifiez les paramètres selon vos besoins, cliquez sur OK, puis indiquez le nom et l'emplacement du fichier PDF cible. Si vous avez sélectionné l'option Afficher le fichier PDF généré, le fichier sera automatiquement ouvert dans votre visionneuse PDF par défaut.

Chapitre 5 Création de fichiers PDF... 100