SCANSOFT Omnipage User Manual 12 [fr]

AVIS JURIDIQUES

Copyright © 2002 ScanSoft, Inc. Tous droits réservés. Aucune partie de cette publication ne peut être transmise, transcrite, reproduite ou stockée dans un système de récupération de données, ni traduite dans une langue ou un langage informatique sous quelque forme ou par quelque moyen que ce soit (mécanique, électronique, magnétique, optique, chimique, manuel, etc.) sans l'accord préalable par écrit de ScanSoft, Inc., 9 Centennial Drive, Peabody, Massachusetts 01960, USA. Imprimé aux États-Unis et aux Pays-Bas.
Le logiciel présenté dans ce manuel est fourni sous licence et son utilisation et sa copie sont soumises aux termes de la licence.
EMARQUE IMPORTANTE
R
ScanSoft, Inc. fournit cette publication « en l'état », sans garantie d’aucune sorte, expresse ou implicite, y compris, mais de manière non limitative, toute garantie implicite de qualité commerciale ou d’adéquation à un usage particulier. Certaines juridictions ne reconnaissant pas les limitations de garantie expresse ou implicite dans certaines transactions, cette clause peut ne pas s’appliquer à votre cas. ScanSoft se réserve le droit de réviser et/ou modifier cette publication périodiquement sans obligation de notification de telles révisions ou modifications.
ARQUES COMMERCIALES
M
ScanSoft, OmniPage, OmniPage Pro, PaperPort, Pagis, Tr u e Pa ge et Direct OCR sont des marques déposées ou des marques commerciales de ScanSoft, Inc. enregistrées aux États-Unis et/ou dans d'autres pays.
Tous les autres noms de société ou de produit cités peuvent être des marques de leurs propriétaires respectifs.
ScanSoft, Inc.
9 Centennial Drive Peabody, MA 01960 États-Unis
ScanSoft Belgium BVBA
Guldensporenpark 32 BE-9820 Merelbeke Belgique
Numéro de référence : 50-281201-01A

T ABLE DES MATIÈRES

PRÉSENTATION GÉNÉRALE 7
Utilisation de ce manuel 8
Consultation de laide en ligne 9
Aide HTML en ligne 9 Aide contextuelle 9 Notes techniques 10 Glossaire 10
1INSTALLATION ET CONFIGURATION 11
Environnement requis 12 Installation de OmniPage Pro 13 Configuration dun scanner pour utilisation avec
OmniPage Pro 14 Lancement de OmniPage Pro 16 Enregistrement de OmniPage Pro 17 Nouvelles fonctions dOmniPage Pro 12 17
2INTRODUCTION 19
Reconnaissance optique de caractères (OCR) 20
Technologie OCR d’OmniPage Pro 20 Documents dans OmniPage Pro 21 Principales étapes de lOCR 21
Bureau OmniPage 22
Barre des menus 23 Barres d'outils 23 Fenêtre d'image 24
OmniPage Pro Manuel d’utilisation iii
Éditeur de texte 24
Boîte à outils OmniPage 25
Gestion de documents 26
Vignettes 26 Gestionnaire de documents 27 Personnaliser des colonnes dans le gestionnaire
de documents 28 Supprimer des pages dun document 28 Imprimer un document 29 Fermer un document 29
Documents OmniPage 29
Avantages du format OPD 30 Enregistrer au format OPD 30
Réglages 31
3TRAITEMENT DES DOCUMENTS 33
Guide de démarrage rapide 34
Charger et reconnaître les exemples
de fichiers image 34
iv Table des matières
Numériser et reconnaître un document
d'une page 34
Présentation du traitement 36 Traitement automatique 38
Arrêter et relancer le traitement automatique 39
Traitement manuel 40 Traitement combiné 41 Traitement à l'aide de l'Assistant OCR 43 Traitement à partir dautres applications 44
Configuration de Direct OCR 45 Utilisation de Direct OCR 45 Utilisation de OmniPage Pro avec PaperPort 46
Traitement de documents avec Planifier OCR 47 Définition de la source des images de page 48
Importer des fichiers image 48 Importer des documents à partir dun scanner 49 Numériser avec un chargeur ADF 51 Numériser sans chargeur ADF 51
Définition de la mise en page du document 52 Zones et fonds 53
Découpage en zones automatique 54 Traçage de zones manuel 54 Types et propriétés de zone 56 Gestion des zones 58
Gestion des grilles du tableau dans limage 60 Utilisation des gabarits de zone 62
4VÉRIFICATION ET É DITION 65
Modes daffichage de l’éditeur de texte 66 Vérification des résultats de lOCR 67 Vérification du texte reconnu 68 Dictionnaires utilisateur 70 Apprentissage 71
Apprentissage manuel 72 IntelliTrain 72 Fichiers d’apprentissage 73
Édition du texte et des images 75 Édition en direct 77 Lecture du texte à voix haute 78
OmniPage Pro Manuel d’utilisation v
5ENREGISTREMENT ET EXPORTATION 81
Enregistrement des images originales 82 Enregistrement des résultats de lOCR 83
Enregistrement dun document lors
dune session de travail 84 Sélection dun niveau de formatage 85 Sélection des options d'enregistrement évoluées 86 Enregistrement dun document au format PDF 88
Copie des pages dans le Presse-papiers 88 Ajout de pages à un e-mail comme pièce jointe 89
6INFORMATIONS TECHNIQUES 91
Dépannage 92
Solutions de premier recours 92 Test de OmniPage Pro 93 Augmentation de la quantité de mémoire
disponible 94 Augmentation de l'espace disque 94 Reconnaissance de texte incorrecte 95
vi Table des matières
Reconnaissance de fax incorrecte 96 Problèmes de système ou de performances
pendant l’OCR 96
Support ODMA 97 Fonctions évoluées du module Planifier OCR 97 Types de fichier supportés 98
Types de fichier pour louverture et
lenregistrement des images 98 Types de fichier pour l’enregistrement
des résultats de l’OCR 99
Désinstallation du logiciel 101
INDEX 103

Présentation générale

Nous vous remercions de la confiance que vous portez à OmniPage Pro®. La documentation citée ci-dessous est destinée à vous présenter le programme et à faciliter son utilisation.
Manuel de référence
Le présent manuel fournit des informations relatives aux principes d'utilisation d'OmniPage Pro 12 : procédures dinstallation et de configuration, description des commandes et zones de travail disponibles, instructions de réalisation de différentes tâches, méthodes de personnalisation et de gestion de traitement et diverses informations techniques. Ce manuel est proposé au format PDF ; vous pouvez ainsi utiliser les outils de navigation de votre afficheur PDF et les liens hypertexte intégrés pour passer aux différentes sections du document.
Aide en ligne
L’aide en ligne d’OmniPage Pro contient des informations sur les fonctions, les réglages et les procédures relatives au logiciel. Au format HTML, cette aide a été conçue pour garantir une consultation aisée et rapide. Son module d’aide contextuelle très complet assure une assistance suffisante pour vous permettre d’accomplir sans délai les opérations requises. Voir « Consultation de l’aide en ligne », page 9.
Fichier ReadMe/LisezMoi
Ce fichier au format HTML comporte les informations de dernière minute concernant le logiciel. Il est vivement recommandé de le consulter avant dutiliser OmniPage Pro. Pour ouvrir le fichier ReadMe/LisezMoi, vous pouvez, lors de linstallation dOmniPage Pro, sélectionner l’option ReadMe/LisezMoi, ou, à tout moment, choisir la commande correspondante dans le menu Aide.
Informations de numérisation et renseignements divers
Le site Web de ScanSoft (www.scansoft.com) fournit des informations actualisées au sujet du programme. La section « Scanner Guide » contient des données régulièrement mises à jour et relatives aux scanners supportés et à d'autres questions y afférentes ; ScanSoft effectue des tests sur les 25 modèles les plus répandus. Pour accéder au site Web de ScanSoft, vous pouvez, lors de l’installation d’OmniPage Pro, sélectionner l’option d’accès au site Web, ou, à tout moment choisir la commande correspondante dans le menu Aide.
OmniPage Pro Manuel dutilisation 7

Utilisation de ce manuel

Ce manuel présuppose que vous maîtrisez les principes de travail dans lenvironnement Microsoft Windows. Pour tous détails sur cet environnement (utilisation des boîtes de dialogue, des menus déroulants et contextuels, des barres de défilement, de la fonction Glisser-déplacer, etc.), reportez-vous à la documentation Windows appropriée.
Vou s de vr ie z également connaître le fonctionnement de votre scanner et de son logiciel. Avant de procéder à la configuration du scanner avec OmniPage Pro, assurez-vous quil est installé et qu’il fonctionne correctement. Reportez-vous, si nécessaire, à la documentation du scanner.
Ce manuel utilise les conventions suivantes :
Texte en gras
Tex te e n italiques
Police sans empattement
Introduit les nouveaux termes et signale les titres des différentes sections de chaque chapitre.
Indique le nom des rubriques de l'aide en ligne. Indique le texte développé des options dans les boîtes de dialogue.
Indique les noms de fichier, tels que exemple.tif
Présente une remarque qui introduit des informations supplémentaires.
Présente un conseil qui introduit des suggestions sur laccomplissement de tâches spécifiques à laide des fonctions du logiciel.
8 Présentation générale

Consultation de l’aide en ligne

L’aide en ligne d’OmniPage Pro contient des informations sur les fonctions, les réglages et les procédures relatives au programme. Le système daide devient disponible dès linstallation du logiciel.

Aide HTML en ligne

Pour accéder à l’aide en ligne dOmniPage Pro, choisissez la commande Aide OmniPage Pro dans le menu daide. Vous pourrez obtenir les informations requises en consultant des rubriques de la table des matières, en sélectionnant des mots-clés dans lindex alphabétique ou en effectuant des recherches sur lintégralité du texte daide. Les autres commandes du menu Aide vous permettront d’accéder à de nombreux sujets ou pages Web utiles.
Lors de lutilisation dOmniPage Pro, vous pouvez consulter la rubrique d’aide relative à la boîte de dialogue, la zone d’écran ou le message affiché en appuyant sur la touche F1.

Aide contextuelle

Pour afficher des informations succinctes sur un élément d’interface dOmniPage Pro (commande de menu, bouton de barre doutils, groupe doptions, boîte de dialogue, etc.), vous pouvez procéder des manières suivantes :
Pour afficher la rubrique d’aide relative à un élément du bureau en dehors d’une boîte de dialogue ou dune fenêtre de message, cliquez sur le bouton daide dans la barre d’outils standard afin d’afficher l’icône daide (flèche accompagnée d’un point dinterrogation), puis cliquez sur cette icône et sur l’élément requis.
Vou s po uv ez également afficher cette icône via la séquence Maj. + F1. Cette combinaison affiche l'aide relative aux commandes des menus contextuels.
Pour afficher une mini-fenêtre décrivant un élément de boîte de dialogue, cliquez sur le point dinterrogation situé dans langle supérieur droit de la boîte en question puis sur l’élément requis.
Certaines boîtes de dialogue ou fenêtres de message comportent un bouton Aide (icône ou libellé). Pour accéder aux informations sur leurs éléments, cliquez sur ce bouton.
Pour supprimer une fenêtre d’aide contextuelle, cliquez n’importe où sur le bureau.
OmniPage Pro Manuel dutilisation 9

Notes techniques

Le site Web de ScanSoft (www.scansoft.com) propose des notes techniques (Tech Notes) concernant les problèmes les plus courants concernant l'utilisation dOmniPage Pro 12. Ces pages Web peuvent également inclure des conseils sur l'installation et le dépannage du logiciel.

Glossaire

Ce manuel ne comporte pas de glossaire. En revanche, l'aide en ligne inclut un glossaire exhaustif, assorti d'un index alphabétique et d'une table des matières. Consultez-le pour trouver la définition d'un terme utilisé dans ce manuel ou dans le programme.
10 Présentation générale
Chapitre 1

Installation et configuration

Ce chapitre contient les informations nécessaires à l'installation et au lancement d'OmniPage Pro 12, soit les sections suivantes :
Environnement requis
Installation de OmniPage Pro
Configuration dun scanner pour utilisation avec OmniPage Pro
Lancement de OmniPage Pro
Enregistrement de OmniPage Pro
Nouvelles fonctions dOmniPage Pro 12
OmniPage Pro Manuel d’utilisation 11

Environnement requis

Pour installer et utiliser OmniPage Pro 12, vous devez prévoir l’environnement minimum suivant :
Processeur Pentium ou supérieur
Microsoft Windows 98 (à partir de la Deuxième Édition),
Windows Me, Windows NT 4.0 (avec au moins Service Pack 6), Windows 2000 ou Windows XP
64 Mo de mémoire RAM (128 Mo recommandés)
90 Mo despace disque disponible destiné aux fichiers dapplication,
plus 5 Mo despace disponible lors de l’installation
5 Mo pour Microsoft Installer (MSI) si absent de votre système (ce
module est inclus dans le système d'exploitation Windows Me, Windows 2000 et Windows XP)
Affichage SVGA avec 256 couleurs. Couleur 16 bits et résolution
de800x600pixels recommandées [65536 couleurs dans Windows 2000 et Moyenne (16 bits) dans XP].
Souris (ou équivalent) compatible Windows
Lecteur de CD-ROM (pour linstallation)
12 Installation et configuration
Scanner compatible avec le pilote approprié (si vous prévoyez de
numériser des documents). Pour consulter la liste des scanners supportés, reportez-vous au guide des scanners (Scanner Guide) sur le site Web de ScanSoft (www.scansoft.com).
Vous obtiendrez de meilleures performances avec un processeur plus puissant, et des valeurs supérieures de RAM et despace disque.
Installation de OmniPage Pro
Pour vous guider dans linstallation, OmniPage Pro 12 affiche des instructions sur chaque écran.
Avant de lancer linstallation dOmniPage Pro, respectez les points suivants :
Fermez les applications actives, en particulier les logiciels antivirus.
Si vous installez OmniPage Pro sur un système Windows NT,
Windows 2000 ou Windows XP, ouvrez une session avec privilèges dadministrateur.
Si votre système dispose dune version antérieure d’OmniPage Pro ou
que vous effectuez une mise à niveau à partir d'une version de démonstration ou dune édition limitée d'OmniPage, le programme dinstallation vous demandera lautorisation de désinstaller le logiciel existant.
Pour installer OmniPage Pro :
1. Insérez le CD-ROM OmniPage Pro dans le lecteur approprié. En principe,
le programme dinstallation démarre automatiquement. Si ce n’est pas le cas, ouvrez lExplorateur Windows, cliquez sur l’icône du lecteur de CD-ROM, puis cliquez deux fois sur le fichier de programme
Autorun.exe.
Chapitre 1
2. Choisissez la langue dinstallation souhaitée. Ce choix détermine également
la version du module Texte-parole et la langue de l'interface du programme. L'interface du programme affiche dans la langue choisie des éléments tels que les commandes de menu, les boîtes de dialogue, les fenêtres de message, etc. Vous pouvez modifier la langue dinterface ultérieurement, via les options du logiciel, mais la sélection effectuée lors de l’installation détermine la version du module Texte-parole installée. Reportez-vous à la deuxième remarque ci-dessous.
3. Pour installer le logiciel, suivez les instructions affichées sur les écrans
successifs. Tous les fichiers nécessaires à la numérisation sont copiés automatiquement lors de l’installation.
Certains problèmes peuvent être résolus en désinstallant puis en réinstallant OmniPage Pro. Voir « Désinstallation du logiciel », page 101.
A l’avenir, le module Texte-parole sera fourni en anglais, français, allemand, italien, portugais et espagnol, en fonction de la région ou de la version. Pour obtenir les dernières informations à ce sujet, consultez le fichier ReadMe/LisezMoi. Toutefois notez qu’une seule version linguistique du module Texte-parole peut être installée avec OmniPage Pro. Voir « Lecture du texte à voix haute », page 78.
Installation de OmniPage Pro 13
Configuration dun scanner pour utilisation avec OmniPage Pro
Tous les fichiers nécessaires à la configuration et au support du scanner sont copiés automatiquement lors de linstallation du programme. Avant de numériser des documents à laide dOmniPage Pro 12, vous devrez vérifier que votre scanner est installé correctement, avec le pilote approprié, et tester son fonctionnement. Les pilotes du scanner ne sont pas fournis avec OmniPage Pro.
L’installation et la configuration du scanner s’effectuent via l’Assistant du scanner, que vous pouvez lancer vous-même, en appliquant les procédures décrites. Sinon, l'Assistant du scanner apparaît la première fois que vous tentez une numérisation.
Pour configurer votre scanner avec OmniPage Pro 12 à l’aide de l'Assistant du scanner, suivez les étapes suivantes :
Choisissez Démarrer Programmes ScanSoft
OmniPage Pro 12.0 Assistant du scanner.
ou cliquez sur le bouton Configuration dans longlet Scanner de la boîte de dialogue Options.
ou choisissez un paramètre de numérisation dans la zone de liste déroulante Importer une page de la boîte à outils et cliquez sur le bouton Importer une page.
14 Installation et configuration
L'Assistant du scanner démarre. La première fenêtre s'affiche uniquement lors de la configuration initiale, à partir d'OmniPage Pro.
Choisissez Sélectionner un scanner ou un appareil photo numérique,
puis cliquez sur Suivant. La liste de tous les pilotes de scanner TWAIN détectés s'affiche ; le scanner par défaut du système est sélectionné.
Cliquez une fois pour sélectionner le pilote de scanner voulu. Si vous
devez rechercher un pilote, cliquez sur Autres pilotes. Si vous voulez masquer l'interface de votre scanner au cours de la numérisation ou modifier la méthode de transfert des images, sélectionnez Configurer les paramètres évolués pour ouvrir une fenêtre supplémentaire. Cliquez sur Suivant.
Choisissez Oui pour tester la configuration de votre scanner, puis
cliquez sur Suivant. L'Assistant vérifie la connexion de l'ordinateur au scanner. À l'issue de lopération, cliquez sur Suivant.
Chapitre 1
Insérez une page de test dans le scanner. L'Assistant est prêt à effectuer
une numérisation de base au moyen du logiciel fourni par le fabricant du scanner. Cliquez sur Suivant. L'interface utilisateur native de votre scanner s'affiche.
Cliquez sur Numériser pour lancer la numérisation de la page de test.
Si nécessaire, cliquez sur Image inversée ou Image manquante et
effectuez les sélections appropriées.
Si l'image affichée dans la fenêtre est correcte, cliquez sur Suivant.
Sélectionnez l'élément qui décrit le mieux votre scanner, puis cliquez
sur Suivant.
Cliquez sur Suivant pour passer à la sélection de la taille de page.
Les tailles de page que l'Assistant du scanner attribue à votre scanner
sont indiquées dans la fenêtre. Pour modifier les tailles de page, cliquez sur Évolué, effectuez les changements voulus et cliquez sur Suivant.
Insérez dans le scanner une page contenant du texte, mais pas d'image.
Cliquez sur Suivant pour lancer une numérisation en noir et blanc.
Si nécessaire, cliquez sur Image inversée ou Image manquante et
effectuez les sélections appropriées.
Si l'image affichée dans la fenêtre est correcte, cliquez sur Suivant.
Si vous disposez d'un scanner couleur, insérez une photographie
couleur ou une page comportant une image couleur. Cliquez sur Suivant pour lancer une numérisation en couleur. Si nécessaire, cliquez sur Image inversée ou Image manquante et effectuez les sélections appropriées. Si l'image affichée dans la fenêtre est correcte, cliquez sur Suivant. Si votre scanner ne gère pas la couleur, ignorez cette étape.
Insérez dans le scanner une photographie ou une page contenant une
image. Cliquez sur Suivant pour lancer une numérisation en niveaux de gris. Si nécessaire, cliquez sur Image inversée ou Image manquante et effectuez les sélections appropriées. Si l'image affichée dans la fenêtre est correcte, cliquez sur Suivant.
Vous venez de configurer votre scanner pour utilisation avec
OmniPage Pro 12. Cliquez sur Terminer.
Pour modifier les réglages du scanner par la suite ou pour configurer un autre scanner, ouvrez de nouveau l'Assistant de configuration du scanner depuis le menu Démarrer de Windows ou depuis longlet Scanner de la boîte de dialogue Options. Pour tester et dépanner un scanner ne fonctionnant pas correctement, ouvrez l'Assistant du scanner depuis le menu Démarrer de Windows et
Configuration dun scanner pour utilisation avec OmniPage Pro 15
sélectionnez Tester scanner/appareil photo numérique dans la première fenêtre, puis appliquez la procédure décrite ci-dessus.
Lancement de OmniPage Pro
Pour lancer OmniPage Pro 12, effectuez l'une des opérations suivantes :
Dans la barre des tâches Windows, cliquez sur Démarrer et choisissez
Programmes ScanSoft OmniPage Pro 12.0 OmniPage Pro 12.0.
Cliquez deux fois sur l’icône OmniPage Pro située dans le dossier
dinstallation dOmniPage Pro ou sur le bureau Windows (si vous ly avez placée).
Cliquez deux fois sur l’icône ou le nom de fichier dun document
OmniPage (OPD) pour le charger. Voir « Documents OmniPage », page 29.
Lorsque vous ouvrez l’application, l’écran d’accueil puis le bureau OmniPage Pro s’affichent. Voir « Bureau OmniPage », page 22. Cette section présente les principales zones de travail du programme.
Vou s po uv ez également exécuter le programme avec une interface limitée:
Ouvrez le programme Planifier OCR. Dans la barre des tâches
Windows, cliquez sur Démarrer et choisissez Programmes ScanSoft OmniPage Pro 12.0 Planifier OCR. Voir « Tra i te m en t de documents avec Planifier OCR », page 47.
16 Installation et configuration
Dans une application déclarée dans Direct OCR, choisissez Acquérir
texte dans le menu Fichier. Voir « Configuration de Direct OCR », page 45.
Cliquez avec le bouton droit sur une icône ou un nom de fichier image
pour afficher son menu contextuel. Choisissez la sous-option requise de la commande Convertir en pour définir une cible.
Pour ajouter des services dOCR, utilisez OmniPage Pro 12 avec les
produits de gestion de documents de ScanSoft, PaperPort Vo ir « Utilisation de OmniPage Pro avec PaperPort », page 46.
®
ou Pagis®.
Chapitre 1
Enregistrement de OmniPage Pro
L’Assistant d’enregistrement ScanSoft est lancé à l’issue de l’installation du programme. L’enregistrement s’effectue via un formulaire électronique facile à remplir (moins de cinq minutes). Lorsque vous avez terminé de remplir le formulaire et que vous cliquez sur Envoyer, le programme tente de se connecter à Internet pour accomplir lenregistrement.
Si vous nenregistrez pas votre copie du logiciel pendant son installation, le programme vous invitera à intervalles réguliers à accomplir cette formalité. Vous pouvez visiter le site Web (www.scansoft.com) pour vous enregistrer en ligne. Cliquez sur Support, puis dans l'écran de support principal, choisissez Enregistrer dans la colonne de gauche.
Pour plus de détails sur l'utilisation de vos données d'enregistrement, reportez-vous à la clause relative à la confidentialité de la politique de ScanSoft.
Nouvelles fonctions d’OmniPage Pro 12
La famille de produits OmniPage® vient de senrichir de OmniPage Pro 12. Si vous effectuez une mise à jour, vous n'aurez probablement pas besoin de lire en détail le présent manuel. La liste ci-dessous vous présente les innovations de la version 12 :
Importante augmentation de la précision
De nouveaux niveaux de précision avec l'amélioration de la synergie entre les moteurs de reconnaissance, le support des dictionnaires professionnels et l'apprentissage possible des caractères choisis par l'utilisateur.
Rationalisation de l’interface
Vous pouvez effectuer le traitement automatique et manuel directement à partir de la boîte à outils OmniPage, sans avoir recours à des barres d'outils séparées (voir la page 25). Les vignettes apparaissent dorénavant dans la fenêtre d'image ; vous pouvez choisir d'afficher la page courante, la page des vignettes ou les deux (voir page 26). La vue Détails de la version précédente a été remplacée par le gestionnaire de documents, qui inclut une colonne de remarques pour les commentaires et les mots-clés explorables.
Nouveaux concepts de zones
La fonction de découpage en zones « en direct » permet de modifier des zones « à la volée », sans devoir relancer la reconnaissance de la page
Enregistrement de OmniPage Pro 17
entière (voir page 77). Le fond des pages est affecté du type Traiter (découpage en zones automatique) ou Ignorer ; par conséquent lintégralité des instructions de découpage en zones apparaît sur la page et vous pouvez enregistrer celles-ci dans des gabarits de zone (voir page 53). Les procédures à suivre pour tracer des zones irrégulières, ainsi que diviser et joindre des zones, ont été simplifiées et elles n'exigent aucun outil séparé (voir page 58).
Amélioration de la vérification
La boîte de dialogue Vérification de lOCR affiche maintenant les mots douteux dans un contexte étendu. Un vérificateur dynamique peut rester ouvert pendant la vérification du texte, tandis que l'affichage et la fenêtre d'image suivent le contexte d'édition (voir page 67).
Niveaux de formatage pour laffichage et lenregistrement
L'affichage dans l'éditeur de texte accepte trois niveaux de formatage (voir page 66). Le niveau de formatage de sortie est désormais sélectionné au moment de l'exportation ; les sélections possibles dépendent du type de fichier spécifié. L’option d'exportation Pages en continu est une version améliorée de la vue Conserver l'enchaînement des colonnes de la version précédente. Elle conserve la mise en page, si possible sans cadres et blocs de texte, pour la disposition du texte entre les colonnes (voir page 85).
Meilleure analyse des pages
Le transfert du formatage des tableaux a été amélioré, en particulier la détection des tableaux dépourvus de traits de grille dans les pages originales. Les adresses Web et e-mail peuvent être détectées et transférées vers l'éditeur de texte ; vous pouvez également insérer des hyperliens. L'ordre de lecture peut maintenant être affiché et modifié
après reconnaissance dans la vue True Page
®
de l'éditeur de texte. Voir à
partir de page 75.
18 Installation et configuration
Meilleur traitement PDF
OmniPage Pro 12 recherche le texte de fond dans les PDF qu'il ouvre, afin de garantir une précision de reconnaissance supérieure. Un nouveau type de fichier, PDF édité, assure une bonne conservation du format sur les pages modifiées dans l'éditeur de texte à l'issue de la reconnaissance.
Options d'enregistrement évoluées
La gamme des options de sauvegarde a été enrichie pour chaque type de fichier de sortie. Les types de fichier de sortie définis par l'utilisateur peuvent être créés sur la base de réglages personnalisés (voir page 86). Si votre version dOmniPage Pro 12 inclut les nouveaux formats d'enregistrement XML et eBook, voir page 99.
Chapitre 2

Introduction

De nos jours, la plupart des activités professionnelles (correspondance, création de rapports, gestion des données, etc.) font appel à un ordinateur et pourtant, certaines sources dinformation circulent toujours sous la forme imprimée et ne sont pas directement exploitables par la machine.
Ainsi, si vous voulez insérer un article de magazine au format papier dans un rapport en cours de création sur ordinateur, vous devez trouver un moyen de le faire, en évitant la saisie manuelle, source d'erreur et synonyme de perte de temps.
OmniPage Pro vous propose une solution sûre : la reconnaissance optique de caractères (OCR). Ce chapitre décrit lemploi de la technologie OCR par OmniPage Pro 12 dans le but de transformer les informations contenues dans vos documents numérisés ou fichiers image en données électroniques éditables par vos applications habituelles.
Ce chapitre propose les sections suivantes :
Reconnaissance optique de caractères (OCR)
Documents dans OmniPage Pro
Principales étapes de lOCR
Bureau OmniPage
Gestion de documents
Documents OmniPage
Réglages
OmniPage Pro Manuel d’utilisation 19

Reconnaissance optique de caractères (OCR)

La reconnaissance optique de caractères (OCR) est une opération qui consiste à extraire du texte dune image obtenue par numérisation dun document papier ou par ouverture dun fichier image électronique. directement utilisable car ses caractères se composent de groupes de points (pixels).
Pendant la reconnaissance, OmniPage Pro 12 analyse limage proposée, identifie les caractères quelle contient et définit les solutions permettant de les transformer en texte éditable. À lissue de la reconnaissance, le texte peut être enregistré dans la plupart des applications (logiciels de traitement de texte ou de PAO, tableurs, etc.).
Technologie OCR d’OmniPage Pro
Outre le texte, OmniPage Pro peut reconnaître les éléments et caractéristiques suivants du document :
Éléments graphiques
Photos, logos, illustrations, etc.
Formatage du texte
Format des caractères, tel que type (Arial, Times New Roman...), corps (8, 12) et style (gras, italique, souligné tel que retraits, tabulations, marges et interlignes.
) d'une police. Format des paragraphes,
Le texte d’une image n’est pas
20 Introduction
Mise en page
Agencement des colonnes, agencement des tableaux, emplacement des éléments graphiques et des en-têtes.
Les éléments et caractéristiques conservés par OmniPage Pro dépendent des réglages sélectionnés pour chaque document. Pour plus de détails sur le choix des réglages, consultez la rubrique Conseils de réglages de laide en ligne OmniPage Pro.
OmniPage Pro reconnaît uniquement les caractères imprimés, tels que les sorties imprimante ou le texte tapé à la machine. Vous pouvez toutefois lui demander de conserver un bloc de texte manuscrit (une signature, par exemple) en affectant celui-ci du type de zone Graphique.
Chapitre 2
Documents dans OmniPage Pro
OmniPage Pro 12 gère les documents de façon individuelle. Lorsque vous importez la première image (à partir d’un scanner ou dun fichier), le programme crée un document. Toutes les images importées par la suite sont ajoutées à ce document, jusqu’à son enregistrement et sa fermeture.
Dans OmniPage Pro, un document comporte une ou plusieurs pages, chacune delles constituée par une image importée. Après la reconnaissance, le document comportera également le texte reconnu correspondant à ses images (affichable via l’éditeur de texte) et des graphiques ou des tableaux éventuels. Voir « Bureau OmniPage », page 22.

Principales étapes de lOCR

OmniPage Pro propose deux modes de traitement des documents : automatique et manuel. Voir « Traitement automatique », page 38 et « Traitement manuel », page 40. Les deux modes impliquent globalement les mêmes étapes principales :
1. Importer des images de document dans OmniPage Pro
Vou s po uv ez numériser un document papier (avec ou sans le chargeur de feuilles automatique [ADF]) ou charger un ou plusieurs fichiers image. Les images importées apparaissent sous la forme de vignettes dans la fenêtre d'image ; l'image de la première page est affichée. Les informations relatives aux pages concernées s'affichent dans le gestionnaire de documents. Voir « Définition de la source des images de page », page 48.
2. Exécuter lOCR pour obtenir du texte éditable
Pendant la reconnaissance, OmniPage Pro trace des zones autour des parties de l’image à traiter, puis interprète le contenu textuel et graphique de chaque zone. Vous pouvez également créer des zones manuellement ou en appliquant un gabarit de zones prédéfini. À l’issue de la reconnaissance, vous pouvez détecter et corriger les erreurs éventuelles à l’aide du module de vérification de lOCR et éditer le document dans l’éditeur de texte.
3. Exporter le document vers la destination de votre choix
Une fois le document reconnu, vous pouvez l’enregistrer dans un fichier (en spécifiant le nom et le type voulus), le copier dans le Presse-papiers ou l’envoyer comme pièce jointe d’un e-mail. Vous pouvez également l’enregistrer au format de document OmniPage (OPD) selon la procédure décrite ci-après. Un même document peut être enregistré plusieurs fois avec différents réglages d’emplacement, de type de fichier, de formatage, etc., selon vos besoins. Voir « Enregistrement et exportation », page 81.
Reconnaissance optique de caractères (OCR) 21
Barre d’outils Standard
Boîte à outils OmniPage
L’onglet Vignettes contient des images réduites de toutes les pages du document.
La page actuelle présente une icône en forme d'« œil ».
Ce symbole marque une page reconnue.

Bureau OmniPage

Le bureau OmniPage Pro dispose dune barre de titre et de menus dans sa partie supérieure et dune barre d’état dans sa partie inférieure. Il est composé de trois espaces de travail ou fenêtres : gestionnaire de documents, fenêtre d'image et éditeur de texte. Dans leur partie supérieure, ces trois espaces de travail comprennent les boutons de fermeture, d'agrandissement et de réduction de la fenêtre. La Fenêtre d'image est munie de la barre doutils Image et la fenêtre Éditeur de texte de la barre doutils Formatage.
Barre doutils Formatage
Barre d’outils Image
Boutons pour explorer le document
Boutons permettant d'afficher ou de masquer le gestionnaire de documents, l'éditeur de texte et l’affichage des vignettes et de la page actuelle pour la fenêtre d'image. Vous pouvez également effectuer ces opérations depuis le menu Affichage.
22 Introduction
Faites glisser ces barres de
fractionnement pour
redimensionner les zones
de travail.
Fenêtre d'image :
Cette fenêtre affiche l'image de la page actuelle et indique les zones tracées. La fenêtre d'image peut afficher la page actuelle, la page des vignettes ou les deux.
Boutons de l’éditeur de texte offrant trois niveaux de formatage.
Éditeur de texte :
Affiche le résultat de la reconnaissance de la page actuelle en mode True Page.
Barre d’outils
Chapitre 2
L’exemple utilisé s’appuie sur un document de trois pages. La page 1 représente la page actuelle, reconnue et vérifiée; la page2 a été reconnue mais non vérifiée; la page 3 a été importée et divisée manuellement en zones, mais n’a pas été reconnue. L’icône figurant dans la partie inférieure de chaque vignette indique l’état de la page correspondante.
Les boutons de la barre d’état vous permettent dafficher et de masquer les fenêtres du bureau OmniPage Pro, et de passer à d’autres pages du document. Un clic avec le bouton droit dans une fenêtre affiche son menu contextuel avec les commandes les plus utiles pour cette fenêtre.

Barre des menus

Pour obtenir des informations succinctes sur une commande de menu, cliquez sur le bouton daide contextuelle puis sur la commande concernée. La fenêtre qui apparaît explique la fonction de la commande. Pour fermer cette fenêtre, cliquez n’importe où sur l’écran.
Barres d’outils
Le programme propose trois barres d'outils principales, qui peuvent toutes être flottantes, si besoin. Le menu Affichage permet de les afficher, de les masquer et de les personnaliser. L'aide contextuelle explique l'action de chaque outil. Deux barres d'outils supplémentaires permettent de piloter des tâches spécifiques.
Emplacement p ar
défaut
Autres emplace­ments d'ancrage
Action
Standard
Image
Formatage
Vérificateur
Réagencement
Horizontalement sous la barre de menus
Verticalement à gau­che de la page d'image actuelle
Horizontalement en haut de l'éditeur de texte
Placez le curseur sur la fenêtre du vérificateur pour afficher cette barre d'outils flottante.
Cliquez sur loutil Changer lordre de lecture. Cette barre doutils remplace la barre d’outils Formatage.
Tout bord du bureau OmniPage
Verticalement à droite de la page d'image actuelle
Aucun
Exécution des fonctions de base du pro­gramme. Voir page 29 et page 67.
Opérations sur les images, les zones et les tableaux. Voir page 53 et page 60.
Formatage du texte reconnu dans l'édi­teur de texte. Voir page75.
Contrôle de l'emplacement et de l'aspect du vérificateur. Voir page 68.
Modification de l'ordre des éléments dans les pages reconnues. Voir page 75.
Bureau OmniPage 23

Fenêtre d'image

Lorsque cette fenêtre affiche l'image de page actuelle, la barre d'outils Image est disponible. Les images de page possèdent toutes une valeur de fond : Traiter ou Ignorer. Les zones peuvent être tracées manuellement sur les images de page ou placées automatiquement à l'issue de la reconnaissance. Il existe cinq types de zones : Traiter, Ignorer, Texte, Tableau et Graphique. Les zones sont automatiquement tracées pour les éléments placés à l'intérieur des zones Traiter et sur un fond Traiter en dehors d'autres zones, et leurs types de zones sont déterminés pendant le traitement. Voir « Zones et fonds », page 53.
Si l'image de page actuelle est masquée, les vignettes apparaissent en rangées pour assurer une utilisation optimale de l'espace disponible.
24 Introduction

Éditeur de texte

L'éditeur de texte affiche les résultats de la reconnaissance selon trois niveaux de formatage :
Aucun formatage
Conserver le formatage polices/paragraphes
Tru e Pa ge
Le mode True Page conserve la mise en page sur la base des cadres et des blocs de texte, de tableaux et d'images. True Page peut afficher des zones multicolonnes, afin de présenter des blocs de texte pouvant être assimilés à un enchaînement de colonnes au moment de l'exportation. Tru e Pa ge correspond également à un niveau de formatage d'exportation, de même que Pages en continu, qui conserve la mise en page sans blocs ni cadres. Voir « Modes d’affichage de l’éditeur de texte », page 66.
Chapitre 2

Boîte à outils OmniPage

La boîte à outils dOmniPage Pro vous permet de gérer toutes les étapes du traitement. Elle est placée par défaut dans la partie supérieure du bureau OmniPage, au-dessus des fenêtres de travail, mais peut également prendre la forme de fenêtre flottante ou être ancrée le long du bord inférieur du bureau.
Bouton Lancer Bouton Importer la page Bouton Exécuter l’OCR Bouton Exporter les
Liste déroulante Importer la page
Liste déroulante de description de la mise en page
résultats
Liste déroulante Exporter les résultats
Le traitement automatique est lancé, arrêté et relancé à l’aide du bouton Lancer (1-2-3). Voir « Traitement automatique », page 38.
Le traitement manuel permet de traiter les documents page par page et étape par étape. Vous pouvez démarrer chacune des étapes avec le bouton correspondant : Importer la page (1), Exécuter l’OCR (2) et Exporter les résultats (3). Voir « Traitement manuel », page 40.
Vous pouvez passer du mode automatique au mode manuel à tout moment, à la seule condition que le programme ne soit pas en train deffectuer une opération de traitement. Cette propriété signifie que vous pouvez modifier le mode sélectionné entre les différentes étapes du traitement dun document. Par exemple, il est possible de traiter automatiquement certaines pages, puis insérer dans le document dautres pages traitées manuellement. Selon le même principe, vous pouvez appliquer le mode automatique à une pile de pages, puis vérifier le résultat obtenu et, si nécessaire, retraiter certaines pages manuellement. Cette procédure est décrite au chapitre 3. Voir « Trai t e m en t com b i n é», page 41.
L'Assistant OCR est conçu pour les nouveaux utilisateurs. Voir « Tr a i t e m e n t à l'aide de l'Assistant OCR », page 43. Si un document est ouvert lorsque vous lancez l'Assistant OCR, le programme vous invite à l'enregistrer, puis le ferme. Si vous utilisez lAssistant OCR pour traiter et enregistrer un document, celui-ci est par la suite disponible pour des étapes de traitement supplémentaires (ajout de nouvelles pages, retraitement des pages, etc.) en mode automatique ou manuel.
Bureau OmniPage 25

Gestion de documents

La gestion de documents s'effectue à partir des vignettes de la fenêtre d'image ou du gestionnaire de documents (partie inférieure du bureau OmniPage). Les deux fenêtres comportent des informations succinctes sur les pages du document traité et sont synchronisées. Les illustrations utilisées dans ce manuel présentent ces deux fenêtres avec le même document de sept pages. Les pages 1 et 2 sont sélectionnées et la page 4 est la page actuelle (c.-à-d. la page affichée dans la fenêtre d'image). L'état de la page est indiqué comme suit :
Page État Icône Opérations effectuées sur la page
1 Importée Page importée, mais pas encore reconnue.
2 Reconnue
3
4 Modifiée
5 Modifiée, vérifiée
6 En instance
7 Enregistrée
Reconnue, véri- fiée
Page reconnue, non vérifiée ou vérification interrompue.
Page reconnue et entièrement vérifiée. Page reconnue, avec exécution dans l'éditeur
de texte d'au moins une modification ou un changement de formatage.
Page reconnue, modifiée dans l'éditeur de texte et entièrement vérifiée.
Page importée et peut-être reconnue, avec certains changements de type de zone stoc­kés, mais pas traités.
Page reconnue et enregistrée au moins une fois.

Vignettes

L’onglet Vignettes contient des images réduites de toutes les pages du document. Vu leur pr ésentation verticale, vous devrez peut-être faire défiler les vignettes pour atteindre l’élément requis. La page actuelle présente une icône en forme d'«œil ». Vous pouvez sélectionner plusieurs pages dans un document ; toute page sélectionnée présente un aspect « distinctif ». Utilisez les vignettes pour les opérations de page, comme suit :
Pour passer à une page, cliquez sur sa vignette.
Pour modifier lordre dapparition dune page, cliquez sur sa vignette et
faites-la glisser sur le numéro de page voulu. Les pages sont renumérotées automatiquement.
26 Introduction
Pour supprimer une page, sélectionnez sa vignette et appuyez sur la touche Suppr.
Chapitre 2
Pour sélectionner plusieurs pages adjacentes, maintenez enfoncée la touche Maj. et cliquez sur la première, puis sur la dernière vignette du groupe requis. Pour sélectionner plusieurs vignettes non adjacentes, maintenez enfoncée la touche Ctrl et cliquez sur les pages individuelles pertinentes. Cela permet ensuite de déplacer, supprimer ou soumettre à l’OCR le groupe de pages sélectionnées. Vous pouvez aussi exporter les pages sélectionnées.
Pour afficher des informations sur une image importée, placez le curseur sur la vignette correspondante (les bulles d'aide doivent être activées). La mini-fenêtre qui saffiche spécifie la taille de limage en pixels et en unités de mesure du programme. Vo us êtes également informé de la résolution de l’image.

Gestionnaire de documents

Cette fonction fournit un résumé d'informations sur un document sous la forme d'un tableau. Les rangées représentent les pages ; les colonnes offrent les données statistiques ou d’état des pages, et (le cas échéant) spécifient les statistiques globales du document. L'illustration ci-dessous affiche les colonnes définies par l'utilisateur.
Pour afficher la vignette d’une page, placez le curseur sur son icône d’état.
Entrez des commentaires ou des mots-clés consultables.
La page actuelle présente une icône en forme d'«œil ». Dans le gestionnaire de documents, vous pouvez effectuer les opérations suivantes :
Pour passer à une page, cliquez sur la partie gauche de la rangée de pages ou double-cliquez dans sa rangée.
Pour modifier lordre dapparition dune page, cliquez sur sa rangée et faites-la glisser à l’emplacement requis. Un indicateur saffiche pour vous signaler lendroit dinsertion de la page. Les pages sont renumérotées automatiquement.
Pour supprimer une page, sélectionnez sa rangée et appuyez sur la touche Suppr.
Pour sélectionner plusieurs pages adjacentes, maintenez enfoncée la touche Maj. et cliquez sur la première, puis sur la dernière rangée du groupe requis. Pour sélectionner plusieurs rangées non adjacentes, maintenez enfoncée la touche Ctrl et cliquez sur les éléments individuels pertinents. Cela permet
Gestion de documents 27
ensuite de déplacer, supprimer ou soumettre à l’OCR le groupe de pages sélectionnées. Vous pouvez aussi exporter les pages sélectionnées.
La sélection de plusieurs pages n’affecte pas l’état de la page actuelle. Toutes les pages sélectionnées sont contrastées.

Personnaliser des colonnes dans le gestionnaire de documents

Vou s po uv ez spécifier les colonnes que vous souhaitez inclure dans le gestionnaire de documents. Dans le menu Affichage, cliquez sur Personnaliser les colonnes pour afficher la boîte de dialogue illustrée ci-dessous.
Cet élément est contrasté.
Pour sélectionner (activer) un élément, cochez sa case.
La taille d’image est fournie en pixels.
Pour modifier lordre dapparition des colonnes, contrastez un élément, puis cliquez sur l'une de ces flèches.
28 Introduction
Définissez la largeur de la colonne contrastée.
Définissez les colonnes à afficher, leur largeur et leur ordre dapparition. Le contenu de chaque colonne est décrit en détail dans la rubrique Personnaliser les colonnes du gestionnaire de documents de l'aide en ligne. Vous pouvez modifier la largeur des colonnes tout simplement en faisant glisser les séparations de colonne voulues dans la barre de titre.

Supprimer des pages dun document

Toute suppression de page doit être confirmée et ne peut pas être annulée. Pour supprimer la page actuelle, vous devez recourir à la commande Supprimer la page actuelle du menu Édition. Pour supprimer toutes les pages sélectionnées dans le gestionnaire de documents ou dans la page des vignettes, appuyez sur la touche Suppr ou utilisez la commande Effacer du menu contextuel.
Chapitre 2

Imprimer un document

Pour imprimer un document, utilisez la commande Imprimer du menu Fichier. Vous pouvez décider dimprimer une image de page ou le texte reconnu (c.-à-d., le résultat de lOCR affiché dans l’éditeur de texte). Vous pouvez imprimer tout ou partie des pages d'un document. L'outil Imprimer de la barre d’outils Standard envoie à l'imprimante des images ou du texte, en fonction de la fenêtre active (fenêtre d'image ou éditeur de texte).

Fermer un document

Pour fermer un document, utilisez la commande Fermer du menu Fichier. Si vous navez pas effectué de sauvegarde du document ou si vous y avez apporté des modifications depuis le dernier enregistrement, vous êtes invité à lenregistrer. Pour plus de détails sur lenregistrement dun document au format de document OmniPage (*.OPD), reportez-vous à la section qui suit. Un message vous demande également denregistrer les nouvelles données dapprentissage, si vous avez sélectionné l’option Demander l'enregistrement des données d'apprentissage à la fermeture des documents dans la section Vérification de la boîte de dialogue Options.

Documents OmniPage

Le format Document OmniPage correspond au type de fichier propre à OmniPage Pro (extension .OPD). C'est un des types de fichiers disponibles pour lenregistrement dun document. Le format OPD est destiné à lenregistrement des documents sur lesquels vous avez lintention de retravailler plus tard dans OmniPage Pro. Ainsi, vous pourrez terminer le traitement du document, y ajouter des pages ou modifier le texte reconnu.
Un document OmniPage contient limage de page originale (corrigée et prétraitée) et toute zone tracée sur celle-ci. À lissue de la reconnaissance, un fichier OPD comporte également le résultat de lOCR. Les caractères reconnus sont enregistrés avec leurs coordonnées et détails techniques, ce qui permet de conserver le lien entre limage et le texte correspondant, et rend possible la vérification lors de la réouverture du fichier dans OmniPage Pro.
Au moment de lenregistrement au format de document OmniPage, le logiciel sauvegarde également les réglages en cours (et les nouvelles données dapprentissage). Lors de louverture dun document OmniPage, ses réglages sont appliqués, remplaçant les paramètres du programme.
Documents OmniPage 29

Avantages du format OPD

Le format OPD, proposé parmi dautres types de fichiers disponibles dans OmniPage Pro, est particulièrement adapté aux circonstances suivantes :
Vous ne pouvez pas terminer le traitement dun document au cours de la
session en cours.
Vous souhaitez transmettre le document à dautres utilisateurs disposant
dOmniPage Pro (par exemple, l’envoyer à un spécialiste pour vérification). Votr e b ureau es t équipé d’un scanner générant des images destinées à la reconnaissance et la vérification sur plusieurs postes de travail.
Vous souhaitez mettre en place une archive des documents reconnus dont
les images originales restent accessible. (le texte reconnu permet d’effectuer des recherches par mot-clé et accepte dautres techniques de récupération de documents).
Avant d'installer une mise à jour d'OmniPage Pro, vous devez enregistrer les résultats de la reconnaissance stockés dans les fichiers OPD. En effet, ces fichiers ne seront peut-être pas compatibles avec les nouveaux formats de fichier OPD ; il se peut aussi que seules les images soient conservées. Lorsque vous ouvrez un fichier OPD créé dans OmniPage Pro 10, seules les images sont chargées. Lorsque vous ouvrez un fichier OPD créé dans OmniPage Pro 11, les images et les pages reconnues sont chargées, mais les zones ne sont pas conservées.

Enregistrer au format OPD

30 Introduction
Si vous avez lintention de créer un fichier OPD, il est recommandé d’enregistrer votre document sous ce format dès le début de son traitement (à des fins de protection). Pendant une session de travail, utilisez régulièrement le bouton Enregistrer, et sauvegardez le document à la fin de la session.
Le bouton Enregistrer sauvegarde le document actuel sous le même nom et type de fichier, mais vous pouvez enregistrer votre document sous plusieurs formats. Si, lors du premier enregistrement du document, vous lavez affecté d’un format autre que OPD (par exemple, .doc), utilisez la commande Enregistrer sous du menu Fichier pour le sauvegarder en tant que fichier OPD. Si vous enregistrez un document OPD sous un autre format, le programme ne le réenregistre pas automatiquement au format OPD. Au moment de la fermeture du document ou de l'application, vous serez invité à enregistrer le document en tant que fichier OPD.
La barre de titre indique le nom du fichier dans lequel le document entier a été enregistré pour la dernière fois.
Loading...
+ 76 hidden pages