SCANSOFT OMNIPAGE PRO 12, OMNIPAGE SE, OMNIPAGE SE 12 User Manual

AVIS JURIDIQUES

Copyright © 2002 ScanSoft, Inc. Tous droits réservés. Le logiciel présenté dans ce manuel est fourni sous licence et son utilisation et sa copie sont
soumises aux termes de la licence.
R
EMARQUE IMPORTANTE
ScanSoft, Inc. fournit cette publication « en l'état», sans garantie d’aucune sorte, expresse ou implicite, y compris, mais de manière non limitative, toute garantie implicite de qualité commerciale ou d’adéquation à un usage particulier. Certaines juridictions ne reconnaissant pas les limitations de garantie expresse ou implicite dans certaines transactions, cette clause peut ne pas s’appliquer à votre cas. ScanSoft se réserve le droit de réviser et/ou modifier cette publication périodiquement sans obligation de notification de telles révisions ou modifications.
ARQUES COMMERCIALES
M
ScanSoft, OmniPage, OmniPage SE, OmniPage Pro, PaperPort, Pagis, True Page et Direct OCR sont des marques déposées ou des marques commerciales de ScanSoft, Inc. enregistrées aux États-Unis et/ou dans d'autres pays.
Tous les autres noms de société ou de produit cités peuvent être des marques de leurs propriétaires respectifs.
ScanSoft, Inc.
9 Centennial Drive Peabody, MA 01960 États-Unis
ScanSoft Belgium BVBA
Guldensporenpark 3 2 BE-9820 Merelbeke Belgique
Numéro de référence: 58-281201-01A

T ABLE DES MATIÈRES

PRÉSENTATION GÉNÉR ALE 7
Utilisation de ce manuel 8
Consultation de laide en ligne 9
Aide HTML en ligne 9 Aide contextuelle 9 Notes techniques 10 Glossaire 10 OmniPage SE 10
1INSTALLATION ET CONFIGURATION 11
Environnement requis 12 Installation de OmniPage SE 13 Configuration dun scanner pour utilisation avec
OmniPage SE 14 Lancement de Omn iPage SE 16 Enregistrement de OmniPage SE 17 Nouvelles fonctions dOmniPage Pro 12 17 OmniPage SE et OmniPage Pro 12 19
2INTRODUCTION 21
Reconnaissance optique de caractères (OCR) 22
Technologie OCR d’OmniPage SE 22 Documents dans OmniPage SE 23 Principales étapes de lOCR 23
Bureau OmniPage 24
Barre des menus 25
OmniPage SE Manuel d’utilisa tion iii
Barres d’outils 25 Fenêtre d'image 26 Éditeur de texte 26 Boîte à outils OmniPage 27
Gestion de documents 28
Vignettes 28 Gestionnaire de documents 29 Personnaliser des colonnes dans le
gestionnaire de documents 30 Supprimer des pages dun document 30 Imprimer un document 31 Fermer un document 31
Documents OmniPage 31
Avantages du format OPD 32 Enregistrer au format OP D 32
Réglages 33
3TRAITEMENT DES DOCUMENTS 35
iv Table des matières
Guide de démarrage rapide 36
Charger et reconnaître les exemples de
fichiers image 36 Numériser et reconnaître un document
d'une page 36
Présentation du traitement 38 Traitement automatique 40
Arrêter et relancer le traitement automatique 41
Traitement manuel 42 Traitement combiné 43 Traitement à l'aide de l'Assistant OCR 45 Traitement à partir dautres applications 46
Configuration de Direct OCR 47
Utilisation de Direct OCR 47 Utilisation de OmniPage SE avec PaperPort 48
Traitement de documents avec Planifier OCR 49 Définition de la source des images de page 50
Importer des fichiers image 50 Importer des documents à partir dun scanner 51 Numériser avec un chargeur ADF 53 Numériser sans chargeur ADF 53
Définition de la mise en page du document 54 Zones et fonds 55
Découpage en zones automatique 56 Traçage de zones manuel 56 Types et propriétés de zone 58 Gestion des zones 60
Gestion des grilles du tableau dans limage 62 Utilisation des gabarits de zone 64
4VÉRIFICATION ET ÉDITION 67
Modes daffichage de l’éditeur de texte 68 Vérification des résultats de lOCR 69 Vérification du texte reconnu 70 Dictionnaires utilisateur 72 Apprentissage 73
Apprentissage manuel 74 IntelliTrain 74 Fichiers d’apprentissage 75
Édition du texte et des images 77 Édition en direct 79 Lecture du texte à voix haute 80
OmniPage SE Manuel d’utilisation v
5ENREGISTREMENT ET EXPORTATION 83
Enregistrement des images originales 84 Enregistrement des résultats de lOCR 85
Enregistrement dun document lors
dune session de travail 86 Sélection dun niveau de formatage 87 Sélection des options d'enregistrement évoluées 88 Enregistrement dun document au format PDF 90
Copie des pages dans le Presse-papiers 90 Ajout de pages à un e-mail comme pièce jointe 91
6INFORMATIONS TECHNIQUES 93
Dépannage 94
Solutions de premier recours 94 Test de OmniPage SE 95 Augmentation de la quantité de mémoire
disponible 96 Augmentation de l'espace disque 96 Reconnaissance de texte incorrecte 97
vi Table des matières
Reconnaissance de fax incorrecte 98 Problèmes de système ou de performances
pendant l’OCR 98
Support ODMA 99 Fonctions évoluées du module Planifier OCR 99 Types de fichier supportés 100
Types de fichier pour louvertu r e et
lenregistrement des images 100 Types de fichier pour l’enregistrement
des résultats de l’OCR 102
Désinstallation du logiciel 103

Présentation générale

Nous vous remercions de la confiance que vous portez à OmniPage® SE. La documentation citée ci-dessous est destinée à vous présenter le programme et à faciliter son utilisation.
Manuel de référence
Le présent manuel fournit des informations relatives aux principes d'utilisation d'OmniPage SE (Special Edition) : procédures dinstallation et de configuration, description des commandes et zones de travail disponibles, instructions de réalisation de différentes tâches, méthodes de personnalisation et de gestion de traitement et diverses informations techniques. Ce manuel est proposé au format PDF ; vous pouvez ainsi utiliser les outils de navigation de votre afficheur PDF et les liens hypertexte intégrés pour passer aux différentes sections du document.
Aide en ligne
Laide en ligne dOmniPage SE contient des informations sur les fonctions, les réglages et les procédures relatives au logiciel. Au format HTML, cette aide a été conçue pour garantir une consultation aisée et rapide. Son module daide contextuelle très complet assure une assistance suffisante pour vous permettre daccomplir sans délai les opérations requises. Voir « Consultation de laide en ligne », page 9.
Fichier ReadMe/LisezMoi
Ce fichier au format HTML comporte les informations de dernière minute concernant le logiciel. Il est vivement recommandé de le consulter avant dutiliser OmniPage SE. Pour ouvrir le fichier ReadMe/LisezMoi, vous pouvez, lors de linstallation dOmniPage SE, sélectionner loption ReadMe/LisezMoi, ou, à tout moment, choisir la commande correspondante dans le menu Aide.
Informations de numérisation et renseignements divers
Le site Web de ScanSoft (www.scansoft.com) fournit des informations actualisées au sujet du programme. La section « Scanner Guide » contient des données régulièrement mises à jour et relatives aux scanners supportés et à d'autres ques tio ns y a f férentes ; ScanSoft effectue des tests sur les 25 modèles les plus répandus. Pour accéder au site Web de ScanSoft, vous pouvez, lors de l’installation d’OmniPage SE, sélectionner l’option d’accès au site Web, ou, à tout moment choisir la commande correspondante dans le menu Aide.
OmniPage SE Manuel dutilisation 7

Utilisation de ce manuel

Ce manuel présuppose que vous maîtrisez les principes de travail dans lenvironnement Microsoft Windows. Pour tous détails sur cet environnement (utilisation des boîtes de dialogue, des menus déroulants et contextuels, des barres de défilement, de la fonction Glisser-déplacer, etc.), reportez-vous à la documentation Windows appropriée.
Vous devriez également connaître le fonctionnement de votre scanner et de son logiciel. Avant de procéder à la configuration du scanner avec OmniPageSE, assurez-vous quil est installé et qu’il fonctionne correctement. Reportez-vous, si nécessaire, à la documentation du scanner.
Ce manuel utilise les conventions suivantes :
Texte en gras
Texte en italiques
Police sans empattement
Introduit les nouveaux termes et signale les titres des différentes sections de chaque chapitre.
Indique le nom des rubrique s de l'aide en li gne. Indique le te xte développé des options dans les boîtes de dialogue.
Indique les noms de fichier, tels que exemple.tif
Présente une remarque qui introduit des informations supplémentaires.
Présente un conseil qui introduit des suggestions sur laccomplissement de tâches spécifiques à laide des fonctions du logiciel.
L'icône SE, placée en marge de certaines sections, vous permet d'identifier rapidement les différences entre OmniPage SE et OmniPage Pro 12. Voir « OmniPage SE », page 10.
8 Présentation générale

Consultation de l’aide en ligne

L’aide en ligne d’OmniPageSE contient des informations sur les fonctions, les réglages et les procédures relatives au programme. Le système daide devient disponible dès linstallation du logiciel.

Aide HTML en ligne

Pour accéder à l’aide en ligne dOmniPageSE, choisissez la commande Aide OmniPageSE dans le menu daide. Vous pourrez obtenir les informations requises en consultant des rubriques de la table des matières, en sélectionnant des mots-clés dans lindex alphabétique ou en effectuant des recherches sur lintégralité du texte daide. Les autres commandes du menu Aide vous permettront d’accéder à de nombreux sujets ou pagesWeb utiles.
Lors de lutilisation dOmniPage SE, vous pouvez consulter la rubrique d’aide relative à la boîte de dialogue, la zone d ’écran ou le message affiché en appuyant sur la touche F1.

Aide contextuelle

Pour afficher des informations succinctes sur un élément d’interface dOmniPage SE (commande de menu, bouton de barre doutils, groupe doptions, boîte de dialogue, etc.), vous pouvez procéder des manières suivantes :
Pour afficher la rubrique d aide relative à un élément du bureau en dehors d une boîte de dialog ue ou dune fenêtre d e message, cli quez sur le b out on d’aide dans la barre d’outils standard afin d’afficher l’icône daide (flèche accompagnée d’un point dinterrogation), puis cliquez sur cette icône et sur l’élément requis.
Vous pouvez également afficher cette icône via la séquence Maj.+ F1. Cette combinaison affiche l'aide relative aux commandes des menus contextuels.
Pour afficher une min i-fenêtre décrivant un élément de boîte de dialogue, cliquez sur le point dinterrogation situé dans langle supérieur droit de la boîte en question puis sur l’élément requis.
Certaines boîtes de dialogue ou fenêtres de message comportent un bouton Aide (icône ou libellé). Pour accéder aux informations sur leurs éléments, cliquez sur ce bouton.
Pour supprimer une fenêtre daide contextuelle, cliquez n’importe où sur le bureau.
OmniPage SE Manuel dutilisation 9

Notes techniques

Le site Web de ScanSoft (www.scansoft.com) propose des notes techniques (Tech Notes) concernant les problèmes les plus courants concernant l'utilisation
dOmniPage l'installation et le dépannage du logiciel.
®
. Ces pages Web peuvent également inclure des conseils sur

Glossaire

Ce manuel ne comporte pas de glossaire. En revanche, l'aide en ligne inclut un glossaire exhaustif, assorti d'un index alphabétique et d'une table des matières. Consultez-le pour trouver la définition d'un terme utilisé dans ce manuel ou dans le programme.

OmniPage SE

La version dOmniPage dont vous disposez est une version spéciale de lapplication OmniPage Pro
certains fabricants de scanners et ne comprend pas lensemble des fonctionnalités dOmniPage Pro 12. Ce guide ainsi que laide en ligne offrent une descript ion de lensemble de s f onc ti onnalités du produit. L’icône SE, placée en marge de certaines sections, vous permet didentifier rapidem ent les différences entre chacune des versions.
Si vous êtes intéressé par les fonctionnalités supplémentaires offertes par la version professionnelle du produit, consultez notre site Web pour effectuer une mise à niveau vers OmniPage Pro 12.Voir « OmniPage SE et OmniPage Pro 12 », page 19.
®
. Cette version a spécialement été conçue pour
10 Présentation générale
Chapitre 1

Installation et configuration

Ce chapitre contient les informations nécessaires à l'installation et au lancement d'OmniPage SE, soit les sections suivantes :
Environnement requis
Installation de OmniPage SE
Configuration dun scanner pour utilisation avec OmniPageSE
Lancement de OmniPageSE
Enreg istrement de OmniPage SE
Nouvelles fo nctio ns dOmniPage Pro 12
OmniPage SE et OmniPage Pro 12
OmniPage SE Manuel d’utilisation 11

Environnement requis

Pour installer et utiliser OmniPageSE 2.0, vous devez prévoir l’environnement minimum suivant:
Processeur Pentium ou supérieur
Microsoft Windows 98 (à partir de la Deuxième Édition),
Windows Me, WindowsNT 4.0 (avec au moins Service Pack 6), Windows2000 ou Windows XP
64 Mo de mémoire RAM (128Mo recommandés)
90 Mo despace disque disponible destiné aux fichiers dapplication,
plus 5 Mo despace disponible lors de l’installation
5 Mo pour Microsoft Installer (MSI) si absent de votre système (ce
module est inclus dans le système d'exploitation Windows Me, Windows2000 et Windows XP)
Affichage SVGA avec 256 couleurs. Couleur 16 bits et résolution
de800x600pixels recommandées [65536 couleurs dans Windows 2000 et Moyenne (16 bits) dans XP].
Souris (ou équivalent) compatible Windows
Lecteur de CD-ROM (pour linstallation)
12 Installation et configuration
Scanner compatible avec le pilote approprié (si vous prévoyez de
numériser des documents). Pour consulter la liste des scanners supportés, reportez-vous au guide des scanners (Scanner Guide) sur le site We b de ScanSoft (www.scansoft.com).
Vous obtiendrez de meilleures performances avec un processeur plus puissant, et des valeurs supérieures de RAM et despace disque.
Installation de OmniPage SE
Pour vous guider dan s linstallation, OmniPage SE affiche des i n stru ctions sur chaque écran.
Ava nt de lancer linstallation dOmniPage SE, respectez les points suivants :
Fermez les applications actives, en particulier les logiciels antiv irus.
Si vous installez OmniPage SE sur un système Windows NT,
Windows2000 ou Windows XP, ouvrez une session avec privilèges dadministrateur.
Si une version antérieure d'OCR de Sca nSoft est déjà installée sur votre
ordinateur, le programme d'installation vous demandera l'autorisation de désinstaller le logiciel existant.
Pour installer OmniPage SE :
1. Insérez le CD-ROM OmniPage SE dans le lecteur approprié. En principe, le programme dinstallation démarre automatiquement. Si ce n’est pas le cas, ouvrez lExplorateur Windows, cliquez sur l’icône du lecteur de CD-ROM, puis cliquez deux fois sur le fichier de programme
Autorun.exe.
Chapitre 1
2. Choisissez la langue dinstallation souhaitée. Ce choix détermine également la version du module Texte-parole et la langue de l' interface du p rogramme . L'interface du programme affiche dans la langue choisie des éléments tels que les commandes de menu, les boîtes de di alogue, les fenêtres de message, etc. Vous pouvez modifier la langue dinterface ultérieurement, via les options du logiciel, mais la sélection effectuée lors de l’installation détermine la version du mo dul e Texte-par o le in st al lée. Veuillez noter que le module Texte-parole n'est pas disponible dans OmniPage SE.
3. Pour installer le logiciel, suivez les instructions affichées sur les écrans successifs. Tous les fichiers nécessaires à la n umérisation sont copiés automatiquement lors de l’installation.
Certains problèmes peuvent être résolus en désinstallant puis en réinstallant OmniPage SE. Voir « Désinstallation du logiciel », page 103.
Dans OmniPage Pro 12, le module Texte-parole est disponible en français, anglais (britannique et américain), allemand, italien, portugais et espagnol. Ce module n'est pas disponible dans OmniPage SE. Voir « Le cture du texte à voix haute », page 80.
Installation de OmniPage SE 13
Configuration dun scanner pour utilisation avec OmniPage SE
Tous les fichiers nécessaires à la configuration et au support du scanner sont copiés automatiquement lors de linstallation du programme. Avant de numériser des documents à laide dOmniPageSE, vous devrez vérifier que votre scanner est installé correctement, avec le pilote approprié, et tester son fonctionnement. Les pilotes du scanner ne sont pas fournis avec OmniPage SE.
L’installation et la configuration du scanner s’effectuent via l’Assistant du scanner, que vous pouvez lancer vous-même, en appliquant les procédures décrites. Sinon, l'Assistant du scanner apparaît la première fois que vous tentez une numérisation.
Pour configurer votre scanner avec OmniPageSE à l’aide de l'Assistant du scanner, suivez les étapes suivant es:
Choisissez DémarrerProgrammes ScanSoft
OmniPage SE 2.0 ou cliquez sur le bouton Configuration dans longlet Scanner de la
boîte de dialogue Options. ou choisissez un paramètre de numérisation dans la zone de liste
déroulante Importer une page de la boîte à outils et cliquez sur le bouton Importer une page.
Assistant du scanner.
14 Installation et configuration
L'Assistant du scanner démarre. La première fenêtre s'affiche uniquement lors de la configuration initiale, à partir d'OmniPage SE.
Choisissez Sélectionner un scanner ou un appareil photo numérique,
puis cliquez s ur Suivant. La liste de tous les pilotes de scanner TWAIN détectés s'affiche ; le scanner pa r défaut du système e s t sélectionné.
Cliquez une fois pour sélectionner le pilote de scanner voulu. Si vous
devez rechercher un pilote, cliquez sur Autres pilotes. Si vous voulez masquer l'interface de votre scanner au cours de la numérisat ion ou modifier la méthode de transfert des images, sélectionnez Configurer les paramètres évolués pour ouvrir une fenêtre supplémentaire. Cliquez sur Suivant.
Choisissez Oui pour tester la configuration de votre scanner , puis
cliquez sur Suivant. L'Assistant vérifie la connexion de l'ordinateur au scanner. À l'issue de lopération, cliquez sur Suivant.
Chapitre 1
Insérez une page de test dans le scanner. L'Assistant est prêt à effectuer
une numérisation de base au moyen du logiciel fourni par le fabricant du scanner. Cliquez sur Suivant. L'interface utilisateur native de votre scanner s'affiche.
Cliquez sur Numériser pour lancer la numérisation de la page de test.
Si nécessaire, cliquez sur Image inversée ou Image manquante et
effectuez les sélections appropriées.
Si l'image affichée dans la fenêtre est correcte, cliquez sur Suivant.
Sélectionnez l'élément qui décrit le mieux votre sc anner, puis cliquez
sur Suivant.
Cliquez sur Suivant pour passer à la sélection de la taille de page.
Les tailles de page qu e l'Assistant du scanner attribue à votre scanner
sont indiquées dans la fenêtre. Pour modifier les tailles de page, cliquez sur Évolué, effectuez les changements voulus et cliquez sur Suivant.
Insérez dans le scanner une page contenant du texte, mais pas d'image.
Cliquez sur Suivant pour lancer une numérisation en noir et blanc.
Si nécessaire, cliquez sur Image inversée ou Image manquante et
effectuez les sélections appropriées.
Si l'image affichée dans la fenêtre est correcte, cliquez sur Suivant.
Si vous disposez d'un scanner couleur, insérez une photographie
couleur ou une page comportant une image couleur. Cliquez sur Suivant pour lancer une numérisation en couleur. Si nécessaire, cli quez sur Image inversée ou Image manqua nte et effec tuez les sélections appropriées. Si l'image affichée dans la fenêtre est correcte, cliquez sur Suivant. Si votre scanner ne gère pas la couleur, ignorez cette étape.
Insérez dans le scanner une photographie ou une page contenant une
image. Cliquez sur Suivant pour lancer une numérisation en niveaux de gris. Si nécessaire, cliquez sur Image inversée ou Image manquante et effectuez les sélections appropriées. Si l'image affichée dans la fenêtre est correcte, cliquez sur Suivant.
Vous venez de configurer votre scanner pour utilisation avec
OmniPageSE. Cliquez sur Terminer.
Pour modifier les réglages du scanner par la suite ou pour configurer un autre scanner, ouvrez de nouveau l'Assistant de configuration du scanner depuis le menu Démarrer de Windows ou depuis longlet Scanner de la boîte de dialogue Options. Pour tester et dépanner un scanner ne fonctionnant pas correctement, ouvrez l'Assistant du scanner depuis le menu Démarrer de Windows et
Configuration dun scanner pour utilisation avec OmniPa geSE 15
sélectionnez Tester scanner/appareil photo numérique dans la première fenêtre, puis appliquez la procédure décrite ci-dessus.
Lancement de OmniPage SE
Pour lancer OmniPageSE, effectuez l'une des opérations suivantes :
Dans la barre des tâches Windows, cliquez sur Démarrer et choisissez
Programmes
Cliquez deux fois sur l’icône OmniPage SE située dans le dossier
dinstallation dOmniPage SE ou sur le bureau Windows (si vous ly avez placée).
Cliquez deux fois sur l’icône ou le nom de fichier dun document
OmniPage (OPD) pour le charger. Voir « Documents OmniPage», page 31.
Lorsque vous ouvrez l ’application, l’écran d’accueil puis le bur eau OmniPage SE s’affichent. Voir « Bureau OmniPage », page 24. Cette section présente les principales zones de travail du progra mme.
Vous pouvez également exécuter le programme avec une interface limitée:
Ouvrez le programme Planifier OCR. Dans la barre des tâches
Windows, cliquez sur Démarrer et choisissez Programmes OmniPage Pro 12.0 avec Planifier OCR », page 49. Cette fonction n'est pas disponible dans OmniPage SE.
ScanSoft Omn iPage SE 2.0 OmniPage SE 2.0.
ScanSoft
Planifier OCR. Voir « Traitement de documents
16 Installation et configuration
Dans une application déclarée dans Direct OCR, choisissez Acquérir
texte dans le menu Fichier. Voir «Configuration de Direct OCR », page 47.
Cliquez avec le bouton droi t sur une icône ou un nom de fichier image
pour afficher son menu contextuel. Choisissez la sous-option r equise d e la commande Convertir en pour définir une cible.
Pour ajouter des services dOCR, utilisez OmniPageSE avec les
produits de gestion de documents de ScanSoft, PaperPort Voir « Utilisation de OmniPage SE avec PaperPort », page 48.
®
ou Pagis®.
Chapitre 1
Enregistrement de OmniPage SE
L’Assistant d’enregistrement ScanSoft est lancé à l’issue de l’installation du programme. L’enregist rement s’effectue via un formulaire électronique facile à remplir (moins de cinq minutes). Lorsque vous avez terminé de remplir le formulaire et que vous cliquez sur Envoyer, le programme tente de se connecter à Internet pour accomplir lenregistrement.
Si vous nenregistrez pas votre copie du logiciel pendant son installation, le programme vous invitera à intervalles réguliers à accomplir cette formalité. Vous pouvez visiter le site Web (www.scansoft.com) pour vous enregistrer en ligne. Cliquez sur Support, puis dans l'écran de support principal, choisissez Enregistrer dans la colonne de gauche.
Pour plus de détails sur l'utilisation de vos données d'enregistrement, reportez-vous à la clause relative à la confidentialité de la politique de ScanSoft.
Nouvelles fonctions d’OmniPage Pro 12
La famille de produits OmniPage® compte désormais OmniPage Pro 12 et OmniPage SE. Cette section présente les améliorations apportées à Omn iPage Pro 12. Comme l'indique la section suivante, certaines de ces fonctionnalités sont également comprises dans OmniPage SE. Nouvelles fonctionnalités de OmniPage Pro 12 par rapport à OmniPage Pro 11:
Importante augmentation de la précision
De nouveaux niveaux de précision avec l'amélioration de la synergie entre les moteurs de reconnaissance, le support des dictionnaires professionnels et l'apprentissage possible des cara c tères choisis par l'utilisateur.
Rationalisation de l’interface
V ous pouvez e ffectuer le trai tement automatique et manuel d irectement à partir de la boîte à outils OmniPage, sans avoir recours à des barres d'outils séparées (voir la page 27). Les vignettes apparaissent dorénavant dans la fenêtre d'image; vous pouvez choisir d'afficher la page courante, la page des vignettes ou les deux (voir page 28). La vue Détails de la version précédente a été remplacée par le gestionnaire de documents, qui inclut une colonne de remarques pour les commentaires et les mots-clés explorables.
Nouveaux concepts de zones
La fonction de découpage en zones « en direct » permet de modifier des zones « à la volée », sans devoir relancer la reconnaissance de la page
Enregistrement de OmniPage SE 17
entière (voir page 79). Le fond des pages est affecté du type Traiter (découpage en zones automatique) ou Ignorer ; par conséquent lintégralité des instructions de découpage en zones apparaît sur la page et vous pouvez enregistrer celles-ci dans des gabarits de zone (voir page 55). Les procédures à suivre pour tracer des zones irrégulières, ainsi que diviser et joindre des zones, ont été simplifiées et elles n'exigent aucun outil séparé (voir page 60).
Amélioratio n d e la vérification
La boîte de dialogue Vérificati on de lOCR a ffiche mainte nant les mots douteux dans un conte xte étendu. Un vérificateur dynamique peut rester ouvert pendant la vérification du texte, tandis que l'affichage et la fenêtre d'image suivent le contexte d'édition (voir page 69).
Niveaux de formatage pour laffichage et lenregistrement
L'affichage dans l'éditeur de texte accepte trois niveaux de formatage (voir page 68). Le niveau de formatage de sortie est désormais sélectionné au moment de l'exportation ; les sélections po ssibles dépendent du type de fichier spécifié. L’option d'exportation Pages en continu est une version améliorée de la vue Conserver l'enchaînement des colonnes de la version précédente. Elle conserve la mise en page, si possible sans cadres et blocs de texte, pour la disposition du texte entre les colonnes (v oir page 87).
Meilleure analyse des pages
Le transfert du formatage des tableaux a été amélioré, en particulier la détection des tableaux dépourvus de traits de grille dans les pages originales. Les adresses Web et e-mail peuvent être détectées et transférées vers l'éditeur de texte ; vous pouvez également insérer des hyperliens. L'ordre de lecture peut maintenant être affiché et modifié
après reconnaissance dans la vue True Page
®
de l'éditeur de texte. Voir à
partir de page 77.
18 Installation et configuration
Meilleur traitement PDF
OmniPagePro 12 recherche le texte de fond dans les PDF qu'il ouvre, afin de garantir une précision de reconnaissance supérieure. Un nouveau type de fichier, PDF édité, assure une bonne conservation du format sur les pages modifiées dans l'éditeur de texte à l'issue de la reconnaissance.
Options d'enregistrement évoluées
La gamme des optio ns de sauve gard e a été enrichie pour chaque type de fichier de sortie. Les types de fichier de sortie définis par l'utilisateur peuvent être créés sur la base de réglages personnalisés (voir page 88). Si votre version dOmniPagePro 12 inclut les nouveaux formats d'enregistrement XML et eBook, voir page102.
Chapitre 1

OmniPage SE et OmniPage Pro 12

La liste suivante répertorie les fonctionnalités de la version professionnelle d'OmniPage Pro 12 qui n'ont pas été ajoutées à OmniPage SE :
Meilleur niveau de reconnaissance.
Accès au module d'apprentissage, IntelliTrain et aux fichiers
d'apprentissage pour la reconnaissance de caractères.
Capacité d'ouverture et de lecture du contenu de fichiers PDF.
Capacité d'enregistrement des fichiers reconnus au format PDF.
Numérisation en vis-à-vis pour numériser les livres en un clin d'œil.
Des fonctionnalités de formatage des pages en continu permettant une
conservation parfaite de la mise en page.
Planifiez l'OCR pour que vos travaux soient traités de façon
automatique et selon un horaire défini.
Gestion des formats d'image TIFF LZW et GIF en entrée et sortie.
Exportation aux formats eBook et XML.
Prise en charge de la sortie WYSIWYG HTML 4.0.
Nombre de langues reconnues passant de 50 à plus de 100. Accès à des
dictionnaires juridiques et médicaux dans certaines langues.
Accès au module Texte-parole RealSpeak, permettant la lecture à voix
haute des textes reconnus.
Pour obtenir une mise à niveau, consultez le site www.scansoft.com.
OmniPage SE et OmniPage Pro 12 19
20 Installation et configuration
Chapitre 2

Introduction

De nos jours, la plupart des activités professionnelles (correspondance, création de rapports, gestion des données, etc.) font appel à un ordinateur et pourtant, certaines sources dinformation circulent toujours sous la forme imprimée et ne sont pas directement exploitables par la machine.
Ainsi, si vous voulez insérer un article de magazine au format papier dans un rapport en cours de création sur ordin a teur, vous devez trouver un moyen de le faire, en évitant la saisie manuelle, source d'erreur et synonyme de perte de temps.
OmniPage SE vous propose une solution sûre: la reconnaissance optique de caractères (OCR). Ce chapitre décrit lemploi de la technologie OCR par OmniPageSE dans le but de transformer les informations contenues dans vos documents numérisés ou fichiers image en données électroniques éditables par vos applications habituelles.
Ce chapitre propose les sections suivantes:
Reconnaissance optique de caractères (OCR)
Documents dans OmniPage SE
Principales étapes de lOCR
Bureau O mniPage
Gestion de doc uments
Documents OmniPage
Réglages
OmniPage SE Manuel dutilisation 21

Reconnaissance optique de caractères (OCR)

La reconnaissance optique de caractères (OCR) est une opération qui consiste à extraire du texte dune image obtenue pa r numérisation dun document papier ou par ouverture dun fichier image électronique. directement utilisable car ses caractères se composent de groupes de points (pixels).
Pendant la reconnaissance, OmniPage SE analyse limage proposée, identifie les caractères quelle contient et définit les solutions permettant de les transformer en texte éditable. À l’issue de la reconnaissance, le texte peut être enregistré dans la plupart des applications (logiciels de traitement de texte ou de PAO, tableurs, etc.).
Technologie OCR d’OmniPage SE
Outre le texte, OmniPage SE peut reconnaître les éléments et caractéristiques suivants du document :
Éléments graphiques
Photos, logos, illustrations, etc.
Format age du texte
Format des caractères, tel que type (Arial, Times New Roman...), corps (8, 12) et style (gras, italique, souligné tel que retraits, tabulations, marges et interlignes.
) d'une police. Format des paragraphes,
Le texte d’une image n’est pas
22 Introduction
Mise en page
Agencement des colonnes, agencem ent de s tabl ea ux, e mpl ace ment d es éléments graphiques et des en-têtes.
Les éléments et caractéristiques conservés par OmniPage SE dépendent des réglages sélectionnés pour chaque document. Pour plus de détails sur le choix des réglages, consultez la rubrique Conseils de réglages de laide en ligne OmniPage SE.
OmniPage SE reconnaît uniquement les caractères imprimés, tels que les sorties imprimante ou le texte tapé à la machine. Vous pouvez toutefois lui demander de conserver un bloc de texte manuscrit (une signature, par exemple) en affectant celui-ci du type de zone Graphique.
Chapitre 2
Documents dans OmniPage SE
OmniPage SE gère les documents de façon individuelle. Lors que vous impor tez la première image (à partir dun scanner ou d’un fichier), le programme crée un document. Toutes les images impo rtées par la suite sont ajoutées à ce document, jusqu’à son enregistrement et sa fermeture.
Dans OmniPage SE, un document comporte une ou plusieurs pages, chacune delles constituée par une image importée. Après la reconnaissance, le document comportera également le texte reconnu correspondant à ses images (affichable via l’éditeur de texte) et des graphiques ou des tableaux éventuels. Voir « Bureau OmniPage », page 24.

Principales étapes de lOCR

OmniPage SE propose deux modes de traitement des documents : automatique et manuel. Voir « Traitement automatique », page 40 et « Traitement manuel », page 42. Les deux modes impliquent globale me n t les mêmes étapes princi pales :
1. Importer des images de document dans OmniPage SE
Vous pouvez numériser un document papier (avec ou sans le chargeur de feuilles automatique [ADF]) ou charger un ou plusieurs fichiers image. Les images importées apparaissent sous la forme de vi gnettes dans la fenêtre d'image ; l'image de la première page est affichée. Les informations relatives aux pages concernées s'affichent dans le gestionnaire de documents. Voir « Définition de la source des images de page », page 50.
2. Exécu te r lOCR pour obtenir du texte éditable
Pend ant la reconnai ssance, OmniPage SE trace des zones autour des parties de l’image à traiter, puis interprète le contenu textuel et graphique de chaque zone. Vous pouvez également créer des zones manuellement ou en appliquant un gabarit de zones prédéfini. À l’issue de la reconnaissance, vous pouvez détecter et corriger les erreurs éventuelles à l’aide du module de vérification de lOCR et éditer le document dans l’éditeur de texte.
3. Exporter le document vers la destination de votre choix
Une fois le docu ment re connu, vous pouv ez l’enregistrer dans un fichier (en spécifiant le nom et le type voulus), le copier dans le Presse-papiers ou l’envoyer comme pièce jointe d’un e-mail. Vous pouvez également l’enregistrer au format de document OmniPage (OPD) selon la procédure décrite ci-après. Un même document peut être enr egi stré plusieurs fois avec différents réglages d’emplacement, de type de fichier, de formatage, etc., selon vos besoins. Voir «Enregistrement et exportation», page 83.
Reconnaissance optique de caractères (OCR) 23
Barre d’outils Standard
Boîte à outils OmniPage
L’onglet Vignettes contient d es images réduites de toutes les pages du document.
La page actuelle présente une icône en forme d'« œil ».
Ce symbole marque une page reconnue.

Bureau OmniPage

Le bureau OmniPage dispose dune barre de titre et de menus dans sa partie supérieure et dune barre d’état dans sa partie inférieure. Il est composé de trois espaces de travail ou fenêtres : gestionnaire de documents, fenêtre d'image et éditeur de texte. Dans leur partie supérieure, ces trois espaces de travail comprennent les boutons de fermeture, d'agrandissement et de réduction de la fenêtre. La Fenêtre d'image est munie de la barre doutils Image et la fenêtre Éditeur de texte de la barre doutils Formatage.
Barre doutils Formatage
Barre d’outils Image
Boutons pour explorer le document
Boutons permettant d'af fich er ou de masquer le gestionnaire de documents, l'éditeur de texte et l’affichage des vignettes et de la page actuelle pour la fenêtre d'image. Vous pouvez également effectuer ces opérations depuis le menu Affichage.
24 Introduction
Faites glisser ces barres de fractionnement pour redimensionner les zones de travail.
Fenêtre d'image :
Cette fenêtre affiche l'image de la page actuelle et indique les zones tracées. La fenêtre d'image peut afficher la page actuelle, la page des vignettes ou les deux.
Boutons de l’éditeur de texte offrant trois niveaux de formatage.
Éditeur de texte :
Affiche le résultat de la reconnaissance de la page actuelle en mode True Page.
Barre d’outils
Chapitre 2
L’exemple utilisé s’appuie sur un document de trois pages. La page 1 représente la page actuelle, reconnue et vérifiée; la page2 a été reconnue mais non vérifiée; la page 3 a été importée et divisée manuellement en zones, mais n’a pas été reconnue. L’icône figurant dans la partie inférieure de chaque vignette indique l’état de la page correspondante.
Les boutons de la barre d’état vous permettent dafficher et de masquer les fenêtres du bureau OmniPage SE, et de passer à dautres pages du document. Un clic avec le bouton droit dans une fenêtre affiche son menu contextuel avec les commandes les plus utiles pour cette fenêtre.

Barre des menus

Pour obtenir des informations succinctes sur une commande de menu, cliquez sur le bouton daide contextuelle puis sur la commande concernée. La fenêtre qui apparaît explique la fonction de la commande. Pour fermer cette fenêtre, cliquez n’importe où sur l’écran.
Barres d’outils
Le programme propose trois barres d'outils principales, qui peuvent toutes être flottantes, si besoin. Le menu Affichage permet de les afficher, de les masquer et de les personnaliser. L'aide contextuelle explique l'action de chaque outil. Deux barres d'outils supplémentaires permettent de piloter des tâches spécifiques.
Emplacement p ar
défaut
Autres emplace­ments d'ancrage
Action
Standard
Image
Formatage
Vérificateur
Réagencement
Horizontalement sous la barre de menus
Verticalement à gau­che de la page d'image actuelle
Horizontalement en haut de l'éditeur de texte
Placez le curseur sur la fenêtre du vérificateur pour afficher cette barre d'outils flottante.
Cliquez sur loutil Changer lordre de lecture. Cette barre doutils remplace la barre d’outils Formatage.
Tout bord du bureau OmniPage
Verticalement à droite de la page d'image actuelle
Aucun
Exécution des fonctions de base du pro­gramme. Voir page 31 et page 69.
Opérations sur les images, les zones et les tableaux. Voir page 55 et page 62.
Formatage du texte reconnu dans l'édi­teur de texte. Voir page77.
Contrôle de l'emplacement et de l'aspect du vérificateur. Voir page 70.
Modification de l'ordre des éléments dans les pages reconnues. Voir page 77.
Bureau OmniPage 25

Fenêtre d'image

Lorsque cette fenêtre affiche l'image de page actuelle, la barre d'outils Image est disponible. Les images de page possèdent toutes une valeur de fond: Traiter ou Ignorer. Les zones peuvent être tracées manuellement sur les images de page ou placées automatiquement à l'issue de la reconnaissance. Il existe cinq types de zones : Traiter, Ignorer, Texte, Tableau et Graphique. Les zones sont automatiquement tracées pour les éléments placés à l'intérieur des zones Traiter et sur un fond Traiter en dehors d'autres zones, et l eurs types de zones sont déterminés pendant le traitement. Voir « Zones et fonds », page 55.
Si l'image de p a ge actuelle est masquée, les vignettes apparaissent en rangées pour assurer un e utilisation optimale de l'espace disponible.
26 Introduction

Éditeur de texte

L'éditeur de texte affiche les résulta ts de la reconna i ssance selo n troi s niv eaux de formatage :
Aucun for matage
Conserver le formatage polices/paragraphes
True Page
Le mode T rue Page conserve la mise en page sur la base des cadres et des blocs de texte, de tableaux et d'images. True Page peut afficher des zones multicolonnes, afin de présenter des blocs de texte pouvant être assimilés à un enchaînement de colonnes au moment de l'exportation. True Page correspond également à un niveau de formatage d'exportation, de même que Pages en contin u, qui conserve la mise en page sans blocs ni cadres. Voir « Mo des d’affichage de l’éditeur de texte », page 68. OmniPage SE ne prend pas en charge la fonction de formatage des Pages en continu.
Chapitre 2

Boîte à outils OmniPage

La boîte à outils dOmniPage SE vous permet de gérer toutes les étapes du traitement. Elle est placée par défaut dans la partie supérieure du bureau OmniPage, au-dessus des fenêtres de travail, mais peut également prendre la forme de fenêtre flottante ou être ancrée le long du bord inférieur du bureau.
Bouton Lancer Bouton Importer la page Bouton Exécuter l’OCR Bouton Exporter les
Liste déroulante Importer la page
Liste déroulante de description de la mise en page
résultats
Liste déroulante Exporter les résultats
Le traitement automatique est lancé, arrêté et relancé à l’aide du bouton Lancer (1-2-3). Voir « Traitement automatique», page 40.
Le traitement manuel permet de traiter les documents page par page et étape par étape. Vous pouvez démarrer chacune des étapes avec le bouton corr es po nda nt: Importer la page (1), Exécuter l’OCR (2) et Exporter les résultats (3). Voir « Traitement manuel », page 42.
Vous pouvez passer du mode auto ma tiq ue au mode manuel à tout moment, à la seule condition que le programme ne soit pas en train deffectuer une opération de traitement. Cette propriété signifie que vous pouvez modifier le mode sélectionné entre les différentes étapes du traitement dun document. Par exemple, il est possible de traiter automatiquement certaines pages, puis insérer dans le document dautres pages trait ées manuel lement. Se lon le même principe, vous pouvez appliqu er l e mode automatique à une pile de pages, puis vérifier le résultat obtenu et, si nécessaire, retraiter certaines pages manuelleme nt. Ce tte procédure est décrite au chapitre 3. Voir «Traitement combiné», page 43.
L'Assistant OCR est conçu pour les nouveaux utilisateurs. Voir « Traitement à l'aide de l'Assistant OCR », page 45. Si un document est ouvert lorsque vous lancez l'Assistant OCR, le programme vous invite à l'enregistrer, puis le ferme. Si vous utili s ez l’Assistant OCR pour traiter et enregistrer un document, celui-ci est par la suite disponibl e pour des étapes de traitement supplémentaires (ajout de nouvelles pages, retraitement des pages,etc.) en mode automatique ou manuel.
Bureau OmniPage 27

Gestion de documents

La gestion de documents s'effectue à partir des vignettes de la fenêtre d'image ou du gestionnaire de documents (partie inférieur e du b ure au Omni P age). Les deux fenêtres comportent des informations succinctes sur les pages du document traité et sont synchronisées. Les ill us t rations utilisées dans ce manuel présentent ces deux fenêtres avec le même document de sept pages. Les pages 1 et 2 sont sélectionnées et la page 4 est la page actuelle (c.-à-d. la page affichée dans la fenêtre d'image). L'état de la page est indiqué comme suit :
Page État Icône Opérations effectuées sur la pa ge
1 Importée Page importée, mais pas encore reconnue.
2 Reconnue
3
4 Modifiée
5 Modifiée, vérifiée
6 En instance
7 Enregistrée
Reconnue, véri- fiée
Page reconnue, non vérifiée ou vérification interrompue.
Page reconnue et entièrement vérifiée. Page reconnue, avec exécution dans l'éditeur
de texte d'au moins une modification ou un changement de formatage.
Page reconnue, modifiée dans l'éditeur de texte et entièrement vérifiée.
Page importée et peut-être reconnue, avec certains changements de type de zone stockés, mais pas traités.
Page reconnue et enregistrée au moins une fois.

Vignettes

L’onglet Vignettes contient des images réduites de toutes les pages du document. Vu leur présentation verticale, vous devrez peut-être faire défiler les vignettes pour atteindre l’élément requis. La page actuelle présente une icône en forme d'«œil ». Vous pouvez sélectionner plusieurs pages dans un document ; toute page sélectionnée présente un aspect « distinctif ». Utilisez les vignettes pour les opérations de page, comme suit :
Pour passer à une page, cliquez sur sa vignette. Pour modifier lordre dapparition dune page, cliquez sur sa vignette et
faites-la glisser sur le numéro d e pa ge voulu. Les pages sont renumérotées automatiquement.
28 Introduction
Pour supprimer une page, sélectionnez sa vignette et appuyez sur la touche Suppr.
Chapitre 2
Pour sélectionner plusieurs pages adjacentes, maintenez enfoncée la touche Maj. et cliquez sur la première, puis sur la dernière vignette du groupe requis. Pour sélectionner plusieurs vignettes non adjacentes, maintenez enfoncée la touche Ctrl et cliquez sur les pages individuelles pertinentes. Cela permet ensuite de déplacer, supprimer ou soumettre à l’OCR le groupe de pages sélectionnées. Vous po uvez aussi exporter les pages sélectionnées.
Pour afficher des informations sur une image importée, placez le curseur sur la vignette correspondante (les bulles d'aide doivent être activées). La mini-fenêtre qui saff ic he s péc ifie la t ail le de l image en pixels et en unités de mesure du programme. Vous êtes également informé de la résolution de limage.

Gestionnaire de documents

Cette fonction fournit un résumé d'informations sur un document sous la forme d'un tableau. Les rangées rep résentent les pages ; les colonnes offrent les données statistiques ou d’état des pages, et (le cas échéant) spécifient les statistiques globales du document. L'illustration ci-dessous affiche les colonnes définies par l'utilisateur.
Pour afficher la vignette d’une page, placez le curseur sur son icône d’état.
Entrez des commentaires ou des mots -clés consultables.
La page actuelle présente une icône en forme d'«œil ». Dans le gestionnaire de documents, vous pouvez effectuer les opérations suivantes:
Pour passer à une page, cliquez sur la partie gauche de la rangée de pages ou double-cliquez dans sa rangée.
Pour modifier lordre dapparition dune page, cliquez sur sa rangée et faites-la glisser à l’emplacement requis. Un indicateur saffiche pour vous signaler lendroit dinsertion de la page . Les pages sont renumérotées automatiquement.
Pour supprimer une page, sélectionnez sa rangée et appuyez sur la touche Suppr.
Pour sélectionner plusieurs pages adjacentes, maintenez enfoncée la touche Maj. et cliquez sur la première, puis sur la dernière rangée du groupe requis. Pour sélectionner plusieurs rangées non adjacentes, maintenez enfoncée la
Gestion de documents 29
touche Ctrl et cliquez sur les éléments individuels pertinents. Cela permet ensuite de déplacer, supprimer ou soumettre à l’OCR le groupe de pages sélectionnées. Vous pouvez aussi exporter les pages sélectionnées.
La sélection de plusieurs pages n’affecte p as l’état de la page actuelle. Toutes les pages sélectionnées sont contrastées.

Personnaliser des colonnes dans le gestionnaire de documents

Vous pouvez spécifier les colonnes que vous souhaitez inclure dans le gestionnaire de documents. Dans le menu Affichage, cliquez sur Personnaliser les colonnes pour afficher la boîte de dialogue illustrée ci-dessous.
Cet élément est contrasté.
Pour sélectionner (activer) un élément, coche z s a case.
La taille d’image est fournie en pixels.
Pour modifier lordre dapparition des colonnes, contrastez un élément, puis cliquez sur l'une de ces flèches.
30 Introduction
Définissez la largeur de la colonne contrastée.
Définissez les colonnes à afficher, leur largeur et leur ordre dapparition. Le contenu de chaque colonne est décrit en détail dans la rubrique Personnaliser les colonnes du gestionnaire de documents de l'aide en ligne. Vous pouvez modifier la largeur des colonnes tout simplement en faisant glisser les séparations de colonne voulues dans la barre de titre.

Supprimer des pages dun document

Toute suppressio n de page doit être confirmée et ne peut pas être annulée. Pour supprimer la page actuelle, vous devez recourir à la commande Supprimer la page actuelle du menu Édition. Pour supprimer tout es les pages sélectionnées dans le gestionnaire de documents ou dans la page des vignettes, appuyez sur la touche Suppr ou utilisez la commande Effacer du menu contextuel.
Loading...
+ 78 hidden pages