Xerox OmniPage SE User Manual [fr]

D ROITS D AUTEUR
Copyright © 2002 ScanSoft, Inc. Tous droits réservés. Aucune partie de cette publication ne peut être transmise, transcrite, reproduite ou stockée dans un système de récupération de données, ni traduite dans une langue ou un langage informatique sous quelque forme ou par quelque moyen que ce soit (mécanique, électronique, magnétique, optique, chimique, manuel, etc.) sans l'accord préalable par écrit du département juridique de ScanSoft, Inc. (Legal Department at ScanSoft, Inc., 9 Ce ntennial Drive, Peabody, Massachusetts 01960, U.S.A.).
R
EMARQUE IMPORTANTE
ScanSoft, Inc. fournit cette publication « en l'état», sans aucune garantie d’aucune sorte, expresse ou implicite, y compris et de manière non limitative, toute garantie implicite de qualité commerciale ou d’adéquation à un usage particulier. Certaines juridictions ne reconnaissant pas les limitations de garantie expresse ou implicite dans certaines transactions, cette clause peut ne pas s’appliquer à votre cas. ScanSoft se réserve le droit de réviser et/ou modifier cette publication périodiquement sans obligation de notification de telles révisions ou modifications.
ARQUES COMMERCIALES
M
ScanSoft, OmniPage, OmniPage Pro, OmniPage SE, PaperPort, Pagis, True Page, Direct OCR, AutoOCR et OCR Proofreader sont des marques déposées ou des marques commerciales de
ScanSoft, Inc. enregistrées aux États-Unis et/ou dans d’autres pays. Tous les autres noms de produit cités peuvent être des marques de leurs propriétaires
respectifs et sont reconnus comme tels.
ScanSoft Inc.
9 Centennial Drive Peabody, MA 01960 U.S.A.
Numéro de référence : 58-28001-01A
T ABLE DES MATIÈRES
PRÉSENTATION GÉNÉRALE VII
Utilisation du manuel viii
Consultation de laide en ligne ix
Aide HTML en ligne ix Aide contextuelle ix Notes techniques x Glossaire x
OmniPage SE x
1INSTALLATION ET CONFIGURATION 11
Environnement requis 12 Installer OmniPage SE 13 Configurer un scanner pour utilisation avec
OmniPage SE 14 Lancer OmniPage SE 16 Enregistrer OmniPage SE 17 Nouvelles fonctions dOmniPage Pro 11 18 OmniPage SE et OmniPage Pro 11 19
2INTRODUCTION 21
Reconnaissance optique de caractères (OCR) 22
Technologie OCR dOmniPage SE 22 Définition d'un document dans OmniPage SE 23 Principales étapes du traitement dun document23
Bureau OmniPage SE 24
MANUEL OMNIPAGE SE iii
Barre doutils Standard 25 Barre des menus 26 Barre doutils Image 26 Barre doutils Formatage 27 Boîte à outils OmniPage 27
Gérer des documents 28
Fenêtre Vignettes 29 Fenêtre Détails 29 Personnaliser des colonnes dans la fenêtre
Détails 31 Supprimer des pages dun document 31 Imprimer un document 32 Fermer un document 32
Documents OmniPage 32
Avantages du format OPD 33 Enregistrer au format OP D 33
Réglages 34
iv TABLE DES MATIÈRES
3DIDACTICIEL : TRAITEMENT DES DOCUMENTS 37
Guide de Démarrage Rapide 38
Charger et reconnaître les fichiers images
exemples 38 Numérisation et reconnaissance d'un document
d'une page 38
Traiter des documents à l’aide de lAssistant OCR 41 Traiter des documents automatiquement 44
Boutons de commande 45
Traiter des documents manuellement 46 Traitement combiné automatique/manuel 48 Traitement à partir dautres applications 49
Configurer Direct OCR 49
Utiliser Direct OCR 49 Utiliser OmniPageSE avec PaperPort 51
Traiter des documents avec Planifier OCR 52 Définir la source des images de page 53
Importer des fichiers image 53 Importer des documents à partir dun scanner 54 Numériser avec un chargeur ADF 56 Numériser des documents volumineux sans
chargeur ADF 56
Spécifier la mise en page du document 57 Tracer des zones manuellement 58
Gérer les zones 59 Propriétés de zone 60
Gérer les grilles du tableau dans limage 61 Utiliser des gabarits de zone 63
4VÉRIFICATION ET ÉDITION 65
Vérifier les résu ltats de lOCR 66 Comparer le texte reconnu à l’original 67 Dictionnaires utilisateur 68 IntelliTrain 69 Modes daffichage de l’éditeur de texte 72 Éditer du texte et des images 73 Lire le texte à voix haute 74 Ébauche de page 76
MANUEL OMNIPAGE SE v
5ENREGISTREMENT ET EXPORTATION 77
Préparer les résultats de lOCR pour l exportation 78 Enregistrer le document dans un fichier 79
Enregistrer des images originales 79 Enregistrer les résultats de l’OCR 80
Enregistrer un do cument lors dune session de travail 81 Copier un document dans le Presse-papiers 82 Joindre un document à un e-mail 83
6INFORMATIONS TECHNIQUES 85
Dépannage 85
Solutions de premier recours 86 Tester OmniPage SE 87 Mémoire insuffisante 88 Espace disque insuffisant 88
Types de fichiers supportés 90
Types de fichiers pour louverture et
lenregistrement des images 90
vi TABLE DES MATIÈRES
Types de fichiers pour l’enregistrement
des résultats de l’OCR 91 Enregistrer un document au format PDF 92
Problèmes de reconnaissance 93
Reconnaissance de texte incorrecte 93 Reconnaissance de fax incorrecte 94 Problèmes de système ou de performances
pendant l’OCR 95
Désinstaller le logiciel 96
INDEX 97

Présentation g énérale

Nous vous remercions de la confiance que vous portez à OmniPage SE™ (Special Edition). La documentation citée ci-dessous est destinée à vous présenter le programme et à faciliter son utilisation.
Manuel d’utilisation
Le présent manuel fournit des informations relatives aux principes dutilisation dOm niPage SE : procédures dinstallation et de configuration, description des commandes et zones de travail disponibles, instructions de réalisation de différentes tâches, méthodes de personnalisation et de gestion de traitement et diverses informations techniques. Ce guide est disponible au format PDF. Ce format vous permet dutiliser les liens hypertexte d es références croisées ainsi que les autres outils de navigation offerts par votre programme de consultation de fichiers PDF.
Aide en ligne
L’aide en ligne d’OmniPageSE contient des informations sur les fonctions, les réglages et les procédures relatives au logiciel. Au formatHTML, cette aide a été conçue pour garantir une consultation aisée et rap id e. S on m odu le daide contextuelle très complet assure une assistance suffisante pour vous permettre daccomplir sans délai les opérations requises. Pour plus de détails, reportez-vous à la section Consultation de l’aide en ligne.
Fichier Read Me/Lisez Moi
Ce fichier au format HTML comporte les informations de dernière minute concernant le logiciel. Il est vivement recommandé de le consulter avant d’utiliser OmniPage SE. Pour ouvrir le fichier ReadMe/LisezMoi, vous pouvez, lors de l’installation d’OmniPage SE, sélectionner l’option ReadMe/ LisezMoi, ou, à tout moment, choisir la commande correspondante dans le menu « Aide ».
Informations de numérisation et diverses
Le site Web de ScanSoft (www.scansoft.fr) fournit des informations actualisées au sujet du progra mme. Le « Guide du scanner » (actuellement en anglais) contient des données mises à jour régulièrem ent et relatives aux scanners supportés et à d’autres questions y afférentes. Pour accéder au site Web de ScanSoft, vous pouvez, lors de l’installation d’OmniPage SE, sélectionner l’option d’accès au site Web, ou, à tout moment, choisir la commande correspondante dans le menu « Aide ».
MANUEL OMNIPAGE SE vii

UTILISATION DU MANUEL

Ce manuel présuppose que vous maîtrisez les principes de travail dans lenvironnement Microsoft Windows. Pour tous détails sur cet environnement (utilisation des boîtes de dialogue, des menus déroulants et contextuels, des barres de défilement, de la fonction Glisser-déplacer, etc.), reportez-vous à la documentation Windows appropriée.
Vous devriez également connaître le fonctionnement de votre scanner et de son logiciel. Avant de procéder à la configuration du scanner avec OmniPageSE, assurez-vous qu’il est installé et qu’il fonctionne correctement. En cas de besoin, reportez-vous à la documentation du scanner.
Ce manuel utilise les conventions suivantes :
Texte en gras
Texte en italiques
Police sans empattement
Remarque: Astuce:
Introduit les nouveaux termes et signale les titres des différentes sections de chaqu e chapitre.
Met en évidence les références aux différentes sections de ce manuel (sauf mention contraire, toute section citée se trouve dans le même chapitre que la référence). Indique les boutons principaux utilisés lors du traitement automatique : Démarrer, Arrêter, Terminer, Autres pages.
Indique les noms de fichier, tels que exemple.tif
Introduit des informations supplémentaires. Introduit des conseils sur laccomplissement de tâches
spécifiques à laide des fonctions du logiciel.
viii PRÉSENTATION GÉNÉRALE

CONSULTATION DE LAIDE EN LIGNE

L’aide en ligne d’OmniPageSE contient des informations sur les fonctions, les réglages et les procédures relatives au programme. Le système d’aide devient disponible dès linstallation du logiciel.

Aide HTML en ligne

Po ur accéder à laide en ligne dOmniPage SE, choisissez la commande « Aide OmniPage SE » dans le menu daide. Vous pourrez obtenir les
informations requises en consultant des rubriques de la table des matières, en sélectionnant des mots-clés dans l’index alphabétique ou en effectuant des recherches sur l’intégralité du texte d’aide. Les autres commandes du menu « Aide » vous permettront d’accéder à de nombreux sujets et pages Web utiles.
Lors de lutilisation dOmniPage SE, vous pouvez consulter la rubrique daide relative à la boîte de dialogue, la zone d’écran ou le message affiché en appuyant sur la touche F1.

Aide contextuelle

Pour afficher des informations succinctes sur un élément d’interface dOmniPageSE (commande de menu, bouton de barre doutils, groupe doptions, boîte de dialogue, etc.), vous pouvez procéder des manières suivantes :
Pour afficher la rubrique daide relative à un élément du bureau en dehors dune boîte de dialogue ou dune fenêtre de message, cliquez sur le bouton daide dans la barre doutils standard afin d’afficher l’icône d’aide (flèche accompagnée dun point dinterrogation), puis cliquez sur cette icône et sur l’élément requis.
Vous pouvez également afficher cette icône via la séquence Maj.+ F1. Pour afficher une mini-fenêtre décrivant un élément de boîte de dialogue,
cliquez sur le point dinterrogation situé dans langle supérieur droit de l a boîte en question puis sur l’élément requis.
Certaines boîtes de dialogue ou fenêtres de message comportent un bouton Aide (icône ou libellé). Pour accéder aux informations sur leurs éléments, cliquez sur ce bouton.
MANUEL OMNIPAGE SE ix
Pour supprimer une fenêtre daide co ntextuelle, cliquez nimporte où sur le bureau.

Notes techniques

Le site Web de ScanSoft (www.scansoft.fr) fournit des informations techniques (Tech Notes) au sujet d'OmniPage SE et propose de l'assistance pour l'installation et le dépannage du logiciel.

Glossaire

Un glossaire complet d'OmniPage SE (disposant d'un index alphabétique et d'une table des matières) est inclus dans l'aide en ligne du programme. Consultez ce glossaire pour trouver la signification d'un terme technique utilisé dans le manuel ou le programme.

OMNIPAGE SE

La version dOmniPage dont vous disposez est une version spéciale de
lapplication OmniP a gePro certains fabricants de scanners et ne comprend pas l’ensemble des fonctionnalités dOmniPage Pro 11. Ce guide ainsi que laide en ligne offrent une description de lensemble des fonctionnalités du produit. L’icône SE, placée en marge de certaines sections, vous permet d’identifier rapidement les diff érences entre chacune des versions.
. Cette version a spécialement été conçue pour
Si vous êtes intéressé par les fonctionnalités supplémentaires offertes par la version professionnelle du produit, consultez notre site Web pour effectuer une mise à niveau vers OmniPage Pro 11.
x PRÉSENTATION GÉNÉRALE
1Installation et
configuration
Ce chapitre contient les infor mations nécessaires à l’installation et au lancement dOmniPage SE, soit les sections suivantes :
u Environnement requis u Installer OmniPage SE u Configurer un scanner pour utilisation avec OmniPage SE u Lancer OmniPage SE u Enregistrer OmniPage SE u Nouvelles fonctions dOm niPage Pro 11 u OmniPage SE et OmniPage Pro 11
MANUEL OMNIPAGE SE 11

ENVIRONNEMENT REQUIS

Pour installer et utiliser OmniPage SE, vous devez prévoir l’environnement minimum suivant :
u Processeur Pentium ou supérieur u Microsoft Windows 9 5, Windows 98, Windows Me, Windows
2000 ou Windows NT 4.0
u 32 Mo de mémoire RAM (64 Mo recommandés) u 75 Mo despace di sque dispo nible desti né aux fic hiers d application,
plus 10 Mo despace disponible lors de l’installation
u 9 Mo pour Microsoft Installer (MSI) et 44Mo pour Internet
Explorer, le cas échéant. (Ces logiciels font partie de linstallation de Windows 98, Windows Me et Windows2000.)
u Affichage SVGA avec 256 couleurs et rés olu ti on d e 800 x 60 0 p ixels u Souris (ou équivalent) compatible Windows u Lecteur de CD-ROM (pour linstallation) u Scanner compatible (si vous prévoyez de numériser des documents).
Pour consulter la liste des scanners supportés, consultez le « Guide du scanner » (actuellement en anglais) disponible sur le si te Web de ScanSoft.
Remarque : Vous obtiendrez de meilleures performances avec un
processeur plus puissant, et des valeurs supérieures de RAM et d’espace disque.
12 INSTALLATION ET CONFIGURATION

INSTALLER OMNIPAGE SE

Pour vous guider dans linstallation, OmniPage SE affiche des instructions sur chaque écran.
Avant de lancer linstallati on dOmniPage SE, respectez les points suivants :
u Vérifiez que le scanner est compatible avec votre système, qu'il est
connecté au PC et sous tension.
u Fermez les applications actives, en particulier les logiciels antivirus. u Si vous installez OmniPage SE sur un système Windows 2000 ou
Windows NT, ouvrez une session avec privilèges d’administrateur.
u Si une version antérieure dOmniPage est déjà instal lée sur votre
ordinateur, le programme dinstallation vous demandera lautorisation de désinstaller le logiciel existant.
t Pour instal ler OmniPage SE :
1.
Insérez le CD-ROM OmniPage SE dans le lecteur approprié. En principe, le programme dinstallation démarre automatiquement. Si ce n’est pas le cas, ouvrez lExplorateur Windows, cliquez sur l’icône du lecteur de CD-ROM, puis cl iq uez de ux fois sur le fichier de p r o gramme AUTORUN.EXE.
2. Choisissez la langue d’installation souhaitée. Ce choix détermine
également la langue de linterf ace du progr amme (commandes de menu,
boîtes de dialogue, fenêtres de message, etc.). Vous pouvez mo difier la langue dinterface ultérieurement, mais la sélection effectuée lors de linstallation détermine la versio n du module Tex t e-parole installée avec le programme. Veuillez noter que le module Texte-parole n’est pas disponible dans OmniPage SE
3. Pour installer le logiciel, suivez les instructions affichées sur les écrans
successifs. Tous les fichiers nécessaires à la numérisation sont copiés automatiquement lors de l’installation.
Remarque : Certains problèmes affectant OmniPageSE peuvent être
résolus par linstallation puis la désinstallation du logiciel. Reportez-vous à la section Désinstaller le logiciel du chapitre 6.
INSTALLER OMNIPAGE SE 13
Remarque : Dans OmniPage Pro 11, le modu le Texte-parole est
disponible en français, anglais (britannique et américain), allemand, italien, portugais et espagnol. Ce module n’est pas disponible dans OmniPage SE. Reportez-vous également à la section Lire le texte à voix haute du chapitre 4.
CONFIGURER UN SCANNER POUR UTILISATION AVEC
MNIPAGE SE
O
Tous les fichiers nécessaires à la configuration et au support du scanner sont copiés automatiquement lors de l'installation du programme. Avant de numériser des documents à l'aide d'OmniPage SE, vous devrez vérifier que votre scanner est installé correctement et tester son fonctionnement.
L'installation et la configuration du scanner s'effectuent via l'Assistant de numérisation. Vous pouvez accéder à ce dernier via la procédure décrite ci­dessous. La fenêtre de l'Assistant de numérisation apparaît également lors de la première numérisation d'un document à partir d'OmniPage SE.
Pour configur er votre scanner pour l'utilisation avec OmniPage SE à l'aide de l'Assistant de n umérisation, procédez comme suit:
u Choisissez Démarrer É Programmes É ScanSoft OmniPage SE É
Assistant de numérisation, ou Cliquez sur le bouton Configuration de l'onglet Scanner dans la boîte de dialogue Options, ou Choisisse z la commande de numérisation dans la liste déroulante Importer la page dans la boîte à outils Om niPage.
u Choisissez Sélectionner la source de numérisation, puis cliqu e z sur
Suivant.
u Cliquez sur le pilote TWAIN de votre scanner pour le sélectionner,
puis cliquez sur Suivant.
u Choisissez Oui pour tester la configuration de votre scanner, puis
cliquez sur Suivant.
u L'Assistant teste la connexion entre l'ordinateur et le scann er.
Cliquez sur Suivant.
u Placez une page de test dans le scanner.
14 INSTALLATION ET CONFIGURATION
u L'assistant se prépare à réaliser une numérisation standard à l'aide
du logiciel fourni avec le scanner. Cliquez sur Suivant.
u L'interface native de votre scanner apparaît. Pour lancer un test de
numérisation, cliquez sur Numériser.
u Si nécessaire, cliquez s ur Image inversée ou Image manquante
et effectuez les sélections appro priées.
u Une fois l'image affichée correctement dans la fenêtre, cliquez sur
Suivant.
u Sélectionnez l'option la plus appropriée à votre scanner et cliquez
sur Suivant.
u Cliquez sur Suivant pour passer à la sélection de la taille de page. u Les tailles de page supportées par le scanner et détectées par
l'Assistant de numérisation apparaissent. Pour apporter des modifications à la liste affichée, cliquez sur Évolué, effectuez les changements requis et cliquez sur Suivant.
u Placez dans le scanner une page comportant uniquement du texte
(sans images). Cliquez sur Suivant pour lancer la numérisation en noir et blanc.
u Si nécessaire, cliquez s ur Image inversée ou Image manquante
et effectuez les sélections appro priées.
u Une fois l'image affichée correctement dans la fenêtre, cliquez sur
Suivant.
u Si vous disposez d'un scanner couleur, placez une photographie ou
une page couleur dans le scanner . Cliquez sur S ui vant pour lancer la numérisation en couleur. Si nécessaire, cliquez sur Image invers ée… ou Image manquante et effectuez les sélections appropriées. Une fois l'image affichée correctement dans la fenêtre, cliquez sur Suivant. Si votre scanner ne gère pas la couleur, omettez cette étape.
u Placez une photo graphie ou une page comportant une image dan s le
scanner. Cli quez sur Suiv ant pour lancer la numérisation en niveaux de gris. Si nécessaire, cliquez sur Image inversée… ou Image manquante et effectuez les sélections appropriées. Une fois l'image affichée correctement dans la fenêtre, cliquez sur Suivant.
u Vo tre scanner est désormais configuré pour l'utilisation avec
OmniPage SE. Cliquez sur Terminer.
Pour modifier ultérieurement les paramètres de votre scanner, pour configu­rer un scanner différent ou pour tester et dépanner un scanner installé, rouvrez l'Assistant de numérisation selon une des méthodes suivantes:
CONFIGURER UN SCANNER POUR UT ILISATION AVEC OMNIPAGE SE 15
u Démarrer > Programmes É ScanSoft OmniPage SE É
Assistant de numérisation, ou
u Démarrer > Programmes É ScanSoft OmniPage SE É OmniPage
SE É menu Outils > Options É ScannerÉ bouton Configuration.
Remarque : Pour tester et dépanner un scanner fonctionnant
incorrectement, suivez la procédure ci-des sus en sélectionnant Tester et configurer la source de numérisation actuelle au début du processus.

LANCER OMNIPAGE SE

Pour lancer OmniPage SE, effectuez l'une des opérations suivantes :
u Dans la barre des tâches Windows, cliquez sur Démarrer et
choisissez Programmes OmniPage SE.
u Cliquez deux fois sur l’icône OmniPage SE située dans le dossier
dinstallation dOmniPage SE ou sur le bureau Windows (si vous ly avez placée).
É ScanSoft OmniPage SE É
Lorsque vous ouvrez lapplication, l’écran daccueil puis le bureau OmniPage SE saffichent. Pour plus dinformations sur le bureau OmniPage SE, consulte z le chapitre 2.
Vous pouvez également exécuter le program m e avec une interface limitée:
16 INSTALLATION ET CONFIGURATION
u Cliquez deux fois sur l’icône ou le nom de fichier dun document
OmniPage (OPD) pour le charger. Pour plus de détails, reportez­vous à la section Documents OmniPage du chapitre 2.
u Ouvrez le programme de planification de reconnaissance. Dans la
barre des tâches Windows, cliquez sur Démarrer et choisissez Programmes de détails, reportez-vous à la section Traiter des documents avec Planifier OCR du chapitre 3.
u Dans une application déclarée dans Direct OCR, cliquez sur
Acquérir texte du menu Fichier. P our plus de détails, reportez-vous à la section Configurer Direct OCR du chapitre 3.
ÉScanSoft OmniP age SE ÉPlanifier OCR. Pour plus
u Cliquez avec le bouton droit sur une icône ou un nom de fichier
image pour afficher son menu contextuel. Choisissez la sous-option requise de la commande « Convertir en » pour définir une cible.
u
Utilisez OmniPage SE pour bénéficier des services OCR dans les
produits de gestion de documents PaperPort Voir
Utiliser OmniP age SE avec PaperPort
®
ou Pagis® de ScanSoft.
du chapitre 3.

ENREGISTRER OMNIPAGE SE

À l'issue de l'installation, le programme lance l'Assistant d'enregistrement de ScanSoft. L'enregistrement s'effectue via un formulaire électronique facile à remplir (moins de cinq minutes).
Lorsque vous avez terminé de remplir le formulaire et que vous cliquez sur Envoyer, le programme tente de se connecter à Internet po ur eff ectuer l'enre­gistrement en ligne sur-le-champ.
Si vous n'enregistrez pas votre copie du logiciel pendant son installation, le programme vous invitera à intervalles réguliers à accomplir cette formalité. Po ur procéder à un enregistrement en ligne, rendez-vous sur le site Web de ScanSoft : www.scansoft.fr. Cliquez sur Support, puis choisissez Enregistrer dans la colonne de gauche.
Pour des informations sur l'utilisation des données d'enregistrement, consul­tez la clause de confidentialité de ScanSoft (Privacy Policy).
ENREGISTRER OMNIPAGE SE 17
NOUVELLES FONCTIONS DOMNIPAGE PRO 11
La famille de produits OmniPage® compte désormais OmniPage Pro 11 et OmniPage SE. Cette section présente les améliorations apportées à OmniPage Pro 11. Comme lindique la section suivante, certaines de ces fonctionnalités sont également comprises dans OmniPage SE.
Nouvelles fonctionnalités de OmniPage Pro 11 par rapport à OmniPage Pro 10 :
u Meilleur e précision – Son moteur de reconnaissance r évisé co nfère à
la version 11 un niveau de précision supérieur à tout autre produit OmniPage.
u Mise en page améliorée – OmniPage Pro 11 permet désormais de
conserver le formatage de loriginal, même si celui-ci contient des tableaux sans grille, des en-têtes, des bas de pages ou des lettrines.
u Vérification dOCR plus efficac e – La nouvelle fonction I ntelliTrain
exploite automatiquement les co rrections apportées aux documents précédents pour assurer une meilleure reconnaissance du document traité.
u Compatibilité avec le format PDF – Vous pouvez désormais
importer des fichiers PDF (y compris en lecture seule) et les convertir au format de vos applications favorites (W ord, Ex cel, etc.). V ous po uvez également créer des fichier s PDF à partir de documents imprimés ou de fichiers image.
18 INSTALLATION ET CONFIGURATION
u Génération optimisée des pages HTML – Grâce à la nouvelle
option de génération de documents HTML affichés en mode réel (correspondant à l'impression/la publication), vos pages HTML conservent le formatage du texte, les graphiques et les fonds du document or iginal.
u Support linguistique étendu – OmniPage Pro 11 supporte mainte-
nant plus de 100 langues (y compris les alphabets grec et cyrillique).
u Vue Détails – Cette fenêtre offre des possibilités renforcées de
personnalisation dinformations sur des pages individuelles, facilitant ainsi la gestion des pages dun document.
u Éditeur de texte – Cet éditeur innovant avec affichage en mode réel
(correspondant à l'impression/la p ublication) permet de remanier les résultats de la reconnaissance à l’aide dune large gamme d’outils d’édition, un puissant support de couleurs et quatre niveaux de formatage pour laffichage et l’exportation.
u Meilleur traitement des documents de mauvaise qualité– Un
nouveau module d’élimination des imperfections réduit sensiblement le nombre derreurs de reconnaissance susceptibles de se produire dans le cas de s docume nts comporta nt des tâches ou des fonds en dégradé ou de couleur.

OMNIPAGE SE ET OMNIPAGE PRO 11

La liste suivante répertorie les fonctionnalités de la version professionnelle dOmniPage Pro qui nont pas été ajoutées à OmniPage SE :
u Meilleur niveau de reconnaissance. u Accès au module dapprentissage IntelliTrain pour la reconnaissance
de caractères.
u Capacité douverture et de lecture du contenu de fichiers PDF. u Capacité denregistrement des fichiers reconnus au format PDF u Capacité douverture de fichiers imag e TIFF FX. u Gestion des formats dimage LZW TIFF et GIF en entrée et sortie. u Prise en charge de la sortie WYSIWYG HTML 4.0. u Nombre de langues reconnues passant de 50 à plus de 100. u Accès au module T exte-parole, permettant la lecture à voix haute des
textes reconnus.
Pour plus dinformations sur OmniPagePro 11, ou pour obtenir une mise à niveau, consultez le site www.scansoft.com/opse.
OMNIPAGE SE ET OMNIPAGE PRO 11 19
20 INSTALLATION ET CONFIGURATION

2Introduction

De nos jours, la plupart des activit és professionnelles (correspondance, création de rapports, gestion des données, etc.) font appel à un ordinateur et pourtant, certaines sources dinformation circulent toujours sou s l a forme imprimée et ne sont pas directement exploitables par la machine.
Ainsi, si vous vo ule z insér er un article de magazine au format papier dans un rapport en cours de création sur l' ordinateur, vous devez trouver un moyen de le faire, en évitant la saisie manuelle tout à fait inefficace.
OmniPage SE vous propose une solution sûre : la reconnaissance optique de caractères (OCR ). Ce chapitre décrit lemploi de la techn ologie OCR par OmniPage SE dans le but de transformer les informations contenues dans vos documents numérisés ou fichiers image en données électroniques éditables par vos applications habituelles.
Il traite les sujets suivants :
u Reconnaissance optique de caractères (OCR)
u Définition d'un document dans OmniPage SE
u Principales éta pes du traitement dun document u Bureau OmniPage SE u Gérer des documents u Documents OmniPage (OPD) u Réglages
MANUEL OMNIPAGE SE 21

RECONNAISSANCE OPTIQUE DE CARACTÈRES (OCR)

La reconnaissance optique de caractères (OCR) est une opération qui consiste à extraire du texte dune image obtenue par numérisation dun document papier ou par ouverture dun fichier image électronique. Le texte dune image n’est pas directement util isable car ses caractères se composent de groupes de points (pixels).
Pendant la reconnais sance, O mniPage SE analyse limage proposée, identifie les caractères qu’elle contient et définit les solutions permettant de les transformer en texte éditable. À l’issue de la r econnais sance, le te xte p eut être enregistré dans la plupart des applications (logiciels de traitement de texte ou de PAO, tableurs,etc.).

Technologie OCR dOmniPage SE

Outre le texte, OmniPage SE peut reconnaître les éléments et caractéristiques suivants du document.
Éléments graphiques
Photos, logos, illustrations, etc.
Formatage du texte
Format des caractères, tel que type (Arial, Times New Roman...), corps (8, 12) et style (gras, italique, souligné paragraphes, tel que retraits, tabulations, marges et interlignes.
) d'une police. Format des
22 INTRODUCTION
Mise en pag e
Agencement des colonnes, agence ment des tableaux, emplacement des éléments graphiques et des en-têtes.
Les éléments et caractéristiques conservés par OmniPage SE dépendent des réglages sélectionnés pour chaque document. Pour plus de détails sur le choix des réglages, consultez la rubrique Conseils de réglages de laide en ligne OmniPage SE.
Remarque : OmniPage SE reconnaît uniquement les caractères imprimés,
tels que les sorties imprimante ou le texte tapé à la machine. Vous pouvez toutefois lui demander de conserver un bloc de texte manuscrit (une signature, par exemple) en affectant celui-ci du type de zone Graphique.

Définition d'un document dans OmniPage SE

OmniPage SE gère les documents de façon individuelle. Lorsque vous importez la première image (à partir dun scanner ou dun fichier), le programme crée un document. Toutes les images importées par la suite sont ajoutées à ce document, jusqu’à son enregistrement et sa fermeture.
Dans OmniPage SE, un document comporte une ou plusieurs pages, chacune delles constituée p a r une image importée. Après la reconnaissance, le document comport e ra également le texte reconnu correspondant à ses images (affichable via l’Éditeur de texte) et des graphiques ou des tableaux éventuels. Pour plus de détails sur les différents éléments de l’écran OmniPage SE, reportez-vous à la section Bureau OmniPage SE.

Principales étapes du traitement dun document

OmniPage SE propose deux modes de traitement des documents: automatique et manuel. (Consultez le chapitre3 Traiter des documents automatiquement et Traiter des documents manuellement.) Les deux modes impliquent globalement les même étapes principales :
1. Importer des imag es de document dans OmniPage SE
Vous pouvez numériser un document papier (avec ou sans le chargeur de feuilles automatique ADF) ou charger un ou plusieurs fichiers image. Les images importées apparaissent dans la fenêtre Vignettes et les infor­mations relatives aux pages concernées s af fic hent d ans la fe nêtre Détails (fenêtres faisant partie du ge stionnai re de docume nt). L’image de la page en cours figure dans la fenêtre Image originale.
2. Exécuter lOCR pour obtenir du texte éditable
Pendant la reconnaissance, OmniPage SE trace des zones autour des parties de l’image à traiter, puis interprète le contenu textuel et graphi- que de chaque zone. Vous pouvez également créer des zones manuellement ou en appliquant un gabarit de zones prédéfini. À l’issue de la reconnaissance, vous pouvez détecter et corriger les erreurs éven- tuelles à laide du module de vérification de lOCR et éditer le document dans l’Éditeur de texte.
3. Exporter le document vers la destination de votre choix
Une fois le document reconnu, vous pouvez lenre gi st rer dans un fichier (en spécifiant le nom et le type voulus), le copier dans le Presse-papiers ou lenvoyer comme pièce jointe dun e-mail. Vous pouvez également lenregistrer au format Document OmniPage (OPD) selon la procédure décrite ci-après. Un même document peut être enregistré plusieurs fois
RECONNAISSANCE OPTIQUE DE CARACTÈRES (O CR) 23
Barre d’outils Standard
Boîte à outils
La page actuelle présente un fond clair.
avec différents paramètres demplacement, de type de fichier, de formatage, etc., selo n vos besoins. Voir le chapitre 5.

BUREAU OMNIPAGE SE

Le bureau OmniPage SE dispose dune barre de titre et de menus dans sa partie supérieure et dune barre d’état dans sa partie inférieure. Il est composé de trois espaces de travail ou fenêtres : Gestionnaire de document, Image originale et Éditeur de texte. La fenêtre Gestionnaire de document présente deux onglets : Vignettes et Détails. La fenêtre Image originale est munie de la barre doutils Image et la fenêtre Éditeur de texte de la barre doutils de formatage.
Barre doutils de formatage
Ce symbole marque une page reconnu e.
L’onglet Vignettes contient des images réduites de toutes les pages du docume nt.
Boutons pour explorer le document
Boutons pour afficher, masquer ou réaménager les fenêtres.
24 INTRODUCTION
Barre d’outils Image
Image originale :
Affiche l’image de la page actuelle avec toutes les zones tracées automatiquement ou manuellement.
Faites glisser cette barre de fractionnement vers la droite ou la gauche pour redimensionner les fenêtres.
Boutons de l’Éditeur de texte offrant quatre niveaux de for ma tage.
Éditeur de texte : Affiche le
résultat de la reconnaissa nc e de la page actuelle en mode True Page.
Remarque : Pour configurer l'affichage des fenêtres du bureau OmniPage
(Gestionnaire de document, Image originale ou Éditeur de texte), cochez/ décochez la ou les cases correspondantes dans le menu Affichage ou utilisez les boutons appropriés de la barre d'état.
La boîte à outils OmniPage permet à l’utilisateur de gérer le traitement. Cette boîte peut prendre trois aspects différents, en fonction du mode de traitement activé (boutons de gauche). L’illustration précédente correspond à lOCR manuel. L’exemple utilisé s’appuie sur un docum e nt de trois pages. La page 1 représente la page actuelle, reconnue et vérifiée; la page2 a été reconnue mais non vérifiée; la page3 a été importée et divisée manuellement en zones, mais n’a pas été reconnue. L’icône figurant dans langle inférieur droit de chaque vignette indique l’état de la page.
Les boutons de la barre d’état vous permettent dafficher, de masquer et de réaménager les fenêtres du bureau OmniPage SE, et de passer à d’autres pages du document. Un clic avec le bouton droit dans une fenêtre affiche so n menu contextuel avec les commandes les plus utiles pour cette fenêtre.

Barre doutils Standard

La barre doutils Standard contient des boutons et une liste déroulante permettant deffectuer les tâches courantes. Elle peut prendre la forme de barre flottante ou être ancrée à tout bord du bureau OmniPage SE. Toutes les fonctions proposées sur cette barre sont également accessibles par l'intermédiaire de menus.
Nouveau
document.
Ouvrir un Document OmniPage.
Enregistrer le document act uel en conservant son nom et type de fichier.
Imprimer limage ou le résultat de l'OCR pou r tout ou partie de s pages.
Vérifier
le texte reconnu.
Couper la sélection dans l'Éditeur de texte.
Copier la sélection dans l’Éditeur de texte.
Coller la sélection dans l'Éditeur de texte.
Annuler la dernière opération.
Ouvrir la boîte de dialogue Options.
BUREAU O MNIPAGE SE 25
Zoom sur la fenêtre ac tive (Image originale ou Éditeur de texte).
Aide contextuelle

Barre des menus

Pour obtenir des informations succinctes sur une commande de menu, cliquez sur le bouton d’aide contextuelle puis sur la commande concernée. La fenêtre qui apparaît explique la fonction de la commande. Pour fermer cette fenêtre, cliquez nimporte où sur l’écran.

Barre doutils Image

La barre doutils Image contient des boutons permettant d’agrandir/de réduire et de faire pivoter limage actuelle, ainsi que de manipuler les z ones et les séparations de tableaux présentes sur la page. Ces fonctions sont décrites en détail dans le chapitre3, dans Tracer des zones manuellement et Gérer les grilles du tableau dans limage. L’illustration ci-dessous résume les rôles des différents boutons de la barre. La barre d outils Image peut prendre la forme de barre flottante (librement déplaçable sur le bureau) ou être ancrée à tout bord de la fenêtre Image originale.
Tracer des zones rectangulaires.
Tracer des zones irrégulières.
Ajouter à la zone ou fusionner plusieurs zones.
Soustraire de la zone ou la diviser en plusieurs zones.
Astuce : Vous pouvez également redimensionner et faire pivoter l’image
originale par le biais d'un menu contextuel. Cliquez avec le bouton droit dans la fenêtre I mage originale (en dehors dune zo ne) et sélectionnez une valeur de zoom ou de rotation.
Réagencer les zones.
Propriétés de zone
Déplacer
des séparations de rangées ou de colonnes dans un tableau.
Insérer des séparations de colonnes dans un tableau.
Insérer des séparations de rangées dans un tableau.
Supprimer des séparations de rangées ou de colonnes individuelles.
Supprimer/ Remplacer toutes
les séparations de rangées et de colonnes.
Rotation de l’image.
Zoom avant sur
limage de page.
Zoom arrière
sur limage de page.
26 INTRODUCTION

Barre doutils Formatage

La barre doutils Formatage contient des boutons permettant de modifier le texte reconnu dans l’Éditeur de texte. Ces fonctions sont décrites en détail au chapitre 4, dans Éditer du texte et des images. L’illustration ci-dessous résume les rôles des différents boutons de la barre, qui est toujours visible dans la partie supérieure de l’Éditeur de texte.
Styles de paragraphe
Nom de police
Corps de police
Gras Souligné
Alignement
de paragraphe
PucesItalique
Afficher/masquer
les caractères non imprimables.

Boîte à outils OmniPage

La boîte à outils dOmniPage vous permet de gérer toutes les étapes du traitement. Elle est placée par défaut dans la partie supérieure du bureau OmniPa ge SE, au-d essus d es fen êtres de travail, mais peut également prendre la forme de fe nêtre flottante ou être ancrée le long du bord inférieur du bureau.
La boîte à outils dispose de trois boutons à gauche déterminant le mode de traitement activé : AutoOCR, OCR manuel et As sistant OCR. Lor sque vous cliquez sur un bouton, la boîte à outils affiche les options correspondantes. L’illustration présentée au début de ce chapitre reflète le bureau OmniPage SE en mode OCR manuel. L’illustration ci-dessous présente les réglages disponibles pour loption AutoOCR.
Le traitement automatique est lancé, arrêté et relancé à l’aide des boutons dans la par t ie droite de la barre doutils. L’utilisation de ces boutons et tous les réglages y afférant sont décrits au chapitre 3, Traiter des documents automatiquement.
Vous pouvez passer du mode automatique au mode manuel à tout moment, à la seule condition que le programme ne soit pas en train deffectuer une opération de traitement. Cette propriété signifie que vous pouvez modifier le
BUREAU O MNIPAGE SE 27
mode sélectionné entre les différentes étapes du traitement dun document. Par exemple, il est possible de traiter automatiquement certaines pages, puis insérer dans le document dautres p a ges traitées manuellement. Selon le même principe, vous pouvez appliquer le mode automatique à une pile de pages, puis vérifier le résultat obtenu et, si nécessaire, retraiter certaines pages manuellement. Cette procédure est décrite au chapitre 3 Traitement combiné automatique/manuel.
Po ur lanc er lAssistant OCR, le bureau OmniPage SE ne doit comporter aucun document. Voir Traiter des documents à laide de lAssistant OCR. Si vous utilisez lAssistant pour traiter et enregistrer un document, celui-ci est par la suite disponible pour des étapes de traitement supplémentaires (ajout de nouvelles pages, retraitement des pages, etc.) en mode automatique ou manuel.

GÉRER DES DOCUMENTS

Le gestionna ire de document est s itué dans la partie gauche du bureau OmniPage SE et présente deux onglets : Vignettes et Détails. Pour afficher la fenêtre correspondant à un onglet, cliquez sur celui-ci. Les deux fenêtres comportent des informations succinctes sur les pages du document traité et sont synchronisées (lors du passage dune fenêtre à l’autre, les pages actuelle et sélectionnées sont conservées). Les illustrations présentent ces deux fenêtres avec le même document de quatre pages. Les pages 1 et 2 sont sélectionnées et la page 4 est la page actuelle (c.-à-d. la page affichée dans la fenêtre Image originale). Le gestio nnaire de document indique l’état du traitement dune page à l’aide des icônes suivantes:
28 INTRODUCTION
Page État
1 Importée
2
3 Reconnue
4 Vérifiée Page reconnue et entièrement vérifiée.
Divisée en zones
Icône (Vignet­tes)
Icône (Détails)
Opérations effectuées sur la page
Page importée, sans zones définies manuellement ou via un gabarit, et non reconnue.
Page importée, avec zones définies manuellement ou via un gabarit, et non reconnue.
Page reconnue, non vérifiée ou vérification inter­rompue.

Fenêtre Vignettes

L’onglet Vignettes contient des images réduites de toutes les pages du document. Vu leur présentation verticale, vous devrez peut-être faire défiler les vignettes pour atteindre l’élément requis. La page actuelle se caractérise par un fond clair et son numéro de page apparaît en gras. Vous pouvez sélectionner plusieurs pages dans un document ; toute page sélectionnée présente un aspect « en relief ». Chaque page dispose d’une icône d’état dans sa partie inférieure droite (voir la section précédente).
Pour passer à une page, cliquez sur sa vignette. Pou r modifier lordre dapparition dune page, cliquez sur sa vignette et
faites-la glisser sur le numéro de page voulu. Les pages sont renumérotées automatiquement.
P our sup primer une page, sélectionnez sa vignet t e et ap puyez sur la touche Suppr.
Pou r sél ect ionner plusieurs pages adjacentes, maintenez enfoncée la touche Maj. et cliquez sur la première, puis sur la dernière vignette du groupe requis. Pour sélectionner plusieurs vignettes non adjacentes, maintenez enfoncée la touche Ctrl et cliquez sur les pages individuelles pertinentes. Cela permet ensuite de déplacer, supprimer ou soumettre à lOCR le groupe de pages sélectionnées.
Pour afficher la vignette d’une page, placez le curseur sur son icône d’état.

Fenêtre Détails

Cette nouvelle fonction a été introduite dans OmniPage SE pour vous fournir un résumé d’informations sur un document sous la forme d’un tableau. Les rangées représentent les pages ; les colonnes offrent le s données statistiques ou d’état des pages, et (le cas échéant) spécifient les statistiques globales du document. L’illustration ci-dessous affiche les colonnes par défaut (à gauche) et quatre colonnes définies par lutilisateur.
Nombre de zones de différents types présentes sur la page.
GÉRER DES DOC UMENTS 29
La page ac tuel le es t c ontr ast ée. Da ns l a f enêtre Détails, v ous pouvez effectuer les opérations suivantes:
Pour passer à une page, cliquez sur sa ran gée. Pou r modifier lordre dapparition dune page, cliquez sur sa rangée et
faites-la glisser à l’emplacement requis. Une flèche s’affiche pour vous signaler lendroit dinsertion de la page. Les pages sont renumérotées automatiquement.
Pour supprimer une page, sélectionnez sa rangée et appuyez sur la touche Suppr.
Pou r sél ectionner plusieurs pages adjacentes, maintenez enfoncée la touche Maj. et cliquez sur la première, puis sur la dernière rangée du groupe requis. Pour sélectionner plusieurs rangées non adjacentes, maintenez enfoncée la touche Ctrl et cliquez sur les éléments individuels pertine n ts. Cela permet ensuite de déplacer, supprimer ou soumettre à l’OCR le groupe de pages sélectionnées.
La sélection de plusieurs pages naffecte pas l’état de la page actuelle. Toutes les pages sélectionnées sont contrastées.
Astuce : Pour consulter les informations sur la taille dune image, placez
le curseur sur sa vignette ou en dehors dune zone dans la fenêtre Image originale. La mini-fenêtre qui s affiche spécifie la taille de limage en pixels et en unités de mesure du programme. Vous êtes également informé de la résolution de limage.
30 INTRODUCTION
Loading...
+ 70 hidden pages