ABBYY FineReader version 8.0 User Manual [fr]

Système de reconnaissance optique de caractères
ABBYY® FineReader
Version 8.0 Guide de l'utilisateur
© 2005 ABBYY Software. Tous droits réservés.
Manuel utilisateur ABBYY FineReader 8.0
Les informations du présent document sont susceptibles de modifications sans préavis et n'impliquent aucun engagement de la part d'ABBYY. Le logiciel décrit dans ce document est fourni aux termes d'un accord de licence. Le logiciel ne peut être utilisé ou copié qu'en stricte conformité avec les termes de l'accord de licence. La copie de ce logiciel sur tout support constitue une infraction aux lois de la Fédération de Russie relatives f la protection juridique des logiciels et des bases de données et aux lois internationales, sauf autorisation expresse dans le cadre de la licence ou des accords de nondivulgation. Aucune partie de ce document ne peut en aucun cas être reproduite ni transmise, sous aucune forme ni par aucun moyen, sans l'autorisation expresse écrite d'ABBYY.
© 2005 ABBYY Software Ltd. Tous droits réservés. © 19872003 Adobe Systems Incorporated. Adobe® PDF Library est concédé sous licence Adobe Systems Incorporated. Kit de réalisation de logiciel Microsoft Reader Content © 2004 Microsoft Corporation, One Microsoft Way, Redmond, Washington 980526399 ÉtatsUnis. Tous droits réservés. ABBYY, the ABBYY Logo, Scan&Read, ABBYY FineReader sont des marques déposées ou des appellations commerciales d'ABBYY Software Ltd. Adobe, le logo Adobe, le logo Adobe PDF et Adobe PDF Library sont des appellations commerciales ou des marques déposées d'Adobe Systems Incorporated aux Étatsunis et/ou dans d'autres pays. Microsoft, Outlook, Excel, PowerPoint et Windows sont des marques déposées ou des appellations commerciales de Microsoft Corporation aux EtatsUnis et/ou dans d'autres pays. Fonts Newton, Pragmatica, Courier © 2001 ParaType, Inc. Font OCRvGOST © 2003 ParaType, Inc. © 19992000 Image Power, Inc. and the University of British Columbia, Canada. © 20012002 Michael David Adams. Tous droits réservés. Toutes les autres marques sont la propriété de leurs détenteurs respectifs.
2
Manuel utilisateur ABBYY FineReader 8.0
Table des matières
BIENVENUE ...................................................................................................................... 4
Nouveautés dans ABBYY FineReader 8.0........................................................................... 5
Chapitre 1 Utilisation d'ABBYY FineReader ...................................................................... 7
Installation et démarrage d'ABBYY FineReader....................................................................................................................................................................8
Acquisition de l'image............................................................................................................................................................................................................................... 9
Analyse de la présentation de la page........................................................................................................................................................................................18
Reconnaissance.......................................................................................................................................................................................................................................... 22
Vérification et modification de texte......................................................................................................................................................................................... 29
Enregistrement dans des applications et des formats externes.............................................................................................................................. 35
Travailler avec les lots............................................................................................................................................................................................................................ 44
Tâches automatisées...............................................................................................................................................................................................................................47
Chapitre 2 ABBYY Screenshot Reader............................................................................. 54
Installation et démarrage d'ABBYY Screenshot Reader................................................................................................................................................ 55
Barre d'outils ABBYY Screenshot Reader................................................................................................................................................................................ 55
Capture de textes et de tableaux à partir de l'écran de l'ordinateur....................................................................................................................56
Création de captures d'écran............................................................................................................................................................................................................ 56
Options supplémentaires....................................................................................................................................................................................................................57
Chapitre 3 ABBYY Hot Folder & Scheduling.................................................................... 58
Installation et démarrage d'ABBYY Hot Folder & Scheduling................................................................................................................................. 59
Fenêtre principale de Hot Folder & Scheduling.................................................................................................................................................................59
Configuration d'un dossier d'images........................................................................................................................................................................................... 60
Fichier journal d'un dossier d'images .........................................................................................................................................................................................62
Options supplémentaires pour ABBYY Hot Folder & Scheduling........................................................................................................................62
Annexe ........................................................................................................................... 63
Formats d'enregistrement de document pris en charge par ABBYY FineReader ......................................................................................64
Support de formats d'image..............................................................................................................................................................................................................64
Raccourcis clavier..................................................................................................................................................................................................................................... 65
Glossaire..........................................................................................................................................................................................................................................................67
3
Manuel utilisateur ABBYY FineReader 8.0
BIENVENUE
Merci d'avoir acheté ABBYY FineReader ! Les documents électroniques prennent une part de plus en plus importante aujourd'hui dans nos activités quotidiennes. Il n'en reste pas moins que les lettres commerciales, les livres et les journaux continuent d'être imprimés et que des millions de personnes utilisent ABBYY FineReader pour convertir leurs documents papier au format électronique. ABBYY FineReader est à l'avant–garde de la technologie. Vous disposez d'un contrôle complet des informations imprimées : en quelques minutes, vous pouvez transformer un texte imprimé ou un fichier PDF sous un format modifiable facile à exploiter. ABBYY FineReader vous aide à :
collecter les informations à partir de diverses sources et établir un rapport
modifier un document papier ou un fax
rédiger un article, une thèse ou un dossier en vue de sa publication
publier des coupures de presse et des extraits d'un ouvrage sur le Web
extraire du texte d'un fichier PDF et y apporter des modifications
ABBYY FineReader est particulièrement simple à utiliser. Même si la reconnaissance optique de caractères (OCR) vous est étrangère, vous serez très rapidement performant. Et si vous êtes un expert en la matière, vous n'aurez aucune difficulté à tirer parti des multiples paramétrages possibles pour un maximum d'efficacité. Ce Guide de l'utilisateur présente les fonctions et commandes spécifiques à ABBYY FineReader et explique comment apprendre à « lire » à votre ordinateur. Bienvenue dans le monde de l'OCR !
4
Manuel utilisateur ABBYY FineReader 8.0
Nouveautés dans ABBYY FineReader 8.0
Par rapport à la version précédente, ABBYY FineReader 8.0 bénéficie de multiples améliorations et propose de nouvelles fonctions qui vous permettront d'améliorer votre productivité lors du traitement de documents numérisés, d'images, de fichiers PDF et de télécopies. Les innovations technologiques en matière d'intelligence ont pour but notamment d'améliorer la lecture de clichés pris avec des appareils photo numériques, d'affiner la reconnaissance des télécopies et des documents papier de faible résolution, de mieux gérer les présentations des documents et d'optimiser la protection des fichiers PDF. Les nouvelles fonctions telles que la planification des opérations, la reconnaissance des captures d'écran et l'automatisation des tâches répétitives liées au traitement des documents permettent de gagner en efficacité. Les principales améliorations et nouveautés apportées au produit sont décrites en détail dans les paragraphes qui suivent. Les fonctions disponibles uniquement dans ABBYY FineReader 8.0 Corporate Edition sont signalées le cas échéant.
Amélioration de 30% de la précision avec des documents et des télécopies de faible résolution
ABBYY FineReader offre une fidélité remarquable lors de la reconnaissance de documents de bonne qualité et sait aussi se montrer à la hauteur avec des documents de moins bonne facture. C'est généralement le cas avec des télécopies ou des documents papier numérisés à une résolution inférieure à celle recommandée pour la reconnaissance optique de caractères. Grâce à une meilleure gestion de ce type de document dans ABBYY FineReader 8.0, la qualité de la reconnaissance est 30% plus précise qu'auparavant.
Traitement des images prises avec des appareils photo numériques
Lorsque vous êtes en déplacement ou que vous n'avez aucun scanner à portée de main, le plus simple est de prendre une photo des documents avec un appareil photo numérique en vue de procéder à leur reconnaissance sur votre ordinateur de bureau. ABBYY FineReader 8.0 intègre maintenant une nouvelle technologie de reconnaissance adaptative qui permet d'optimiser la reconnaissance optique de caractères à partir des clichés.
Protection des fichiers PDF
La nouvelle version d'ABBYY FineReader est compatible avec les paramètres de sécurité des fichiers PDF et permet non seulement de définir un mot de passe d'ouverture de document et un mot de passe des autorisations, mais aussi de sélectionner d'autres options de protection des fichiers PDF. Vous pouvez opter pour un codage de type RC4 sur 40 bits ou 128 bits ou pour le tout nouveau mode de codage AES (Advanced Encryption Standard) sur 128 bits.
Création de fichiers PDF balisés
La nouvelle option d'enregistrement de fichiers PDF balisés dans ABBYY FineReader 8.0 permet désormais de créer des fichiers PDF plus faciles à lire sur des dispositifs disposant d'écran de taille réduite, comme par exemple les périphériques portables.
Automation Manager
Cette nouvelle fonction permet d'optimiser le traitement de tâches répétitives en les regroupant sous la forme d'une succession d'opérations que vous activez d'un seul clic. Plusieurs tâches automatisées sont prédéfinies, mais rien ne vous empêche de créer vos propres tâches automatisées et de les partager avec des collègues.
Prise en charge des hyperliens
La nouvelle version est capable de reconnaître les hyperliens, qu'il s'agisse de liens à des sites Web ou d'adresses électroniques, et de les reconstituer dans les documents de sortie. Vous pouvez également ajouter de nouveaux hyperliens dans les documents reconnus.
Mode de reconnaissance rapide
Avec ABBYY FineReader 8.0, il est possible de traiter des documents deux à deux et demi plus vite grâce au nouveau mode de reconnaissance rapide. Ce mode convient avant tout aux documents avec une présentation relativement simple et offrant une bonne qualité d'impression et de numérisation. Pour des documents plus complexes, il est préférable d'opter pour un mode de reconnaissance plus précis. Les résultats obtenus en mode rapide sont, cependant, tout à fait satisfaisants dans la majorité des cas, comme par exemple lors de la conversion de documents papier en fichiers PDF modifiables.
Enregistrement au format Microsoft Reader e–book (LIT)
Il est possible, à présent, de sauvegarder les résultats de la reconnaissance sous un format plus adapté aux périphériques portables et aux agendas numériques. Il s'agit, en l'occurrence du format LIT e–book de Microsoft Reader.
Définition des propriétés des documents
ABBYY FineReader 8.0 permet de définir des propriétés supplémentaires spécifiques aux documents (Titre, Auteur, Sujet et Mots clés) et d'enregistrer ces données aux formats de fichier PDF, DOC/RTF, XLS, HTML, Word XML et LIT. Ces propriétés peuvent être utilisées par le système d'exploitation et tout autre logiciel pour faciliter la recherche et l'indexation de données.
Support étendu pour les langues et les dictionnaires
Le nombre total de langues prises en charge est maintenant de 179. L'utilisation des dictionnaires et la vérification de l'orthographe sont désormais possibles dans 36 langues. Les principaux dictionnaires de reconnaissance en anglais et en allemand sont maintenant complétés par des dictionnaires juridiques et médicaux dans ces mêmes langues. Il n'est pas utile de sélectionner des langues de reconnaissance spécialisées pour gérer du texte dans un domaine de spécialité.
5
Manuel utilisateur ABBYY FineReader 8.0
Ouverture de fichiers PDF et de fichiers TIFF multipages
Si vous n'avez pas besoin de convertir le document en entier, vous pouvez vous contenter d'ouvrir les pages sélectionnées des fichiers PDF ou TIFF multipages dans ABBYY FineReader 8.0.
ABBYY Screenshot Reader
(disponible avec ABBYY FineReader 8.0 Professional Edition après enregistrement et proposé par défaut dans ABBYY FineReader 8.0 Corporate Edition) Cet utilitaire simple et convivial permet de capturer une partie de l'écran et de reconnaître le texte qui s'y trouve. Il vous donne également la possibilité d'enregistrer dans un fichier ou dans le Presse–papiers les zones numérisées à l'écran.
ABBYY Hot Folder & Scheduling
(disponible uniquement avec ABBYY FineReader 8.0 Corporate Edition) L'ancienne fonction prévue pour vérifier et traiter automatiquement les images entrantes dans les dossiers a été améliorée dans la nouvelle version d'ABBYY FineReader. Il est possible désormais de planifier le traitement des images et de procéder à la conversion de documents sur votre ordinateur en dehors de vos activités normales, pendant la nuit, par exemple.
6
Manuel utilisateur ABBYY FineReader 8.0
Chapitre 1 Utilisation d'ABBYY FineReader
Contenu de ce chapitre:
Installation et démarrage d'ABBYY FineReader
Acquisition de l'image
Analyse de la présentation de la page
Reconnaissance
Vérification et modification de texte
Enregistrement dans des applications et des formats externes
Travailler avec les lots
Tâches automatisées
Traitement des documents en réseau
7
Manuel utilisateur ABBYY FineReader 8.0
Installation et démarrage d'ABBYY FineReader
Ce chapitre traite des procédures d'installation d’ABBYY FineReader et de sujets apparentés, notamment la configuration système requise et l'installation sur station de travail et réseau. La configuration d’ABBYY FineReader est assurée par un programme d'installation spécial, fourni avec le produit de distribution. Utilisez toujours le CD–ROM fourni avec votre lot de logiciels.
Configuration matérielle et logicielle requise
La configuration suivante est requise pour utiliser ABBYY FineReader :
1. PC avec Intel® Pentium®/Celeron®/Xeon™/AMD K6/Athlon™/Duron™/Sempron™ ou processeur compatible. La vitesse du processeur doit être de 500 MHz ou supérieure
2. Microsoft® Windows® 2003, Microsoft langue correspondante est requise pour les interfaces localisées).
3. 128 Mo plus 16 Mo de mémoire pour chaque processeur supplémentaire sur les systèmes multiprocesseurs
4. 250 Mo d’espace disque disponible pour une installation typique minimale et 100 Mo d'espace disque pour utiliser le programme
5. scanner 100% compatible TWAIN, caméra numérique ou modem/fax
6. Une carte et un écran vidéo (résolution min. 800 × 600 ppp)
7. Un clavier et une souris ou tout autre dispositif de pointage
Installation d'ABBYY FineReader
Le programme d'installation vous guide tout le long de l'installation d'ABBYY FineReader. Veuillez fermer toutes les autres applications avant d'installer ABBYY FineReader.
Pour installer ABBYY FineReader :
1. Insérez le CD–ROM dans le lecteur de CD. Le programme d'installation démarre automatiquement
2. Suivez les instructions du programme d'installation.
Si le programme d'installation ne démarre pas automatiquement :
1. Cliquez sur le bouton Démarrer dans la barre des tâches, puis sélectionnez la commande Paramètres/Panneau de configuration.
2. Cliquez deux fois sur l'icône Ajout/Suppression de programmes.
3. Sélectionnez l'onglet Installation/Désinstallation et cliquez sur le bouton Installer.
4. Suivez les instructions du programme d'installation.
Option d'installation
Au cours de l'installation, vous êtes invité à sélectionner l'une des deux options d'installation suivantes :
Typique (recommandé) – tous les composants sont installés, y compris toutes les langues de reconnaissance, une seule langue d'interface sélectionnée pendant l'installation.
Installation personnalisée – vous pouvez choisir un nombre quelconque de composants présents dans le produit (notamment les langues de reconnaissance disponibles).
Si un message d'erreur s'affiche, reportez–vous au fichier Readme.htm, se trouvant sur le CD d'installation d'ABBYY FineReader pour obtenir de l'aide. Remarque : si vous souhaitez utiliser les dictionnaires et les motifs utilisateur d'une version précédente d’ABBYY FineReader, ne désinstallez pas cette version avant d'installer la nouvelle. Tout motif et dictionnaire utilisateur existant pourra alors être utilisé dans la version plus récente.
®
Windows® XP, Microsoft® Windows® 2000 (la prise en charge de la
Démarrage d'ABBYY FineReader
Pour démarrer ABBYY FineReader :
Sélectionnez la commande ABBYY FineReader 8.0 Professional Edition (Corporate Edition) dans le menu Démarrer/Programmes/ABBYY FineReader 8.0.
Cliquez sur dans la barre d'outils Microsoft Word.
Dans l'Explorateur Windows, cliquez avec le bouton droit de la souris sur le fichier à ouvrir. Dans le menu local,
sélectionnez la commande Ouvrir avec ABBYY FineReader.
Remarque : avant de démarrer ABBYY FineReader, assurez–vous, a que le scanner est connecté à l'ordinateur et sous tension. Si ce
n'est pas le cas, consultez le manuel d'utilisation du scanner pour des instructions d'installation. Si vous n'avez pas de scanner, ABBYY FineReader peut reconnaître vos fichiers d'image (les fichiers d'exemple de ce type se trouvent dans le dossier ABBYY FineReader/Démo).
Installation sur un serveur et une station de travail réseau
Installation sur un serveur réseau
Cette rubrique ne concerne que les administrateurs système. L'installation se décompose en deux étapes. Le programme est d'abord installé sur le serveur et peut être installé depuis le serveur sur des stations de travail, via l'une des quatre méthodes suivantes :
8
Manuel utilisateur ABBYY FineReader 8.0
via Active Directory
via Microsoft Systems Management Server (SMS)
via Task Scheduler
via la ligne de commande
manuellement en mode interactif
Pour installer ABBYY FineReader 8.0 Corporate Edition sur le serveur :
1. Insérez le CD–ROM dans le lecteur de CD.
2. Exécutez le fichier setup.exe depuis le CD–ROM d’ABBYY FineReader.
Pour plus d'informations sur l'installation d'ABBYY FineReader sur des stations de travail, l'utilisation de License Manager et l'utilisation du programme sur un réseau local, reportez–vous au "Guide de l'administrateur système" qui se trouve dans le dossier Administrator's Guide sur le serveur où ABBYY FineReader est installé.
Acquisition de l'image
La qualité de la reconnaissance dépend dans une large mesure de la qualité de l'image source. Ce chapitre vous explique comment numériser un document correctement, comment ouvrir et lire une image déjà présente sur votre ordinateur (consultez la liste des formats d'image pris en charge dans la section Formats d'image pris en charge), comment traiter les images et les préparer pour la reconnaissance (éliminer la "poussière" de numérisation), etc.
Numérisation
ABBYY FineReader "dialogue" avec les scanners par l'intermédiaire de l'interface TWAIN. Cette norme universelle a été adoptée en 1992 pour unifier les normes d'interaction des périphériques d'imagerie (tels que les scanners) et les applications externes. ABBYY FineReader peut "dialoguer" avec un scanner de deux manières via un gestionnaire TWAIN :
en utilisant sa propre interface : dans ce cas, vous utilisez la boîte de dialogue Paramètres de scanner d’ABBYY FineReader pour définir les options de numérisation ; l'option correspondante est Utiliser l'interface ABBYY FineReader ;
en utilisant l'interface TWAIN su scanner : dans ce cas, vous utilisez la boîte de dialogue TWAIN du scanner pour définir les options de numérisation ; l'option correspondante est Utiliser l'interface de la source TWAIN.
Les deux modes présentent des avantages et des inconvénients.
Quand vous choisissez l'option Utiliser l'interface de la source TWAIN, l'option d'aperçu de l'image devient généralement disponible. L'aperçu vous permet de définir la zone de numérisation et d'ajuster la luminosité : ces réglages sont faciles car vous pouvez vérifier leur impact sur l'aperçu. Un inconvénient est que les différents scanners utilisent des boîtes de dialogue de gestionnaire TWAIN différentes. Les instructions d'utilisation de la boîte de dialogue TWAIN sont fournies avec le scanner. Lorsque vous sélectionnez l'option Utiliser l'interface ABBYY FineReader, les fonctionnalités suivantes deviennent disponibles : tout d'abord, vous pouvez numériser des images multiples sur les scanners à chargeur automatique ; ensuite, vous pouvez enregistrer les options de numérisation dans les fichiers de modèle de lot (*.fbt) puis les utiliser avec d'autres lots. Vous pouvez aisément commuter d'un mode à l'autre :
Sélectionnez l'onglet Numériser/Ouvrir dans la boîte de dialogue Options (menu Outils>Options) et cliquez sur le bouton radio approprié : Utiliser l'interface de la source TWAIN ou Utiliser l'interface ABBYY
FineReader.
Remarque :
1. L'option Utiliser l'interface ABBYY FineReader peut ne pas être disponible avec certains modèles de scanner.
2. Si vous voulez voir la boîte de dialogue Paramètres de scanner dans le mode Utiliser l'interface ABBYY
FineReader, sélectionnez l'option Montrer la boîte de dialogue d'options avant de numériser sur l'onglet Numériser/Ouvrir (menu Outils>Options).
Important : consultez la documentation du scanner pour le connecter correctement. Après avoir connecté le scanner à l'ordinateur,
n'oubliez pas d'installer un gestionnaire TWAIN et/ou une application de numérisation.
Pour lancer la numérisation :
Cliquez sur le bouton 1 – Numériser ou sélectionnez la commande Numériser dans le menu Fichier. La fenêtre Image apparaît et montre une "photographie" de la page numérisée dans la fenêtre principale d’ABBYY FineReader. Pour numériser plusieurs pages d'affilée, sélectionnez l'option Numériser des images multiples à partir de l'onglet Numériser/Ouvrir de la boîte de dialogue Options.
Remarque :Pour ouvrir cette boîte de dialogue, sélectionnez Options... à partir du menu du bouton 1–Numériser.
Si la numérisation n'a pas démarré directement, l'une des deux boîtes de dialogue suivantes apparaît :
La boîte de dialogue Source TWAIN du scanner. Vérifiez les options de numérisation et cliquez sur la touche de numérisation (elle peut s'appeler Te rm i ne r , Scan, Final, selon le modèle de scanner).
La boîte de dialogue Paramètres de scanner. Vérifiez les options de numérisation et cliquez sur la touche de numérisation (elle peut s'appeler Te rm i ne r , Scan, Final, selon le modèle de scanner).
9
Manuel utilisateur ABBYY FineReader 8.0
Conseil :
Si vous souhaitez lancer la reconnaissance dès que les images sources sont numérisées, vous pouvez utiliser la commande Numériser&Lire.
Cliquez sur la flèche à droite du bouton Numériser&Lire et choisissez Numériser&Lire dans le menu local.
ABBYY FineReader numérise et lit les images. La fenêtre Image affiche une "photographie" de la page numérisée et la fenêtre Te x te affiche le résultat de la reconnaissance dans la fenêtre principale d’ABBYY FineReader.
Définition des paramètres de numérisation
La qualité de la reconnaissance dépend dans une large mesure de celle de l’image numérisée. Pour régler celle–ci, vous devez définir les principaux paramètres de numérisation : résolution, mode de numérisation et luminosité.
Les principaux paramètres de numérisation sont les suivants :
Résolution : choisissez une résolution de 300 ppp pour le texte normal (taille de police de 10 points ou plus) et de 400 à 600 ppp pour les textes de plus petite taille (9 points ou moins).
Mode de numérisation gris. La numérisation en niveaux de gris est le mode le plus performant pour le système de reconnaissance. Si vous numérisez vos images dans ce mode, l’application règle automatiquement la luminosité.
Mode de numérisation : noir et blanc. Le mode noir et blanc permet d’accélérer la numérisation, mais au risque de perdre certaines informations sur les caractères. Cela peut affecter la qualité de la reconnaissance des documents de qualité d’impression moyenne ou médiocre.
Mode de numérisation : couleur. Si vous numérisez des documents en couleur, qu’il s’agisse d’images, de caractères en couleur ou d’un arrière–plan, il peut être utile de conserver les couleurs dans le document électronique. Dans ce cas, utilisez le mode de numérisation couleur. Dans les autres cas, choisissez le mode gris.
Luminosité : dans la plupart des cas, une luminosité de valeur moyenne (50%) suffit. Certains documents numérisés en noir et blanc peuvent nécessiter un réglage de la luminosité.
Remarque : la numérisation dans une résolution de 400 à 600 ppp (au lieu des 300 ppp par défaut), en niveaux de gris ou en couleur (au lieu de noir et blanc) est plus lente. Sur certains modèles de scanner, la numérisation en 600 ppp prend quatre fois plus de temps qu'en 300 ppp.
Pour définir les paramètres de numérisation :
Si vous numérisez vos images au moyen de l’interface TWAIN d’ABBYY FineReader, cliquez sur le bouton Paramètres de scanner à partir de l'onglet Numériser/Ouvrirde la boîte de dialogue Options (menu Outils>Options). La boîte de dialogue Paramètres de scanner apparaît. Définissez les options de
numérisation dans la boîte de dialogue.
Si vous numérisez les images au moyen de l’interface de la source TWAIN, la boîte de dialogue TWAIN de votre scanner apparaît automatiquement lorsque vous cliquez sur le bouton 1 –Numériser. Définissez les paramètres de numérisation dans la boîte de dialogue. Le nom des options de numérisation peut varier selon le modèle de scanner ; par exemple, le terme "seuil" peut s’appliquer à la luminosité. Le réglage de luminosité peut également se présenter sous la forme d’une icône de soleil ou d'un cercle noir et blanc. Ces options sont décrites plus précisément dans la documentation de votre scanner.
Conseils pour le réglage de la luminosité
L'image numérisée doit être lisible. Vous vérifier sa lisibilité, examinez–la dans la fenêtre Zoom.
– exemple d'une bonne image (du point de vue de l'OCR)
Si vous constatez que l'image numérisée est médiocre (caractères collés ou fragmentés, consultez le tableau ci–dessous pour savoir comment améliorer la qualité de l'image.
10
Manuel utilisateur ABBYY FineReader 8.0
Votre image a cette allure : Remède possible :
Réduisez la luminosité pour rendre l'image plus sombre.
caractères "déchirés" ou très clairs
Essayez de numériser en niveaux de gris (le réglage automatique de la luminosité est utilisé dans ce mode).
caractères déformés, collés ou remplis
Augmentez la luminosité pour rendre l'image plus claire.
Essayez de numériser en niveaux de gris (le réglage automatique de la luminosité est utilisé dans ce mode).
Numérisation de documents multipages
ABBYY FineReader propose un mode de numérisation spécialisé (Numériser des images multiples) très pratique lorsqu'il est nécessaire de traiter un volume important de pages. Pour activer ce mode, sélectionnez l'option Numériser des images multiples à partir de l'onglet Numériser/Ouvrir de la boîte de dialogue Options (menu Outils>Options). Il présente certaines particularités :
Si vous numérisez vos images au moyen de l’interface TWAIN d’ABBYY FineReader, le scanner ne s’arrête pas après avoir numérisé une page et passe automatiquement à la suivante.
Si vous numérisez vos images au moyen de l’interface de la source TWAIN, la boîte de dialogue TWAIN du scanner n’est pas refermée quand le scanner a fini de numériser une page. Vous pouvez insérer la page suivante et la numériser, et ainsi de suite.
Si vous devez numériser un grand nombre de pages, deux possibilités s’offrent à vous : vous pouvez utiliser un chargeur automatique de documents (ADF) ou faire le travail manuellement.
Numérisation avec un chargeur automatique :
1. Si vous utilisez l’interface d’ABBYY FineReader, sélectionnez l’option Utiliser le chargeur automatique de documents de la boîte de dialogue Paramètres de scanner (pour ouvrir cette boîte de dialogue, cliquez sur le
bouton Paramètres de scanner situé sous l'onglet Numériser/Ouvrir de la boîte de dialogue Options) et l'option Numériser des images multiples sous l'onglet Numériser/Ouvrir dans la boîte de dialogue Options (menu Outils>Options...), puis cliquez sur 1_Numériser pour lancer la numérisation.
2. Si vous utilisez l’interfacee de la source TWAIN, sélectionnez l’option Utiliser le chargeur automatique de documents de la boîte de dialogue TWAIN de votre scanner (cette option peut avoir un nom différent selon le modèle du scanner ; les options de la boîte de dialogue TWAIN sont décrites dans la documentation du scanner) et l'option Numériser des images multiples sous l'onglet Numériser/Ouvrir dans la boîte de dialogue
Options (menu Outils>Options...), puis cliquez sur 1_Numériser pour lancer la numérisation.
Numérisation sans chargeur automatique :
Si vous utilisez l'interface ABBYY FineReader, sélectionnez l'option Numériser des images multiples à partir de l'onglet Numériser/Ouvrir de la boîte de dialogue Options (menu Outils>Options...), puis cliquez sur 1_Numériser pour lancer
l'opération. Certaines méthodes vous permettent de numériser plus facilement des pages multiples sur un scanner à plat sans chargeur automatique. Deux alternatives s’offrent à vous :
Définissez la valeur de la pause, c’est–à–dire le délai séparant le moment où le scanner finit de numériser une page et celui où il commence à numériser la suivante. Sélectionnez l’option Pause entre les pages puis définissez la valeur de la pause (en secondes) dans la boîte de dialogue Paramètres de scanner (pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de scanner situé sous l'onglet Numériser/Ouvrir de la boîte de dialogue Options). Dans ce cas, le scanner ne commence à numériser la page de texte qu’au bout du délai en secondes que vous avez défini ; ainsi, vous disposez de suffisamment de temps pour insérer la page suivante. Une fois la pause terminée, la numérisation se poursuit normalement.
Sélectionnez l’option Arrêt entre les pages de la boîte de dialogue Paramètres de scanner (pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de scanner situé sous l'onglet Numériser/Ouvrir de la boîte de dialogue Options). Dans ce cas, chaque fois que le scanner a fini de numériser une page, une boîte de dialogue vous demande si vous souhaitez poursuivre la numérisation. Cliquez sur le bouton Oui pour continuer ou Non pour mettre fin à l’opération.
Lorsque vous avez fini de numériser les pages, sélectionnez la commande Arrêter la numérisation du menu Fichier. Si vous utilisez l’interface de la source TWAIN
Sélectionnez la commande Numériser des images multiples du menu Fichier. La boîte de dialogue TWAIN de votre scanner apparaît. Cliquez sur Numériser (ce bouton peut également s’appeler Final ou autre selon la boîte de dialogue TWAIN de votre scanner) pour lancer la numérisation.
Numérisez la page, insérez–en une nouvelle et cliquez sur le bouton Numériser de la boîte de dialogue TWAIN de votre scanner et ainsi de suite. Lorsque vous avez terminé, cliquez sur le bouton Fermer (il peut également avoir un autre nom) dans la boîte de dialogue TWAIN de votre scanner.
11
Manuel utilisateur ABBYY FineReader 8.0
Conseil : Pour avoir un meilleur contrôle de la qualité de vos images numérisées, pensez à sélectionner l'option Ouvrir l'image pendant la numérisation du groupe Numériser/Ouvrir dans la boîte de dialogue b héritées (pour ouvrir cette boîte de dialogue, cliquez sur le bouton Options héritées... sous l'onglet Général dans la boîte de dialogue Options). Si vous activez cette option, chaque page est ouverte dans la fenêtre Image immédiatement après la numérisation. Si l’image vous semble mal numérisée, arrêtez l’opération (sélectionnez la commande Arrêter la numérisation du menu Fichier) et recommencez.
Résolution des problèmes de numérisation : votre scanner ne prend pas en charge TWAIN
Vous pouvez utiliser ABBYY FineReader même si votre scanner n'est pas compatible TWAIN. Procédez simplement comme suit :
1. Créez un nouveau lot et ouvrez–le. Si un lot est déjà ouvert, sautez cette étape.
2. Définissez les paramètres de reconnaissance appropriés (langue de reconnaissance, type de document, type d'impression).
3. Sélectionnez la commande Lancer la reconnaissance en arrière–plan dans le menu Traitement.
4. Numérisez le document souhaité avec un programme d'acquisition d'image compatible avec votre scanner. Ne fermez pas ABBYY FineReader. Enregistrez l'image numérisée dans le dossier où vous avez enregistré le lot ABBYY FineReader ouvert ; le nom du fichier doit être 0001.TIF. ABBYY FineReader trouvera automatiquement l'image et la lira. Remarque : si votre lot contient déjà des pages, le nom du premier fichier d'image numérisé ne doit pas être
0001.TIF mais XXXX.TIF, où XXXX est le nombre de pages du lot majoré d'une unité. Par exemple, si le lot contient 10 pages, le nom de fichier du premier fichier d'image numérisé sera 0011.tif. Si vous numérisez un autre fichier, il sera nommé 0012.TIF, et ainsi de suite.
5. Numérisez le second document et enregistrez–le sous le nom 0002.TIF, etc.
6. Appuyez sur F5 pour actualiser la liste de pages.
7. Sélectionnez la commande Arrêter la reconnaissance en arrière–plan dans le menu Traitement pour mettre fin à la reconnaissance.
ABBYY FineReader lit ainsi pas à pas toutes les pages souhaitées.
Ouverture des images et des fichiers PDF
Vous pouvez reconnaître des images même si vous n'avez pas de scanner (consultez la liste des formats utilisables dans la section Formats d'image pris en charge). Pour ouvrir une image :
Cliquez sur la flèche à droite du bouton 1 – Numériser et sélectionnez la commande Ouvrir une image dans le menu contextuel. L'icône du bouton 1 – Numériser change et le titre devient Ouvrir.
Sélectionnez la commande Ouvrir une image dans le menu Fichier.
Dans Windows Explorer : cliquez avec le bouton droit de la souris sur le fichier d’image à ouvrir, puis dans le menu
contextuel, sélectionnez l’option Ouvrir avec ABBYY FineReader. Si l'application ABBYY FineReader est déjà lancée, l'image s'ajoute au lot en cours. Dans le cas contraire, une copie d’ABBYY FineReader est lancée, avant l'ajout de l'image. Cette copie ouvre le dernier lot sur lequel vous avez travaillé.
Dans Microsoft Outlook ou Windows Explorer : cliquez sur le fichier image que vous souhaitez ouvrir et faites–le glisser dans la fenêtre minimisée d’ABBYY FineReader. L'image est ajoutée au lot en cours et ouverte dans la fenêtre Image.
Sélectionnez une ou plusieurs images dans le boîte de dialogue Ouvrir. Les images sélectionnées sont affichées dans la fenêtre Lot et la dernière apparaît dans les fenêtres Image et Zoom d’ABBYY FineReader. Toutes les images sélectionnées sont recopiées dans le dossier de lot. Consultez la section Informations générales sur l'utilisation des lots pour des informations sur l'organisation des lots et l'affichage des images qu'ils contiennent. Conseil : si vous voulez que les images ouvertes soient reconnues immédiatement, utilisez le mode Ouvrir&Lire :
1. Sélectionnez la commande Ouvrir&Lire dans le menu Traitement ou appuyez sur ALT+MAJ+D. La boîte de dialogue Ouvrir apparaît.
2. Sélectionnez les images à reconnaître.
Ouverture de fichiers PDF
L'auteur d'un fichier PDF peut en restreindre l'accès. Il peut, par exemple, protéger son fichier par un mot de passe ou limiter l'accès à certaines fonctions, telles que l'extraction de texte et de graphiques. L'accès à ces fonctions restreintes constituerait une violation de copyright, c'est pourquoi ABBYY FineReader vous demande de fournir un mot de passe pour pouvoir ouvrir ce type de fichier.
Numérisation de pages doubles
Lorsque vous numérisez un livre, il est plus commode de numériser à la fois les pages de gauche et les pages de droite (des "pages doubles"). Toutefois, la qualité de reconnaissance est meilleure si la page double est segmentée après numérisation, de sorte que chaque page du lot correspond à une seul page du livre. La reconnaissance et l'analyse de la présentation sont effectuées pour chaque page séparément, chaque page étant redressée si nécessaire. Si vous souhaitez segmenter des pages doubles :
Avant la numérisation, sélectionnez l'option Segmenter les pages doubles sur l'onglet Numériser/onglet Ouvrir (menu Outils >Options).
Si cette option est définie, chaque page double est segmentée en deux pages de lot. Consultez la section Informations générales sur l'utilisation des lots pour plus d'informations sur les lots.
12
Manuel utilisateur ABBYY FineReader 8.0
Remarque : si une image double est segmentée en deux de manière incorrecte, désélectionnez la case à cocher Partager les pages doubles, numérisez à nouveau la page double ou rajoutez l'image correspondante au lot, puis essayez de segmenter manuellement l'image, à l'aide de la boîte de dialogue Partager l'image (Image>Partager l'image).
Ajout d'images de cartes de visite au lot
Il est pratique, lorsque vous saisissez des cartes de visite, d'en saisir un grand nombre à la fois (autant que le scanner peut en contenir). La qualité de la reconnaissance est optimale (grâce au redressement, par exemple) lorsque chaque carte de visite est numérisée sur une page à part. Le système présente des outils de partage automatique et manuel des images contenant des cartes de visite agencées selon un ordre donné.
Pour partager une image :
1. Sélectionnez l'image requise dans la fenêtre Lot.
2. Sélectionnez la commande Partager l'image du menu Image. La boîte de dialogue Partager l’image s'affiche.
3. Cliquez sur le bouton Partager les cartes de visite.
Remarque:
1. La page divisée est supprimée du lot et remplacée par les éléments qui la composent. Pour en savoir plus, consultez la section Informations générales concernant l’utilisation des lots.
2. Si l'image est incorrectement divisée dans les cartes de visite, essayez de la fragmenter manuellement en cliquant sur le bouton Ajouter un séparateur vertical/Ajouter un séparateur horizontal.
3. Pour supprimer l'ensemble des séparateurs, cliquez sur le bouton Supprimer tous les séparateurs.
4. Pour déplacer un séparateur, activez le mode Sélectionner un séparateur (cliquez sur le bouton déplacez le séparateur.
5. Pour supprimer un séparateur, activez le mode Sélectionner un séparateur (cliquez sur le bouton déplacez le séparateur hors de l'image.
), puis
), puis
Utilisation d'un appareil photo numérique pour photographier des textes
Photographier des documents demande de la pratique et des compétences particulières. L'intérêt de cette rubrique est justement de vous apprendre à vous préparer et à régler votre appareil photo numérique de façon à obtenir les meilleurs clichés possibles pour la reconnaissance optique de caractères. Pour plus d'informations sur la configuration de votre propre appareil, reportez–vous à la documentation qui l'accompagne.
Avant de faire des clichés...
1. Assurez–vous que la page est parfaitement cadrée et qu'aucun objet indésirable n'est visible.
2. Veillez à ce que la page soit éclairée de façon homogène et qu'elle ne comporte aucune ombre ou zone plus sombre.
3. Aplanissez la page si cela est nécessaire et placez–vous de façon à ce que l'appareil photo soit parallèle au plan du document et que l'objectif soit centré sur le texte à photographier.
Configuration nécessaire
Configuration minimale
Capteur de 2 millions de pixels
Objectif à focale variable (les objectifs à focale fixe, communs sur les téléphones cellullaires et les périphériques
portables, donnent des photographies non satisfaisantes pour la reconnaissance optique de caractères)
Configuration recommandée
Capteur de 5 millions de pixels
Mode de désactivation du flash
Contrôle manuel de l'ouverture du diaphragme ou mode priorité ouverture
Mise au point manuelle
Utilisation d'un système anti–bougé (ou trépied recommandé en l'absence d'un tel système)
Zoom optique
13
Manuel utilisateur ABBYY FineReader 8.0
Comment photographier des textes ?
Luminosité
Prenez vos photos de préférence à la lumière du jour ou dans des conditions d'éclairage satisfaisantes.
Installation de l'appareil photo
L'utilisation d'un trépied est vivement recommandée. Les meilleurs résultats sont obtenus lorsque vous réglez le zoom optique au niveau maximal. L'objectif doit être parallèle au plan du document et centré par rapport au texte. Au niveau de grossissement maximal, la distance entre l'appareil photo et le document doit être suffisante pour cadrer tout le sujet. Cette distance varie généralement de 50 à 60 cm.
Utilisation du flash
Si la luminosité est suffisante, désactivez le flash pour éviter un reflet trop important sur la page et des ombres trop prononcées. Lorsque les conditions d'éclairage sont mauvaises, utilisez le flash en vous tenant à environ 50 cm du document, mais prévoyez également une source lumineuse supplémentaire.
Important ! Le reflet est plus important lorsque vous utilisez le flash avec des documents imprimés sur du papier brillant.
Mode de sélection
Ouverture du diaphragme
Lorsque l'éclairage ambiant est faible, la valeur d'ouverture recommandée est de 2,3 à 4,5, c'est–à–dire la valeur maximale autorisée par l'appareil photo. Sous une lumière vive, la netteté des images est d'autant plus importante que la valeur d'ouverture est faible.
Sensibilité du film
Lorsque les conditions d'éclairage ne sont pas satisfaisantes, veillez à sélectionner un nombre ISO plus élevé.
Mise au point
La mise au point automatique risque de ne pas fonctionner correctement en cas de luminosité insuffisante. Faites une mise au point manuelle.
14
Manuel utilisateur ABBYY FineReader 8.0
Balance des blancs
Si votre appareil photo le permet, utilisez une feuille de papier blanche pour régler la balance des blancs. Sinon, sélectionnez le mode d'équilibrage des blancs le plus adapté aux conditions d'éclairage ambiantes.
Recommandations supplémentaires
Un mauvais éclairage entraîne une surexposition de la part de l'appareil photo, ce qui risque de produire des image moins nettes. Pour y remédier, essayez les solutions suivantes :
Actionnez le système anti–bougé, si l'appareil photo en est équipé.
Utilisez le stabilisateur optique pour éviter de faire bouger l'appareil au moment où vous appuyez sur le
déclencheur.
Que faire si...
L'image est trop foncée et peu contrastée
Essayez d'utiliser des sources lumineuses supplémentaires. Sinon, augmentez l'ouverture du diaphragme.
L'image n'est pas assez nette
La mise au point automatique risque de ne pas fonctionner correctement en cas de luminosité insuffisante. Essayez d'utiliser des sources lumineuses supplémentaires. Si ce n'est pas possible, faites une mise au point manuelle. Si une partie seulement de l'image est floue, réduisez l'ouverture du diaphragme. Augmentez la distance entre le document et l'appareil photo et utilisez le plus grand zoom possible. Visez un point situé entre le centre du document et un bord du document.
Le flash produit un reflet au centre de l'image
Désactivez le flash. Sinon, essayez de prendre la photo aussi loin que possible.
Travailler avec les images
Nettoyer l’image
L'image reconnue peut contenir de la "poussière", c'est–à–dire de nombreux points superflus. Ces points en excès sont dus à la numérisation de documents de qualité d'impression médiocre. Les points situés près du contour des caractères peuvent avoir un effet négatif sur la qualité de la reconnaissance. Il est donc souhaitable de réduire le nombre de ces points. Pour cela :
Choisissez Nettoyer l'image dans le menu Image>Réglages de l'image.
Si vous souhaitez nettoyer un bloc en particulier :
Choisissez Nettoyer le bloc dans le menu Image>Réglages de l'image.
Remarque : dans le cas où l'original est très pâle ou imprimé dans une police très fine, le nettoyage de l'image risque de faire
disparaître des points, des virgules ou des parties très fines des caractères, provoquant une dégradation de la qualité de reconnaissance. Si vous numérisez ou ouvrez des images très "poussiéreuses", sélectionnez l'option Nettoyer l'image dans le groupe Prétraitement de l'image de l'onglet Numériser/Ouvrir une image (menu Outils >Options) pour les nettoyer avant que l'application ne les ajoute au lot.
Changer la résolution d'une image
La résolution, mesurée en points par pouce (ppp), détermine la finesse des détails d'une image. Le niveau maximum de performances en matière de reconnaissance optique de caractères (OCR) est atteint par ABBYY FineReader lorsque la résolution verticale et la résolution horizontale sont identiques et comprises entre 50 et 3200 ppp. La plage recommandée est de 200 à 600 ppp et la valeur conseillée est de 300 ppp. Une résolution d'image trop faible ou trop élevée peut nuire à la qualité de la reconnaissance. Certains formats d'image, tels que les fichiers *.bmp, n'ont pas de résolution. La résolution des images n'est pas toujours standard (204*96 ppp, par exemple), ce qui peut également avoir une incidence sur la qualité OCR. ABBYY FineReader vérifie et rectifie, si besoin est, la résolution de chaque image, sans changer les dimensions. Les images dont la
résolution a été corrigée par le programme sont signalées par d'image pour afficher un conseil dans une info–bulle.
dans la fenêtre Lot. Positionnez le curseur de la souris sur ce type
15
Manuel utilisateur ABBYY FineReader 8.0
Lorsque la qualité OCR d'une image est mauvaise, vous pouvez parfois obtenir de meilleurs résultats simplement en changeant sa résolution. Pour redéfinir la résolution d'une image signalée par :
Dans la fenêtre Lot, sélectionnez l'image (repérée par un ) qui vous intéresse. Si l'info–bulle vous indique que la résolution de l'image ne convient pas, choisissez la commande Corriger la résolution dans le menu Image.
Dans la boîte de dialogue qui s'affiche, sélectionnez le type de l'image (image numérisée, image télécopiée ou capture d'écran) ou choisissez Autre résolution et entrez la résolution exacte de l'image.
Choisissez Images sélectionnées pour appliquer le changement de résolution aux seules images sélectionnées. Choisissez Toutes les images dans le lot si vous préférez changer la résolution de l'ensemble des images du lot. La dernière option est celle recommandée si les images proviennent d'une seule et même source.
Redresser les lignes de texte
Lorsque vous numérisez des livres très épais, il n'est pas rare que le texte en bordure de reliure soit déformé. Le même phénomène est visible si vous photographiez le texte avec un appareil–photo numérique. Pour remédier à cela :
Choisissez Outils>Options et cliquez sur l'onglet Numériser/Ouvrir. Sous Prétraitement de l'image, sélectionnez Redresser les lignes de texte.
Remarque : Le redressement des lignes de texte peut prendre un certain temps.
Inverser l’image
Certains scanners inversent les images (transforment le noir en blanc et réciproquement) pendant la numérisation. Vous pouvez utiliser la commande Inverser l'image pour rendre au document une apparence standard, c'est–à–dire avec une police noire sur fond blanc. Pour cela :
Choisissez Inverser l'image dans le menu Image>Réglages de l'image.
Remarque : Si vous numérisez ou ouvrez des images inversées, sélectionnez l'option Inverser l'image dans le groupe Numériser/Ouvrir de la boîte de dialogue Options héritées avant d'ajouter ces images au lot. Pour accéder à la boîte de dialogue Options héritées, cliquez sur le bouton Options héritées... à partir de l'onglet Général de la boîte de dialogue Options.
Faire pivoter ou basculer l'image
La qualité de reconnaissance dépend de l'orientation de l'image (le texte doit se lire de haut en bas et les lignes doivent être horizontales). Par défaut ABBYY FineReader détecte automatiquement l'orientation de la page pendant la reconnaissance. Si ABBYY FineReader a mal détecté l'orientation de la page, désélectionnez l'option Détecter l'orientation d'image (pendant la reconnaissance) de l'onglet Numériser/Ouvrir et faites pivoter l'image manuellement pour lui donner une orientation standard :
Cliquez sur le bouton pour faire pivoter l'image de 90° vers la droite.
Cliquez sur le bouton pour faire pivoter l'image de 90° vers la gauche.
Sélectionnez l'option Rotation à 180° dans le menu Image>Faire pivoter/Basculer l'image pour faire pivoter l'image de 180 degrés.
Pour basculer l'image :
horizontalement (autour de l'axe vertical) – choisissez Basculement horizontal dans le menu Image>Faire pivoter/Basculer l'image,
verticalement (autour de l'axe horizontal ) – choisissez Basculement vertical dans le menu Image>Faire pivoter/Basculer l'image.
ou sélectionnez la commande Faire pivoter/Basculer l'image dans le menu Image
ou sélectionnez la commande Faire pivoter/Basculer l'image dans le menu Image
Effacer un bloc
Si vous ne souhaitez pas reconnaître une zone donnée de l'image ou si de grandes zones de l'image sont "poussiéreuses", vous pouvez les effacer. Pour cela :
Sélectionnez l'outil bouton gauche de la souris. Relâchez le bouton pour effacer la zone sélectionnée.
et sélectionnez la zone de l'image que vous voulez effacer en maintenant enfoncé le
Détourer une image
Il arrive parfois que les bords des images numérisées soient trop foncés. Il est possible d'éliminer les zones indésirables de l'image avant de commencer la reconnaissance optique de caractères. Vous pouvez également vous servir de l'outil Détourer l'image pour réduire l'image à un format de papier standard (A4 ou A5, par exemple).
1. Dans la fenêtre Image, sélectionnez l'outil Image).
2. Cela a pour effet d'afficher l'image dans la fenêtre Détourer l'image et de représenter ses bords par des lignes de couleur.
Dans la liste déroulante à gauche, vous pouvez choisir l'échelle à laquelle vous préférez visualiser
l'image dans la fenêtre.
Pour recadrer l'image, positionnez le curseur de la souris sur la bordure en couleur et faites–la glisser
jusqu'à l'endroit voulu. Vous obtenez le même effet en plaçant le curseur sur l'un des coins de l'image
(ou choisissez la commande Détourer l'image dans le menu
16
Manuel utilisateur ABBYY FineReader 8.0
et en le faisant glisser dans le sens diagonale. La partie de l'image qui sera éliminée est représentée en gris. Cliquez sur le bouton Détourer.
Pour réduire l'image à un format de papier standard, sélectionnez le format voulu dans la liste
Détourer selon à droite.
Pour éviter de recadrer une image et passer immédiatement à la suivante, cliquez sur le bouton
Ignorer.
Désélectionnez l'option Passer à l'image suivante pour éviter qu'ABBYY FineReader traite
automatiquement l'image suivante dès que vous avez terminé de travailler sur l'image actuelle.
Remarque :
1. Il est recommandé de recadrer l'image avant de commencer le traçage des blocs et la reconnaissance de l'image.
2. Vous pouvez modifier la couleur des bords des images dans la fenêtre Détourer l'image. Pour cela, cliquez sur l'onglet Affichage de la boîte de dialogue (menu Outils>Options). Dans le groupe Apparence, sélectionnez l'option Détourer un bloc de l'image dans la liste et cliquez sur le champ Couleur. Dans la boîte de dialogue
Couleur, choisissez la couleur désirée.
Redimensionner l'image
Sélectionnez l'outil / de la barre Image (dans la fenêtre Image) et cliquez sur l'image. L'échelle de l'image sera multipliée/divisée par deux.
Cliquez avec le bouton droit de la souris sur l'image et sélectionnez la commande Redimensionner, puis sélectionnez l'échelle de votre choix dans le menu contextuel.
Récupérer les informations de l’image
Vous pouvez obtenir les informations suivantes sur l'image : largeur et hauteur en pixels ; résolution verticale et horizontale par pouce (ppp) ; type d'image.
Cliquez avec le bouton droit de la souris sur l'image et sélectionnez la commande Propriétés dans le menu contextuel. Une boîte de dialogue s'ouvre. Sélectionnez l'onglet Image dans cette boîte de dialogue.
Imprimer l'image
Vous pouvez imprimer l'image ouverte dans la fenêtre Image, les images des pages sélectionnées dans la fenêtre Lot ou les images de toutes les pages du lot :
Sélectionnez la commande Imprimer>Image dans le menu Fichier. La boîte de dialogue Impression s'ouvre. Réglez les paramètres d’impression requis (imprimante, nombre de pages à imprimer, nombre de copies, etc.).
Annuler la dernière action
Pour annuler la dernière action, cliquez sur le bouton Annuler sur la barre Standard .
Conseil : pour annuler l'action Annuler, cliquez sur le bouton Rétablir de la barre Standard
.
Numérotation des pages
Un numéro est affecté à chaque page numérisée. Le numéro par défaut est celui de la dernière page du lot majoré d'une unité. Vous pouvez toutefois définir manuellement le numéro des pages si vous le souhaitez, par exemple pour conserver la numérotation initiale ou numériser une série de pages classées par numéro. Pour cela :
Sélectionnez l'option Demander un numéro de page avant d'ajouter la page au lot sur l'onglet Numériser/Ouvrir une image (menu Outils>Options).
Si vous numérisez un grand nombre de pages recto verso triées par numéro :
1. Sélectionnez l'option Demander un numéro de page avant d'ajouter la page au lot sur l'onglet Numériser/Ouvrir une image (menu Outils>Options).
2. Spécifiez le numéro de la première page numérisée dans la boîte de dialogue Numéro de page, puis sélectionnez l'option Pages paires et impaires séparément dans le champ Numérotation des pages. Sélectionnez l'ordre de numérotation des pages : croissant ou décroissant. Le mode dépend de la manière dont vous disposez les pages recto verso dans le chargeur automatique de documents, c'est–à–dire si le numéro disposé au–dessus est le plus grand ou le plus petit.
Options d'image de lot
Sélectionnez l'option Convertir en noir et blanc les images couleur et en niveaux de gris si vous numérisez vos images en niveaux de gris avec l'interface de la source TWAIN et que les images numérisées ne contiennent ni image, police ni arrière–plan couleur ou si vous ne souhaitez pas conserver les couleurs sur les images numérisées. Si vous définissez cette option, les images numérisées occupent moins d'espace disque.
Remarque : cette option figure dans la boîte de dialogue Options héritées. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Options héritées... à partir de l'onglet Général de la boîte de dialogue Options.
17
Manuel utilisateur ABBYY FineReader 8.0
Analyse de la présentation de la page
Avant toute reconnaissance, ABBYY FineReader doit "savoir" quelles sont les parties de l'image à reconnaître. C'est le rôle que joue la procédure d'analyse de la présentation. Elle trace des blocs de texte, d'image, de tableau et de code barre. Ce chapitre traite des sujets suivants : cas où une analyse de page manuelle peut être utile, types de bloc disponibles, modification des blocs tracés par l'analyse automatique, amélioration de l'analyse de la présentation à l'aide de modèles de bloc.
Informations générales sur l'analyse de la présentation
L'analyse de la présentation de la page peut s'effectruer automatiquement ou manuellement. Dans la plupart des cas, ABBYY FineReader traite lui–même la tâche d'analyse. Lancez l'analyse automatique en cliquant sur le bouton 2 – Lire. La reconnaissance est effectuée en même temps que l'analyse de la présentation.
Cliquez sur ce bouton pour lire une image ouverte. Pour modifier le mode du bouton, cliquez sur la flèche à sa droite et sélectionnez la commande appropriée dans le menu
Remarque : une procédure autonome d'analyse de la présentation est également disponible (menu Traitement>Lire>Analyser la présentation). Vous pouvez utiliser cette procédure si nécessaire, mais pensez que la qualité de l'analyse peut être inférieure. En effet,
la procédure simultanée d'analyse de la présentation et de reconnaissance met en œuvre les informations acquises pendant la reconnaissance pour seconder l'analyse de la présentation. Vous pouvez tracer des blocs manuellement dans les cas suivants :
1. Vous voulez reconnaître une partie d'une page;
2. L'analyse automatique de la présentation a tracé les blocs incorrectement.
Conseil :
Dans certains cas, vous pouvez améliorer la qualité de l'analyse automatique et ajustant les options d'analyse. Vérifiez les options en cours (l'onglet Lire , menu Outils>Options).
Si l'application trace incorrectement certains blocs, il est souvent plus rapide de modifier les blocs à l'aide des outils de modification de bloc que de supprimer tous les blocs et de les tracer manuellement.
contextuel.
Types de blocs
Les blocs sont des zones d'image encadrées. Les blocs indiquent au système quelles zones de l'image reconnaître et dans quel ordre. Les blocs ont également une influence sur la façon dont est conservée la présentation d'origine. Les blocs de types différents comportent des cadres de différentes couleurs. Vous pouvez modifier les couleurs des cadres de bloc dans l'onglet Affichage de la boîte de dialogue Options (menu Outils >Options), dans le groupe Apparence. Sélectionnez le type de bloc dans le champ Elément, ainsi que la couleur de votre choix dans le champ Couleur.
Les types de bloc suivants sont disponibles :
Zone de reconnaissance – ce type de bloc sert à la reconnaissance et à l'analyse automatiques. Après avoir cliqué sur le bouton 2 – Lire, tous les blocs de ce type seront analysés et reconnus automatiquement. Te xt e – ce type de bloc sert aux zones d'image de texte. Il ne doit contenir que du texte formaté dans une seule colonne. Si des images
se trouvent à l'intérieur du texte, tracez un bloc séparé pour chacune. Tablea u – ce type de bloc sert aux zones d'image de tableaux ou aux zones de texte structurées en tableaux. Lorsque l'application lit des blocs de ce type, elle trace des séparateurs verticaux et horizontaux dans le bloc, de manière à constituer un tableau. Ce bloc est représenté sous forme de tableau dans le texte en sortie. Vous pouvez tracer et modifier des tableaux manuellement. Image – ce type de bloc sert aux zones contenant des images. Un bloc de ce type peut contenir une image réelle ou tout autre objet (par exemple une partie de texte) que vous souhaitez afficher sous forme d'image dans le texte reconnu. Code barre – ce type de bloc sert aux zones de l'image qui sont des codes barre. Si votre document comporte un code barre imprimé et que vous ne voulez pas l'afficher comme une image, mais comme une série de lettres et de chiffres dans le texte reconnu, tracez un bloc séparé pour le code barre et définissez le type de bloc sur code barre.
Remarque : Si vous voulez qu'ABBYY FineReader lise automatiquement les codes barre de vos documents, veillez à activer l'option Rechercher les codes barre dans le groupe Lire de la boîte de dialogue Options héritées. Dans le cas contraire, désactivez l'option (pour ouvrir cette boîte de dialogue, cliquez sur le bouton Options héritées... sous l'onglet Général dans la boîte de dialogue Options).
18
Manuel utilisateur ABBYY FineReader 8.0
Type de code barre
Code 3 sur 9
Code de contrôle 3 sur 9
Code 3 sur 9 sans astérisque
Codabar
Code 93
Code 128
EAN 8
EAN 13
IATA 2 sur 5
Entrelacé 2 sur 5
Contrôle entrelacé 2 sur 5
Matrice 2 sur 5
Postnet
Industriel 2 sur 5
UCC–128
UPC–A
UPC–E
PDF417
Options d'analyse automatique de la présentation
La procédure d'analyse automatique de la présentation d’ABBYY FineReader trace des blocs des types suivants : blocs de texte, de tableau, d'image et de code barre. La procédure d'analyse automatique de la présentation (associée à la reconnaissance de texte) démarre lorsque vous cliquez sur le bouton 2 – Lire. Avant de cliquer sur ce bouton, vous devez définir les principales options d'analyse de la présentation : type de document et options d'analyse de tableau.
Cliquez sur ce bouton pour démarrer le processus de reconnaissance d'une image ouverte. Pour changer le mode du bouton, cliquez sur la flèche qui se trouve sur sa droite et sélectionnez l'option de votre choix dans le menu contextuel.
Options d'analyse de tableau
En principe, l'application divise automatiquement le tableau en lignes et en colonnes. Pour ajuster d'autres options de tableau, ouvrez la boîte de dialogue Options héritées et sélectionnez une valeur dans le groupe Lire (pour ouvrir cette boîte de dialogue, cliquez sur le bouton Options héritées... sous l'onglet Général dans la boîte de dialogue Options). Réglez ces options si :
l'analyse automatique de la présentation a tracé incorrectement les lignes et les colonnes du tableau ;
le document contient de nombreux tableaux simples de même type (par exemple le tableau ne comporte pas de
cellules fusionnées ou chaque cellule ne comporte qu'une ligne de texte).
1. Utilisez l'option Une ligne de texte par cellule dans le tableau si vous traitez un tableau sans séparateurs
noirs ou un tableau dans lequel certains séparateurs sont noirs et d'autres non, et dans lequel chaque cellule ne comporte qu'une ligne de texte. Par exemple :
Kilomètres Miles
1 0.62 5 3.2
Phénomène physique t, degrés Celsius
Point d'ébullition
de l'eau
Point de congélation
de l'eau
100
0
2. Utilisez l'option Tableau sans cellules fusionnées si vous traitez un tableau qui ne contient pas de cellules
fusionnées. Par exemple :
Température
Degrés Celsius Degrés Kelvin
–273 0
100 373
Remarque : ne sélectionnez pas les options Une ligne de texte par cellule et Tableau sans cellules fusionnées si votre texte comporte des tableaux de structures différentes. Le choix de ces options risque de provoquer des erreurs d'analyse de la présentation et d'avoir une incidence négative sur la qualité de la reconnaissance.
– ce tableau ne compte qu'une ligne de texte par cellule
– ce tableau compte plusieurs lignes de texte par cellule
– la cellule Température est une cellule fusionnée
19
Manuel utilisateur ABBYY FineReader 8.0
Tracer et modifier des blocs manuellement
Pour créer un nouveau bloc :
1. Sélectionnez l'un des outils suivants :
– pour tracer une zone de reconnaissance;
– pour tracer un bloc de texte;
– pour tracer un bloc d'image;
– pour tracer un bloc de tableau.
2. Positionnez la souris au point où vous souhaitez placer un angle de votre bloc. Maintenez enfoncé le bouton gauche de la souris et déplacez le pointeur jusqu'au point où vous voulez placer l'angle opposé du bloc.
3. Relâchez le bouton de la souris.
Un cadre entoure la zone de l'image que vous avez sélectionnée. Vous pouvez alors changer le type de bloc. Le type de bloc peut être l'un des suivants : Zone de reconnaissance, Texte, Tableau, Image ou Code barre. Pour modifier le type du bloc :
Cliquez sur le bloc avec le bouton droit de la souris et sélectionnez l'option Modifier le type de bloc, puis le type de bloc de votre choix dans le menu contextuel.
Modifier des blocs
Pour déplacer les bords du bloc :
1. Cliquez sur le bord du bloc et maintenez enfoncé le bouton gauche de la souris. Le pointeur de la souris se transforme en flèche à deux pointes.
2. Déplacez le pointeur dans la direction de votre choix.
3. Relâchez le bouton de la souris.
Remarque : si vous cliquez sur l'angle d'un bloc, vous déplacerez simultanément les bords verticaux et horizontaux du bloc. Pour ajouter une partie de bloc rectangulaire :
1. Sélectionnez l'outil
2. Cliquez sur le bloc auquel vous voulez ajouter une partie. Maintenez enfoncé le bouton gauche de la souris et déplacez le pointeur en diagonale. Sélectionnez la zone de l'image que vous voulez ajouter au bloc et relâchez le bouton. Le rectangle que vous avez tracé sera ajouté au bloc.
3. Si nécessaire, déplacez le bord du bloc.
Pour couper une partie de bloc rectangulaire :
1. Sélectionnez l'outil
.
.
20
Manuel utilisateur ABBYY FineReader 8.0
2. Cliquez sur le bloc dont vous voulez couper une partie. Maintenez enfoncé le bouton gauche de la souris et déplacez le pointeur en diagonale. Sélectionnez la zone de l'image que vous voulez couper et relâchez le bouton. Le rectangle sélectionné est découpé du bloc.
3. Si nécessaire, déplacez le bord du bloc.
Remarque :
1. Vous pouvez modifier les bordures des blocs en y ajoutant de nouveaux nœuds (points de séparation). Vous pouvez utiliser la souris pour déplacer les segments ainsi créés dans la direction de votre choix. Pour ajouter un nœud, appuyez sur la touche MAJ, puis placez le pointeur de la souris à l'endroit où vous voulez l'insérer (le pointeur se transforme alors en croix), puis cliquez sur la bordure. Le nœud se crée alors.
2. ABBYY FineReader impose certains prérequis concernant la forme des blocs. Il faut notamment veiller à ce que les lignes de texte dans les blocs ne soient pas divisées pour que la reconnaissance s'effectue correctement. Pour satisfaire ces exigences, ABBYY FineReader corrige automatiquement les bordures des blocs une fois que vous avez ajouté ou coupé une partie de bloc (si vous coupez la partie supérieure ou inférieure d'un bloc ou si vous tentez de couper une partie entre les deux angles du haut ou du bas, l'application réagira comme si vous aviez coupé l'angle de droit du bloc, respectivement haut ou bas), ou interdit certaines opérations lorsque vous essayez de déplacer les segments formant la bordure du bloc.
Pour sélectionner un bloc ou un groupe de blocs :
Sélectionnez l'outil dessinez un rectangle contenant tous les blocs que vous voulez sélectionner.
Remarque : vous pouvez sélectionner un ou plusieurs blocs en utilisant les outils habituels de sélection de blocs. Pour sélectionner
plusieurs blocs, maintenez enfoncée la touche MAJ ou CTRL avec l'un des outils choisis : flèche sur les blocs que vous voulez sélectionner. Pour inverser la sélection (pour ajouter un bloc non sélectionné ou désélectionner un
bloc sélectionné), maintenez enfoncée la touche CTRL avec l'un des outils choisis : , , ou et déplacez la flèche sur les blocs de votre choix.
Pour déplacer des blocs :
Maintenez enfoncée la touche ALT avec l'un des outils choisis : , , , ou et déplacez les blocs.
Pour renuméroter des blocs :
1. Sélectionnez l'outil
2. Cliquez sur les blocs dans l'ordre qui vous convient. Le contenu des blocs s'affichera dans le même ordre dans le texte en sortie.
Remarque : si vous renumérotez des blocs sur une image déjà reconnue, le texte reconnu de la fenêtre Te x te en mode brouillon sera réorganisé en conséquence.
Pour supprimer un bloc :
Sélectionnez l'outil
Sélectionnez les blocs que vous voulez supprimer et appuyez sur la touche SUPPR.
Remarque : si vous supprimez un bloc déjà reconnu, le texte correspondant de la fenêtre Te x te sera également supprimé. Pour supprimer tous les blocs de l'image :
Sélectionnez l'option Supprimer tous les blocs et le texte dans le menu Image.
Remarque : si l'image dans laquelle vous supprimez des blocs a déjà été reconnue, tout le texte reconnu de la fenêtre Texte sera également supprimé.
et cliquez sur le bloc de votre choix ou appuyez sur le bouton gauche de la souris et
, , ou et déplacez la
.
et cliquez sur le bloc que vous souhaitez supprimer.
Modifier un tableau
Pour modifier un tableau, sélectionnez les outils suivants dans la barre d'outils Image :
– pour ajouter un séparateur vertical ;
– pour ajouter un séparateur horizontal ;
– pour supprimer un séparateur ;
Pour fusionner plusieurs cellules :
Sélectionnez l'option Fusionner les cellules dans le menu Image>Cellules du tableau.
Pour segmenter des cellules précédemment fusionnées :
Sélectionnez l'option Segmenter les cellules dans le menu Image>Cellules du tableau.
Pour fusionner des lignes du tableau (la division en colonnes est conservée) :
Sélectionnez l'option Fusionner les lignes dans le menu Image>Cellules du tableau.
Analyse manuelle de la présentation d'un tableau
Conseil : si la procédure d'analyse de la présentation d'un tableau ne divise pas correctement le tableau en lignes et colonnes, essayez de modifier les résultats de l'analyse automatique, plutôt que de supprimer tous les blocs et de les tracer manuellement. Dans la plupart des cas, la correction des résultats de l'analyse automatique prend moins de temps.
21
Manuel utilisateur ABBYY FineReader 8.0
Pour modifier un tableau manuellement :
Utilisez les outils suivants de la barre d'outils Image pour modifier le tableau:
Ajouter un séparateur vertical
Ajouter un séparateur horizontal
Supprimer un séparateur
Si la cellule du tableau contient seulement une image, sélectionnez la commande Traiter la cellule comme une image dans la boîte de dialogue Propriétés de bloc (menu Affichage>Propriétés). Si la cellule contient à la fois du texte et des images, tracez un ou plusieurs blocs d'image dans la cellule.
Pour fusionner des cellules ou des lignes de tableau :
Sélectionnez la commande Fusionner les cellules ou Fusionner les lignes dans le menu Image>Cellules du tableau.
Remarque : vous pouvez segmenter des cellules précédemment fusionnées avec la commande Segmenter les lignes du tableau (menu Image>Cellules du tableau). L'option Fusionner les lignes n'affecte pas la division du tableau en colonnes. Remarque : pour éviter de tracer manuellement des séparateurs horizontaux et verticaux, tracez un bloc de tableau distinct, puis cliquez dessus avec le bouton droit et sélectionnez la commande Analyser la structure du tableau dans le menu contextuel. Le système trace tous les séparateurs qu'il estime nécessaires. Vous pouvez modifier le tableau si certains séparateurs sont incorrects.
Utilisation des modèles de bloc
Si vous traiter un grand nombre de documents de présentation identique, comme des formulaires ou des questionnaires, l'analyse de la présentation de chaque page peut prendre beaucoup de temps. Vous pouvez créer un modèle de bloc, contenant un ensemble standard de blocs d'un type particulier correspondant à la présentation de vos pages, puis appliquer ce modèle à toutes les pages similaires que vous devez lire. Remarque : vous ne pouvez utiliser le modèle créé que pour les documents numérisés avec une résolution identique à celle du document pour lequel vous avez créé le modèle.
Pour créer un modèle de bloc :
1. Ouvrez une image et tracez les bloc automatiquement ou manuellement.
2. Sélectionnez la commande Enregistrer les blocs dans le menu Image. La boîte de dialogue Enregistrer les
blocs sous apparaît. Tapez un nom pour le modèle de bloc.
Pour charger un modèle de bloc :
1. Cliquez sur la fenêtre Lot et sélectionnez les pages auxquelles vous souhaitez appliquer le modèle.
2. Sélectionnez la commande Charger les blocs dans le menu Image. La boîte de dialogue Ouvrir des blocs apparaît.
3. Sélectionnez le fichier de modèle approprié.
4. Sélectionnez le bouton radio Appliquer à approprié. Le bouton Toutes les pages applique le modèle de bloc à toutes les pages du lot, le bouton Pages sélectionnées l'applique uniquement aux pages sélectionnées.
5. Cliquez sur le bouton Ouvrir.
Reconnaissance
L'objectif de la reconnaissance optique de caractères (OCR) est de lire le texte de l'image source et de conserver également sa présentation. Vous devez, au préalable, définir le paramètre de reconnaissance principal, à savoir la langue de reconnaissance. Ce chapitre décrit ces paramètres et traite d'autres questions importantes concernant la reconnaissance, notamment le rôle des différents paramètres de reconnaissance.
Informations générales sur la reconnaissance
Remarque : vérifiez les options suivantes : langue de reconnaissance, type d'impression du texte reconnu et mode de reconnaissance avant de lancer la reconnaissance. Vous pouvez :
1. Reconnaître un ou plusieurs blocs tracés sur une image.
2. Reconnaître une page ouverte ou toutes les pages sélectionnées dans la fenêtre Lot.
3. Reconnaître toutes les pages non reconnues du lot.
4. Reconnaître toutes les pages en arrière–plan. Ce mode vous permet de modifier et de reconnaître les pages en même temps.
5. Reconnaître des pages en mode Apprentissage gabarit utilisateur. Ce mode sert en général à reconnaître les textes composés dans des polices décoratives ou à traiter des volumes importants (plus de cent pages) de documents de qualité d'impression médiocre.
6. Reconnaître le même lot sur plusieurs postes de travail.
22
Manuel utilisateur ABBYY FineReader 8.0
Pour lancer la reconnaissance :
Cliquez sur le bouton 2 – Lire de la barre d'outils Assistant ou
Sélectionnez la commande appropriée dans le menu Traitement>Lire:
Lire – pour reconnaître la page ouverte ou toutes les pages sélectionnées dans la fenêtre Lot. Lire toutes les pages – pour reconnaître toutes les pages non reconnues du lot. Lire le bloc – pour reconnaître un ou plusieurs blocs tracés sur une image.
Processus>Lancer la reconnaissance en arrière–plan – pour lancer la reconnaissance en arrière–plan.
Par défaut, le bouton 2 – Lire reconnaît l'image ouverte. Pour changer le mode du bouton, cliquez sur la flèche qui se trouve sur sa droite et sélectionnez l'option de votre choix dans le menu contextuel.
Remarque : si vous reconnaissez une page déjà reconnue, la reconnaissance ne portera que sur les blocs modifiés et ajoutés.
Langue de reconnaissance
ABBYY FineReader reconnaît aussi bien les documents unilingues que multilingues (par exemple anglais–français). Lors de la reconnaissance de documents en anglais ou en allemand, vous pouvez également utiliser ces langues avec les dictionnaires spécialisés correspondants. Outre les dictionnaires spécialisés dans le domaine médical et légal, ces langues comprennent aussi des dictionnaires ABBYY FineReader généraux. Pour définir la langue de reconnaissance du texte, sélectionnez–la dans la liste déroulante de la barre d’outils Standard.
Pour reconnaître un document multilingue :
1. Sélectionnez la commande Sélectionner plusieurs languesdans la liste de langues de la barre d’outils Standard. La boîte de dialogue Langue de reconnaissance apparaît.
2. Sélectionnez les langues appropriées.
Remarque
1. Si vous utilisez souvent une combinaison de langues déterminée, créez un nouveau groupe de langues et ajoutez– lui les langues appropriées.
2. L’augmentation du nombre de langues de reconnaissance utilisées simultanément peut entraîner une dégradation de la qualité de la reconnaissance. Il est conseillé de limiter ce nombre à deux ou trois.
3. Avant de lire des documents, vérifiez les polices sélectionnées sur l’onglet onglet Enregistrer : ces polices doivent prendre en charge tous les caractères utilisés dans les langues de reconnaissance sélectionnées, sinon le texte ne sera pas affiché correctement (des lettres seront remplacées par "?" ou "¡"). Consultez la section Caractères langues de reconnaîssance qui peuvent être représentées incorrectement dans la fenêtre Editeur du Texte.
Il peut arriver que la langue de reconnaissance requise ne figure pas dans la liste. Il peut y avoir plusieurs raisons à cela :
1. La langue n’est pas prise en charge par ABBYY FineReader. Consultez la liste complète des langues de reconnaissance dans la section Langues prises en charge.
2. La langue ne figure pas dans la liste de la barre d’outils Reconnaissance. Pour ajouter la langue requise, vous devez sélectionner la commande Sélectionner d’autres langues dans la liste de la barre d’outils Standard. La boîte de dialogue Langue de reconnaissance apparaît. Sélectionnez la langue requise.
3. La langue a été déconnectée pendant une installation personnalisée. Pour ajouter d’autres langues, exécutez le programme d'installation d’ABBYY FineReader en mode installation des composants (Installation personnalisée), désactivez tous les éléments à l’exception de Langues de reconnaissance et cliquez sur le bouton Détails. La liste des langues prises en charge par ABBYY FineReader est affichée. Sélectionnez les langues requises. Remarque : veillez à indiquer le dossier où vous avez installé ABBYY FineReader.
4. Vous avez acheté votre produit ABBYY FineReader à partir d'un site de vente en ligne. Pour réduire la durée du téléchargement, le produit commercialisé sur ces sites de vente en ligne intègre uniquement les interfaces et les langues de reconnaissance les plus fréquemment utilisées. Pour télécharger des langues supplémentaires, choisissez Démarrer/Programmes/ABBYY FineReader 8.0/Télécharger des langues supplémentaires et suivez les instructions du programme.
23
Manuel utilisateur ABBYY FineReader 8.0
Pour montrer/masquer une langue dans la liste déroulante de la barre d'outils :
Sélectionnez la langue requise dans la boîte de dialogue Editeur de langue (menu Outils>Editeur de langue) puis sélectionnez ou désélectionnez l’option Montrer cette langue dans la liste déroulante de la barre
d’outils.
Conseil : il est même possible de définir une langue de reconnaissance pour un bloc séparé ! Pour ce faire, cliquez avec le bouton droit
de la souris sur le bloc concerné et sélectionnez Propriétés dans le menu contextuel. La boîte de dialogue Propriétés apparaît. Sélectionnez l’onglet Bloc puis choisissez la langue de reconnaissance du bloc dans le champ Langues de l’onglet.
Type d'impression du texte source
Dans la plupart des cas, le type d'impression du texte est détecté automatiquement. Pour vous en assurer, sélectionnez Détection automatique dans le groupe Type d'impression de la boîte de dialogue Options héritées (pour accéder à la boîte de dialogue Options héritées, cliquez sur le bouton Options héritées... à partir de l'onglet Général de la boîte de dialogue Options).
Si vous reconnaissez des sorties d'imprimante matricielle en mode brouillon ou des documents de machine à écrire, vous pouvez améliorer la qualité de la reconnaissance en spécifiant un autre type d'impression :
Sélectionnez l'option Machine à écrire pour la reconnaissance de documents dactylographiés.
Sélectionnez l'option Imprimante matricielle pour la reconnaissance de sorties d'imprimante matricielle.
Voici un exemple de sortie d'imprimante matricielle. Notez que les lignes des caractères se composent de points distincts.
Voici un exemple de document dactylographié. Toutes les lettres ont la même largeur (comparez par exemple "w" et "a").
Pour modifier le type d'impression :
Sélectionnez le type d'impression voulu dans le groupe Type d'impression de la boîte de dialogue Options héritées (pour accéder à la boîte de dialogue Options héritées, cliquez sur le bouton Options héritées... à partir de l'onglet General de la boîte de dialogue Options).
Remarque : quand vous avez terminé la reconnaissance de documents issus d'une imprimante matricielle ou d'une machine à écrire, pensez à rétablir le paramètre Détection automatique pour reconnaître correctement le texte normal.
Autres options de reconnaissance
Mode de reconnaissance
ABBYY FineReader 8.0 vous permet de choisir la vitesse ou la qualité du processus de reconnaissance. Deux modes sont disponibles :
Approfondi Dans ce mode, ABBYY FineReader analyse et reconnaît à la fois des documents simples et des documents de présentation complexe et, en particulier, les documents avec du texte sur un fond de couleur ou un fond tramé ainsi que des documents présentant des tableaux complexes (comme les tableaux avec un quadrillage blanc et des tableaux à cellules de couleur). Remarque : par rapport au mode Rapide, le mode Approfondi est plus lent mais assure une meilleure qualité de reconnaissance.
Rapide Ce mode est recommandé pour le traitement de volumes importants de documents avec une présentation simple et des images de bonne qualité.
Vous pouvez définir le mode de reconnaissance sous l'onglet Lire de la boîte de dialogue Options (menu Outils>Options).
Reconnaissance PDF
ABBYY FineReader 8.0 extrait les données de type texte des fichiers PDF et les utilise pour la reconnaissance. L'extraction du texte accélère le processus de reconnaissance par 2 ou 3. Cependant, les fichiers PDF peuvent posséder un codage non standard. En pareil cas, le texte peut seulement être récupéré par reconnaissance optique des caractères. Si vous n'êtes pas satisfait de la qualité de la reconnaissance d'un document PDF :
Sous l'onglet Lire de la boîte de dialogue Options (menu Outils>Options), sélectionnez l'option Reconnaître le PDF comme une image dans le groupe de reconnaissance PDF et relancez la lecture du document.
Reconnaissance de code barre
Si vous voulez qu'ABBYY FineReader reconnaisse automatiquement les codes barre de vos documents, veillez à activer l'option Rechercher les codes barre dans le groupe Lire de la boîte de dialogue Options héritées. ABBYY FineReader crée alors des blocs de type code barre indépendants ; ils seront affichés dans le texte reconnu sous la forme d’une série de lettres et de nombres. Pour connaître la liste complète des types de code barre pris en charge par ABBYY FineReader 8.0, veuillez consulter Types de blocs. Remarque : pour ouvrir la boîte de dialogue Options héritées, cliquez sur le bouton Options héritées sur l'onglet Général dans la boîte de dialogue Options (Outils>Options).
Montrer l'image pendant la reconnaissance
La reconnaissance d'un grand nombre de pages est plus rapide si l'image traitée n'est pas affichée. Pour effectuer la reconnaissance sans afficher l'image :
Désactivez l'option Montrer l'image pendant la reconnaissance dans la boîte de dialogue Options héritées (pour ouvrir cette boîte de dialogue, cliquez sur le bouton Options héritées... sous l'onglet Général dans la boîte de dialogue Options).
24
Manuel utilisateur ABBYY FineReader 8.0
Direction du texte
Si l'application ne reconnaît pas correctement les blocs contenant du texte vertical (bloc de texte ou cellule de tableau) :
Cliquez sur le bloc de texte vertical à l'aide du bouton droit de la souris, puis sélectionnez la commande Propriétés du menu contextuel. La boîte de dialogue Propriétés de bloc s'affiche. Sélectionnez l’élément requis dans la liste intitulée Direction du texte et relancez la reconnaissance de l'image.
Texte inversé ou basculé
Si l'application ne reconnaît pas correctement le texte inversé ou basculé (bloc de texte, cellule de tableau ou tableau entier) :
Cliquez sur le bloc approprié à l'aide du bouton droit de la souris, puis sélectionnez la commande Propriétés du menu contextuel. La boîte de dialogue Propriétés de bloc s'affiche. Sélectionnez l'article Inversé ou Basculé, puis relancez la reconnaissance de l'image.
Reconnaissance en arrière–plan
Le mode de reconnaissance en arrière–plan vous sera utile si vous souhaitez modifier les pages déjà reconnues tout en poursuivant la reconnaissance. Pour lancer la reconnaissance en arrière–plan :
Sélectionnez la commande Lancer la reconnaissance en arrière–plan dans le menu Traitement. Le signe
apparaît dans la ligne d'état, en bas de la fenêtre principale d’ABBYY FineReader. Si le mode d'affichage
Détails est actif dans la fenêtre Lot (pour activer ce mode, cliquez avec le bouton droit de la souris dans la fenêtre Lot et sélectionnez Fenêtre Lot>Détails dans le menu contextuel), la page en cours de reconnaissance
comporte l'icône
Lorsque le mode de reconnaissance en arrière–plan est actif, la reconnaissance reprend automatiquement quand une page non reconnue est ajoutée au lot. Remarque : si votre lot contient de nombreuses pages, vous remarquerez que la vitesse de reconnaissance est accrue sur les systèmes multiprocesseurs en mode Arrière–plan. Pour arrêter la reconnaissance en arrière–plan :
Sélectionnez la commande Arrêter la reconnaissance en arrière–plan dans le menu Traitement.
Remarque : le mode de reconnaissance en arrière–plan utilise les options de reconnaissance en cours.
dans la colonne Ouvert par.
Reconnaissance avec apprentissage
Comme indiqué précédemment, ABBYY FineReader lit sans difficulté les textes imprimés dans presque n’importe quelle police et il est pratiquement insensible à la qualité de l’impression. En général, vous pourrez reconnaître n’importe quel texte sans apprentissage préalable. ABBYY FineReader fournit toutefois des outils d’apprentissage pour les gabarits utilisateur. Le mode Apprentissage gabarit utilisateur peut vous servir pour :
1. reconnaître des textes imprimés dans des polices décoratives ;
2. reconnaître des textes contenant des caractères spéciaux (par exemple des symboles mathématiques) ;
3. reconnaître des volumes importants (plus de cent pages) de texte de qualité médiocre.
Conseil : n'utilisez le mode Apprentissage gabarit utilisateur que dans les cas mentionnés. Dans les autres situations, vous obtiendrez peut–être une très légère amélioration de la qualité de reconnaissance, mais qui ne compensera pas le temps consacré à l’apprentissage. L’apprentissage de gabarit se déroule comme suit. Dans un premier temps, vous reconnaissez une ou deux pages dans un mode d'apprentissage spécial. Le résultat est appelé gabarit. Ensuite, ABBYY FineReader utilise ce gabarit pour reconnaître plus facilement le reste du texte. Il arrive parfois que deux ou trois caractères soient "collés". Il est souvent impossible de les séparer ; ABBYY FineReader ne peut pas les inclure dans des cadres contenant un caractère chacun. Si c'est le cas (il n’est pas possible de déplacer le cadre pour qu’il contienne un caractère entier sans englober de fragment des caractères adjacents), vous pouvez apprendre à ABBYY FineReader à reconnaître la combinaison de caractères "inséparables". Des exemples de combinaisons inséparables classiques seront ff, fi, fl, etc. Ces combinaisons sont désignées ligatures.
Remarque :
1. Le gabarit ainsi créé n’est utile que pour reconnaître les textes imprimés dans la même police de la même taille et numérisés avec la même résolution que le document sur lequel vous avez effectué l’apprentissage du gabarit.
2. Chaque gabarit est créé pour un lot particulier. Si vous supprimez le lot, vous supprimez le gabarit en même temps. Vous pouvez mettre n’importe quel gabarit à la disposition d’autres lots. Pour ce faire, enregistrez les options de lot dans un fichier au format de modèle de lot.
3. Si vous devez reconnaître des textes imprimés dans une police différente, n’oubliez pas de déconnecter le gabarit. Cliquez sur le bouton radio Ne pas utiliser de gabarit utilisateur de l’onglet Lire, menu Outils>Options.
Pour effectuer l’apprentissage d’un gabarit utilisateur :
1. Lancez le mode Apprentissage gabarit utilisateur : cliquez sur le bouton radio Apprentissage gabarit utilisateur de l’onglet Lire, menu Outils>Options, groupe Apprentissage. Le nom de gabarit par défaut
("Default") s’affiche sur la ligne d’état.
2. Cliquez sur le bouton 2 – Lire.
3. Effectuez l’apprentissage du gabarit : reconnaissez une ou deux pages en mode Apprentissage gabarit utilisateur. Les caractères appris sont enregistrés dans le gabarit par défaut. Une fois l’apprentissage du gabarit terminé, ABBYY FineReader enregistre le gabarit créé (Default.ptn) dans le dossier de lot actif.
25
Manuel utilisateur ABBYY FineReader 8.0
4. Modifiez votre gabarit.
5. Désactivez le mode apprentissage (cliquez sur le bouton radio Utiliser gabarit utilisateur de l’onglet onglet Lire).
6. Effectuez la reconnaissance du reste du texte en cliquant sur le bouton 2 – Lire.
Remarque :
1. Pour créer plusieurs gabarits pour le même lot, ouvrez la boîte de dialogue Editeur de gabarit (cliquez sur le bouton Editeur de gabarit de l’onglet Lire ou sélectionnez la commande Outils>Editeur de gabarit). Créez un nouveau gabarit (cliquez sur le bouton Nouveau dans la boîte de dialogue) et sélectionnez–le (cliquez sur le bouton Définir comme actif). L’utilisation d’un gabarit créé est identique à celle du gabarit par défaut ; reportez–vous aux étapes 1–5. N’oubliez pas qu’un seul gabarit peut être actif à la fois.
2. Si vous avez créé plusieurs gabarits pour le même lot, le gabarit actif est le dernier créé. Le nom du gabarit actif est affiché dans la barre d’état. Pour activer un autre gabarit, sélectionnez–le dans la liste de la boîte de dialogue Editeur de gabarit (menu Outils>Editeur de gabarit) et cliquez sur le bouton Définir comme actif. Cliquez ensuite sur le bouton radio Utiliser gabarit utilisateur de l’onglet Lire, menu Outils>Options, groupe Apprentissage gabarit utilisateur.
3. Si l’option Utiliser gabarits intégrés est active, ABBYY FineReader tente de lire le texte au moyen des gabarits intégrés et ne s’arrête que sur les caractères incertains. Si vous apprenez au système à lire les polices décoratives et/ou non standard (telles que Tibétain), ABBYY FineReader risque de lire les caractères incorrectement avec les gabarits intégrés. Dans ce cas, désactivez la case à cocher Utiliser gabarits intégrés de l’onglet onglet Lire et apprenez au système à reconnaître chacun des caractères.
Apprentissage d’un gabarit utilisateur
1. Assurezvous que le bouton radio Apprentissage gabarit utilisateur de l’onglet Reconnaissance (menu Outils>Options), groupe Apprentissage est activé.
2. Cliquez sur le bouton 2 – Lire. ABBYY FineReader lance la reconnaissance. Lorsqu’il rencontre un caractère qu’il ne connaît pas, la boîte de dialogue Apprentissage de gabarit apparaît. L’image du caractère y est affichée.
Apprentissage pour reconnaître un caractère : Le cadre de la fenêtre supérieure de la boîte de dialogue doit contenir un caractère unique entièrement contenu dans le cadre. Si celui–ci ne contient qu’une partie de caractère ou plus d’un caractère, cliquez sur les bords du cadre et déplacez–les pour que les
conditions ci–dessus soient réunies. Les boutons
et permettent également de déplacer les bords du cadre (cette option est utile pour l’apprentissage des symboles en italiques ; voir plus loin). Lorsque vous avez terminé, tapez le caractère et cliquez sur le bouton Apprentissage.
Remarque
1. Le système ne peut apprendre à lire que les caractères de l’alphabet de la langue active. Si vous apprenez à ABBYY FineReader à lire des caractères que vous ne pouvez pas saisir au clavier, vous pouvez utiliser une combinaison de deux caractères pour les signaler ou copier le caractère requis depuis la Table des
caractères (cliquez sur le bouton
dans la boîte de dialogue Apprentissage de gabarit pour l’ouvrir).
2. Si vous souhaitez apprendre au système à retenir la mise en forme des caractères, sélectionnez Italique ou Gras dans la boîte de dialogue Apprentissage de gabarit avant de cliquer sur le bouton Apprentissage.
26
Manuel utilisateur ABBYY FineReader 8.0
3. Veillez à saisir les caractères en majuscules lorsque vous effectuez l’apprentissage d’images de majuscules et en minuscules pour les images de minuscules.
Si vous vous trompez pendant l’apprentissage, vous pouvez cliquer sur le bouton Précédent pour restaurer la position précédente du cadre ; la dernière paire "caractère–image" est alors supprimée du gabarit. Cette opération d’annulation est limitée : elle n’est applicable qu’au dernier mot. Apprentissage de la reconnaissance des ligatures Une ligature est une combinaison de deux caractères "collés", par exemple fi, fl, ffi, etc. Ces caractères sont difficiles à séparer car ils sont "collés" à l’impression. Il est préférable de les traiter comme un caractère composé "simple". L’apprentissage des ligatures se fait de la même manière que celui des caractères séparés :
1. Tapez la combinaison de caractères requise puis cliquez sur le bouton Apprentissage.
2. Le cadre de la fenêtre supérieure de la boîte de dialogue doit contenir la ligature en entier. Vous pouvez
déplacer le bord du cadre au moyen de la souris ou en cliquant sur les boutons
Chaque gabarit peut contenir jusqu’à 1 000 nouveaux caractères. Toutefois, il est déconseillé de créer un trop grand nombre de ligatures, car cela risque de dégrader la qualité de la reconnaissance.
Lors de l’apprentissage d’ABBYY FineReader, tenez compte des limitations suivantes :
1. ABBYY FineReader ne fait pas la différence entre certains caractères habituellement considérés comme différents. Ces images sont reconnues comme un seul et même caractère. Par exemple, les apostrophes simple ('), droite (’) et gauche (‘) sont considérées dans le gabarit comme un même caractère, à savoir l’apostrophe simple. Ainsi, vous ne verrez jamais apparaître les apostrophes droite et gauche dans le texte reconnu, même si vous apprenez au logiciel à les reconnaître.
2. Dans certains cas, une image est reconnue comme un caractère particulier, selon l’environnement.
et .
Modification d'un gabarit utilisateur
Il peut être conseillé de modifier un nouveau gabarit avant de vous en servir pour la reconnaissance. Un gabarit dépourvu de l'apprentissage correct a des effets négatifs sur la qualité de la reconnaissance et il est utile de le vérifier. Le gabarit ne doit contenir que des caractères ou ligatures entiers. Il faut retirer du gabarit les caractères dont les bords sont endommagés et ceux qui sont incorrectement identifiés. Pour modifier un gabarit utilisateur :
1. Sélectionnez la commande Editeur de gabarit dans le menu Outils. La boîte de dialogue Editeur de gabarit apparaît.
2. Sélectionnez le gabarit approprié et cliquez sur le bouton Modifier. La boîte de dialogue Editeur de gabarit apparaît.
3. Sélectionnez un caractère et cliquez sur le bouton Propriétés pour modifier le titre du caractère et définir la police correcte : italique, gras, indice ou exposant. Vous pouvez également cliquer sur le bouton Supprimer pour retirer du lot les caractères dont l'apprentissage est incorrect.
Langues utilisateur et groupes de langues
En complément des langues et groupes de langues intégrés, vous pouvez créer une nouvelle langue ou constituer un nouveau groupe (à partir des langues prises en charge par ABBYY FineReader) et l'utiliser lors de la reconnaissance. La création d'une nouvelle langue peut s'imposer dans les cas suivants :
1. Pour vous connecter à un dictionnaire utilisateur.
Par exemple, vous devez reconnaître un texte en anglais contenant de nombreuses abréviations. Vous
pouvez créer un dictionnaire d'abréviations, créer une nouvelle langue et connecter le dictionnaire à la langue. Vous pouvez ensuite constituer un nouveau groupe de langues constitué de l'anglais (avec le dictionnaire système) et de votre nouvelle langue (avec le dictionnaire d'abréviations) et vous servir de ce groupe pour reconnaître vos textes.
2. Pour reconnaître certains documents spéciaux, par exemple :
Des listes d'articles ne comportant que des références de produits. Ces références ne contiennent
souvent que des chiffres et certaines lettres. Vous pouvez créer une nouvelle langue ne contenant que les caractères requis et l'utiliser pour reconnaître ces documents.
Des documents entièrement en capitales. Vous améliorerez la qualité de la reconnaissance si vous créez
une langue interdisant toutes les minuscules. Il est utile de créer un groupe de langues si vous utilisez fréquemment une combinaison de langues déterminée. Pour créer une langue ou un groupe de langues, ouvrez la boîte de dialogue de l' Editeur de langue (menu Outils, commande
Editeur de langue).
Création d'une nouvelle langue
Pour créer une nouvelle langue de reconnaissance :
1. Sélectionnez la commande Editeur de langue dans le menu Outils.
2. Cliquez sur le bouton Nouveau. Dans la boîte de dialogue qui apparaît, sélectionnez le bouton radio Créer une copie de la langue et sélectionnez une langue source pour la nouvelle.
3. La boîte de dialogue Propriétés de langue simples apparaît.
27
Manuel utilisateur ABBYY FineReader 8.0
Définissez les paramètres suivants pour la nouvelle langue (tous les paramètres sont définis dans la boîte de dialogue Propriétés de langue simples) :
1. Nom de la nouvelle langue.
2. Alphabet de base à utiliser. Ce paramètre est défini dans le champ Alphabet. Si nécessaire, modifiez l'alphabet en
cliquant sur le bouton
.
3. Le dictionnaire à utiliser par le système (à la fois pour la reconnaissance et la vérification orthographique). Vous avez les possibilités suivantes :
Aucun (aucun dictionnaire pour la langue)
Intégré (dictionnaire fourni avec ABBYY FineReader)
Dictionnaire utilisateur
Si vous souhaitez ajouter des mots au dictionnaire, ou vous connecter à un ancien dictionnaire utilisateur ou un fichier texte au format Windows (ANSI) ou Unicode (le seul impératif est que les termes soient séparés par des espaces ou autre caractère non alphabétique) cliquez sur le bouton Modifier le dictionnaire. Remarque : la vérification orthographique considère comme corrects les termes du dictionnaire utilisateur s'ils apparaissent comme suit dans le texte : capitales définies dans le dictionnaire, toutes les lettres minuscules, toutes les lettres majuscules, première lettre majuscule. Exemples :
Capitales définies dans le
Les formes suivantes seront correctes :
dictionnaire :
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
aBc aBc, abc, Abc, ABC
Expression normale (spécifiant la grammaire de la nouvelle langue ; consultez la section Expressions normales).
Remarque :
1. Vous pouvez cliquer sur le bouton Avancé dans la boîte de dialogue Propriétés de langue simples pour définir certaines propriétés avancées de la nouvelle langue, telles que les caractères ignorés dans les mots, les caractères interdits, etc.
2. La nouvelle langue utilisateur créée est enregistrée par défaut dans le dossier de lot. ABBYY FineReader Corporate Edition permet de spécifier un autre dossier. Pour plus d'informations sur le travail de groupe avec des langues utilisateur et leurs dictionnaires, consultez la section Travail de groupe avec les mêmes langues et dictionnaires utilisateur.
Création d'un nouveau groupe de langues
Si vous effectuez fréquemment la reconnaissance de textes dans certaines combinaisons de langues, par exemple l'anglais et l'allemand, vous pouvez créer un groupe de langues associant ces langues. Le groupe sera affiché dans la liste de langues de la barre d'outils
Standard. Remarque : vous pouvez spécifier les langues de reconnaissance directement depuis la liste de langues de la barre d'outils Standard.
Pour cela, sélectionnez l'option Sélectionner plusieurs langues dans la liste. La boîte de dialogue Langue de reconnaissance apparaît. Sélectionnez les langues souhaitées dans la boîte de dialogue.
28
Manuel utilisateur ABBYY FineReader 8.0
Pour créer un groupe de langues de reconnaissance :
1. Sélectionnez la commande Editeur de langue dans le menu Outils et cliquez sur le bouton Nouveau. Une boîte de dialogue apparaît. Sélectionnez la commande Créer un nouveau groupe de langues dans la boîte de dialogue.
2. La boîte de dialogue Propriétés de groupe de langues apparaît.
Définissez les paramètres suivants de groupe de langues (tous les paramètres sont définis dans la boîte de dialogue Propriétés de groupe de langues) :
1. Nom du groupe.
2. Langues composant le groupe.
Remarque
1. Dans certains cas, vous êtes sûr que des caractères ne seront jamais trouvés dans les textes reconnus. Vous pouvez alors spécifier ces caractères (désignés caractères interdits) dans les propriétés du groupe de langues. Cette définition de caractères interdits peut améliorer la vitesse et la qualité de la reconnaissance. Pour spécifier ces caractères, cliquez sur le bouton Avancé dans la boîte de dialogue Propriétés de groupe de langues. La boîte de dialogue Propriétés avancées apparaît. Spécifiez les caractères interdits sur la ligne Caractères interdits.
2. Le nouveau groupe de langue utilisateur créé est enregistré par défaut dans le dossier de lot. ABBYY FineReader Corporate Edition permet de spécifier un autre dossier. Pour plus d'informations sur le travail de groupe avec des langues utilisateur et leurs dictionnaires, consultez la section Travail de groupe avec les mêmes langues et dictionnaires utilisateur.
Vérification et modification de texte
Quand la reconnaissance est terminée, le texte reconnu apparaît dans la fenêtre Te x te . Cette fenêtre constitue l'éditeur intégré d’ABBYY FineReader. Elle vous permet de vérifier le résultat de la reconnaissance et de modifier le texte obtenu. L'éditeur d’ABBYY FineReader comporte deux caractéristiques spéciales :
1. Un système intégré de vérification orthographique (voir la liste des langues prise en charge par la vérification dans la section Langues prises en charge).
2. Une aide visuelle commode : l'image source de la ligne de texte que vous vérifiez est affichée dans la fenêtre
Zoom.
Le système de vérification orthographique contient :
1. Des outils permettant de trouver les mots douteux (contenant des caractères incertains).
2. Des outils détectant les fautes d'orthographe.
3. Des outils pour ajouter des termes inconnus au dictionnaire d’ABBYY FineReader. L'ajout de termes améliore la qualité de la reconnaissance.
Vérification du texte dans ABBYY FineReader
Les caractères et les mots reconnus de façon incertaine qui sont absents du dictionnaire sont mis en évidence dans différentes couleurs. Par défaut, le bleu clair indique les caractères incertains et le rose indique les mots absents du dictionnaire. Pour modifier la couleur :
Sélectionnez l'option Caractère incertain (ou Absent du dictionnaire) ainsi que la couleur de votre choix
dans l'option Couleur de l'onglet Affichage (menu Outils >Options) dans le groupe Apparence.
Pour vérifier les résultats de la reconnaissance :
1. Cliquez sur le bouton 3 – Vérification orthographique de la Barre d'outils Assistant (ou sélectionnez la commande Vérification orthographique dans le menu Outils).
29
Manuel utilisateur ABBYY FineReader 8.0
2. La boîte de dialogue Vérification orthographique s'ouvre.
La vérification orthographique recherche les mots incertains, les mots absents du dictionnaire et les mots mal orthographiés. Pour vérifier l'orthographe, vous pouvez cliquer sur ce bouton ou appuyer sur la touche F7.
3. La boîte de dialogue Vérification orthographique comporte trois fenêtres. La fenêtre supérieure est identique à la fenêtre Zoom d’ABBYY FineReader, elle affiche l'image originale du mot éventuellement mal orthographié. La fenêtre du centre affiche le mot éventuellement mal orthographié lui–même, tandis que la ligne au–dessus affiche le nom du type possible d'erreur. La fenêtre Suggestions du bas vous offre des suggestions de remplacement (le cas échéant). Les suggestions sont basées sur le dictionnaire sélectionné dans la liste déroulante Langue du
dictionnaire ; vous pouvez sélectionner dans cette liste la langue de votre choix. Remarque : vous pouvez agrandir la boîte de dialogue Vérification orthographique pour faciliter les
opérations de vérification et d'édition. Pour cela, cliquez sur le bord de la boîte de dialogue ; le pointeur de la souris se transforme en flèche à deux pointes. Faites glisser le bord pour agrandir ou réduire la boîte de dialogue.
4. Ce que vous pouvez faire avec les mots éventuellement mal orthographiés Les possibilités sont les suivantes :
Cliquez sur le bouton Ignorer pour laisser le mot inchangé.
Cliquez sur le bouton Tout ignorer pour laisser inchangés tous les mots identiques dans le texte.
Remarque. Lorsque vous cliquez sur le bouton Ignorer ou Tout ignorer, le drapeau « incertain » est supprimé du mot : le système considère que le mot ne contient pas de caractères non reconnus ou incertains ; ces caractères ne sont plus mis en évidence. Lorsque vous exportez ces mots au format PDF et que vous activez le mode Remplacer les mots incertains par des images, ils ne seront pas remplacés par des images.
Sélectionnez une suggestion de remplacement et cliquez sur le bouton Remplacer ou Tout
remplacer pour remplacer le mot en cours ou toutes ses occurrences dans le texte. Si la fenêtre Suggestions n'affiche aucune suggestion correcte pour le mot, modifiez ce dernier ou les mots
avoisinants de la fenêtre, située au centre de la boîte de dialogue (attention : lorsque vous passez en mode de modification, certains boutons changent leurs actions et leurs légendes sont également modifiées). Cliquez alors sur le bouton Confirmer (Tout confirmer) pour modifier le mot actuel (tous les mots de ce type) dans le texte et pour aller sur le mot suivant reconnu de manière incertaine.
Cliquez sur Ajouter... pour ajouter le mot au dictionnaire. Lorsque le mot a été ajouté, l'application
considère que toutes les futures occurrences de ce mot sont correctes dans toutes ses formes.
Cliquez sur Options... pour déterminer les paramètres de vérification orthographique.
Cliquez sur Fermer pour refermer la fenêtre de la boîte de dialogue.
Se déplacer entre des mots incertains
Pour consulter rapidement les résultats de reconnaissance, vous pouvez utiliser le bouton
et le bouton pour aller au mot incertain suivant et précédent. Vous pouvez également utiliser les touches de raccourci F4 (MAJ F4) pour naviguer entre des mots incertains.
30
Manuel utilisateur ABBYY FineReader 8.0
Options de vérification et de modification de texte
Ces options sont définies sur l'onglet Vérification orthographique (menu Outils>Options).
Niveau d'affichage d'erreur
Remarque : cette option doit être définie avant de lancer la reconnaissance.
La liste Niveau d'affichage d'erreur vous permet de sélectionner parmi les valeurs suivantes :
Aucun – les erreurs de reconnaissance ne sont pas mises en évidence.
Standard – les caractères non reconnus et incertains sont mis en évidence.
Approfondi – comme Standard, mais les mots absents du dictionnaire sont également mis en évidence.
Remarque : le nombre d'erreurs affiché dans la fenêtre Tex t e changera après la relecture du document.
Arrêt sur les caractères incertains
Si cette option est définie, la vérification orthographique s'arrêtera sur les termes comportant des caractères incertains.
Arrêt sur les mots absents du dictionnaire
Si cette option est définie, la vérification orthographique s'arrêtera sur les termes absents du dictionnaire. Si un mot est absent du dictionnaire, cela peut indiquer qu'il a été lu incorrectement.
Arrêt sur les mots composés
Si cette option est définie, la vérification orthographique s'arrêtera sur les termes absents du dictionnaire et qui peuvent être construits selon les modèles morphologiques disponibles ou à partir des mots du dictionnaire.
Remarque : cette option figure dans la boîte de dialogue Options héritées. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Options héritées... à partir de l'onglet Général de la boîte de dialogue Options.
Ignorer les mots contenant des chiffres
Si cette option est définie, la vérification orthographique considèrera corrects tous les mots contenant des chiffres, sauf s'ils contiennent des caractères incertains.
Corriger les espaces avant et après les ponctuations
Si cette option est définie, la vérification orthographique ne s'arrêtera pas si elle détecte des espaces incorrects avant ou après les marques de ponctuation, mais corrigera automatiquement ces espaces.
Remarque : cette option figure dans la boîte de dialogue Options héritées. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Options héritées... à partir de l'onglet Général de la boîte de dialogue Options.
Ajout et suppression de mots dans le dictionnaire utilisateur
Ajouter un mot au dictionnaire utilisateur
L'enrichissement du dictionnaire est une bonne manière d'améliorer la qualité de la reconnaissance. Au cours de la reconnaissance, ABBYY FineReader vérifie les mots qu'il reconnaît dans le dictionnaire. Il est judicieux d'ajouter les mots inconnus les plus fréquents (par exemple les abréviations, les noms et autres termes fréquemment utilisés dans vos documents). L'une des caractéristiques spécifiques du système de vérification orthographique d’ABBYY FineReader est qu'il n'ajoute pas simplement le mot sous la forme où il l'a trouvée dans le texte, mais crée le paradigme du mot, c'est–à–dire l'ensemble de toutes ses formes. Cette fonction permet à ABBYY FineReader de "connaître" le mot dans sa globalité juste après avoir rencontré la première de ses formes dans le texte, de sorte que par la suite toutes les autres formes peuvent être reconnues en toute confiance. Pour ajouter un mot au dictionnaire pendant la vérification orthographique :
Cliquez sur le bouton Ajouter dans la boîte de dialogue Vérification orthographique.
Définissez les paramètres suivants dans la boîte de dialogue Forme de base.
1. Eléments du discours (nom, adjectif, verbe, non fléchi).
2. Si le mot s'écrit toujours avec une première lettre capitale, sélectionnez l'option Nom propre. Si vous ajoutez une abréviation, sélectionnez l'option Abréviation.
3. La forme de base du mot.
Cliquez sur OK. La boîte de dialogue Créer un paradigme s'ouvre. Dans cette boîte de dialogue, ABBYY FineReader vous pose des questions concernant les formes du mot. Vos réponses aident ABBYY FineReader à construire le paradigme du mot que vous ajoutez. Cliquez sur Oui ou sur Non lorsque ABBYY FineReader vous pose une question. En cas d'erreur, cliquez sur le bouton De nouveau pour répondre correctement à la question. Le paradigme construit s'affiche dans la boîte de dialogue Paradigme. Remarque :
1. Si vous ne souhaitez pas construire le paradigme et préférez toujours ajouter les mots sous forme non fléchie, sélectionnez l'option Sauter l'invite de forme de mot (dictionnaire anglais seulement) de l'onglet Vérification orthographique (menu Outils >Options).
2. Vous pouvez également ajouter des mots lorsque vous voyez la liste des mots ajoutés. Pour cela, sélectionnez la commande Afficher les dictionnaires dans le menu Outils. La boîte de dialogue Sélection de dictionnaire s'ouvre. Choisissez la langue dans la boîte de dialogue Sélection de dictionnaire et cliquez sur Afficher. Le dictionnaire accompagné de la liste des mots ajoutés s'ouvre. Vous pouvez ajouter votre mot en cliquant sur le bouton Ajouter.
31
Manuel utilisateur ABBYY FineReader 8.0
3. La construction de paradigmes pour les termes que vous ajoutez dans les dictionnaires utilisateur n’est disponible que pour l’anglais, l’italien, le français, l’allemand (ancienne et nouvelle orthographe), le russe, l’espagnol et l’ukrainien.
Si le mot ajouté existe dans le dictionnaire, le système vous en avertit. Dans ce cas, vous pouvez consulter son paradigme. Si vous pensez que le paradigme existant est incorrect (c'est souvent le cas lorsque vous ajoutez un homonyme appartenant à un autre élément de discours), vous pouvez en construire un autre (bouton Ajouter de la boîte de dialogue Ajouter un terme).
Conseil :
1. ABBYY FineReader vous permet d'importer des dictionnaires utilisateur créés dans des versions précédentes (ABBYY FineReader 5.0, 6.0 et 7.0).
2. ABBYY FineReader vous permet d'importer votre dictionnaire utilisateur (*.dic) créé dans Microsoft Word 6.0, 7.0, 97 et 2000.
Pour importer un dictionnaire :
1. Sélectionnez la commande Afficher les dictionnaires dans le menu Outils, puis sélectionnez la langue du dictionnaire et cliquez sur le bouton Afficher.
2. Cliquez sur le bouton Importer dans la boîte de dialogue et sélectionnez des fichiers portant les extensions *.pmd, *.txt ou *.dic.
Pour supprimer un mot du dictionnaire :
1. Sélectionnez la commande Afficher les dictionnaires dans le menu Outils. Sélectionnez la langue et cliquez sur le bouton OK. Une boîte de dialogue s'ouvre.
2. Sélectionnez le mot que vous souhaitez supprimer et cliquez sur le bouton Supprimer.
Modification de texte dans ABBYY FineReader
Remarque : si la fenêtre de texte d’ABBYY FineReader n'affiche pas les caractères correctement (des signes "?" ou "¡" s'affichent à la place de tout ou partie des lettres), cela signifie que la police en cours ne prend pas totalement en charge l'alphabet de votre langue de reconnaissance. Sélectionnez une police prenant en charge le jeu de caractères de reconnaissance entier (par exemple Arial Unicode ou Bitstream Cyberbit) dans le groupe Polices de l'onglet onglet Enregistrer (menu Outils>Options), puis lisez à nouveau le document. Consultez la section Caractères langues de reconnaîssance qui peuvent être représentées incorrectement dans la fenêtre Editeur du Texte.
Lorsqu'une page a été lue, son texte s'affiche dans la fenêtre Te x te . Lorsque vous envoyez votre texte vers une application externe, sa mise en page est conservée conformément aux options de préservation de la présentation. Définissez ces options dans l'onglet onglet Enregistrer (menu Outils >Options) et dans les boîtes de dialogue correspondant aux différents formats. Les caractères incertains sont mis en évidence. Vous pouvez annuler la mise en évidence de ces mots ; il vous suffit pour cela de désélectionner l'option Mettre en évidence les caractères incertains de l'onglet Affichage (menu Outils >Options). L’éditeur ABBYY FineReader possède deux modes d’affichage pour les documents : le mode normal (mise en page standard) et le mode brouillon. Le mode normal affiche les blocs avec le texte, les tableaux et les images reconnus, tels qu'ils apparaissent dans l'image source. Ainsi, ce mode conserve la mise en page standard du document source : colonnes, tableaux, images et lettrines (grandes lettres occupant plusieurs lignes d'un paragraphe). Le bloc dans lequel le pointeur se trouve est activé. Lorsque vous déplacez le pointeur en appuyant sur les touches du clavier, l'ordre de navigation entre les blocs est déterminé par leur numérotation dans l'image source. Si le texte d'un bloc est trop volumineux pour tenir dans ce bloc (par exemple, vous avez modifié le texte, qui prend maintenant trop de place), certaines parties de texte des blocs inactivés risquent de ne pas être visibles ; si tel est le cas, des points rouges apparaissent sur son bord. Lorsqu'un bloc est activé, ses bords s'élargissent pour afficher la totalité du texte contenu dans ce bloc. Les caractéristiques suivantes du texte ne s'affichent pas dans le mode brouillon : retrait à gauche ; alignement des paragraphes (tous les paragraphes sont alignés à gauche) ; couleurs du texte et du fond. Une police de taille unique (12 pt par défaut) est utilisée dans tout le texte affiché en mode brouillon. La police et ses effets (gras, italique, souligné, exposant et indice) sont conservés dans le mode brouillon.
Vous pouvez passer du mode brouillon au mode normal et réciproquement en cliquant sur sur
(pour passer en mode brouillon) dans la fenêtre Te x te .
(pour passer en mode normal) ou
Vous pouvez modifier la taille de la police pour afficher le texte en mode brouillon. Pour cela :
1. Sélectionnez Options dans le menu Outils.
2. Définissez votre police dans l'option Taille de la police d'édition brouillon dans l'onglet Affichage.
L'éditeur intégré d’ABBYY FineReader vous offre les fonctions d'édition de texte suivantes :
Copier, couper, coller
1. Avant d'utiliser les commandes copier et couper, sélectionnez le texte.
32
Manuel utilisateur ABBYY FineReader 8.0
2. Suivez les instructions ci–dessous, selon ce que vous voulez faire :
Pour copier la sélection :
Vous pouvez cliquer sur le bouton Copier de la barre d'outils Standard ou
Bouton Copier
sélectionner la commande Copier dans le menu Edition ou dans le menu contextuel, ou encore
appuyer sur ALT+C
Pour couper la sélection :
Vous pouvez cliquer sur le bouton Couper de la barre d'outils Standard ou
Bouton Couper
sélectionner la commande Couper dans le menu Edition ou dans le menu contextuel, ou encore
appuyer sur ALT+X
Pour coller le texte copié :
Bouton
Vous pouvez cliquer sur le bouton Coller de la barre d'outils Standard ou
sélectionner la commande Coller dans le menu Edition ou dans le menu contextuel, ou encore
appuyer sur ALT+V
Coller
Rechercher et remplacer
Pour rechercher un mot ou une phrase dans le texte que vous modifiez : vous pouvez :
sélectionner la commande Chercher dans le menu Edition ou
appuyer sur ALT+F
La boîte de dialogue Rechercher s'ouvre. Tapez le mot ou la phrase que vous souhaitez rechercher sur la ligne Chercher de la boîte de dialogue, et définissez les paramètres de recherche. Remarque : pour rechercher le même mot avec les mêmes paramètres, appuyez simplement sur la touche F3. Pour chercher et remplacer un mot ou une phrase dans le texte que vous modifiez : vous pouvez :
sélectionner la commande Remplacer dans le menu Edition ou
appuyer sur ALT+H
La boîte de dialogue Remplacer s'ouvre. Tapez le mot ou la phrase que vous souhaitez rechercher sur la ligne Chercher de la boîte de dialogue, puis tapez le mot ou la phrase de remplacement sur la ligne Remplacer par et définissez les paramètres de recherche. Style et attributs des polices
1. Cliquez sur le mot ou sélectionnez le texte dont vous souhaitez modifier la police. Les actions suivantes sont à votre disposition :
vous pouvez cliquer sur le bouton (par exemple
) sur la barre Formatage ou
cliquer avec le bouton droit de la souris dans la fenêtre Te xt e et sélectionner la commande Propriétés de caractère dans le menu contextuel. La boîte de dialogue Caractère s'ouvre. Sélectionnez le type de police de
votre choix et définissez ses paramètres dans la boîte de dialogue ou
appuyer sur ALT+B pour obtenir des caractères gras, sur ALT+I pour obtenir des caractères en italique ou sur ALT+U pour souligner le mot ou le texte.
Remarque : la couleur d'arrière–plan du bloc et le formatage du texte en petites lettres capitales (toutes les minuscules sont
remplacées par des petites lettres capitales) indiqués dans la boîte de dialogue Polices ne sont pas affichés dans la fenêtre Te xt e . Ces fonctions sont visibles uniquement lorsque vous avez exporté le texte dans les applications qui prennent en charge ces fonctions. Alignement du texte
1. Sélectionnez le texte à aligner. Effectuez l’une des actions suivantes :
cliquez sur le bouton (par exemple
) dont vous avez besoin sur la barre Formatage, ou
cliquez dans la fenêtre Te xt e avec le bouton droit de la souris et sélectionnez la commande Propriétés de caractère dans le menu contextuel. La boîte de dialogue Caractère s'ouvre. Sélectionnez l’élément requis dans le
champ Alignement.
Annuler et rétablir
vous pouvez :
Pour annuler une action :
Vous pouvez cliquer sur le bouton Annuler de la barre d'outils Standard ou
Bouton Annuler
sélectionner la commande Annuler dans le menu Edition, ou encore appuyer sur ALT+Z
Pour rétablir une action annulée :
Vous pouvez cliquer sur le bouton Rétablir de la barre d'outils Standard ou
Bouton Rétablir
sélectionner la commande Rétablir dans le menu Edition, ou encore appuyer sur ALT+Y
33
Manuel utilisateur ABBYY FineReader 8.0
Modification de tableaux
Pour fusionner le contenu de cellules ou de lignes :
Maintenez enfoncée la touche CTRL, sélectionnez les cellules ou les lignes à fusionner et sélectionnez la commande Fusionner les cellules du tableau ou Fusionner les lignes du tableau dans le menu
Image>Cellules du tableau.
Pour segmenter le contenu de cellules :
Sélectionnez la commande Segmenter les cellules du tableau dans le menu Image>Cellules du tableau.
Remarque : cette opération ne peut être appliquée qu'aux cellules précédemment fusionnées.
Pour segmenter le contenu de lignes ou de colonnes :
Sélectionnez l'outil ou dans la barre d'outils de la fenêtre Image, puis cliquez sur la ligne (colonne) à segmenter pour ajouter un nouveau séparateur horizontal (vertical).
Conseil : vous pouvez fusionner le contenu de lignes à l'aide de l'outil ou de la commande Fusionner les lignes du tableau (menu Image>Cellules du tableau).
Pour supprimer le contenu de cellules :
Sélectionnez une ou plusieurs cellules à supprimer dans la fenêtre Texte et appuyez sur SUPPR.
Création et modification des hyperliens
Un hyperlien vous renvoie généralement d'une page Web à une autre. Le fait de cliquer sur un hyperlien permet aussi, dans certains cas, d'afficher une image, d'exécuter un fichier multimédia, d'envoyer un courrier électronique ou de lancer une application. ABBYY FineFeader 8.0 est capable de reconnaître les hyperliens correspondant à :
un fichier, comme file://D:\MesDocuments\FineReaderGuide.pdf ;
un protocole de transfert de fichier (FTP), comme ftp:// ;
un site Web comme http://www.abbyy.com ;
une adresse électronique comme mailto:office@abbyy.com.
ABBYY FineReader permet d'identifier le texte d'un hyperlien et de reconstituer son adresse de destination dans le document de sortie. Les hyperliens reconnus sont affichés en bleu et soulignés. Remarque :Vous pouvez changer la couleur d'un hyperlien à partir de l'onglet Enregistrer de la boîte de dialogue Options. Lorsque vous visualisez le document reconnu dans la fenêtre Texte, il suffit de positionner le curseur de la souris sur un hyperlien pour afficher son adresse. Pour suivre un hyperlien, maintenez la touche CTRL enfoncée et cliquez sur sur l'hyperlien.
Pour changer le texte et l'adresse d'un hyperlien :
1. Sélectionnez le texte de l'hyperlien.
2. Cliquez sur le bouton dans la barre d'outils de la fenêtre Te xt e .
3. Dans la boîte de dialogue Modifier l'hyperlien qui s'affiche, tapez le nouveau texte dans le champ Tex t e à afficher.
4. Dans la même boîte de dialogue, spécifiez le type d'adresse dans le groupe Lier à :
Sélectionnez Page Web pour établir un lien avec une page sur Internet. Dans le champ Adresse,
indiquez le protocole et l'URL de la page (exemple : http://www.abbyy.com);
Sélectionnez Fichier local pour établir un lien avec un fichier. Cette option a pour effet d'ouvrir la
boîte de dialogue Ouvrir. Il convient alors de spécifier le nom du fichier auquel l'hyperlien renvoie.
Sélectionnez Adresse électronique pour que l'utilisateur puisse envoyer un courrier à l'adresse
indiquée dans l'hyperlien. Dans le champ Adresse, spécifiez le protocole et l'adresse électronique (exemple : mailto:office@abbyy.com).
Pour insérer un hyperlien :
1. Dans le document, sélectionnez le texte qui fera office d'hyperlien. Si vous omettez de sélectionner du texte, c'est l'adresse de l'hyperlien qui sera affichée dans le document.
2. Cliquez sur le bouton dans la barre d'outils de la fenêtre Te xt e .
3. Dans la boîte de dialogue Modifier l'hyperlien qui s'affiche, tapez le nouveau texte dans le champ Tex t e à afficher.
4. Dans la même boîte de dialogue, spécifiez le type d'adresse dans le groupe Lier à :
Sélectionnez Page Web pour établir un lien avec une page sur Internet. Dans le champ Adresse,
indiquez le protocole et l'URL de la page (exemple : http://www.abbyy.com);
Sélectionnez Fichier local pour établir un lien avec un fichier. Cette option a pour effet d'ouvrir la
boîte de dialogue Ouvrir. Il convient alors de spécifier le nom du fichier auquel l'hyperlien renvoie.
34
Manuel utilisateur ABBYY FineReader 8.0
Sélectionnez Adresse électronique pour que l'utilisateur puisse envoyer un courrier à l'adresse
indiquée dans l'hyperlien. Dans le champ Adresse, spécifiez le protocole et l'adresse électronique (exemple : mailto:office@abbyy.com).
Pour supprimer un hyperlien :
Dans la fenêtre Te xt e , cliquez avec le bouton droit de la souris sur l'hyperlien que vous avez l'intention d'effacer et choisissez Supprimer l'hyperlien dans le menu contextuel.
Enregistrement dans des applications et des formats externes
Les résultats de la reconnaissance peuvent être enregistrés dans un fichier, exportés vers une application externe sans être enregistrés sur le disque, copiés dans le Presse–papiers ou envoyés par courrier électronique dans tout type de format d'enregistrement pris en charge. Il est possible d'enregistrer toutes les pages ou uniquement les pages sélectionnées. ABBYY FineReader peut exporter le résultat de la reconnaissance vers les applications suivantes : Microsoft Word 6.0, 7.0, 97 (8.0), 2000 (9.0), 2002 (10.0) et 2003 (11.0); WordPerfect 2003 (11.0); Microsoft Excel 6.0, 7.0, 97 (8.0), 2000 (9.0), 2002 (10.0) et 2003 (11.0); Microsoft PowerPoint 2002 (10.0) et 2003 (11.0); Corel WordPerfect 7.0, 8.0, 9.0 et 2002 (10.0) et 2003 (11.0); Lotus Word Pro 9.5, 97 et Millennium Edition; StarWriter 4.x. 5.x et 6.x, Adobe Acrobat/Reader (toutes les versions).
Informations générales sur l'enregistrement du texte reconnu
Vous pouvez :
1. enregistrer le texte reconnu à l'aide de l'assistant Enregistrement,
2. enregistrer les pages ouvertes ou sélectionnées dans un fichier ou les exporter vers une application externe,
3. enregistrer toutes les pages du lot dans un fichier ou les exporter vers une application externe,
4. enregistrer l'image de page.
Cliquez sur le bouton 4 – Enregistrer pour envoyer les résultats de la reconnaissance à une application ou les enregistrer dans un fichier. L'apparence de l'icône dépend du mode d'enregistrement actif. La légende du bouton Enregistrer indique le nom de l'application sélectionnée pour l'exportation.
Pour enregistrer le texte reconnu :
Cliquez sur la flèche à droite du bouton 4 – Enregistrer et sélectionnez la commande appropriée dans le menu contextuel. Remarque : si vous souhaitez n'enregistrer que certaines pages, sélectionnez–les avant de cliquer sur le bouton 4 – Enregistrer.
Quand l'exportation est terminée, l'icône du bouton 4 – Enregistrer change, en fonction de l'opération effectuée : envoi du texte reconnu à une application, envoi par courrier électronique, copie dans le Presse–papiers ou enregistrement dans un fichier. L'icône du bouton 4 – Enregistrer correspond toujours au dernier mode d'exportation utilisé. Si vous souhaitez exporter d'autres images en utilisant le même mode, il vous suffit donc de cliquer sur l'icône sans passer par le menu contextuel du bouton.
Options d’enregistrement de texte
Les options d'enregistrement sont définies avant l'enregistrement, sous l'onglet Enregistrer de la boîte de dialogue Options (menu Outils>Options). Vous pouvez également configurer certaines d'entre elles à l'aide de l'assistant d'enregistrement et des boîtes de dialogue Enregistrer les pages , Envoyer des pages par courrier et Envoyer des images par courrier.
Polices à utiliser (disponible si vous effectuez l’enregistrement dans les formats RTF, DOC, Word XML, PPT et HTML).
Par défaut, les polices de l’onglet Enregistrer sont utilisées lorsque vous enregistrez au format RTF, DOC, Word XML, PPT et HTML. Vous pouvez spécifier les polices à utiliser. Vous pouvez changer les polices dans la fenêtre Te x t e ou définir d’autres polices sur l’onglet
Enregistrer, groupe Polices puis relancer la lecture du document.
Enregistrer toutes les pages du lot ou seulement les pages sélectionnées
Vous pouvez enregistrer toutes les pages du lot ou n’enregistrer que celles que vous sélectionnez. Si vous souhaitez enregistrer uniquement un certain nombre de pages, sélectionnez–les avant de procéder à l’enregistrement.
Modes d’enregistrement du texte reconnu (disponible si vous enregistrez plusieurs pages de lot à la fois)
Créer un fichier séparé pour chaque page : chaque page de lot est enregistrée dans un fichier séparé. Le numéro de la page de lot est ajouté automatiquement à la fin du nom de fichier.
Nommer les fichiers en tant qu'images source : utilisez cette option pour enregistrer chaque page dans des fichiers séparés, dont le nom est identique à celui des images source.
Remarque :
1. Les pages ne contenant pas d'informations sur l'image source (les pages numérisées, par exemple) ne sont pas enregistrées dans ce mode. Un avertissement s'affiche si de telles pages s'intercalent entre les pages enregistrées.
2. Si plusieurs pages d'un lot proches les unes des autres affichent une image identique à l'image source, ou si leurs images source portent le même nom, ces pages sont traitées comme celles d'un fichier TIFF multipage, et leur texte est enregistré dans un même fichier. Si les pages, dont les images source portent un nom identique, ne sont
35
Manuel utilisateur ABBYY FineReader 8.0
pas proches les unes des autres, elles sont traitées comme si leurs fichiers d'images étaient différents, et le texte est donc enregistré dans des fichiers différents portant le même nom, suivi d'un index : _1, _2, etc.
Créer un nouveau fichier à chaque page vide : le lot entier est traité comme une série de groupes
de pages, dont la dernière reste blanche. Les pages des différents groupes sont enregistrées dans différents fichiers, dont les noms sont formés à partir d'un nom spécifié par l'utilisateur, suivi d'un index : –1, –2, –3, etc.
Créer un fichier unique pour toutes les pages : toutes les pages (ou toutes les pages sélectionnées)
du lot sont enregistrées dans un même fichier.
Enregistrement du texte reconnu au format RTF, DOC ou Word XML
Important ! L'option d'enregistrement au format Word XML est disponible uniquement dans Microsoft Word 2003. Toutes les options d'enregistrement aux formats RTF, DOC et Wo rd X ML sont définies dans l'onglet RTF/DOC/Word XML de la boîte de dialogue Paramètres de format. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de format sous l'onglet
Enregistrer dans la boîte de dialogue Options ou appuyez sur CTRL+MAJ+X. Remarque : lorsque vous enregistrez du texte au format RTF, DOC ou Word XML, ABBYY FineReader utilise les polices définies dans
l'onglet Enregistrer de la boîte de dialogue Options (menu Outils > Options) ou celles que vous avez définies au cours de l'édition de texte dans la fenêtre Tex t e .
Préservation de la présentation de la page
Les modes de préservation de la présentation dépendent des valeurs définies dans le groupe Conserver la présentation. Vous avez le choix entre les options suivantes :
Colonnes, tableaux, paragraphes, polices
Cette option préserve la présentation du document d'origine, mais dans certains cas, vous pourrez constater une légère différence par rapport à la présentation originale. Sélectionnez cette option si vous envisagez de réaliser de nombreuses modifications et mises en forme sur le texte reconnu.
Présentation initiale
Sélectionnez cette option si vous voulez que les résultats de la reconnaissance aient le même aspect que l'original. Remarque : cette option permet peu de modifications du texte reconnu. Elle est surtout destinée aux documents de type brochure ou aux documents courts de type artistique.
Tableaux, paragraphes, polices
Choisissez cette optionsi vous avez besoin de conserver le contenu du document original, sans la présentation exacte du document.
Définition du format de papier
Vous pouvez sélectionner le format de papier par défaut qui sera utilisé pour l'enregistrement au format RTF, DOC ou Word XML. Pour cela, spécifiez le format requis dans la liste déroulante Format de papier par défaut. Conseils
1. Si vous ne trouvez pas le format de papier qui convient dans la liste, il est possible d'ajouter un format personnalisé. Pour ce faire, sélectionnez Ajouter un format de papier personnalisé dans la liste, puis dans la boîte de dialogue qui s'affiche, indiquez le nom, la hauteur et la largeur du format de papier personnalisé.
2. Pour garantir que les résultats de la reconnaissance s'adaptent au format du papier, sélectionnez l'option Augmenter le format de papier si le contenu dépasse. ABBYY FineReader sélectionne automatiquement le format le plus approprié à l'enregistrement du texte et des images reconnus.
Paramètres de texte
Il faut savoir que les valeurs par défaut des paramètres de texte (qu'une option soit définie ou pas) dépendent du type de préservation mentionné ci–dessus.
Conserver les sauts de ligne
Cette option enregistre l'organisation initiale des lignes dans le format RTF/DOC/Word XML.
Conserver les sauts de page
Cette option enregistre l'organisation initiale des pages dans le format RTF/DOC/Word XML.
Conserver la couleur de texte
Cette option enregistre la couleur initiale des caractères. Remarque : Word 6.0, 7.0 et 97 (8.0) possèdent une palette de couleurs restreinte pour le texte et l'arrière–plan. Pour cette raison, les couleurs initiales du document peuvent être remplacées par des couleurs disponibles dans la palette de Word. En revanche, Word 2000 (9.0) ou une version ultérieure conserve l'intégralité des couleurs initiales du document.
Supprimer les tirets optionnels
Cette option supprime le tiret facultatif (¬) du texte reconnu. Si l'option Conserver les sauts de ligne est sélectionnée, les symboles de tiret optionnel seront remplacés par le signe de tiret (–).
Mettre en évidence les caractères incertains
Choisissez cette option si vous préférez modifier le texte reconnu dans Microsoft Word plutôt que dans la fenêtre Te xt e d'ABBYY FineReader. Si cette option est activée, tous les caractères incertains seront mis en évidence dans la fenêtre Microsoft Word.
36
Manuel utilisateur ABBYY FineReader 8.0
Conseil : il est possible de modifier la couleur des caractères incertains sous l'onglet Affichage de la boîte de dialogue Options (menu Outils > Options).
Autoriser la compatibilité avec Microsoft Word 95
Cette option permet d'enregistrer les résultats de la reconnaissance dans Microsoft Word 95. Remarque : lors de l'enregistrement dans Microsoft Word 95, seul le format d'image BMP est disponible pour les images.
Activer la fenêtre Zoom dans Microsoft Word 2003 (pour le format Word XML)
Cette option permet l'affichage de la fenêtre Zoom d'ABBYY FineReader dans Microsoft Word 2003. Lors de l'enregistrement des résultats au format Word XML, l'image reconnue peut être visualisée dans la fenêtre Zoom intégrée dans Microsoft Word. Cette fenêtre présente alors l'image agrandie de la ligne actuelle ou de la partie du document.
Paramètres de l'image
Si vous voulez conserver les images dans le texte reconnu, assurez–vous que l'option Conserver les images est sélectionnée dans le groupe Paramètres de l'image. Si le document reconnu contient de nombreuses images, vous pouvez réduire la taille du fichier obtenu : sélectionnez la qualité et le format d'image voulus dans le groupe Paramètres de l'image. Qualité La liste déroulante Qualité offre trois niveaux. Sélectionnez :
Elevée si vous envisagez d'imprimer les résultats de la reconnaissance.
Moyenne si les résultats de la reconnaissance sont destinés à une simple visualisation à l'écran.
Basse si vous prévoyez de publier les résultats de la reconnaissance sur Internet.
Plus la valeur choisie dans la liste déroulante Qualité est élevée, meilleure est la qualité des images enregistrées. La taille du fichier dépend également de la valeur spécifiée : plus la valeur est élevée, plus le fichier créé est volumineux. Conseil : pour obtenir un rapport taille/qualité optimal, enregistrez les résultats de la reconnaissance en utilisant une qualité donnée et ouvrez l'image dans une application de visualisation, puis recommencez cette opération avec d'autres valeurs. Format En principe, ABBYY FineReader sélectionne automatiquement le format d'image. Pour vous assurer que c'est bien le cas, veillez à ce que l'option (Automatique) soit sélectionnée dans la liste déroulante Format. En revanche, pour définir le format manuellement, choisissez l'une des options suivantes :
JPEG, couleur (photo) Cette option convient aux documents contenant des photos numériques en couleur ou encore des photos numérisées.
JPEG, niveaux de gris (photo) Cette option est réservée aux photos numérisées ou numériques enregistrées en niveaux de gris.
PNG, couleur (graphiques, diagrammes) Cette option vous permet d'enregistrer les graphiques, les diagrammes ou les dessins tout en préservant leurs couleurs.
JPEG, niveaux de gris (graphiques, diagrammes) Cette option est réservée à l'enregistrement des graphiques et des diagrammes en niveaux de gris.
PNG, noir et blanc Cette option vous permet d'enregistrer les images en noir et blanc.
Enregistrement du texte reconnu au format XLS
Toutes les options d'enregistrement au format XLS sont définies dans l'onglet XLS de la boîte de dialogue Paramètres de format. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de format sous l'onglet Enregistrer dans la boîte de dialogue Options ou appuyez sur CTRL+MAJ+X. Les options suivantes vous permettent de personnaliser le mode d'enregistrement de sorte qu'il soit plus facile de rechercher et traiter le document par la suite :
Ignorer le texte à l'extérieur des tableaux
Cette option vous permet d'enregistrer seulement les tableaux et d'ignorer les autres résultats de reconnaissance.
Convertir les valeurs numériques en nombres
Cette option a pour effet de convertir les nombres au format « nombre » dans le fichier XLS. Microsoft Excel peut effectuer des opérations arithmétiques sur les cellules de ce format.
Enregistrement du texte reconnu au format PDF
Toutes les options d'enregistrement au format PDF sont définies dans l'onglet PDF de la boîte de dialogue Paramètres de format. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de format sous l'onglet Enregistrer dans la boîte de dialogue
Options ou appuyez sur CTRL+MAJ+X.
Définition du format de papier
Vous pouvez sélectionner le format de papier par défaut qui sera utilisé pour l'enregistrement au format PDF. Pour cela, spécifiez le format requis dans la liste déroulante Format de papier par défaut. Conseils
37
Manuel utilisateur ABBYY FineReader 8.0
1. Si vous ne trouvez pas le format de papier qui convient dans la liste, il est possible d'ajouter un format personnalisé. Pour ce faire, sélectionnez Ajouter un format de papier personnalisé dans la liste, puis dans la boîte de dialogue qui s'affiche, indiquez le nom, la hauteur et la largeur du format de papier personnalisé.
2. Si vous voulez préserver la taille d'origine de la page, sélectionnez l'option Conserver la taille originale de
l'image.
Mode d'enregistrement
ABBYY FineReader offre quatre modes de création PDF :
Texte et images seulement
Cette option permet d'enregistrer uniquement le texte reconnu et les images qui s'y rapportent. La page sera entièrement modifiable et la taille du fichier PDF relativement petite.
Image de la page seulement
Ce mode permet d'enregistrer une image de la page. Il est virtuellement impossible de différencier ce type de fichier PDF de l'original, mais il faut savoir que vous ne pourrez pas le modifier et faire des recherches.
Texte par–dessus l'image de page
Ce mode a pour effet d'enregistrer l'arrière–plan et les images du document original et de placer le texte au– dessus. En règle générale, ce type de fichier PDF nécessite plus d'espace disque que le mode Texte et images seulement et est entièrement modifiable. Dans certains cas, vous pourrez constater une légère différence par rapport à la présentation originale, liée au positionnement du texte sur l'image.
Texte sous l'image de page
Ce mode enregistre l'intégralité de la page sous forme d'image et insère le texte reconnu en dessous de façon à ce qu'il soit invisible. Vous disposez ainsi d'un document parfaitement fidèle à la présentation originale et offrant des possibilités de recherche de texte intégral.
PDF balisé
Outre le contenu proprement dit, les fichiers PDF peuvent inclure des informations sur la structure du document telles que les parties logiques, les images, les tableaux, etc. Cette structure est l'expression des « balises PDF ». Un fichier PDF contenant des balises peut être réorganisé afin de s'adapter aux différentes tailles d'écran et de s'afficher correctement sur les ordinateurs portables. Si vous envisagez d'enregistrer du texte reconnu dans un fichier PDF balisé, sélectionnez l'option Activer le PDF balisé (pour Adobe
Acrobat 5.0 et versions suivantes) et ABBYY FineReader ajoutera automatiquement les balises PDF au document PDF de sortie.
Paramètres de l'image et des polices
Si le document reconnu contient de nombreuses images, vous pouvez réduire la taille du fichier obtenu : sélectionnez la qualité et le format d'image voulus dans le groupe Paramètres de l'image.
Qualité
La liste déroulante Qualité offre trois niveaux. Sélectionnez :
Elevée si vous envisagez d'imprimer les résultats de la reconnaissance.
Moyenne si les résultats de la reconnaissance sont destinés à une simple visualisation à l'écran.
Basse si vous prévoyez de publier les résultats de la reconnaissance sur Internet.
Plus la valeur choisie dans la liste déroulante Qualité est élevée, meilleure est la qualité des images enregistrées. La taille du fichier dépend également de la valeur spécifiée : plus la valeur est élevée, plus le fichier créé est volumineux. Conseil : pour obtenir un rapport taille/qualité optimal, enregistrez les résultats de la reconnaissance en utilisant une qualité donnée et ouvrez l'image dans une application de visualisation, puis recommencez cette opération avec d'autres valeurs.
Format
En principe, ABBYY FineReader sélectionne automatiquement le format d'image. Pour vous assurer que c'est bien le cas, veillez à ce que l'option (Automatique) soit sélectionnée dans la liste déroulante Format. En revanche, pour définir le format manuellement, choisissez l'une des options suivantes :
JPEG, couleur (photo) Cette option convient aux documents contenant des photos numériques en couleur ou encore des photos numérisées.
JPEG, niveaux de gris (photo) Cette option est réservée aux photos numérisées ou numériques enregistrées en niveaux de gris.
LZW, couleur (sans perte)
Cette option s'applique avant tout aux graphiques.
LZW, niveaux de gris (sans perte)
Cette option convient aux graphiques et images en niveaux de gris.
ZIP, couleur (sans perte)
Cette option est prévue pour des images créées avec des programmes de dessin.
ZIP, niveaux de gris (sans perte)
Cette option permet d'enregistrer des images en niveaux de gris.
CCITT4, noir et blanc
Cette option permet d'enregistrer les images en noir et blanc.
Conseils
38
Manuel utilisateur ABBYY FineReader 8.0
1. Lorsque vous enregistrez des textes ayant des pages de codes non latines (par exemple, l'alphabet cyrillique, grec, tchèque, etc.), ABBYY FineReader utilise les polices fournies par la société ParaType (www.paratype.com/shop).
2. Avant de modifier des fichiers PDF avec des pages de codes non latines dans Adobe Acrobat, vous devez remplacer la police du texte actuel par une police installée sur l'ordinateur.
Police
Lors de l'enregistrement d'un texte reconnu au format PDF, ABBYY FineReader utilise les polices Adobe Acrobat standard ou les polices système. Dans la liste déroulante Police, sélectionnez :
Utiliser des polices standard Si cette option est activée, le fichier PDF fait appel aux polices standard d'Adobe Acrobat : Times, Helvetica et CourierNew.
Utiliser des polices système Si cette option est activée, le fichier PDF a recours aux polices standard installées sur l'ordinateur.
Par défaut, ABBYY FineReader incorpore les polices dans le document PDF obtenu. Les polices incorporées garantissent que le document PDF ressemble trait pour trait à l'original, quelle que soit la manière dont vous le visualisez ou l'imprimez. Cependant, elles ont pour effet d'augmenter la taille du fichier. Si vous ne jugez pas utile d'incorporer les polices dans vos documents PDF, désactivez l'option Incorporer les polices.
Sécurité
Lors de l'enregistrement des textes reconnus au format PDF, vous pouvez utiliser les mots de passe qui empêchent l'ouverture, l'impression ou la modification du document PDF.
Paramètres de sécurité PDF
Lors de l'enregistrement des textes reconnus au format PDF, vous pouvez utiliser les mots de passe qui empêchent l'ouverture, l'impression ou la modification du document PDF. Les mots de passe et les autres restrictions sont définis dans la boîte de dialogue Paramètres de sécurité PDF. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de sécurité PDF situé sous l'onglet PDF de la boîte de dialogue Paramètres de format. Vous pouvez spécifier un mot de passe d'ouverture de document ou/et un mot de passe des autorisations. Mot de passe d'ouverture de document Cette option empêche les utilisateurs d'ouvrir des documents PDF, sauf s'ils tapent le mot de passe spécifié par l'auteur. Pour ajouter ce mot de passe à votre document PDF :
Sélectionnez l'option Utilisation d'un mot de passe pour ouvrir le document, cliquez sur boîte de dialogue Saisir le mot de passe d'ouverture de document, tapez le mot de passe, puis confirmez–le. Le mot de passe que vous avez saisi s'affiche sous forme de points dans le champ Mot de passe d'ouverture de
document.
Mot de passe des autorisations
Cette option empêche les utilisateurs d'imprimer et de modifier le document PDF sauf s'ils saisissent le mot de passe approprié. Si certains paramètres de sécurité sont activés pour le document, les utilisateurs ne sont pas en mesure de les modifier tant qu'ils ne saisissent pas le mot de passe que vous avez spécifié.
Pour ajouter ce mot de passe à votre document PDF :
Sélectionnez Restreindre impression/modification du document et des paramètres de sécurité, cliquez
sur confirmez–le. Le mot de passe que vous avez saisi s'affiche sous forme de points dans le champ Mot de passe des autorisations.
Il est possible également d'activer ou de désactiver l'impression, la modification ou la copie de vos documents PDF. Ces
restrictions sont définies dans le groupe Paramètres des autorisations.
La liste Impression autorisée active/désactive l'impression d'un document PDF.
La liste Modifications autorisées répertorie les changements réalisables dans le document PDF.
L'option Autoriser la copie de texte, d'images et d'autres contenus permet aux utilisateurs de sélectionner
et de copier du texte, des images et tout autre élément à partir de votre document PDF. Si vous souhaitez interdire la copie du contenu du document, assurez–vous que cette option est désactivée.
La liste déroulante Niveau de codage précise le type de codage d'un document protégé par mot de passe. Vous avez le choix entre trois niveaux : l'élément Basse (40 bits) – compatible avec Acrobat 3.0 et versions
suivantes définit un faible niveau (RC4 40 bits) de codage ; l'option Elevée (128 bits) – compatible avec Acrobat 5.0 et versions suivantes définit un niveau de codage élevé (RC4 128 bits), mais les utilisateurs d'Acrobat 3.0 ne pourront pas ouvrir les documents PDF ; l'option Elevée (128 bits AES) – compatible avec Acrobat 7.0 définit un niveau de codage élevé (AES 128 bits), mais les utilisateurs d'Acrobat 6.0 (ou d'une version
antérieure) ne pourront pas ouvrir les documents PDF.
, puis dans la boîte de dialogue Saisir le mot de passe des autorisations, entrez le mot de passe et
et dans la
39
Manuel utilisateur ABBYY FineReader 8.0
Enregistrement du texte reconnu au format HTML
Toutes les options d'enregistrement au format HTML sont définies dans l'onglet HTML de la boîte de dialogue Paramètres de format. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de format sous l'onglet Enregistrer dans la boîte de dialogue Options ou appuyez sur CTRL+MAJ+X. Remarque : lorsque vous enregistrez du texte au format HTML, ABBYY FineReader utilise les polices définies dans l'onglet Enregistrer de la boîte de dialogue Options(menu Outils > Options ) ou celles que vous avez définies au cours de l'édition de texte dans la fenêtre Te xt e .
Préservation de la présentation de la page
Les modes de préservation de la présentation dépendent des valeurs définies dans le groupe Conserver la présentation. Vous avez le choix entre les options suivantes :
Présentation initiale
Sélectionnez cette option si vous voulez que les résultats de la reconnaissance aient le même aspect que l'original. Remarque : cette option permet peu de modifications du texte reconnu. Elle est surtout destinée aux documents de type brochure ou aux documents courts de type artistique.
Supprimer tout le formatage
Seules la structure des tableaux et la disposition en paragraphes sont conservées. Le texte est composé dans la même police de la même taille.
Conserver police et taille de police
La structure des tableaux, la disposition en paragraphes, la police et la taille de police sont conservées dans ce mode.
Options de format
Les formats HTML disponibles sont les suivants :
1. Complet (utilise CSS ; nécessite Internet Explorer 4.0 ou supérieur) : le nouveau format HTML 4 est utilisé. HTML 4 prend en charge tous les types de préservation de présentation de document (le type de préservation effectivement utilisé dépend des options activées sur l'onglet Formatage dans le groupe Conserver
la présentation). La feuille de style intégrée est utilisée. Remarque : Internet Explorer 4.0 ou une version ultérieure est nécessaire à la visualisation d'un document
enregistré dans ce mode.
2. Simple (compatible avec tous les navigateurs Internet) – le format HTML 3 est utilisé. La présentation du document est préservée approximativement, c'est–à–dire que le retrait de la première ligne n'est pas conservé, mais que la taille de la police est enregistrée approximativement (le format HTML 3 ne prend en charge qu'un nombre limité de tailles de police ; de ce fait, ABBYY FineReader choisit la taille de police du format HTML 3 qui correspond à la taille de police effective du texte). Ce format HTML est pris en charge par tous les navigateurs (Netscape Navigator, Internet Explorer 3.0 et supérieur).
Paramètres de texte
Il faut savoir que les valeurs par défaut des paramètres de texte (qu'une option soit définie ou pas) dépendent du type de préservation mentionné ci–dessus.
Conserver les sauts de ligne
Cette option enregistre l'organisation initiale des lignes dans le format HTML.
Conserver la couleur de texte
Cette option enregistre la couleur initiale des caractères. Remarque : Word 6.0, 7.0 et 97 (8.0) possèdent une palette de couleurs restreinte pour le texte et l'arrière–plan. Pour cette raison, les couleurs initiales du document peuvent être remplacées par des couleurs disponibles dans la palette de Word. En revanche, Word 2000 (9.0) ou une version ultérieure conserve l'intégralité des couleurs initiales du document.
Utiliser une ligne continue comme saut de page
Cette option vous permet de conserver l'organisation en pages initiale (les pages sont séparées par une ligne continue).
Paramètres de l'image
Si vous voulez conserver les images dans le texte reconnu, assurez–vous que l'option Conserver les images est sélectionnée dans le groupe Paramètres de l'image. Si le document reconnu contient de nombreuses images, vous pouvez réduire la taille du fichier obtenu : sélectionnez la qualité et le format d'image voulus dans le groupe Paramètres de l'image.
Qualité La liste déroulante Qualité offre trois niveaux. Sélectionnez :
Elevée si vous envisagez d'imprimer les résultats de la reconnaissance.
Moyenne si les résultats de la reconnaissance sont destinés à une simple visualisation à l'écran.
Basse si vous prévoyez de publier les résultats de la reconnaissance sur Internet.
Plus la valeur choisie dans la liste déroulante Qualité est élevée, meilleure est la qualité des images enregistrées. La taille du fichier dépend également de la valeur spécifiée : plus la valeur est élevée, plus le fichier créé est volumineux.
40
Manuel utilisateur ABBYY FineReader 8.0
Conseil : pour obtenir un rapport taille/qualité optimal, enregistrez les résultats de la reconnaissance en utilisant une qualité donnée et ouvrez l'image dans une application de visualisation, puis recommencez cette opération avec d'autres valeurs.
Format
En principe, ABBYY FineReader sélectionne automatiquement le format d'image. Pour vous assurer que c'est bien le cas, veillez à ce que l'option (Automatique) soit sélectionnée dans la liste déroulante Format. En revanche, pour définir le format manuellement, choisissez l'une des options suivantes :
JPEG, couleur (photo) Cette option convient aux documents contenant des photos numériques en couleur ou encore des photos numérisées.
JPEG, niveaux de gris (photo) Cette option est réservée aux photos numérisées ou numériques enregistrées en niveaux de gris.
PNG, couleur (graphiques, diagrammes) Cette option vous permet d'enregistrer les graphiques, les diagrammes ou les dessins tout en préservant leurs couleurs.
JPEG, niveaux de gris (graphiques, diagrammes) Cette option est réservée à l'enregistrement des graphiques et des diagrammes en niveaux de gris.
PNG, noir et blanc Cette option vous permet d'enregistrer les images en noir et blanc.
Options pour le codage des caractères
ABBYY FineReader détecte automatiquement la page de code. Pour modifier la page de code, sélectionnez celle de votre choix ou encore le type voulu dans le groupe Codage des caractères.
Enregistrement du texte reconnu au format PPT
Lors de l'enregistrement des résultats de la reconnaissance au format PPT, ABBYY FineReader préserve automatiquement et intégralement la présentation. Toutes les options d'enregistrement du format PPT sont définies dans l'onglet PPT de la boîte de dialogue Paramètres de format. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de format sous l'onglet Enregistrer dans la boîte de dialogue
Options ou appuyez sur CTRL+MAJ+X. Remarque : lorsque vous enregistrez du texte au format PPT, ABBYY FineReader utilise les polices définies dans l'onglet Enregistrer
de la boîte de dialogue Options (menu Outils > Options) ou celles que vous avez définies au cours de l'édition de texte dans la fenêtre Te xt e .
Paramètres de texte
Conserver les sauts de ligne
Cette option enregistre l'organisation initiale des lignes dans le format PPT.
Retour à la ligne
Si la mise en forme des lignes est préservée, le texte reconnu sera ajusté en fonction de la largeur du bloc de texte de la diapositive.
Paramètres de l'image
Si vous voulez conserver les images dans le texte reconnu, assurez–vous que l'option Conserver les images est sélectionnée dans le groupe Paramètres de l'image. Si le document reconnu contient de nombreuses images, vous pouvez réduire la taille du fichier obtenu : sélectionnez la qualité et le format d'image voulus dans le groupe Paramètres de l'image.
Qualité La liste déroulante Qualité offre trois niveaux. Sélectionnez :
Elevée si vous envisagez d'imprimer les résultats de la reconnaissance.
Moyenne si les résultats de la reconnaissance sont destinés à une simple visualisation à l'écran.
Basse si vous prévoyez de publier les résultats de la reconnaissance sur Internet.
Plus la valeur choisie dans la liste déroulante Qualité est élevée, meilleure est la qualité des images enregistrées. La taille du fichier dépend également de la valeur spécifiée : plus la valeur est élevée, plus le fichier créé est volumineux. Conseil : pour obtenir un rapport taille/qualité optimal, enregistrez les résultats de la reconnaissance en utilisant une qualité donnée et ouvrez l'image dans une application de visualisation, puis recommencez cette opération avec d'autres valeurs.
Format
En principe, ABBYY FineReader sélectionne automatiquement le format d'image. Pour vous assurer que c'est bien le cas, veillez à ce que l'option (Automatique) soit sélectionnée dans la liste déroulante Format. En revanche, pour définir le format manuellement, choisissez l'une des options suivantes :
JPEG, couleur (photo) Cette option convient aux documents contenant des photos numériques en couleur ou encore des photos numérisées.
JPEG, niveaux de gris (photo) Cette option est réservée aux photos numérisées ou numériques enregistrées en niveaux de gris.
41
Manuel utilisateur ABBYY FineReader 8.0
PNG, couleur (graphiques, diagrammes) Cette option vous permet d'enregistrer les graphiques, les diagrammes ou les dessins tout en préservant leurs couleurs.
JPEG, niveaux de gris (graphiques, diagrammes) Cette option est réservée à l'enregistrement des graphiques et des diagrammes en niveaux de gris.
PNG, noir et blanc Cette option vous permet d'enregistrer les images en noir et blanc.
Important !
Lorsque vous enregistrez les résultats dans le format .PPT, ABBYY FineReader créé des fichiers HTML spéciaux qui contiennent les différentes parties de la présentation. Pour enregistrer la présentation dans un seul fichier, réenregistrez–le au format PowerPoint (sélectionnez Enregistrer sous dans le menu Fichier et choisissez PPT comme format d'enregistrement).
Enregistrement du texte reconnu au format TXT
Toutes les options d'enregistrement au format TXT sont définies dans l'onglet TXT de la boîte de dialogue Paramètres de format. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de format sous l'onglet Enregistrer dans la boîte de dialogue
Options ou appuyez sur CTRL+MAJ+X.
Paramètres de texte
Conserver les sauts de ligne
Cette option enregistre l'organisation initiale des lignes dans le format TXT.
Ajouter à la fin du fichier
Cette option insère le texte à la fin d'un fichier TXT existant.
Utiliser le caractère de saut de page (#12) comme séparateur de pages
Cette option enregistre la présentation de la page du document d'origine au format TXT.
Utiliser une ligne vide comme séparateur de paragraphes
Lorsque cette option est sélectionnée, les paragraphes sont séparés par des lignes vides dans le fichier TXT.
Options pour le codage des caractères
ABBYY FineReader détecte automatiquement la page de code. Pour modifier la page de code, sélectionnez celle de votre choix ou encore le type voulu dans le groupe Codage des caractères.
Enregistrement du texte reconnu au format DBF
Toutes les options d'enregistrement au format DBF sont définies dans l'onglet DBF de la boîte de dialogue Paramètres de format. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de format sous l'onglet Enregistrer dans la boîte de dialogue
Options ou appuyez sur CTRL+MAJ+X.
Paramètres de texte
Ajouter à la fin du fichier
Cette option insère le texte à la fin d'un fichier DBF existant.
Options pour le codage des caractères
ABBYY FineReader détecte automatiquement la page de code. Pour modifier la page de code, sélectionnez celle de votre choix ou encore le type voulu dans le groupe Codage des caractères.
Enregistrement du texte reconnu au format CSV
Toutes les options d'enregistrement au format CSV sont définies dans l'onglet CSV de la boîte de dialogue Paramètres de format. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de format sous l'onglet Enregistrer dans la boîte de dialogue
Options ou appuyez sur CTRL+MAJ+X.
Paramètres de texte
Ignorer le texte à l'extérieur des tableaux
Cette option vous permet d'enregistrer seulement les tableaux et d'ignorer les autres résultats de reconnaissance.
Ajouter à la fin du fichier
Cette option ajoute le texte à la fin d'un fichier CSV existant.
Utiliser le caractère de saut de page (#12) comme séparateur de pages
Cette option enregistre la présentation de la page du document d'origine au format CSV.
Séparateur de champs
Ce champ vous permet de choisir le caractère qui sépare les champs dans le fichier CSV.
Options pour le codage des caractères
ABBYY FineReader détecte automatiquement la page de code. Pour modifier la page de code, sélectionnez celle de votre choix ou encore le type voulu dans le groupe Codage des caractères.
42
Manuel utilisateur ABBYY FineReader 8.0
Enregistrement du texte reconnu au format LIT
Toutes les options d'enregistrement au format LIT sont définies dans l'onglet LIT de la boîte de dialogue Paramètres de format. Pour ouvrir cette boîte de dialogue, cliquez sur le bouton Paramètres de format sous l'onglet Enregistrer dans la boîte de dialogue
Options ou appuyez sur CTRL+MAJ+X.
Paramètres de texte
Conserver les sauts de ligne
Cette option enregistre l'organisation initiale des lignes dans le format LIT.
Convertir les tableaux en texte
Cette option transforme un tableau en texte.
Conserver le texte et la couleur de fond
Cette option vous permet de préserver la couleur initiale du texte ainsi que la couleur de fond.
Paramètres de l'image
Si vous voulez conserver les images dans le texte reconnu, assurez–vous que l'option Conserver les images est sélectionnée dans le groupe Paramètres de l'image. Si le document reconnu contient de nombreuses images, vous pouvez réduire la taille du fichier obtenu : sélectionnez la qualité et le format d'image voulus dans le groupe Paramètres de l'image.
Qualité La liste déroulante Qualité offre trois niveaux. Sélectionnez :
Elevée si vous envisagez d'imprimer les résultats de la reconnaissance.
Moyenne si les résultats de la reconnaissance sont destinés à une simple visualisation à l'écran.
Basse si vous prévoyez de publier les résultats de la reconnaissance sur Internet.
Plus la valeur choisie dans la liste déroulante Qualité est élevée, meilleure est la qualité des images enregistrées. La taille du fichier dépend également de la valeur spécifiée : plus la valeur est élevée, plus le fichier créé est volumineux. Conseil : pour obtenir un rapport taille/qualité optimal, enregistrez les résultats de la reconnaissance en utilisant une qualité donnée et ouvrez l'image dans une application de visualisation, puis recommencez cette opération avec d'autres valeurs.
Format
En principe, ABBYY FineReader sélectionne automatiquement le format d'image. Pour vous assurer que c'est bien le cas, veillez à ce que l'option (Automatique) soit sélectionnée dans la liste déroulante Format. En revanche, pour définir le format manuellement, choisissez l'une des options suivantes :
JPEG, couleur (photo) Cette option convient aux documents contenant des photos numériques en couleur ou encore des photos numérisées.
JPEG, niveaux de gris (photo) Cette option est réservée aux photos numérisées ou numériques enregistrées en niveaux de gris.
PNG, couleur (graphiques, diagrammes) Cette option vous permet d'enregistrer les graphiques, les diagrammes ou les dessins tout en préservant leurs couleurs.
JPEG, niveaux de gris (graphiques, diagrammes) Cette option est réservée à l'enregistrement des graphiques et des diagrammes en niveaux de gris.
PNG, noir et blanc Cette option vous permet d'enregistrer les images en noir et blanc.
Important !
Lorsque vous enregistrez les résultats dans le format .PPT, ABBYY FineReader créé des fichiers HTML spéciaux qui contiennent les différentes parties de la présentation. Pour enregistrer la présentation dans un seul fichier, réenregistrez–le au format PowerPoint (sélectionnez Enregistrer sous dans le menu Fichier et choisissez PPT comme format d'enregistrement).
Enregistrement de l'image de page
1. Sélectionnez une page de lot.
2. Sélectionnez la commande Enregistrer l'image sous dans le menu Fichier. La boîte de dialogue Enregistrer sous apparaît.
3. Dans le disque et le dossier où vous souhaitez enregistrer le fichier, ainsi que le format du fichier. Remarque : Si vous le souhaitez, vous pouvez n’enregistrer que certaines zones d'image encadrées par des blocs (de tout type). Pour cela, sélectionnez le ou les blocs appropriés, puis, dans la boîte de dialogue Enregistrer sous, cliquez sur la case de sélection Enregistrer seulement les blocs sélectionnés. Ce mode ne peut être utilisé que lors de l’enregistrement d’une seule image.
4. Spécifiez le nom du fichier.
5. Cliquez sur OK.
Remarque : vous pouvez enregistrer plusieurs images dans un même fichier (TIFF multipage). Pour ce faire :
1. Sélectionnez les images souhaitées dans la fenêtre Lot.
2. Sélectionnez Fichier>Enregistrer le résultat>Enregistrer des images...
Conseils :
Enregistrement de plusieurs images dans un seul fichier (TIFF multipage)
43
Manuel utilisateur ABBYY FineReader 8.0
1. Sélectionnez les images dans la fenêtre Lot.
2. Sélectionnez la commande Enregistrer l'image sous dans le menu Fichier. Sélectionnez le format TIFF
et l'option Enregistrer sous forme d'un fichier d'image multipage. Remarque : si vous enregistrez plusieurs images de page à l'aide de la fenêtre Lot en tant que fichiers séparés (c'est–à–dire que les images ne sont pas enregistrées sous forme d'un TIFF multipage), les noms des fichiers se composeront du nom de fichier saisi, du numéro de page (4 chiffres) et d'un suffixe de fichier.
Sélection du mode de compression pour un format de fichier TIFF
TIFF est un format de fichier universel largement répandu. Plusieurs formats de modes de compression sont compatibles avec ce format. La compression réduit la taille d'une image. Les modes de compression de distinguent par le taux de compression et la qualité des images compressées. ABBYY FineReader 8.0 prend en charge les modes suivants :
Le mode de compression ZIP convient aux images comportant de grandes zones d'une seule couleur (les captures d'écran, par exemple), aux images créées avec des applications de dessin ainsi qu'aux images en noir et blanc. Le mode ZIP est un mode sans perte, c'est–à–dire qu'il n'a pas d'effet sur la qualité des images finales.
JPEG est un mode de compression généralement réservé aux images en couleur ou en niveaux de gris, comme les photographies. Ce mode permet de réduire considérablement la taille d'un fichier image. Cependant, l'image peut donner l'impression d'une mosaïque, certaines nuances de couleur pouvant être perdues.
CCITT est le mode de compression le plus adapté pour les images en noir et blanc numérisées ou réalisées à l'aide d'une application de dessin. CCITT est un mode de compression sans perte. CCITT Groupe 4 offre un niveau de compression acceptable pour la plupart des types d'image. Le mode CCITT Groupe 3 est prévu pour les télécopieurs.
Le format Packbits est un mode de compression sans perte destiné aux images en noir et blanc numérisées.
LZW est un mode de compression sans perte qui convient pour les graphiques et les images en niveaux de gris.
Remarque : dans ABYY FineReader 8.0, ce mode de compression est seulement disponible pour l'enregistrement des images avec le texte reconnu.
Ajout des propriétés du document
Les propriétés du document contiennent le titre du document, le nom de son auteur, son sujet et ses mots clés. Vous pouvez vous servir des propriétés de document pour trier ou rechercher des fichiers. Ces propriétés sont appliquées à l'ensemble des pages au sein du lot. Pour définir ou modifier les propriétés du document :
Dans la fenêtre Lot, sélectionnez la page du lot qui vous intéresse, puis choisissez Propriétés du document dans le menu Fichier.
ou
Dans la fenêtre Lot, cliquez avec le bouton droit de la souris sur le document qui vous intéresse, puis choisissez Propriétés dans le menu contextuel.
Dans la boîte de dialogue qui s'affiche, entrez le titre, le nom de l'auteur, le sujet du document et les mots–clés. Remarque : Les formats de fichier ne gèrent pas tous les propriétés de document. Les propriétés que vous définissez seront ajoutées aux documents aux formats suivants : DOC, XLS, HTM, PDF et LIT.
Travailler avec les lots
Le lot est le principal référentiel de données ABBYY FineReader les images numérisées, le texte reconnu et les autres données sont conservés dans un lot. La majorité des options d’ABBYY FineReader sont définies dans le cadre d'un lot : numérisation, reconnaissance, options d'enregistrement, etc. Les gabarits utilisateur, les langues utilisateur et les groupes de langues "appartiennent" également aux lots. Quand vous créez un nouveau lot, vous pouvez utiliser les paramètres par défaut, les paramètres du lot en cours ou les paramètres enregistrés dans un fichier *.fbt.
Informations générales concernant l'utilisation des lots
Par défaut, un nouveau lot est créé au démarrage d’ABBYY FineReader. Un lot peut contenir jusqu'à 9 999 pages. Conseil : il peut être utile d'enregistrer les "mêmes" pages dans un même lot. Par exemple, si vous conservez dans un même lot toutes les pages d'un livre, les textes d'une même langue ou les images possédant la même présentation, votre travail s'en trouvera considérablement simplifié. La fenêtre Lot affiche la liste des pages du lot ouvert. Pour afficher une page, cliquez sur son icône ou cliquez deux fois sur son numéro. Tous les fichiers associés à cette page de lot s'ouvriront dans leur fenêtre respective, c'est–à–dire le fichier texte (si la page a été reconnue) dans la fenêtre Te x te et le fichier d'image dans la fenêtre Image. Deux possibilités sont à votre disposition pour afficher les pages dans la fenêtre Lot :
Affichage de lot
Vignettes Dans cette vue, les pages du lot s'affichent sous forme de vignettes. Une vignette est simplement une image très de la page
Description
d'origine. Des icônes supplémentaires apparaissent sur les vignettes à mesure que vous traitez l'image, pour vous indiquer les actions particulières effectuées : reconnaissance, enregistrement, etc. Cette vue peut être utile pour ouvrir une page précise d'un lot : vous voyez une petite image de la page dans la fenêtre de lot et pouvez ainsi déterminer facilement celle
44
Manuel utilisateur ABBYY FineReader 8.0
dont vous avez besoin. Pour ouvrir une image, cliquez simplement sur sa vignette.
Détails Dans cette vue, la fenêtre de lot affiche des informations détaillées concernant chaque page du lot ; vous pouvez trier la
liste des pages selon toute caractéristique appropriée. La vue Détails est pratique lorsque vous manipulez des lots de grande taille, car la fenêtre de lot affiche un nombre beaucoup plus grand de pages dans cette vue que dans la vue Vignettes. Cliquez deux fois sur une page pour l'ouvrir.
Pour choisir le type de vue de la page dans la fenêtre Lot :
Cliquez sur ou sur dans la barre d'outils Standard, ou
Cliquez dans la fenêtre Lot avec le bouton droit de la souris et sélectionnez la commande Fenêtre Lot>... dans le
menu contextuel.
Vous pouvez également régler chaque vue de la fenêtre Lot, c'est–à–dire choisir les caractéristiques affichées, la façon de trier les pages, etc. Pour cela :
Cliquez dans la fenêtre Lot avec le bouton droit de la souris et sélectionnez la commande Fenêtre Lot>Personnaliser dans le menu contextuel. Une boîte de dialogue s'ouvre. Définissez les options de votre choix
dans les onglets Vignettes et Détails de cette boîte de dialogue.
Vous pouvez sélectionner plusieurs pages ou une série de pages :
Pour sélectionner plusieurs pages consécutives, tenez enfoncée la touche MAJ et cliquez sur la première et la dernière page du groupe que vous souhaitez sélectionner.
Pour sélectionner plusieurs pages, tenez enfoncée la touche CTRL et cliquez sur les pages dont vous avez besoin.
Pour sélectionner toutes les pages du lot, ouvrez la fenêtre Lot et choisissez la commande Tout sélectionner dans le menu Edition ou appuyez sur ALT+A.
Création d'un nouveau lot
Pour créer un nouveau lot :
Sélectionnez la commande Nouveau lot dans le menu Fichier ou
Cliquez sur le bouton Nouveau lot (
).
Ouverture d'un lot
Par défaut, un nouveau lot est créé au démarrage d’ABBYY FineReader.
Remarque : si vous souhaitez qu'à son démarrage, ABBYY FineReader ouvre le dernier lot que vous avez utilisé, cochez l'option Ouvrir le dernier lot au démarrage dans l'onglet Général de la boîte de dialogue Options (Outils>Options).
Pour ouvrir un autre lot :
1. Sélectionnez la commande Ouvrir un lot dans le menu Fichier ou cliquez sur le bouton Ouvrir un lot ( La boîte de dialogue Ouverture de lot apparaît.
2. Sélectionnez le dossier approprié dans la boîte de dialogue. Lorsque vous ouvrez un lot, celui qui était ouvert est automatiquement enregistré et fermé. Si vous avez travaillé sur un nouveau lot et que vous pensez avoir besoin de ce fichier ultérieurement, assurez–vous d'enregistrer ce lot avant de quitter le programme.
Vous pouvez ouvrir le lot directement dans Windows Explorer :
Cliquez avec le bouton droit de la souris sur le dossier du lot (représenté par l'icône commande Ouvrir avec ABBYY FineReader dans le menu contextuel. Une copie d’ABBYY FineReader sera lancée et ouvrira le lot que vous avez sélectionné.
) et sélectionnez la
Ajout d'images à un lot
Choisissez Ouvrir PDF/Imagedans le menu Fichier ou appuyez sur CTRL+O.
Sélectionnez les images souhaitées dans la boîte de dialogue Ouvrir une image.
ABBYY FineReader ajoute l'image au lot ouvert et la recopie dans le dossier de lot.
Remarque : Vous pouvez ajouter des images directement depuis Windows Explorer :
1. Dans Windows Explorer, sélectionnez un fichier d'image ou un groupe de fichiers.
2. Cliquez sur la sélection à l'aide du bouton droit de la souris, puis dans le menu contextuel, sélectionnez la commande Ouvrir avec ABBYY FineReader. Si ABBYY FineReader est actuellement exécuté sur votre ordinateur, les fichiers sélectionnés sont ajoutés au lot actuel. Dans le cas contraire, une copie d’ABBYY FineReader est lancée et les fichiers sélectionnés sont ajoutés à un nouveau lot. Cette commande du menu contextuel n'est activée que pour les fichiers au format pris en charge par ABBYY FineReader 8.0.
).
Numéro de page de lot
Toutes les pages de lot sont numérotées. Un lot peut contenir jusqu'à 9 999 pages. Le numéro de page est affiché dans le lot.
45
Manuel utilisateur ABBYY FineReader 8.0
Vous pouvez renuméroter les pages directement dans la fenêtre Lot ou par l'intermédiaire de la boîte de dialogue Renuméroter les pages.
Pour renuméroter les pages dans la fenêtre Lot :
1. Cliquez sur une page de la fenêtre Lot ou appuyez sur F2.
2. Saisissez ensuite le nouveau numéro de la page.
Une fois le numéro de la page modifié, celle–ci est placée de manière à correspondre au nouveau numéro de la fenêtre Lot.
Remarque : cliquer deux fois sur un numéro de page permet d'ouvrir la page correspondante.
Pour renuméroter des pages dans la boîte de dialogue Renuméroter les pages :
1. Sélectionnez une ou plusieurs pages.
2. Sélectionnez la commande Renuméroter les pages dans le menu Lot.
3. Spécifiez le numéro de la première page sélectionnée (celle de plus petit numéro).
Remarque
1. Si vous voulez renuméroter toutes les pages du lot, sélectionnez l'option Toutes les pages dans la boîte de
dialogue Renuméroter les pages.
2. Si vous ne voulez renuméroter qu'une partie du lot :
Sélectionnez les pages à renuméroter dans la fenêtre Lot.
Sélectionnez l'option Pages sélectionnées dans la boîte de dialogue Renuméroter les pages.
3. Si vous voulez que les pages sélectionnées soient renumérotées séquentiellement, sélectionnez l'option Numérotation des pages en continu. Par exemple : les numéros de page étaient 2,5,6. "1" a été défini comme premier numéro. Après renumérotation, les numéros de page seront 1,2,3. Si l'option Numérotation des pages en continu n'avait pas été spécifiée, les numéros de page seraient 1,4,5. Ainsi, la première page se voit attribuer le numéro que vous avez saisi et le reste des pages sera renuméroté de manière à conserver les écarts de numéros initiaux.
Remarque : si vous ne renumérotez qu'une partie des pages du lot, une page renumérotée peut se voir attribuer un numéro déjà occupé par une page non concernée par la renumérotation. Le cas échéant, ABBYY FineReader vous avertira et l'ensemble de l'opération sera annulé.
Enregistrement d'un lot
Pour enregistrer un lot :
Sélectionnez Enregistrer le lot sous dans le menu Fichier.
Dans la boîte de dialogue Enregistrer le lot sous qui s'affiche, spécifiez le nom du lot et l'emplacement dans
lequel il sera enregistré.
Fermeture d'une page de lot ou d'un lot entier
Pour fermer une page de lot :
Sélectionnez la commande Fermer la page en cours dans le menu Lot.
Pour fermer une page de lot :
Sélectionnez la commande Fermer un lot dans le menu Fichier.
Suppression d'un lot
Remarque : la suppression d'un lot implique la suppression de l'intégralité de son contenu, c'est–à–dire toutes ses pages (images et texte), ainsi que tout fichier supplémentaire créé en travaillant avec le lot : gabarits et langues utilisateur, etc. En pratique, vous supprimez tout le contenu du dossier de lot.
Pour supprimer un lot, sélectionnez la commande Supprimer le lot dans le menu Lot.
Pour supprimer une page de lot :
1. Sélectionnez les pages à supprimer dans la fenêtre Lot.
2. Sélectionnez la commande Supprimer la page du lot dans le menu Lot ou appuyez simplement sur SUPPR.
Paramètres du lot
Pour enregistrer les paramètres du lot dans un fichier :
Cliquez sur le bouton Enregistrer les options... de l'onglet Général (Outils>Options). La boîte de dialogue Enregistrer les options sous s'ouvre.
Entrez un nom de fichier.
Les paramètres enregistrés sont les suivants : tous les paramètres des onglets Numériser/Ouvrir, Lire, Vérifier l'orthographe et Enregistrer ainsi que les paramètres définis dans la boîte de dialogue Paramètres de format. Les langues utilisateur, les groupes de langues utilisateur et les gabarits utilisateur sont également enregistrés dans le fichier. Pour appliquer les options à tous les nouveaux lots, cochez la case Appliquer ce jeu d'options aux nouveaux lots dans la boîte de dialogue Enregistrer les options sous.
Pour renvoyer les paramètres par défaut :
Cliquez sur le bouton Rétablir les valeurs par défaut dans l'onglet Général.
46
Manuel utilisateur ABBYY FineReader 8.0
Pour charger les paramètres :
Cliquez sur le bouton Charger des options...dans l'onglet Général, puis sélectionnez le fichier Modèle de lot ABBYY FineReader (*.fbt) contenant les paramètres de votre choix.
Recherche en mode texte intégral dans les pages du lot reconnues
Remarque : pour utiliser cette option, Explorer 4.0 ou ultérieur est requis. Vous pouvez rechercher des mots sous leurs diverses formes grammaticales dans l'ensemble des pages reconnues. L'élément recherché peut être un mot ou un groupe de mots. Les mots peuvent se présenter sous diverses formes (pour les langues prises en charge par le dictionnaire) ; les mots recherchés peuvent se trouver à n'importe quel endroit du texte et ne pas se suivre.
Pour ce faire :
1. dans le menu Edition, sélectionnez la commande Recherche avancée ou appuyez sur les touches ALT+F3.
2. La fenêtre Rechercher s'ouvre en bas de la fenêtre Zoom.
3. Dans le champ Chercher, tapez le texte à rechercher. Vous pouvez également y coller le contenu du Presse–
papiers ou sélectionner une ancienne recherche dans la liste.
4. CCliquez sur le bouton Chercher.
Le numéro des pages du lot dans lesquelles figurent TOUS les mots saisis dans le champ Chercher s'affiche dans la fenêtre Résultats de la recherche . Pour toutes les pages du lot ainsi trouvées, la fenêtre affiche les données dernièrement modifiées, ainsi que la première section de la page contenant les termes recherchés (mis en évidence). Cliquez sur le numéro de la page pour l'ouvrir dans les fenêtres Image, Texte et Zoom ; dans chacune de celles–ci, tous les mots trouvés sont mis en évidence par la couleur du fond. Remarque : la fonction de recherche avancée ne prend pas en charge les caractères spéciaux (comme les pieds de mouches et les marques de paragraphe).
Tâches automatisées
Le processus de reconnaissance optique des caractères (OCR) implique, dans la grande majorité des cas, plusieurs tâches de routine : numérisation, reconnaissance et enregistrement des résultats dans un format particulier. ABBYY FineReader 8.0 offre différents outils permettant d'automatiser ces tâches pour des documents similaires. Une tâche automatisée est une série d'étapes correspondant chacune à une phase particulière du traitement des documents. Le lancement des tâches automatisées se fait à partir du menu du bouton Numériser&Lire. ABBYY FineReader 8.0 propose 3 tâches automatisées prêtes à l'emploi et ne necessitant aucune adaptation particulière. Vous pouvez également faire appel à l'assistant d'automatisation pour créer vos propres tâches automatisées.
Exécution d'une tâche automatisée
Pour exécuter une tâche automatisée :
Cliquez sur la flèche à droite du bouton Numériser&Lire et sélectionnez la tâche automatisée appropriée, ou
Appuyez sur Ctrl+W(pour une tâche précédemment sélectionnée), ou
Faites votre choix dans le menu Processus>Tâches automatisées, ou
Ouvrez la boîte de dialogue Automation Manager, sélectionnez la tâche automatisée qui vous intéresse et
cliquez sur Exécuter.
La tâche sélectionnée démarre. ABBYY FineReader utilise les options sélectionnées dans la boîte de dialogue Options (choisissez
Outils>Options pour accéder à cette boîte de dialogue). Remarque :Si une tâche automatisée a été programmée pour ajouter des images à un lot qui contient déjà d'autres images, ABBYY
FineReader traite uniquement les images récemment ajoutées.Si une tâche automatisée a été programmée pour traiter un lot existant, ABBYY FineReader gère toute les images de ce lot. Pendant le déroulement de la tâche automatisée, une boîte de dialogue de progression présente l'ensemble des étapes mises en jeu et propose des astuces et des avertissements pour chacune des étapes (le cas échéant).
47
Manuel utilisateur ABBYY FineReader 8.0
Remarque : Si vous souhaitez appliquer à une tâche automatisée des options que vous n'utilisez pas normalement lors de la reconnaissance de documents, le mieux est de créer un jeu de paramètres de lot personnalisés et de charger ces paramètres avant d'exécuter la tâche. Pour créer un jeu de paramètres de lot personnalisés, effectuez les ajustements nécessaires dans la boîte de dialogue Options et cliquez sur Enregistrer les options... à partir de l'onglet Général. La prochaine fois, avant d'exécuter une tâche automatisée, il suffira de
charger le jeu d'options personnalisé et de cliquer sur le bouton Charger des options....
Gestion des tâches automatisées
Automation Manager permet d'exécuter, de créer et de modifier les tâches automatisées, mais aussi de supprimer les tâches automatisées personnalisées dont vous n'avez plus besoin. Pour exécuter Automation Manager :
Cliquez sur la flèche à droite du bouton Numériser&Lire et choisissez Automation Manager..., ou
Appuyez sur Ctrl+T, ou
Dans le menu Processus, choisissez Tâches automatisées>Automation Manager..., ou
Dans le menu Outils, sélectionnez Automation Manager...
Servez–vous des boutons de la barre d'outils Automation Manager pour créer, modifier, supprimer ou exécuter des tâches automatisées.
Le volet gauche contient la liste des tâches automatisées disponibles. Celles fournies avec ABBYY FineReader sont signalées par à la différence des tâches automatisées personnalisées qui sont repérées par votre ordinateur sont matérialisées par
. L'action de cliquer sur une tâche automatisée dans le volet gauche affiche les étapes
. Les tâches automatisées qu'il est impossible d'exécuter sur
correspondantes dans le volet droit. Remarque :Pour transmettre le texte reconnu à une autre application, assurez–vous que celle–ci est installée sur votre ordinateur.Les tâches automatisées configurées pour envoyer le texte reconnu à des applications non installées ne seront pas exécutées. Elles ne seront pas non plus proposées dans la liste à droite du bouton Numériser&Lire ou dans la liste Processus>Tâches automatisées.
Nom du bouton Description du bouton
Nouveau
Crée une tâche automatisée. L'assistant d'automatisation vous aidera à sélectionner les étapes appropriées et à effectuer les réglages nécessaires.
Exporter... Exporte une tâche automatisée dans un fichier qui pourra être partagé avec d'autres ordinateurs.
Dans la boîte de dialogue Exporter la tâche automatisée qui s'affiche, spécifiez un fichier *.fta pour l'enregistrement de la tâche automatisée.
Remarque : Par défaut, ABBYY FineReader sauvegarde les tâches automatisées dans %UserProfile%\Local Settings\Application Data\ABBYY\FineReader\8.00 .
Importer... Importe une tâche automatisée.
Dans la boîte de dialogue Importer la tâche automatisée, sélectionnez le fichier *.fta à importer et spécifiez le
48
Manuel utilisateur ABBYY FineReader 8.0
dossier dans lequel il sera stocké.
Modifier
Copier Copie une tâche automatisée. La copie d'une tâche automatisée sera ajoutée à la liste des tâches automatisées juste
Supprimer Efface une tâche automatisée.
Exécuter Lance une tâche automatisée.
Conseil : Pour changer le nom d'une tâche automatisée, cliquez dessus à l'aide du bouton droit de la souris et choisissez Renommer dans le menu local.
Permet de redéfinir les propriétés de la tâche automatisée sélectionnée. L'assistant d'automatisation vous aidera à choisir les propriétés qui conviennent. Remarque : Il n'est pas possible de modifier les tâches automatisées fournies avec ABBYY FineReader. Vous pouvez, en revanche, en faire des copies pour les modifier.
après l'original.
Remarque : Il est impossible de supprimer les tâches automatisées fournies avec ABBYY FineReader.
Tâches automatisées fournies avec ABBYY FineReader 8.0
ABBYY FineReader est livré avec cinq tâches automatisées qui couvre l'ensemble des étapes nécessaires pour procéder à l'acquisition et à la reconnaissance d'une image d'un document et enregistrer le texte reconnu. L'étape de vérification des résultats de la reconnaissance n'est pas prise en compte dans ces tâches automatisées. Votre copie d'ABBYY FineReader intègre déjà les 3 tâches automatisées suivantes :
PDF/Images vers Word
Cette tâche automatisée :
1. Ouvre les fichiers d'image (JPEG, TIFF, etc.) ou les fichiers PDF. L'exécution de la tâche PDF/Images vers Word a pour effet d'afficher la boîte de dialogue Ouvrir des images. Choisissez les fichiers que vous avez l'intention de traiter et cliquez sur OK. Les images sélectionnées sont alors ajoutées au lot ABBYY FineReader actuel.
2. Reconnaît les images.
3. Envoie le texte reconnu dans Microsoft Word. Un nouveau document Microsoft Word contenant le texte reconnu est alors ouvert. Remarque : Pour tirer parti de cette tâche automatisée, il est nécessaire d'installer Microsoft Word sur votre ordinateur.
Numériser au format Word
Cette tâche automatisée :
1. Numérise les documents papier. Les images des documents numérisés sont ajoutées au lot ABBYY FineReader actuel.
2. Reconnaît les images.
3. Envoie le texte reconnu dans Microsoft Word. Un nouveau document Microsoft Word contenant le texte reconnu est alors ouvert. Remarque : Pour tirer parti de cette tâche automatisée, il est nécessaire d'installer Microsoft Word sur votre ordinateur.
Numériser au format PDF
Cette tâche automatisée :
1. Numérise les documents papier. Les images des documents numérisés sont ajoutées au lot ABBYY FineReader actuel.
2. Reconnaît les images.
3. Envoie le texte reconnu dans Adobe Acrobat/Reader. Un nouveau document PDF s'ouvre, le texte reconnu est inséré dans ce document.
Tâches automatisées personnalisées
Vous pouvez créer vos propres tâches automatisées en fonction de vos besoins en matière de traitement de documents. Il est possible de compléter les cinq tâches automatisées proposées dans ABBYY FineReader en y intégrant des étapes supplémentaires. Vous pouvez, par exemple, prévoir en plus une étape de vérification des résultats de la reconnaissance ou ajouter plusieurs étapes d'enregistrement de manière à sauvegarder votre document sous différents formats. La séquence des étapes dans une tâche automatisée doit respecter l'ordre habituel du traitement d'un document dans ABBYY FineReader : acquisition de l'image reconnaissance vérification des résultats enregistrement des résultats. Chaque nouvelle étape est ajoutée avec des propriétés par défaut. Mais rien ne vous empêche d'adapter ces propriétés à vos besoins. Une tâche automatisée peut contenir des étapes principales et plusieurs étapes supplémentaires. Plus d'informations...
Automatisation d'une tâche
Etapes principales L'acquisition, la reconnaissance et l'enregistrement des images constituent les trois principales étapes. Une tâche automatisée peut impliquer une étape d'acquisition des images, une étape de reconnaisance et plusieurs étapes d'enregistrement.
49
Manuel utilisateur ABBYY FineReader 8.0
Acquisition des images Il s'agit toujours de la première étape dans une tâche automatisée. C'est à ce stade qu'ABBYY FineReader extrait les images à traiter.
Etape Propriété Description
Numériser des images
ABBYY FineReader utilise les paramètres du lot en
Cette étape permet de numériser les documents papier.
cours pour numériser les images.
Ouvrir des images
Demander le nom du fichier d'image au lancement de la tâche (option par défaut)
Traiter les images de ce dossier
Lorsque vous exécutez la tâche, ABBYY FineReader vous invite à sélectionner les fichiers d'image et à les ajouter au lot actuel. Dans la boîte de dialogue Ouvrir des images, désignez les fichiers à traiter et cliquez sur OK.
Lorsque vous exécutez la tâche, ABBYY FineReader ouvre le dossier spécifié dans le champ ci–dessous et ajoute toutes les images qu'il contient dans le lot actuel. Cochez la case Inclure tous les sous–dossiers pour que le programme ABBYY FineReader prenne en compte tous les sous–dossiers lors de la recherche d'images.
Ouvrir un lot
Demander le nom du lot au lancement de la tâche (option par défaut)
Lorsque vous exécutez la tâche, ABBYY FineReader vous invite à entrer un nom de lot. Dans la boîte de dialogue Ouvrir qui s'affiche, sélectionnez le lot que vous avez l'intention de traiter.
Utiliser le lot actuel Lorsque vous exécutez la tâche, ABBYY FineReader commence à traiter les images dans
le lot actuel.
Utiliser ce lot Lorsque vous exécutez la tâche, ABBYY FineReader commence à traiter les images dans
le lot indiqué dans le champ juste en dessous.
Analyse de la présentation
Etape Propriété Description
Charger un modèle de bloc
Demander le modèle de bloc au lancement de la tâche (option par défaut)
Lorsque vous exécutez la tâche, ABBYY FineReader vous invite à sélectionner un modèle de bloc. Accédez au fichier du modèle voulu
dans la boîte de dialogue Ouvrir et cliquez sur OK. Utiliser ce modèle de bloc Spécifiez le chemin d'accès au fichier du modèle à utiliser. Vérifier et régler les blocs de façon manuelle Vous avez la possibilité d'examiner et de rectifier les blocs
manuellement dès que le programme a terminé d'analyser la
présentation et de tracer les blocs nécessaires.
Analyser la présentation
Analyzer automatiquement la présentation, puis régler manuellement les blocs (option par défaut)
Après avoir acquis les images, ABBYY FineReader se charge de les
analyser et de tracer les blocs nécessaires. Vous pouvez alors examiner
ces blocs et les ajuster de façon manuelle. Tracer les blocs manuellement Après avoir acquis les images, ABBYY FineReader vous demande de
tracer les blocs nécessaires de façon manuelle.
Reconnaissance
C'est à ce stade qu'ABBYY FineReader procède à la reconnaissance des images.
Etape Propriété Description
Lire toutes les pages Aucune propriété Cette étape permet de reconnaître automatiquement les images dans le lot ou le dossier spécifié.
Vérification des résultats de la reconnaissance
Etape Propriété Description
Vérifier les résultats
Vérifier l'orthographe Dès que la reconnaissance du texte est terminée, ABBYY FineReader ouvre la boîte
de dialogue Vérifier l'orthographe.
Analyser les résultats sans vérification orthographique
Les pages reconnues seront présentées dans la fenêtre Te x t. Vous serez alors libre de les consulter sans lancer le correcteur orthographique.
Enregistrement
A ce stade du processus, ABBYY FineReader enregistre le texte dans un fichier ou l'envoie vers l'application de votre choix. Une étape automatisée peut comporter plusieurs étapes d'enregistrement.
Etape Propriété Description
50
Manuel utilisateur ABBYY FineReader 8.0
Enregistrer les pages
Enregistrer des images
Demander le nom du fichier de sortie à l'enregistrement (option par défaut)
Enregistrer sous le nom spécifié et à l'emplacement indiqué
Demander le nom du fichier de sortie à l'enregistrement (option par défaut)
Enregistrer sous le nom spécifié et à l'emplacement indiqué
ABBYY FineReader ouvre la boîte de dialogue Enregistrer les pages et vous invite à sélectionner les options de fichier et d'enregistrement.
Si vous sélectionnez cette propriété, il est nécessaire de définir les paramètres suivants :
1. Dossier de sortie Indiquez dans quel dossier vous souhaitez enregistrer le(s) fichier(s) contenant le texte reconnu. Cochez la case Créer un sous–dossier horodaté pour qu'ABBYY FineReader définisse un nouveau sous–dossier chaque fois que vous exécutez cette tâche. Cette option vous évite d'avoir à spécifier manuellement le dossier à chaque exécution de la tâche.
2. Enregistrer au format Choisissez le format de fichier voulu dans la liste déroulante.
3. Options de fichier :
Créer un fichier unique pour toutes les pages – Enregistre toutes les
pages du lot (ou celles sélectionnées) dans un seul et même fichier.
Créer un fichier séparé pour chaque page – Enregistre chaque page
dans un fichier distinct.
Créer un nouveau fichier à chaque page vide – ABBYY FineReader
utilise des pages vides pour répartir les pages par groupes. Un fichier indépendant est donc généré pour chaque groupe de pages. ABBYY FineReader distingue chaque fichier en ajoutant –1, –2, –3, etc. au nom du fichier spécifié dans le champ Nom.
Nommer les fichiers comme images source – Enregistre chaque
page dans un fichier joint distinct portant le même nom que l'image d'origine.
4. Nom de fichier.
ABBYY FineReader ouvre la boîte de dialogue Enregistrer l'image sous et vous invite à sélectionner les options de fichier et d'enregistrement.
Si vous sélectionnez cette propriété, il est nécessaire de définir les paramètres suivants :
1. Dossier de sortie Indiquez dans quel dossier vous souhaitez enregistrer le(s) fichier(s) contenant les images.
2. Enregistrer au format Choisissez le format de fichier voulu dans la liste déroulante. Sélectionnez l'option Enregistrer sous forme d'un fichier d'image multipages si vous avez l'intention d'enregistrer toutes les images dans un seul fichier multipages.
Remarque :Cette option s'applique uniquement aux formats de fichier TIFF et PDF.
3. Nom de fichier.
Etapes supplémentaires
Les étapes supplémentaires d'une tâche automatisée servent à transmettre le texte reconnu à une application externe, à joindre l'image acquise ou le texte reconnu à un courrier électronique et à copier les lots ABBYY FineReader.
Envoi de pages vers une autre application
Etape Propriété Description
Envoyer des pages à
Assistant Enregistrement (option par défaut)
Utilisez l'assistant Enregistrement ou sélectionnez l'application voulue à partir de la liste déroulante. Le texte reconnu sera placé dans un nouveau fichier et ouvert dans l'application de votre choix.
Envoi de l'image ou du texte reconnu sous forme de pièce jointe
Etape Propriété Description
51
Manuel utilisateur ABBYY FineReader 8.0
Envoyer des pages par courrier
Envoyer des images par courrier
Joindre au format Sélectionnez le format de fichier requis dans la liste déroulante. Le texte
reconnu sera sauvegardé dans un fichier sous le format choisi. La liste complète des formats de fichier d'image compatibles avec ABBYY FineReader est fournie dans la rubrique Formats d'enregistrement de
document pris en charge. Remarque :Les pages reconnues peuvent être enregistrées dans différents
fichiers en fonction du choix effectué dans la liste Options de fichier.
Options de fichier Sélectionnez l'option qui convient dans la liste déroulante. Vous avez les
choix suivants :
Créer un fichier unique pour toutes les pages
Toutes les pages sont enregistrées dans un même fichier. Il s'agit de l'option définie par défaut.
Créer un fichier séparé pour chaque page
Chaque page est enregistrée dans un fichier joint distinct. Un fichier indépendant est donc généré pour chaque page. ABBYY FineReader distingue chaque fichier en ajoutant –0001, –0002, –0003, etc. au nom du fichier par défaut.
Créer un nouveau fichier à chaque page vide –
ABBYY FineReader utilise des pages vides pour répartir les pages par groupes. Un fichier indépendant est donc généré pour chaque groupe de pages. ABBYY FineReader distingue chaque fichier en ajoutant –1, –2, –3, etc. au nom du fichier par défaut.
Nommer les fichiers comme images source
Chaque page est enregistrée sous forme de fichier joint distinct portant le même nom que l'image d'origine.
Joindre au format Sélectionnez le format de fichier requis dans la liste déroulante.
Les images sélectionnées seront automatiquement jointes au courrier électronique. La liste complète des formats de fichier d'image compatibles avec ABBYY FineReader est fournie dans la rubrique Formats d'image pris en charge.
Envoyer sous forme d'un fichier d'image multipages
Sélectionnez cette option si vous avez l'intention d'enregistrer toutes les images dans un seul fichier multipages.
Remarque :Cette option s'applique uniquement aux formats de fichier TIFF et PDF.
Nom Donnez un nom au fichier.
Remarque : Si vous sauvegardez les images dans des fichiers indépendants (option Enregistrer sous forme d'un fichier d'image multipages non sélectionnée), ABBYY FineReader ajoute le numéro de page ou de groupe de pages (0001, 0002, etc.) au nom de chacun des fichiers.
Enregistrement du lot
Etape Propriété Description
Enregistrer un lot
Demander le nom du lot à l'enregistrement (option par défaut)
Lors de cette étape, il convient de désigner le dossier réservé au lot depuis la boîte de dialogue Enregistrer le lot sous... qui s'affiche.
Enregistrer le lot dans Accédez au dossier dans lequel vous prévoyez de stocker le lot.
Automatisation d'une tâche
1. Démarrez Automation Manager :
Sélectionnez la commande Automation Manager dans la liste déroulante à droite du bouton
Numériser&Lire, ou
Appuyez sur Ctrl+T, ou
Choisissez Tâches automatisées>Automation Manager à partir du menu Processus, ou
Sélectionnez la commande Automation Manager depuis le menu Outils.
2. Dans la boîte de dialogue Automation Manager, cliquez sur Nouveau.
3. Dans la boîte de dialogue qui s'affiche, donnez un nom à la nouvelle tâche automatisée.
4. Cela a pour effet d'ouvrir l'assistant d'automatisation. Cet assistant vous aide à réaliser les différentes d'étapes d'automatisation et à définir les propriétés qui conviennent.
52
Manuel utilisateur ABBYY FineReader 8.0
Le volet gauche de l'assistant d'automatisation contient la liste des étapes disponibles. Au fur et à mesure que vous sélectionnez des étapes dans cette liste, vous pouvez constater que de nouvelles étapes deviennent disponibles ou à l'inverse que certaines étapes ne sont plus réalisables. Le volet droit présente les étapes sélectionnées et leurs propriétés.
5. Sélectionnez une étape dans le volet gauche. Elle figure à présent dans le volet droit.
6. La propriété d'une étape est affichée dans un champ jaune juste en dessous. Pour changer la propriété par défaut, cliquez sur le lien Modifier... à gauche et sélectionnez une nouvelle propriété.
7. Un lien Supprimer a été prévu pour les étapes d'enregistrement pour que vous puissiez retirer celles dont vous n'avez pas besoin dans votre tâche automatisée. Remarque : Il n'est pas possible de supprimer indépendamment les tâches de numérisation/ouverture, de reconnaissance et d'analyse de la présentation de la page. Pour éliminer ces étapes dans la tâche automatisée, servez–vous du botuon Retour.
8. Dès que vous avez ajouté toutes les étapes nécessaires à votre tâche automatisée et sélectionné leurs propriétés, cliquez sur Te rm i n er .
La nouvelle tâche est ajoutée à la liste des tâches disponibles dans Automation Manager et à la liste déroulante à droite du bouton Numériser&Lire.
53
Manuel utilisateur ABBYY FineReader 8.0
Chapitre 2 ABBYY Screenshot Reader
ABBYY Screenshot Reader est un programme convivial prévu spécialement pour la capture d'écrans et la reconnaissance de textes. Fonctions d'ABBYY Screenshot Reader :
Reconnaissance optique de textes dans n'importe quelle partie d'un écran d'ordinateur.
Reconnaissance optique de tableaux dans n'importe quelle partie d'un écran d'ordinateur.
Création de captures d'écran de n'importe quelle partie d'un écran d'ordinateur.
Enregistrement des résultats de la reconnaissance optique dans un fichier, copie des résultats dans le Presse–
papiers ou envoi vers une autre application.
Grâce à son interface intuitive, ABBYY Screenshot Reader s'adresse aussi bien aux utilisateurs débutants qu'aux utilisateurs expérimentés. Nul besoin, en effet, d'être un spécialiste pour créer des captures d'écran et reconnaître le texte qui s'y trouve. Il suffit d'ouvrir une fenêtre d'une application quelconque et de sélectionner la portion de l'écran que vous souhaitez photographier. Remarque : ABBYY Screenshot Reader concerne tous les utilisateurs d’ABBYY FineReader 8.0 Corporate Edition et tous les utilisateurs enregistrés d’ABBYY FineReader 8.0 Professional Edition.
Contenu du chapitre
Installation et démarrage d'ABBYY Screenshot Reader
Barre d'outils ABBYY Screenshot Reader
Capture de textes et de tableaux à partir de l'écran de l'ordinateur
Création de captures d'écran
Options supplémentaires
54
Manuel utilisateur ABBYY FineReader 8.0
Installation et démarrage d'ABBYY Screenshot Reader
Installation d'ABBYY Screenshot Reader
ABBYY Screenshot Reader est installé avec ABBYY FineReader 8.0 par défaut. Si vous avez opté pour l'installation personnalisée et désélectionné ABBYY Screenshot Reader, voici comment installer cette application :
1. Dans la barre des tâches Windows, cliquez sur Démarrer, puis choisissez Paramètres>Panneau de configuration.
2. Dans la liste des programmes installés, sélectionnez ABBYY FineReader 8.0, puis cliquez sur Modifier.
3. Dans la boîte de dialogue Installation personnalisée, choisissez ABBYY Screenshot Reader.
4. Suivez les instructions du programme d'installation.
Activation d'ABBYY Screenshot Reader
Remarque : L'activation est nécessaire uniquement pour les utilisateurs d'ABBYY FineReader 8.0 Professional Edition. Pour utiliser ABBYY Screenshot Reader, il est indispensable d'être un utilisateur ABBYY FineReader enregistré. Lors de l'enregistrement, vous obtenez un code ABBYY Screenshot Reader. Pour activer ABBYY Screenshot Reader, il suffit d'entrer ce code dans la boîte de dialogue affichée au démarrage de l'application et de cliquer sur OK.
Démarrage d'ABBYY Screenshot Reader
Pour lancer ABBYY Screenshot Reader,cliquez sur Démarrer>Programmes>ABBYY FineReader 8.0 Professional Edition (ou Corporate Edition) et sélectionnez ABBYY Screenshot Reader.
Barre d'outils ABBYY Screenshot Reader
La barre d'outils ABBYY Screenshot Reader s'affiche dès que vous lancez le programme.
La barre d'outils ABBYY Screenshot Reader contient tous les outils dont vous avez besoin pour reconnaître les textes et les tableaux sur l'écran de votre ordinateur, réaliser des captures d'écran à partir des zones sélectionnées à l'écran et configurer ABBYY Screenshot Reader.
Il suffit de cliquer sur ce bouton pour activer l'outil de sélection permettant de délimiter une zone à l'écran. La zone en question est à présent délimitée par un cadre et, selon les paramètres définis, le programme lance alors automatiquement la procédure de reconnaissance du texte dans cette zone ou crée une capture d'écran correspondante. Le texte reconnu ou la capture d'écran peut être enregistré(e) dans un fichier, copié(e) dans le Presse–papiers ou envoyé(e) vers une autre application, selon l'option choisie dans la liste déroulante à droite.
Cette liste déroulante permet de sélectionner l'objet que vous souhaitez capturer à l'écran et de désigner l'emplacement où il sera enregistré.
Ouvre la la boîte de dialogue Options – ABBYY Screenshot Reader à partir de laquelle vous pouvez sélectionner une langue de reconnaissance, changer le mode d'affichage de la barre d'outils ABBYY Screenshot Reader et définir le type d'avertissement (signal sonore et/ou message) utilisé par ABBYY Screenshot Reader pour indiquer qu'une capture d'écran a été copiée dans le Presse–papiers.
/
Ce bouton permet de passer d'un mode d'affichage de la barre d'outils ABBYY Screenshot Reader à l'autre. Si vous sélectionnez
, la barre d'outils ABBYY Screenshot Reader sera toujours affichée au premier plan par rapport aux fenêtres des autres
applications en cours d'exécution.
55
Manuel utilisateur ABBYY FineReader 8.0
Capture de textes et de tableaux à partir de l'écran de l'ordinateur
ABBYY Screenshot Reader est capable de reconnaître le texte et les tableaux sur l'écran de votre ordinateur et d'enregistrer les résultats dans un fichier, de les copier dans le Presse–papiers ou de les envoyer vers une autre application.
Pour reconnaître du texte :
1. Dans la liste déroulante de la barre d'outils ABBYY Screenshot Reader, sélectionnez l'une des options suivantes : Texte vers le Presse–papiers Tableau vers le Presse–papiers Texte vers Microsoft Word Tableau vers Microsoft Excel Texte vers le fichier Tableau vers le fichier
2. Cliquez sur
3. Positionnez–le à un coin de la zone à sélectionner. Tout en maintenant le bouton gauche de la souris enfoncé, faites glisser le curseur dans le sens diagonale jusqu'au coin opposé de la zone à sélectionner. La zone en question est à présent délimitée par un cadre et le programme lance automatiquement la procédure de reconnaissance optique de caractères (OCR).
4. Selon l'action que vous choisissez dans la liste déroulante de la barre d'outils ABBYY Screenshot Reader, vous pouvez enregistrer le texte reconnu dans un fichier, le copier dans le Presse–papiers ou l'envoyer à destination d'une autre application. L'option Texte vers le fichier ou Tableau vers le fichier a pour effet d'ouvrir la boîte de dialogue Enregistrer sous. Vous devez alors spécifier le nom et le format du fichier dans lequel le texte sera enregistré.
Remarque :
Pour annuler la procédure de reconnaissance, cliquez sur Arrêter ou appuyez sur la touche Echap.
. Le curseur de la souris se transforme en .
Que faire si...
Les textes de travail sont rédigés dans plusieurs langues
Avant de lancer la procédure de reconnaissance, assurez–vous que la langue sélectionnée dans la boîte de dialogue Options – ABBYY Screenshot Reader est la même que celle dans laquelle le texte est écrit. Choisissez–en une autre si besoin est.
Remarque : Pour ouvrir la boîte de dialogue Options– ABBYY Screenshot Reader, cliquez sur
Le texte à l'écran semble rédigé dans plusieurs langues
Dans la boîte de dialogue Options – ABBYY Screenshot Reader, choisissez l'option (Sélectionner plusieurs langues...) à partir de la liste déroulante Langue de reconnaissance. Important! La sélection de plusieurs langues risque de réduire la qualité de la reconnaissance. Contentez–vous de sélectionner deux ou trois langues maximum.
.
La langue requise ne figure pas dans la liste
Dans la boîte de dialogue Options – ABBYY Screenshot Reader, choisissez l'option (Sélectionner d'autres langues...) à partir de la liste déroulante Langue de reconnaissance. Si vous ne trouvez pas la langue voulue dans la liste des langues disponibles :
Il est possible que cette langue ne soit pas prise en charge par ABBYY FineReader 8.0. La liste complète des langues de reconnaissance est répertoriée dans la rubrique Langues prises en charge par ABBYY FineReader.
Cette langue a pu être désactivée pendant l'installation personnalisée.
Dans la barre des tâches Windows, cliquez sur Démarrer, puis choisissez Paramètres>Panneau de
configuration.
Dans la liste des programmes installés, sélectionnez ABBYY FineReader 8.0, puis cliquez sur Modifier.
Dans la boîte de dialogue Installation personnalisée, sélectionnez la langue qui convient.
Suivez les instructions du programme d'installation.
La zone sélectionnée contient à la fois du texte et des images
Dans la barre d'outils ABBYY Screenshot Reader, cliquez sur Image vers ABBYY FineReader.L'image de la zone sélectionnée est alors ajoutée à un lot ABBYY FineReader. Si ABBYY FineReader est en cours d'exécution sur votre ordinateur, l'image est insérée dans le lot actuel. Sinon, un nouveau lot est généré pour l'image.
Création de captures d'écran
ABBYY Screenshot Reader permet de générer des captures d'écran à partir des zones sélectionnées à l'écran de votre ordinateur, de les enregistrer dans un fichier, de les copier dans le Presse–papiers ou de les envoyer vers ABBYY FineReader.
56
Manuel utilisateur ABBYY FineReader 8.0
Pour créer une capture d'écran :
1. Dans la liste déroulante de la barre d'outils ABBYY Screenshot Reader, sélectionnez l'une des options suivantes :
Image vers le Presse–papiers Image vers ABBYY FineReader (choisissez cette option si la zone à l'écran contient à la fois du texte et des images) Image vers le fichier
2. Cliquez sur . Le curseur de la souris se transforme en .
3. Positionnez–le à un coin de la zone à sélectionner. Tout en maintenant le bouton gauche de la souris enfoncé, faites glisser le curseur dans le sens diagonale jusqu'au coin opposé de la zone à sélectionner. La zone en question est à présent délimitée par un cadre.
4. Selon l'action que vous choisissez dans la liste déroulante de la barre d'outils ABBYY Screenshot Reader, vous pouvez enregistrer la capture d'écran dans un fichier, la copier dans le Presse–papiers ou l'ajouter à un lot ABBYY FineReader. L'option Texte vers le fichier a pour effet d'ouvrir la boîte de dialogue Enregistrer sous. Vous devez alors spécifier le nom et le format du fichier dans lequel le texte sera enregistré.
Remarque : Pour annuler la création d'une capture d'écran, appuyez sur Echap.
Options supplémentaires
Vous avez la possibilité de sélectionner des options supplémentaires dans la boîte de dialogue Options – ABBYY Screenshot
Reader. Pour ouvrir la boîte de dialogue Options – ABBYY Screenshot Reader, cliquez sur Screenshot Reader. Voici ce que vous pouvez faire à partir de cette boîte de dialogue :
Sélectionner la langue de reconnaissance correspondant à celle du texte dans la zone délimitée à l'écran.
Cocher la case Toujours visible pour que la barre d'outils ABBYY Screenshot Reader apparaisse
systématiquement au premier plan par rapport aux fenêtres des autres applications en cours d'exécution.
Sélectionner l'option Emettre un signal sonore en cas de copie des données pour obtenir un avertissement sonore d'ABBYY Screenshot Reader une fois les données copiées dans le Presse–papiers.
Sélectionner l'option Afficher un message en cas de copie des données pour obtenir un message de notification d'ABBYY Screenshot Reader une fois les données copiées dans le Presse–papiers.
dans la barre d'outils ABBYY
57
Manuel utilisateur ABBYY FineReader 8.0
Chapitre 3 ABBYY Hot Folder & Scheduling
ABBYY FineReader 8.0 intègre à présent un agent de planification appelé ABBYY Hot Folder & Scheduling. ABBYY Hot Folder & Scheduling permet de sélectionner un dossier contenant des images et d'indiquer à quel moment les images en question seront traitées. Vous pouvez, par exemple, configurer votre ordinateur pour qu'il procède à la reconnaissance des images pendant la nuit. Pour définir un dossier d'images, il convient d'abord de sélectionner les options d'ouverture, de reconnaissance et d'enregistrement des images. Il faut ensuite indiquer la fréquence à la laquelle ABBYY FineReader doit vérifier si de nouvelles images sont présentes dans le dossier (à intervalles réguliers ou à un moment donné), et préciser l'heure à laquelle l'opération débute.
Contenu de ce chapitre:
Installation et démarrage d'ABBYY Hot Folder & Scheduling
Fenêtre principale d'ABBYY Hot Folder & Scheduling
Configuration d'un dossier d'images
Fichier journal d'un dossier d'images
Options supplémentaires
58
Manuel utilisateur ABBYY FineReader 8.0
Installation et démarrage d'ABBYY Hot Folder & Scheduling
ABBYY Hot Folder & Scheduling est installé avec ABBYY FineReader 8.0 par défaut. Si vous avez opté pour l'installation personnalisée et désélectionné ABBYY Hot Folder & Scheduling, voici comment installer cette application :
1. Dans la barre des tâches Windows, cliquez sur Démarrer, puis choisissez Paramètres>Panneau de configuration.
2. Cliquez deux fois sur l'icône Ajout/Suppression de programmes.
3. Dans la liste des programmes installés, sélectionnez ABBYY FineReader 8.0, puis cliquez sur Modifier.
4. Dans la boîte de dialogue Installation personnalisée, choisissez ABBYY Hot Folder & Scheduling.
5. Suivez les instructions du programme d'installation.
Exécution d'ABBYY Hot Folder & Scheduling
Pour exécuter ABBYY Hot Folder & Scheduling :
Cliquez sur Démarrer>Programmes>ABBYY FineReader 8.0 et sélectionnez ABBYY Hot Folder&Scheduling ou
Depuis ABBYY FineReader 8.0, choisissez ABBYY Hot Folder & Scheduling partir du menu Outils ou
Cliquez deux fois sur l'icôneABBYY Hot Folder & Scheduling dans la barre des tâches de Windows (cette
icône apparaît à condition d'avoir défini au moins un dossier d'images).
Remarque : Si vous ne pouvez pas démarrer une tâche pour le dossier d'images sélectionné, assurez–vous que le Planificateur de tâches est activé ou contactez votre administrateur système.
Fenêtre principale de Hot Folder & Scheduling
La fenêtre principale d'ABBYY Hot Folder & Scheduling s'affiche dès que vous exécutez cette application.
La barre d'outils ABBYY Hot Folder & Scheduling contient différents boutons prévus spécialement pour définir les tâches à appliquer aux dossiers d'images et consulter les journaux de traitement des images.
Bouton Description
Nouveau Lance l'assistant ABBYY Hot Folder & Scheduling.
Exporter... Exporte un fichier de tâche. Les fichiers de tâches exportés reconnaissables à leur extension (*.hft) peuvent être
transmis à d'autres utilisateurs. Donnez un nom au fichier de tâche dans la boîte de dialogue qui s'affiche.
Remarque : Par défaut, ABBYY FineReader enregistre les fichiers de tâches dans Userprofile%\Local Settings\Application Data\ABBYY\HotFolder\8.00.
Importer... Importe un fichier de tâche. Indiquez le chemin d'accès du fichier de tâche à importer dans la boîte de dialogue
qui s'affiche. Remarque : ABBYY FineReader est capable d'exécuter une tâche importée à condition d'avoir défini un dossier (sur votre ordinateur ou sur le réseau) comme dossier d'images pour la tâche et d'avoir installé toutes les langues
de reconnaissance nécessaires. Modifier Modifie une tâche.
Copier Copie une tâche.La copie est ajoutée à la liste des tâches juste en dessous de la tâche d'origine et prend l'état
Supprimer Supprime une tâche.
Exécuter Lance le traitement des documents. Arrêter Stoppe une tâche. Consulter Ouvre le fichier journal du dossier sélectionné dans lequel sont consignés tous les événements liés au traitement.
Pause.
59
Manuel utilisateur ABBYY FineReader 8.0
journal Options Options supplémentaires ABBYY Hot Folder & Scheduling.
La fenêtre ABBYY Hot Folder & Scheduling présente la liste des tâches. Elle indique, pour chaque tâche, le chemin d'accès complet au dossier d'images et l'état actuel ainsi que l'heure de traitement planifiée.
Etats des tâches
Etat Description
En cours d'exécution
En attente Le programme attend la fin du traitement de la tâche précédente. Planifié Vous avez choisi de vérifier les images dans le dossier au démarrage uniquement. L'heure à laquelle le traitement
Vérification ABBYY FineReader traite les images au fur et à mesure dans le dossier. Pause Le traitement a été momentanément interrompu. Terminé Le traitement des images dans ce dossier est terminé. Erreur Une erreur s'est produite au cours du traitement des images dans ce dossier. ABBYY FineReader n'a pas réussi à
Les images figurant dans le dossier sont en cours de traitement.
commence est indiquée dans la colonne A la prochaine exécution.
terminer les tâches de traitement. Pour déterminer l'origine de l'erreur, sélectionnez le dossier à l'origine du problème et cliquez sur le bouton Consulter journal dans la barre d'outils.
Configuration d'un dossier d'images
Lancez ABBYY Hot Folder & Scheduling, puis cliquez sur le bouton Nouveau de la barre d'outils. Cela a pour effet de démarrer l'assistant ABBYY Hot Folder & Scheduling qui vous guidera tout au long de la procédure de configuration.
Etape 1. Ouvrir des images
A ce stade, vous devez sélectionner le dossier dans lequel les images seront traitées. Vous devez également spécifier la fréquence à laquelle ABBYY FineReader vérifie la présence de nouvelles images dans ce dossier.
Options disponibles à l'étape 1
1. Dans la liste déroulante figurant en haut de la boîte de dialogue, sélectionnez le type de dossier :
Sélectionnez Ouvrir les images à partir du dossier pour qu'ABBYY FineReader traite les images à
partir d'un dossier local ou du réseau. Remarque : vous pouvez sélectionner un lot ABBYY FineReader dans ce champ.
Sélectionnez Ouvrir les images à partir du dossier pour qu'ABBYY FineReader traite les images à
partir d'un dossier situé sur un serveur FTP. Tapez l'identifiant de connexion FTP et le mot de passe associé si le serveur exige une autorisation. Sinon, sélectionnez Connexion anonyme pour recourir à une connexion anonyme. Remarque : vous pouvez sélectionner un lot ABBYY FineReader dans ce champ.
2. Dans le champ Dossier, indiquez le chemin d'accès complet au dossier d'images.
3. Dans le champ Types de fichier, sélectionnez le format des images à traiter.
4. Sélectionnez Segmenter les pages doubles pour fractionner les images des pages de livre en deux pages de lot distinctes. La qualité de la reconnaissance en sera améliorée et vous pourrez enregistrer chaque page dans son propre fichier.
5. Sous Lorsque le traitement est terminé..., précisez si ABBYY FineReader doit supprimer les images du dossier d'images à l'issue de l'opération.
Sélectionnez Ne pas supprimer les images source, traiter seulement les images récemment arrivées pour
conserver les images dans le dossier.
Sélectionnez Supprimer les images source pour retirer les images après leur traitement.
6. Sous Indiquez comment vous voulez vérifier les images dans le dossier, sélectionnez une des deux options disponibles :
Choisissez Vérifier au démarrage pour traiter uniquement les images qui figurent dans ce dossier
lorsque la tâche planifiée commence. Toute image incluse au dossier par la suite ne sera pas traitée.
Sélectionnez Vérifier en continu les images entrantes dans le dossier pour contrôler en
permanence le dossier et traiter les nouveaux fichiers au fur et à mesure qu'ils arrivent. ABBYY FineReader vérifie le dossier toutes les 60 secondes. Remarque : Dans ce mode, les fichiers de sortie comportant du texte reconnu porteront le même nom que les images source.
7. Dans le champ Démarrage, indiquez à quel moment ABBYY FineReader doit commencer le traitement des images du dossier.
Démarrer maintenant lance le traitement dès que le dossier d'images est configuré.
Démarrer au moment indiqué vous permet d'indiquer la date et l'heure de début du traitement.
L'option Pause remet à plus tard la tâche.
60
Manuel utilisateur ABBYY FineReader 8.0
Etape 2. Lire toutes les images
Vous allez maintenant sélectionner les options de reconnaissance.
Options disponibles à l'étape 2
1. Dans la liste déroulante Langue de reconnaissance, sélectionnez la langue du texte des images. Remarque : vous avez la possibilité de sélectionner plusieurs langues de reconnaissance, si besoin est.
2. Sous Mode de reconnaissance, sélectionnez :
Approfondi (dans ce mode, ABBYY FineReader est en mesure de lire même les images de qualité
médiocre) ou
Rapide (ce mode est exclusivement recommandé pour les images de bonne qualité et de présentation
simple).
3. Sous Reconnaissance PDF, sélectionnez :
Extraire le texte du PDF (dans ce mode, ABBYY FineReader extrait les données de type texte des
fichiers PDF et les utilisent pour la reconnaissance) ou
Reconnaître le PDF comme une image (cette option est utile pour les fichiers PDF dont le texte
possède un codage non standard. En pareil cas, le texte peut seulement être récupéré par reconnaissance optique des caractères).
4. Dans le groupe Hyperliens :
Sélectionnez l'option Mettre en évidence les hyperliens si vous voulez qu'ABBYY FineReader mette
en évidence les hyperliens trouvés dans le texte reconnu selon la couleur sélectionnée dans le champ Couleur. Pour sélectionner la couleur ou la changer, cliquez sur le bouton Couleur situé à droite de l'option et faites votre choix dans la boîte de dialogue qui s'affiche.
5. Sous Apprentissage, indiquez si vous voulez utiliser les gabarits utilisateur.
Ne pas utiliser de gabarit utilisateur. Cette option est activée par défaut.
Sélectionnez Utiliser gabarit utilisateur si vous voulez qu'ABBYY FineReader utilise les gabarits utilisateur
pour la reconnaissance optique de caractères. Pour obtenir plus d'informations, reportez–vous à la rubrique Reconnaissance avec apprentissage.
6. Sous Utiliser le modèle de bloc, indiquez le chemin d'accès au modèle de bloc si vous voulez qu'ABBYY FineReader utilise un tel modèle lors de l'analyse de la présentation des images.
Etape 3. Enregistrer le document
Vous allez maintenant sélectionner un dossier où les documents obtenus seront stockés et désigner le format de fichier à appliquer à ces documents.
Options disponibles à l'étape 3
1. Sous Indiquer le dossier de sortie, spécifiez le chemin d'accès au dossier dans lequel les résultats de la reconnaissance seront transférés.
2. Sous Options d'enregistrement :
Dans la liste Type d’enregistrement, sélectionnez le format du fichier dans lequel vous avez
l'intention d'enregistrer les résultats. Cliquez sur le bouton Paramètres de format à droite pour sélectionner des options de format supplémentaires.
3. Si vous avez sélectionné le mode Vérifier au démarrage à l'Etape 1, sélectionnez les options suivantes dans le groupe Indiquer le(s) fichier(s) de sortie :
Options de fichier
Créer un fichier séparé pour chaque page enregistre chaque page dans un fichier différent ; l'option Nommer les fichiers comme images source enregistre chaque page dans un fichier différent dont le
nom correspond à celui de l'image d'origine ; l'option Créer un nouveau fichier à chaque page vide traite le lot entier comme un ensemble de groupes de pages, chaque groupe se terminant par une page vide. Les pages provenant de différents groupes sont enregistrées dans des fichiers distincts. Le nom qui leur est attribué se compose d'un nom spécifié par l'utilisateur suivi d'un numéro d'indexation : –1, –2, –3, etc. ; l'option Créer un fichier unique pour toutes les pages enregistre toutes les pages dans un seul et même fichier.
Dans le champ Nom, donnez un nom au fichier dans lequel le texte reconnu sera enregistré.
Remarque : si vous avez sélectionné le mode Vérifier en continu les images entrantes dans le dossier, le groupe Indiquer le(s) fichier(s) de sortie indique que les fichiers de sortie contenant le
texte reconnu porteront le nom des images source. En effet, les options de fichier et d'attribution de nom ne sont pas disponibles dans ce mode.
4. Cochez l'option Enregistrer le lot si vous voulez enregister le lot ABBYY FineReader. Cliquez sur Parcourir... pour sélectionner le dossier d'enregistrement du lot.
Remarque : l'option Enregistrer le lot n'est pas disponible en mode Vérifier en continu les images entrantes dans le dossier (voir Etape 1). Conseil : vous pouvez ajouter plusieurs étapes d'enregistrement pour conserver les résultats de la reconnaissance sous plusieurs formats. Dans la liste déroulante Type d’enregistrement, sélectionnez (Sélectionner plusieurs formats) et dans la boîte de dialogue qui s'ouvre, précisez les formats dans lesquels vous avez l'intention d'enregistrer les résultats de la reconnaissance.
61
Manuel utilisateur ABBYY FineReader 8.0
Fichier journal d'un dossier d'images
Toutes les opérations liées au traitement automatique des images dans un dossier d'images sont consignées dans un journal. Ce fichier journal contient les informations suivantes :
Nom de la tâche et paramètres correspondants
Erreurs et messages d'avertissement (le cas échéant)
Statistiques (nombre de pages traitées, nombre d'erreurs et d'avertissements, nombre de caractères reconnus
incertains)
Affichage des fichiers journaux
Pour afficher un fichier journal :
1. Dans la fenêtre principale ABBYY Hot Folder & Scheduling, sélectionnez la tâche pour laquelle vous souhaitez consulter le journal.
2. Cliquez sur le bouton Consulter journal dans la barre d'outils.
Options supplémentaires pour ABBYY Hot Folder & Scheduling
Cliquez sur le bouton Options dans la barre d'outils pour sélectionner les options supplémentaires ABBYY Hot Folder & Scheduling qui vous intéressent.
Sélectionnez Stocker le fichier journal dans le dossier de sortie si vous comptez placer le fichier journal dans le dossier réservé aux résultats de la reconnaissance.
Sélectionnez Avertir lorsque c'est terminé si vous souhaitez afficher un message de notification lorsque vous maintenez le curseur au–dessus de l'icône ABBYY Hot Folder & Scheduling dans la barre des tâches de Windows.
62
Manuel utilisateur ABBYY FineReader 8.0
Annexe
Contenu de ce chapitre:
Formats d'enregistrement de document pris en charge par ABBYY FineReader
Support de formats d'image
Raccourcis clavier
Glossaire
63
Manuel utilisateur ABBYY FineReader 8.0
Formats d'enregistrement de document pris en charge par ABBYY FineReader
ABBYY FineReader peut enregistrer le résultat de la reconnaissance dans les formats suivants :
Document Microsoft Word (*.DOC)
Rich Text Format (*.RTF)
Document Microsoft Word XML (*.XML) (Microsoft Word 2003 uniquement)
Adobe Acrobat Format (*.PDF)
HTML
Format Microsoft PowerPoint (*. PPT)
Fichier CSV (Comma Separated Values – valeurs séparées par virgule) (*.CSV)
Texte simple (*.TXT). ABBYY FineReader accepte diverses pages de code (Windows, DOS, Mac, ISO), ainsi que le
codage Unicode.
Feuille Microsoft Excel (*.XLS)
DBF
Microsoft Reader eBook (*.LIT)
Support de formats d'image
ABBYY FineReader ouvre les fichiers d'image dans les formats suivants :
PDF:
Fichiers dans le format PDF, version 1.5 ou ultérieure.
BMP :
2 bits – noir et blanc 4 et 8 bits – palette 16 bits 24 bits – palette et couleurs vraies 32 bits
PCX, DCX :
2 bits – noir et blanc 4– et 8–bit – Palette 24–bit – TrueColor
ABBYY FineReader enregistre les fichiers d'image dans les formats suivants :
BMP :
noir et blanc, niveaux de gris, couleur
PCX :
noir et blanc, niveaux de gris
JPEG :
niveaux de gris, couleur
JPEG 2000 :
niveaux de gris, ñouleur noir et blanc, niveaux de gris, couleur
JPEG :
niveaux de gris et couleurs vraies
JPEG 2000 :
niveaux de gris, ñouleur
TIFF :
noir et blanc – non condensé, CCITT3, CCITT3FAX, CCITT4, packbits, ZIP niveaux de gris – non condensé, packbits, JPEG, ZIP RGB – non condensé, JPEG, ZIP palette – non condensé, packbits, ZIP multi image TIFF
PNG :
noir et blanc, niveaux de gris, couleur
TIFF :
noir et blanc – non condensé, CCITT3, CCITT4, packbits, ZIP niveaux de gris – non condensé, packbits, JPEG, ZIP RGB – non condensé, JPEG, ZIP multi image TIFF
PNG :
64
Manuel utilisateur ABBYY FineReader 8.0
Raccourcis clavier
Menu Pour : Appuyez sur :
Fichier
Edition
Affichage
Lot
Traitement
Ouvrir une image depuis un fichier CTRL+O Numériser une image CTRL+K Arrêter la numérisation Echap Créer un nouveau lot CTRL+N Ouvrir un lot CTRL+MAJ+N Enregistrer les pages CTRL+S Envoyer des pages par courrier CTRL+M Enregistrer une image dans un fichier CTRL+ALT+S Envoyer des images par courrier CTRL+ALT+M Annuler la dernière action CTRL+Z Rétablir la dernière action annulée CTRL+Y Couper la sélection vers le Presse–papiers CTRL+X Copier la sélection vers le Presse–papiers CTRL+C Coller le contenu du Presse–papiers CTRL+V Supprimer le bloc actif, la sélection ou les pages sélectionnées SUPPR
Sélectionner tout le texte de la fenêtre Te x te , toutes les pages du lot ou tous les blocs de l'image ouverte
Chercher le texte spécifié CTRL+F Chercher l'occurrence suivante du texte recherché F3 Chercher et remplacer le texte spécifié CTRL+H Recherche avancée... ALT+F3 Agrandir la fenêtre Lot Afficher la fenêtre Image Agrandir l'image dans la fenêtre Image Réduire l'image dans la fenêtre Image Zoom avant sur des blocs sélectionnés CTRL+MAJ+NUM* Afficher la fenêtre Te xt e Afficher la fenêtre Zoom Propriétés Ouvrir la page suivante du lot CTRL+NUM+ Ouvrir la page précédente du lot CTRL+NUM– Ouvrir une page de numéro spécifié CTRL+G
Fermer la page en cours
Numériser&Lire CTRL+D
Ouvrir&Lire CTRL+MAJ+D
Ouvrir une image à partir d'un fichier Numériser des images CTRL+K Arrêter la numérisation Echap Lire les pages actives ou sélectionnées CTRL+R Lire toutes les pages du lot CTRL+MAJ+R Lire les blocs actifs ou sélectionnés CTRL+MAJ+B Analyser la présentation CTRL+E
ALT+ENTREE
CTRL+F4
CTRL+O
CTRL+A
CTRL+0 CTRL+F2 CTRL+MAJ+NUM+ CTRL+MAJ+NUM–
CTRL+F3 CTRL+F5
65
Manuel utilisateur ABBYY FineReader 8.0
Outils
Fenêtre
Aide Ouvrir l'aide F1
Raccourcis généraux
Analyser la présentation de toutes les pages du lot CTRL+MAJ+E Passer à l'erreur précédente ou à un mot incertain MAJ+F4 Enregistrer les pages CTRL+S Envoyer des pages par courrier CTRL+M Enregistrer une image dans un fichier CTRL+ALT+S Envoyer des images par courrier CTRL+ALT+M Ouvrir la boîte de dialogue Automation Manager CTRL+T Exécuter Automation Manager CTRL+T Démarrer Hot Folder & Scheduling... CTRL+MAJ+H Vérifier l'orthographe du texte reconnu F7 Afficher les dictionnaires CTRL+MAJ+V Ouvrir l'Editeur de langue pour créer ou modifier des langues et des groupes de
langues Ouvrir l'Editeur de gabarit pour créer ou modifier des langues et des groupes de
langues Ouvrir la boîte de dialogue Options Ouvrir la fenêtre suivante CTRL+F6 Ouvrir la fenêtre précédente CTRL+MAJ+F6 Ouvrir la fenêtre Lot Ouvrir la fenêtre Image ALT+2 Ouvrir la fenêtre Texte ALT+3 Ouvrir la fenêtre Zoom ALT+4 Accéder à la fenêtre Recherche avancée Open the Advanced search window
Mettre la sélection en caractères gras Mettre la sélection en caractères italiques CTRL+I Mettre la sélection en caractères soulignés CTRL+U
Passer à la cellule de tableau voisine
CTRL+MAJ+L
CTRL+MAJ+A
CTRL+MAJ+O
ALT+0
ALT+5 ALT+F3
CTRL+B
flèche vers la gauche, la droite, le haut et le bas
66
Manuel utilisateur ABBYY FineReader 8.0
Glossaire
A
ABBYY Hot Folder & Scheduling – Agent de planification qui vous permet de sélectionner un dossier avec des images et de définir la date/l'heure du traitement des images figurant dans ce dossier. Les images du dossier sélectionné sont traitées automatiquement au moment spécifié. ABBYY Screenshot Reader – Application qui vous permet de créer des captures d'écran et d'en reconnaître le texte. Abréviation : forme concise d'un mot ou d'une phrase servant à représenter le tout, par exemple, MS–DOS (pour MicroSoft Disk Operating System), ONU (pour Organisation des Nations Unies), etc. Activation : processus par lequel l'utilisateur reçoit un code spécial de la part d'ABBYY, qui lui permet d'utiliser sa copie du logiciel en mode version complète sur un ordinateur spécifique. ADF (Chargeur automatique de documents) : dispositif du scanner servant au chargement automatique des documents. Un scanner doté d'un chargeur automatique de document vous permet de numériser autant de pages que vous le souhaitez sans aucune intervention manuelle. ABBYY FineReader prend également en charge la numérisation d'images multiples. Analyse de la présentation (tracé des blocs) : processus d'analyse de la mise en page et de la répartition des différentes zones de l'image en blocs, en fonction de la mise en page. Les blocs peuvent être de types différents. L'analyse de la présentation peut s'effectuer soit automatiquement dans le cadre d'une procédure simultanée de reconnaissance et d'analyse de la mise en page (en cliquant sur le bouton 2 –
Lire), soit manuellement. Apprentissage : création des paires "image de caractère :
caractère". Consultez la section Reconnaissance avec apprentissage pour plus d'informations. Assistant Numériser&Lire : exécute un mode Numériser&Lire spécial. ABBYY FineReader vous assiste dans la procédure de traitement du document et vous indique les actions à mener pour obtenir tel ou tel résultat. Automation Manager – Gestionnaire intégré permettant d'exécuter, de créer et de modifier les tâches automatisées, mais aussi de supprimer les tâches automatisées personnalisées dont vous n'avez plus besoin.
B
Bloc : zone encadrée de l'image. Bloc actif : bloc sur lequel vous effectuez des opérations (par
exemple suppression, changement de type, etc.). Le cadre du bloc actif est en gras et ses coins sont repérés par des "carrés".
C
Caractères ignorés : tout caractère qui n'est pas une lettre susceptible de se trouver dans un mot, par exemple caractère syllabique ou accent. Ces caractères sont ignorés au cours d'une vérification orthographique. Caractères incertains : caractères reconnus avec un certain degré d'incertitude. Si ABBYY FineReader n'est pas tout à fait sûr d'avoir reconnu certains caractères, il les marque comme caractères incertains. Caractères interdits : dans certains cas, vous êtes sûr que certains caractères ne se trouveront jamais dans les textes que vous reconnaissez. Vous pouvez alors définir l'ensemble de ces caractères (appelés caractères interdits) dans les propriétés de
groupe de langues. La définition de ces caractères peut améliorer de façon sensible la vitesse et la qualité de la reconnaissance. Pour indiquer le jeu de caractères interdits, cliquez sur le bouton Avancée dans la boîte de dialogue Propriétés avancées de groupe de langues. La boîte de dialogue Propriétés avancées de groupe de langues s'ouvre. Indiquez le jeu de caractères interdits sur la ligne
Caractères interdits. Code barre – Bloc servant aux zones de l'image qui sont des
codes barre. Code d'activation : code envoyé par ABBYY à chaque utilisateur d’ABBYY FineReader Professional Edition lors de la procédure d'activation. Le code d'activation est nécessaire à l'activation d’ABBYY FineReader sur l'ordinateur sur lequel l'ID d'installation a été généré.
E
Effets de police : variations autour du dessin d'une police (gras, italique, souligné, barré, exposant, indice, petites majuscules).
F
Fichier d'activation : fichier envoyé par ABBYY à chaque utilisateur d’ABBYY FineReader Corporate Edition lors de la procédure d'activation. Il contient les informations nécessaires à l'activation du logiciel sur le serveur ou sur un ordinateur autonome le cas échéant. Depuis le serveur, le produit est activé sur les stations de travail. Forme de base : forme sous laquelle les mots apparaissent dans le dictionnaire.
G
Gabarit : ensemble de paires "image de caractère : caractère" créé pendant l'apprentissage de gabarit. Un gabarit est utilisé comme source d'informations supplémentaires au cours de la reconnaissance. Gestionnaire : programme qui contrôle un périphérique (par exemple un scanner, un écran, etc.).
I
Image : bloc utilisé pour les zones prévues pour l'insertion d'images. Un bloc de ce type peut contenir une image ou tout autre objet (par exemple une partie de texte) à afficher sous forme d'image. Image inversée : image dont les caractères sont blancs sur fond noir.
J
Jeu d'options – total des valeurs d'option spécifiées dans les onglets Numériser/Ouvrir, Lire, Vérification
orthographique et Enregistrer des boîtes de dialogue Options, Paramètres de format et Options héritées. Les
jeux d'options comprennent les langues et les gabarits utilisateur. Ces jeux peuvent être enregistrés, puis utilisés (chargés) dans d'autres lots ABBYY FineReader.
L
License Manager : utilitaire utilisé pour la gestion des licences d’ABBYY FineReader et l'activation d'ABBYY FineReader 8.0 Corporate Edition. Ligature : combinaison de deux ou plusieurs caractères "collés", par exemple, fi, fl, ffi etc. Ces caractères sont difficiles à distinguer car ils sont généralement "collés" à l'impression. Il est plus facile de les traiter comme un caractère composé "unique".
67
Manuel utilisateur ABBYY FineReader 8.0
Lot : dossier contenant des fichiers d'image, des fichiers de texte reconnus ainsi que des fichiers d'informations ABBYY FineReader. Un lot peut contenir jusqu'à 9 999 pages. Il peut être utile d'enregistrer les "mêmes" pages dans un même lot. Par exemple, si vous conservez dans un même lot toutes les pages d'un livre, les textes d'une même langue ou les images possédant la même présentation, votre travail s'en trouvera considérablement simplifié. Luminosité : paramètre de numérisation permettant de régler le contraste entre les zones noires et blanches de l'image. Le réglage correct de la luminosité améliore la qualité de la reconnaissance.
M
Mise en page : elle comprend : la façon dont le texte, les tableaux et les images sont disposés sur une page, la façon dont le texte est découpé en paragraphes, la police et la taille de la police du texte, le nombre de colonnes de texte, la couleur des caractères et du fond, l'orientation du texte. Modèle de blocs : description des tailles des blocs et emplacement sur la page. Un modèle de bloc particulier peut être utilisé pour reconnaître les pages de présentation identique. Mot de passe des autorisations : option qui empêche les utilisateurs d'imprimer ou de modifier un document PDF à moins de taper le mot de passe spécifié par l'auteur. Si certains paramètres de sécurité sont activés pour le document, les utilisateurs ne sont pas en mesure de les modifier tant qu'ils ne saisissent pas le mot de passe que vous avez spécifié. Mot de passe d'ouverture de document : option qui empêche les utilisateurs d'ouvrir des documents PDF sauf s'ils tapent le mot de passe spécifié par l'auteur. Mot composé : mot formé de deux ou plusieurs unités lexicales (sens général) ; mot introuvable dans le dictionnaire, mais pouvant être formé de mots du dictionnaire (sens ABBYY FineReader). Mots incertains : mots contenant un ou plusieurs caractères incertains.
N
Nettoyer l'image : suppression de l'excès de petits points noirs de l'image. Numériser&Lire : bouton principal d’ABBYY FineReader. Cliquez sur ce bouton pour que ABBYY FineReader numérise et reconnaisse votre(vos) image(s).
O
Ouvrir&Lire : traite un fichier d'image : ouvre le fichier, analyse la présentation de la page et reconnaît celle–ci.
P
Page de code : tableau définissant les relations entre les codes de caractère et les caractères eux–mêmes. ABBYY FineReader affiche la page de code sous la forme d'un jeu de caractères dans lequel vous pouvez choisir.
Paradigme : ensemble des formes grammaticales d'un mot. Paramètres de sécurité du PDF : restrictions qui
empêchent l'ouverture, l'impression ou la modification du document PDF. Ces paramètres incluent le mot de passe d'ouverture de document, le mot de passe des autorisations et les niveaux de codage. PDF balisé : document PDF comportant le contenu des informations sur la structure du document telles que les parties logiques, les images, les tableaux, etc. Cette structure est l'expression des « balises PDF ». Un fichier PDF contenant des balises peut être réorganisé afin de s'adapter aux
différentes tailles d'écran et de s'afficher correctement sur les ordinateurs portables. Police à espacement fixe : tous les caractères d'une police à espacement fixe possèdent la même largeur. Courier New est un exemple de police à espacement fixe. Sélectionnez l'option
Machine à écrire du groupe Type d'impression (onglet Reconnaissance) pour augmenter la qualité de la
reconnaissance des documents définie pour les polices à espacement fixe. Propriétés des documents : propriétés attribuées à un document permettant à l'utilisateur de trier ou de rechercher des fichiers. Les propriétés du document contiennent le titre du document, le nom de son auteur, son sujet et ses mots clés. ppp (points par pouce) : unité de mesure de la résolution, c'est–à–dire du nombre de points par pouce.
R
Reconnaissance en arrière–plan : mode spécial de reconnaissance. Vous pouvez modifier et enregistrer les pages déjà reconnues pendant que ABBYY FineReader effectue la reconnaissance d'autres pages. Réglage automatique de la luminosité : réglage de la luminosité effectué automatiquement par le scanner ou par ABBYY FineReader. Pendant le réglage automatique, la luminosité est définie séparément pour chaque zone de l'image. Répertoire de veille : dossier spécial contrôlé par ABBYY FineReader. Toute nouvelle image ajoutée à ce dossier est automatiquement ouverte dans la fenêtre d’ABBYY FineReader . Résolution : paramètre de numérisation qui détermine le nombre de ppp utilisés lors de la numérisation. Une résolution de 300 ppp convient aux textes imprimés dans des polices de corps 10 pt ou supérieur, une résolution de 400 à 600 ppp est préférable pour les textes imprimés dans des polices de plus petite taille (9 pt ou moins).
S
Scanner : périphérique permettant de récupérer des images dans un ordinateur. Système multi–polices : système de reconnaissance optique qui reconnaît les jeux de caractères de toutes les polices et de toutes les tailles sans apprentissage.
T
Tablea u : bloc servant aux zones d'image de tableaux ou aux zones de texte structurées en tableaux. Lorsque l'application lit des blocs de ce type, elle trace des séparateurs verticaux et horizontaux dans le bloc, de manière à constituer un tableau. Ce bloc est représenté sous forme de tableau dans le texte en sortie. Tâche automatisée – Série d'étapes correspondant chacune à une phase particulière du traitement des documents. ABBYY FineReader 8.0 propose 3 tâches automatisées prêtes à l'emploi et ne nécessitant aucune adaptation particulière. Vous pouvez créer vos propres tâches automatisées en fonction de vos besoins. Le lancement des tâches automatisées se fait à partir du menu du bouton Numériser&Lire. Tiret optionnel : tiret (¬) indiquant où précisément doit être coupé un mot ou une combinaison de mots à la fin d'une ligne (par exemple "autotracté" sera divisé en "auto– tracté"). ABBYY FineReader remplace tous les tirets trouvés dans les mots du dictionnaire par des tirets optionnels. Te xt e : bloc contenant les zones de texte. Notez que les blocs de texte doivent contenir une seule colonne de texte. TWAIN, boîte de dialogue TWAIN : boîte de dialogue du scanner.
68
Manuel utilisateur ABBYY FineReader 8.0
Type d'image : paramètre de numérisation qui détermine si une image doit être numérisée en noir et blanc, en niveaux de gris ou en couleur. Type d'impression du texte source : paramètre indiquant comment a été imprimé le texte source (sur une imprimante laser ou équivalente, sur une imprimante matricielle en mode brouillon ou sur une machine à écrire). Choisissez le mode Auto pour les textes imprimés sur une imprimante laser, le mode Machine à écrire pour les textes imprimés sur une machine à écrire et le mode Imprimante matricielle pour les textes imprimés sur une imprimante matricielle en mode brouillon.
U
Unicode : norme développée par le Consortium Unicode (Unicode, Inc.). Cette norme est un système de codage international sur 16 bits pour le traitement des textes écrits dans les principales langues du monde. Cette norme peut s'étendre facilement. La norme Unicode détermine le codage des caractères ainsi que les propriétés et les procédures utilisées dans le traitement des textes écrits dans une langue donnée.
Z
Zone de reconnaissance – ce type de bloc sert à la reconnaissance et à l'analyse automatiques. Après avoir cliqué sur le bouton 2 – Lire, tous les blocs de ce type seront analysés et reconnus automatiquement.
69
Loading...