Xerox TextBridge User Manual

ÍNDICE GENERAL
PRÓLOGO
Acerca de este manual ..................... vii
Organización de este manual .............viii
Convenciones tipográficas................. ix
Documentación de consulta .................. xi
Servicio técnico........................... xii
1 INTRODUCCIÓN
¿Qué es TextBridge OCR?...................1–3
Formatos de texto respaldados ...............1–5
Escáneres respaldados .....................1–7
Contenido del paquete TextBridge ............1–9
2 INSTALACIÓN
Instalación del sistema y funcionamiento .......2–2
Instalación y funcionamiento del escáner .......2–5
Pasos básicos para la instalación del escáner .2–5
Escáner XIS Datacopy ..................2–6
Instalación del software TextBridge ...........2–8
Ejecutar el programa de instalación del
software ..........................2–8
Ejecutar el programa de instalación del
escáner ..........................2–12
Guía del usuario TextBridge iii
2 INSTALACIÓN (CONT.)
Instalar y probar un controlador de origen
TWAIN.......................2–12
Instalar y probar el controlador ISIS ...2–15
3 FUNCIONAMIENTO DE TEXTBRIDGE
Las preferencias TextBridge .................3–2
Explorar y convertir un documento............3–6
4 SUGERENCIAS Y TÉCNICAS
Cómo obtener un reconocimiento de texto
excelente ...............................4–1
Uso y mantenimiento del escáner ..........4–2
Ajustar el brillo del escáner ..............4–4
Ajustar los colores .....................4–6
Los filtros de fax .......................4–7
Procesar varios documentos por separado ....4–8
El verificador de palabras ...............4–10
El comando Invertir en Muestra ..........4–11
Definir una zona para capturar sólo los datos
deseados .........................4–13
La opción Ignorar fotos/medios tonos ......4–14
La orientación automática de página ......4–15
La segmentación automática de página ....4–16
iv Guía del usuario TextBridge
El Servidor de aplicaciones TextBridge .....4–21
Arrancar el Servidor de aplicaciones
TextBridge e inscribir las
aplicaciones ...................4–21
Ejecutar el Servidor de aplicaciones
TextBridge desde la aplicación .....4–23
La impresora OCR ....................4–26
Agregar la impresora OCR ...........4–27
Usar la impresora OCR en una aplicación
de imagen.....................4–30
A RESOLUCIÓN DE PROBLEMAS Y ERRORES
Qué hacer cuando se presenta un problema .... A–2
Resolución de problemas comunes ........... A–3
Problemas con los escáneres de tipo ISIS ... A–3 Problemas con los escáneres de tipo TWAIN . A–5
Problemas con la configuración del
escáner ....................... A–6
Problemas con la memoria intermedia .. A–7
Errores del controlador de origen
TWAIN....................... A–9
Problemas con la memoria virtual ........ A–9
Otros problemas del funcionamiento de
TextBridge ...................... A–12
Corrección de las condiciones de error........ A–13
GLOSARIO DE TÉRMINOS
ÍNDICE ALFABÉTICO
Índice general v
LISTA DE TABLAS
P–1. Convenciones tipográficas ................x
1–1. Formatos de texto respaldados ..........1–6
3–1. Preferencias ........................3–3
3–2. Resoluciones y formatos respaldados
por TIFF ..........................3–10
vi Guía del usuario TextBridge
PRÓLOGO
Bienvenido a TextBridge™ de Xerox Imaging Systems, OCR para Windows™. TextBridge presenta la avanzada tecnología de reconocimiento óptico de caracteres y una interfaz de fácil uso que permite digitalizar con gran rapidez texto e imágenes en línea y convertirlos a archivos de texto formateado.
Los archivos generados por TextBridge son compatibles con una gran variedad de aplicaciones como programas de tratamiento de texto, programas de edición electrónica, bases de datos y hojas electrónicas.
Antes de proseguir con la lectura de esta guía, lea detenidamente las secciones de este prólogo. A continuación enumeramos estas secciones en las que se proporciona información útil sobre ciertos aspectos de TextBridge:
Acerca de este manual.
Convenciones tipográficas.
Documentación de consulta.
Servicio técnico.
ACERCA DE ESTE MANUAL
En esta guía se incluye información básica principalmente dirigida al usuario sin grandes conocimientos técnicos. Sin embargo, para entender este manual es necesario estar familiarizado con el funcionamiento de la computadora (PC) y con el programa Microsoft Windows, versión 3.1.
Guía del usuario TextBridge vii
Nota En este manual se proporciona toda la información
necesaria para usar TextBridge. Xerox Imaging Systems agradece al usuario sus comentarios acerca de la información proporcionada en este documento. Complete la tarjeta de inscripción y envíela a Xerox Imaging Systems, Inc.
Organización de este manual
Este es un manual de referencia en el que se proporciona ejemplos y sugerencias prácticas para el uso de TextBridge. Esta dividido en los siguientes capítulos:
Capítulo 1 “Introducción”. Se presentan las funciones y el sistema de ayuda de TextBridge y se indica cómo instalar y usar TextBridge.
Capítulo 2 “Instalación”. Se proporciona información completa sobre la instalación de TextBridge y la configuración de la PC para poder usar la aplicación.
Capítulo 3 “Funcionamiento de TextBridge”. Se indica paso a paso cómo procesar documentos e imagenes en línea y convertirlos en archivos de texto para poder usar en la computadora.
viii Guía del usuario TextBridge
Capítulo 4 “Sugerencias y técnicas”. Se proporcionan ejemplos prácticos que facilitan el uso del sistema y que permiten aprovechar todas las prestaciones de TextBridge. También se describe el uso de TextBridge OCR desde otras aplicaciones.
Apéndice A “Resolución de problemas y corrección de errores”. Se describen los problemas más comunes que pueden presentarse durante la instalación de TextBridge, la configuración del sistema y su funcionamiento. Se recomienda una solución para cada uno de estos problemas. También se enumeran los mensajes de error que pueden generarse durante el funcionamiento de TextBridge y se sugieren las formas de corregir dichos errores.
En el “Glosario de términos” se definen la terminología y los conceptos relativos al sistema y que son mencionados en este manual.
Se incluye también un índice como referencia para localizar la información necesaria.
Convenciones tipográficas
Como se describe en la Tabla P–1, la documentación de TextBridge utiliza ciertos elementos gráficos y un tipo de formateo especial del texto para destacar cierta información e indicar en ciertas ocasiones un significado especial.
Prólogo ix
Tabla P–1. Convenciones tipográficas.
Convención Descripción
negrita Introduce un nuevo término o se
menciona un término importante por primera vez en el capítulo; también se utiliza para señalar un concepto importante en línea.
itálica Indica títulos de otros manuales o
documentos. También se usa para indicar representaciones genéricas de entradas de nombres de archivos en ejemplos. Por ejemplo:
archivo.tif
monoespacio Indica ejemplos, texto de menús,
nombres de archivos o mensajes que se visualizan en la pantalla de la computadora.
“ ” (comillas) Indica títulos de capítulos y secciones
del manual. También se usa para los valores que deben introducirse en un menú. Por ejemplo:
Introducir un número del “1” al “10” ...
‘ ’ (comillas
simples)
Nota Presenta información adicional sobre
x Guía del usuario TextBridge
Indica títulos de menús, opciones, ventanas, cuadros y funciones del programa. También se utilizan en los iconos de TextBridge y para indicar opciones y funciones propias de Microsoft Windows.
Señala una sugerencia que proporciona información útil acerca de los pasos a seguir o bien sobre una función del sistema.
el tema actual.
DOCUMENTACIÓN DE CONSULTA
Remítase a la tarjeta Consulta rápida de TextBridge para información detallada sobre el funcionamiento de TextBridge.
Remítase a las notas de la versión en línea que se incluyen con este producto.
El documento Notas de versión en formato
Microsoft Write, está incluido en los disquetes de instalación TextBridge. Una vez instalado TextBridge, el documento Notas de versión se visualiza automáticamente en el grupo de programas TextBridge OCR bajo el ‘Administrador de programas’ de Windows:
Haga dos veces clic sobre el icono para visualizar información actualizada no incluida en la documentación. Lea detenidamente las Notas de versión antes de proseguir con el funcionamiento de TextBridge.
TextBridge proporciona los controladores necesarios para varios escáneres de sobremesa. Remítase a la documentación del escáner para más información.
Finalmente, remítase al Manual del usuario Microsoft Windows 3.1 para más información sobre el funcionamiento y la configuración de Windows en la computadora.
Prólogo xi
SERVICIO TÉCNICO
Si se presentan problemas con el funcionamiento de TextBridge y no puede resolverlos, efectúe las acciones que enumeramos a continuación:
Primero, consulte el Apéndice A de esta guía para obtener información sobre cómo resolver problemas y para obtener la lista y descripción de los errores y, sugerencias para corregirlos.
Si TextBridge se ha adquirido en un distribuidor autorizado Xerox Imaging Systems y no puede solucionar el problema, llame a su distribuidor.
Para poder ofrecerle un servicio más eficiente, al llamar al servicio técnico, debe tener a mano la siguiente información:
el número de inscripción del software (número de serie del disquete 1 de los disquetes de instalación originales de TextBridge).
una descripción de las acciones previas a la aparición del problema.
si se ha generado un mensaje de error, apúnteselo ya que tendrá que explicar el mensaje y proporcionar el número (de haberlo) al representante.
xii Guía del usuario TextBridge
INTRODUCCIÓN
1
Bienvenido a TextBridge™ OCR para Windows de Xerox Imaging Systems. OCR, abreviatura de optical character recognition (reconocimiento óptico de caracteres), es un proceso en el que se explora una imagen, se reconoce y se codifica la información para reproducirla como texto. Las imágenes pueden provenir de escáneres, módem fax y otras fuentes.
TextBridge presenta un conjunto de aplicaciones que combinan el proceso OCR líder en la industria de Xerox Imaging Systems con la facilidad de uso de la interfaz Microsoft Windows.
La Figura 1–1 muestra la ventana principal de TextBridge, a la cual puede accederse como un programa único o bien incrustado en otras aplicaciones de texto.
Figura 1–1. Ventana principal.
Guía del usuario TextBridge 1–1
Para poder trabajar con aplicaciones de tratamiento de imágenes y de fax, TextBridge proporciona una Impresora OCR, que puede seleccionarse mediante el comando ‘Especificar impresora’ de la aplicación. Después, mediante el comando ‘Imprimir’ de la aplicación, se puede “imprimir” una imagen en la ‘Impresora OCR’ y guardar el texto tratado en un archivo con el formato de texto seleccionado (por ejemplo, en un archivo de un programa de tratamiento de texto).
Las aplicaciones TextBridge pueden convertir el texto reconocido a una variedad de aplicaciones de tratamiento de texto, hojas electrónicas, bases de datos y otros formatos de texto.
TextBridge se ejecuta en computadoras compatibles con Windows y con un microprocesador 80386 (o más potente) y cuatro megabytes como mínimo de memoria (se recomiendan ocho megabytes).
El programa se ejecuta en DOS Versión 5.0 (o superior) y Microsoft Windows, Versión 3.1 (o superior) únicamente en modo extendido.
TextBridge también se ejecuta en el sistema operativo
OS/2® de IBM (versión 2.0).
1–2 Guía del usuario TextBridge
¿QUÉ ES TEXTBRIDGE OCR?
TextBridge OCR es el software que convierte datos de las imágenes en archivos de texto compatibles con la PC.
Con TextBridge OCR puede accederse a importantes datos contenidos en documentos escritos así como fax en línea e imágenes de página provenientes de otras fuentes.
TextBridge reconoce y convierte imágenes exploradas y en línea a archivos de texto que posteriormente pueden ser manipulados. Estos archivos pueden abrirse y editarse, pueden volver a formatearse y publicarse (Figura 1–2).
TextBridge respalda una gran variedad de escáneres de sobremesa y convierte el texto reconocido a diversos formatos de texto.
El escáner puede utilizarse para introducir los documentos impresos en papel a TextBridge, el cual explora las imágenes, efectúa un reconocimiento óptico de caracteres, digitaliza el texto reconocido al formato seleccionado y lo almacena como un archivo de PC.
TextBridge también puede utilizarse para reconocer y digitalizar imágenes de página almacenadas en formato TIFF (Tagged-Image File Format). Estas imágenes pueden provenir de módem fax o de otras fuentes.
Introducción 1–3
la imagen es enviada al programa
TextBridge efectúa el reconocimiento y la conversión de texto
un archivo en línea con el formato de texto especificado es escrito al disco
archivo de
imagen en
línea (TIFF)
archivo de
texto en línea,
por ej. MS Word
Figura 1–2. Proceso TextBridge OCR.
TextBridge se proporciona con una interfaz de fácil uso y una serie de prestaciones incorporadas de gran potencia. Por ejemplo, la herramienta muestra permite visualizar páginas y definir zonas antes del reconocimiento. El verificador permite al usuario interactuar con el software OCR para poder obtener la máxima precisión.
TextBridge incorpora el software para el reconocimiento de documentos de Xerox Imaging Systems y una serie de tecnologías desarrolladas por Xerox Palo Alto Research Center (PARC), centro donde se crearon las primeras interfaces para computadoras.
1–4 Guía del usuario TextBridge
Estas prestaciones permiten obtener el reconocimiento óptico de caracteres más preciso y la retención de formatos en una gran variedad de documentos:
documentos con un tamaño de letra de 6 a 72 puntos en cualquier fuente.
TextBridge puede reconocer con exactitud
tamaños de letra menores de 8 puntos únicamente en aquellas imágenes exploradas a una resolución de 400 puntos por pulgada.
documentos mecanografiados, impresos en máquinas fototipográficas e impresoras por impulso, por tinta y láser.
fotocopias, degradados o documentos con manchas.
documentos con formatos de una o varias columnas.
documentos que contienen medios tonos.
imágenes únicas en línea o TIFF en varias páginas de módem fax y otras fuentes.
fax impreso.
documentos en alemán, español, francés, inglés o italiano.
Las versiones de TextBridge que se envían
fuera de los EE UU pueden reconocer incluso más idiomas.
FORMATOS DE TEXTO RESPALDADOS
TextBridge puede convertir el texto reconocido a varios tipos de salida. TextBridge respalda versiones múltiples con algunos formatos que se ilustran en la Tabla 1–1.
Observe que esta lista está sujeta a cambios. Remítase a las Notas de versión de TextBridge para obtener la información más actual.
Introducción 1–5
Tabla 1–1. Formatos de texto respaldados.
Aplicación Extensión del archivo
Ami Pro 3.0 .sam Ami Pro 2.0 .sam ASCII Standard .txt ASCII Smart .txt ASCII Stripped .txt dBase IV .dbf DCA/RFT .rft DisplayWrite 5 .rft FrameMaker .mif Interleaf .wps Lotus 1-2-3 .wk1 Excel para Macintosh .xls Excel 3.0 .xls Excel 4.0 .xls RTF (Rich Text Format) .rtf RTF para Macintosh .rtf Multimate Advantage .doc PostScript .ps Professional Write 2.0 .doc Professional Write 2.2 .doc Samna Word IV+ .sam Windows Write .wri Word para Windows 2.0 .rtf WordPerfect 4.2 .wpf WordPerfect 5.1 .wpf WordStar .doc
1–6 Guía del usuario TextBridge
ESCÁNERES RESPALDADOS
Si se usan los controladores incorporados ISIS (Image and Scanner Interface Standard) de Pixel Translations Inc., TextBridge funciona con la mayoría de escáneres:
Apple OneScanner Canon IX-12 Complete PC scanner Ficus LeoScan 610 Ficus LeoSscan 1210 Envision 6000 Envision 6100 Envision 8100 Epson ES300C (GT-4000 fuera de EE UU) Epson ES600C (GT-6500 fuera de EE UU) Epson ES800C (GT-8000 fuera de EE UU) Fujitsu ScanPartner 10 Fujitsu M3096G Fujitsu M3097G HP ScanJet HP ScanJet Plus HP IIc HP IIp HP IIcx Microtek MS-II Microtek ScanMaker II Microtek 600Z Panasonic FX-RS307 Relisys Aries 1201 Tamarack 6000c UMAX UC-630 scanner con la tarjeta GSII-PC XIS Datacopy GSplus XIS Datacopy 730GS
Además, TextBridge respalda el estándar TWAIN.
Introducción 1–7
TextBridge funciona con cualquier escáner que cumpla con el estándar TWAIN u otro dispositivo que se conecta a una PC y genera imágenes binarias (en blanco y negro) en un tamaño y resolución respaldados por TextBridge.
Por ejemplo, ciertos escáneres manuales como el de Logitech™ ScanMan® y Artec WalkScan™, se proporcionan con los controladores de fuente TWAIN.
Algunos de los escáneres respaldados por TextBridge mediante ISIS también se proporcionan con los controladores de fuente TWAIN por ejemplo, el Ficus LeoScan™.
Nota Cada día son más los escáneres que funcionan con
TextBridge. Con el respaldo TWAIN y la cantidad creciente de fabricantes de escáneres que proporcionan controladores TWAIN, TextBridge funcionará con aún más escáneres en el futuro. Remítase a las Notas de versión en línea de TextBridge para obtener la información más actualizada.
1–8 Guía del usuario TextBridge
CONTENIDO DEL PAQUETE TEXTBRIDGE
TextBridge se proporciona con varios disquetes de alta densidad de 3,5 pulgadas. Los disquetes incluyen los programas de software y las bibliotecas, los contro­ladores ISIS, los paquetes de idioma y la ayuda en línea.
Con el producto TextBridge se incluye también la guía del usuario y una tarjeta de referencia rápida así como una tarjeta para inscribir el software.
Nota Asegúrese de completar la tarjeta de inscripción del
software para poder obtener asistencia técnica y nuevas versiones del software.
Si alguno de estos componentes no está incluido en el paquete TextBridge, póngase en contacto con el distribuidor autorizado de Xerox Imaging Systems de su zona. Si no obtiene una respuesta satisfactoria llame directamente a Xerox Imaging Systems.
Para más información sobre cómo ponerse en contacto con Xerox Imaging Systems, remítase a la sección “Servicio técnico” en el Prólogo de esta guía.
Introducción 1–9
REQUERIMIENTOS DEL SISTEMA
Para instalar y ejecutar TextBridge, necesita una PC compatible con Windows que cumpla con los siguientes requerimientos:
un microprocesador Intel (o compatible) 80386, 80486 o Pentium™.
Microsoft Windows™, versión 3.1 o superior sólo en modo extendido.
sistema operativo Microsoft Disk Operating System (DOS)™, versión 5.0 o superior.
cuatro megabytes (4Mb) de memoria RAM; se recomienda ocho megabytes (8Mb).
de 8Mb a 16Mb de memoria virtual permanente; se recomienda 16Mb.
Para más información sobre cómo configurar
el sistema con memoria virtual permanente, remítase al Manual del usuario Microsoft
Windows™ (versión 3.1) publicado por Microsoft Corporation.
®
disco duro con un mínimo de 4Mb de espacio libre donde poder instalar TextBridge; los 4Mb de espacio de disco permiten instalar el software de las aplicaciones TextBridge, un controlador de escáner ISIS y un paquete de idioma. Por cada paquete de idioma adicional que se instale, se requieren 700K más.
Nota TextBridge se ejecuta bajo el sistema operativo OS/2
de IBM, Versión 2.0 y superiores, en el que se pueden ejecutar varios programas Windows 3.1. En un sistema OS/2, TextBridge requiere 16Mb de RAM.
1–10 Guía del usuario TextBridge
LA AYUDA EN LÍNEA
TextBridge está diseñado para facilitar el uso y el aprendizaje. Sin embargo, si necesita ayuda, TextBridge incluye un sistema de ayuda en línea basado en texto enlazado.
En todas las pantallas de TextBridge, puede seleccionarse la ayuda y visualizar una pantalla de ayuda sobre una pantalla en particular (Figura 1–3).
botones de la ayuda
Figura 1–3. Ayuda en línea de TextBridge.
Al seleccionar el botón ‘Indice’ en la parte superior de la ventana, puede visualizarse el nivel superior del índice para la ayuda de TextBridge. El sistema de ayuda puede utilizarse de varias formas:
seleccionando un tema de la lista ‘Indice’.
seleccionando un tema enlazado a otro.
buscando un tema en particular.
buscando hacia adelante y hacia atrás.
seleccionando temas con el botón ‘Atrás’.
Introducción 1–11
En todas las ventana de la ayuda , se puede abrir el menú ‘Ayuda’ y seleccionar ‘Uso de la Ayuda’ para más información sobre cómo usar las herramientas de la ayuda.
CÓMO EMPEZAR
Antes de poder usar TextBridge, es necesario instalar el software TextBridge en la PC tal como se indica en el capítulo 2.
Si tiene algún problema al instalar TextBridge,
remítase al Apéndice A de la guía del usuario, en el que se proporciona información sobre la resolución de problemas.
Una vez instalado TextBridge, puede remitirse a la tarjeta de Consulta rápida para más información sobre cómo empezar rápidamente.
Si desea información más detallada sobre el funcionamiento de TextBridge, remítase al capítulo 3 de esta guía.
Una vez familiarizado con el funcionamiento básico de TextBridge, remítase al capítulo 4, “Sugerencias y técnicas” donde se proporcionan prácticos consejos para aprovechar al máximo las prestaciones de TextBridge.
1–12 Guía del usuario TextBridge
INSTALACIÓN
2
En este capítulo se explica cómo instalar TextBridge. La instalación va a efectuarse en tres etapas:
1. Siga las instrucciones del fabricante del escáner para instalar y comprobar el funcionamiento del escáner y del controlador a nivel de sistema DOS o del controlador de origen TWAIN.
El controlador a nivel de sistema del escáner o
el controlador de origen TWAIN son proporcionados por el fabricante del escáner.
2. Instale el software TextBridge con los paquetes de idioma para aquellos idiomas que van a reconocerse.
3. Ejecute el programa TextBridge de instalación del escáner y pruebe la interfaz del escáner.
Nota TextBridge incorpora los controladores necesarios
para los escáneres XIS Datacopy GSplus o 730GS. Para más información, remítase a la sección “Instalación y funcionamiento del escáner” más adelante en este capítulo.
En este capítulo la información sobre la instalación se organiza según las tres etapas que se han enumerado anteriormente.
Sin embargo, antes de empezar a explicar la instalación con más detalle, se especifican otros temas relevantes a la “Instalación del sistema y funcionamiento”.
Guía del usuario TextBridge 2–1
Léase detenidamente esta sección ya que en ella se indica cómo evitar problemas asociados con la limitación de memoria y el uso poco eficaz de los recursos de la PC con TextBridge.
Al final de este capítulo se describe cómo desinstalar el sistema en caso de que se desee restaurar la PC a la instalación original.
INSTALACIÓN DEL SISTEMA Y FUNCIONAMIENTO
TextBridge funciona en Windows 3.1 (o superior) sólo en modo extendido por lo que el microprocesador de la PC debe ser Intel 80386 como mínimo.
Para ejecutar TextBridge es necesario también que la PC tenga como mínimo cuatro megabytes (4Mb) de memoria RAM y debe configurarse con un mínimo de
ocho megabytes (8Mb) de memoria virtual permanente (espacio de intercambio).
Si cree que la mayoría de documentos que va a explorar tienen varias columnas, páginas horizontales de texto o bien páginas con un diseño complejo, debe configurar la PC con ocho megabytes (8Mb) o más de memoria RAM de sistema y 16Mb de memoria virtual.
Con los 4Mb mínimos de memoria TextBridge usaría con más frecuencia la memoria virtual (espacio de intercambio en el disco duro).
Si se intenta ejecutar TextBridge con menos de 4Mb de memoria RAM, la aplicación le indicará que:
Imposible inicializar el servidor.
Por lo general, cuanta más memoria RAM haya disponible para usar TextBridge, menos espacio de intercambio a disco se requerirá durante el funcionamiento.
2–2 Guía del usuario TextBridge
Como norma, el sistema debería configurarse con el doble de memoria virtual que de memoria RAM. Así, si se tiene 4Mb de memoria, configure el sistema con 8Mb de memoria virtual como mínimo. Si tiene 8Mb de memoria RAM, especifique 16Mb de memoria virtual.
Importante La memoria virtual debe configurarse como memoria
virtual permanente, especialmente para una PC con sólo 4Mb de memoria RAM. Esto asegura que TextBridge cuenta siempre con la cantidad adecuada de espacio de intercambio continuo durante el reconocimiento de caracteres. Remítase al Apéndice A
de este manual o al Manual del usuario Microsoft
®
Windows™ para más información sobre cómo
configurar la memoria virtual.
Sea cual sea la cantidad de memoria RAM y de memoria virtual, existen también otras asignaciones en la configuración del sistema pueden afectar la disponibilidad de memoria para TextBridge y esto, puede afectar directamente al rendimiento del sistema.
A continuación se enumeran los elementos que pueden afectar el rendimiento del sistema TextBridge:
Discos RAM Si se ha configurado el sistema para que use parte
de la memoria extendida como espacio de almacenamiento temporal de archivos, disco RAM, esto resta espacio a la memoria disponible.
Instalación 2–3
Programas TSR (terminate-and-stay­resident)
Algunos programas están diseñados para que cargarse automáticamente en memoria al arrancar el sistema o bien a permanecer en memoria incluso después de salir del programa. Estos programas afectan la cantidad de memoria disponible para TextBridge.
Controladores de memoria expandida Son programas que usan memoria extendida como
memoria expandida (la memoria utilizada por el sistema operativo), por ejemplo, un controlador Windows.
Otros controladores Estos son programas que proporcionan cierto tipo
de control en el sistema, por ejemplo, un controlador de red.
Si cree que el rendimiento de TextBridge es bajo o que el tiempo de respuesta del sistema es lento, compruebe si el sistema está configurado con algunos de estos dispositivos. De haber uno o más, elimine aquellos que no necesite para mejorar el rendimiento de TextBridge.
2–4 Guía del usuario TextBridge
INSTALACIÓN Y FUNCIONAMIENTO DEL ESCÁNER
Con los controladores ISIS proporcionados por Pixel Translations Incorporated, TextBridge funciona con varios escáneres de sobremesa.
Además, como respalda el estándar TWAIN, TextBridge funciona con la mayoría de dispositivos que cumplen con el estándar TWAIN que proporciona imágenes binarias en un tamaño y resolución respaldados. Los dispositivos TWAIN respaldados incluyen un gran número de escáneres manuales.
Nota Como el número de escáneres respaldados aumenta
constantemente, remítase a las notas de la versión de TextBridge para obtener una lista actual. Si el escáner no está en la lista, llame al distribuidor autorizado de Xerox Imaging Systems de su zona o llame directamente al servicio técnico de XIS.
La mayoría de escáneres requieren un controlador a nivel de sistema o bien un controlador de origen TWAIN, el cual puede obtenerse del fabricante del escáner o de la tarjeta de interfaz. Consulte la
documentación del escaner para más información sobre cómo instalar el escáner, la tarjeta de la interfaz y el controlador.
Para los escáneres XIS Datacopy GSplus o 730GS es necesario remitirse a la sección “Escáner XIS Datacopy” para más información sobre los controladores a nivel de sistema correctos para usar con TextBridge.
Instalación 2–5
Pasos básicos para la instalación del escáner
Los pasos básicos para instalar un escáner son:
1. Instalar la tarjeta de interfaz del escáner correcta (de ser necesario) en el enlace de la PC.
2. Conectar el escáner a la tarjeta de interfaz (o al puerto serial si es un escáner manual) con el cable correcto y encender el escáner y la PC.
3. Instalar el archivo (.SYS) del controlador del escáner a nivel de sistema o el controlador de origen TWAIN en el disco duro de la PC como se indica en la documentación del escáner.
4. Comprobar el funcionamiento del escáner mediante las herramientas de software proporcionadas por el fabricante. Después de comprobar que el escáner funciona, instalar el software TextBridge.
Si el escaner funciona independientemente de
TextBridge, es indicio de que el funciona­miento es correcto. Configurar el escáner para que funcione con TextBridge no debería presentar complicación alguna.
Escáner XIS Datacopy
TextBridge funciona con dos escáneres de XIS Datacopy: el GSplus (con la tarjeta 1201 de Rancho Technology) y el 730GS (con la tarjeta 111 de Datacopy).
Si el escáner adquirido para ejecutarse con el software XIS DISCOVER es uno de los mencionados anteriormente, este producto se proporciona con un controlador a nivel de sistema distinto al que se necesita para que funcione con TextBridge. Los controladores a nivel de sistema correctos para los escáneres XIS Datacopy se incluyen en los disquetes de instalación de TextBridge.
2–6 Guía del usuario TextBridge
Instale TextBridge tal como se indica en la sección “Instalación del software TextBridge” más adelante en este mismo capítulo. Después, remitase al controlador a nivel de sistema apropiado del archivo CONFIG.SYS. Los controladores se encuentran en el subdirectorio llamado DATACOPY, bajo el directorio de instalación TextBridge. El directorio predeterminado de instalación es C:\TXBRIDGE.
Para el escáner GSplus, el controlador a nivel de sistema a utilizar es XIS380GS.SYS. Este es el controlador a nivel de sistema que debe usarse para poder usar el escáner GSplus con TextBridge.
La sentencia DEVICE del archivo CONFIG.SYS para el controlador GSplus sería:
DEVICE=C:\TXBRIDGE\DATACOPY\XIS380GS.SYS
Para el escáner 730GS, el controlador a nivel de sistema a utilizar es XISDCP30.SYS y además, es necesario usar la versión proporcionada con TextBridge. Así, la sentencia DEVICE del archivo CONFIG.SYS sería:
DEVICE=C:\TXBRIDGE\DATACOPY\XISDCP30.SYS BASE=2E8
La tarjeta 111 XIS Datacopy es la tarjeta de interfaz adecuada para el 730GS. La dirección predeterminada del puerto E/S es 2E8.
Instalación 2–7
Nota Si la dirección 2E8 entra en conflicto con otras
tarjetas instaladas en la PC, ésta dirección puede cambiarse cambiando las opciones DIP.
A continuación se indican las asignaciones alternativas de la dirección para la tarjeta 111 de Datacopy 111:
218, 228, 238, 248, 258, 268, 278, 288, 298, 2A8, 2B8, 2C8, 2D8
Si cambia la dirección predeterminada, asegúrese de cambiar la sentencia DEVICE del archivo CONFIG.SYS. Por ejemplo, si se han establecido las opciones DIP en la tarjeta 2D8, la sentencia DEVICE del archivo CONFIG.SYS debería ser:
DEVICE=C:\TXBRIDGE\DATACOPY\XISDCP30.SYS BASE=2D8
INSTALACIÓN DEL SOFTWARE TEXTBRIDGE
El proceso de instalación del software TextBridge va a efectuarse en dos etapas. Primero se instalarán los archivos de software y a continuación se ejecutan el programa de instalación del escáner para enlazar TextBridge al controlador a nivel de sistema del escaner o bien al controlador de origen TWAIN.
Nota Si el escáner no está respaldado por TextBridge,
puede ignorar la segunda fase de instalación y ejecutar el programa de instalación del escáner. Por ejemplo, puede usar TextBridge para reconocer archivos TIFF generados por un módem fax.
Ejecutar el programa de instalación del software
Para instalar el software TextBridge siga los pasos indicados a continuación.
2–8 Guía del usuario TextBridge
Nota En este procedimiento se da por entendido que se está
usando un escáner respaldado, que ya está conectado a la PC y que funciona correctamente.
1. Insertar el disquete 1 de TextBridge a la unidad A: o B: según sea necesario.
2. Desde el ‘Administrador de programas’ Windows, ejecute el comando para instalar de TextBridge.
Abra el menú ‘Archivo’ y seleccione el comando
‘Ejecutar’.
En el cuadro ‘Ejecutar’, escriba lo siguiente:
b: setup
En esta acción se entiende que la unidad que se está usando es la B:. Use la unidad A: de ser necesario.
Presione ‘Intro’. Aparece un mensaje de
inicialización seguido del cuadro principal de TextBridge (Figura 2–1).
hacer clic para empezar la instalación
Figura 2–1. Cuadro principal de instalación de
TextBridge.
Instalación 2–9
3. Haga clic en ‘Continuar’ para empezar la instalación de TextBridge en el disco duro.
Ahora aparece un cuadro con el directorio de instalación de TextBridge en el disco duro. El directorio predeterminado es:
C:\TXBRIDGE
4. Haga clic en ‘Continuar’ para proseguir.
Aparece un cuadro para poder elegir los paquetes de idioma OCR que desee instalar.
Para que TextBridge pueda efectuar el
reconocimiento de caracteres, es necesario seleccionar un paquete de idioma como mínimo.
5. Especifique los paquetes de idioma a instalar.
Haga clic en la casilla de verificación para
cada paquete de idioma que desee instalar.
TextBridge respalda el reconocimiento de
caracteres en alemán, español, francés, inglés e italiano. Las versiones europeas de TextBridge respaldan incluso más idiomas. Para cada paquete de idioma son necesarios unos 700K aproximadamente de espacio de disco duro.
Haga clic en ‘Continuar’. El programa de
instalación empieza a instalar los archivos de software de TextBridge tal como se indica en el medidor de porcentaje de la pantalla.
2–10 Guía del usuario TextBridge
6. Inserte los disquetes de instalación de TextBridge tal como se lo indica el sistema.
A medida que el programa de instalación va descomprimiendo los archivos y los copia en el disco duro, va solicitando que se introduzca un disquetes detrás de otro. Inserte los disquetes en el orden solicitado y haga clic en ‘Continuar’.
Una vez instalados todos los archivos necesarios, aparece un cuadro en el que se indica que la instalación se ha completado.
7. Haga clic en ‘Aceptar’.
El programa de instalación crea automáticamente los elementos TextBridge OCR y lo abre en la pantalla (Figura 2–2).
Figura 2–2. Grupo de programas TextBridge OCR.
8. Si el escáner que va a usarse está respaldado, ejecute el programa de instalación del escáner. Siguiente sección.
Si va a procesarse imágenes TIFF en línea únicamente, no es necesario que efectúe el procedimiento descrito en la siguiente sección. Ahora ya puede empezar a usar TextBridge, como se describe en los capítulos 3 y 4 de este manual.
Instalación 2–11
Ejecutar el programa de instalación del escáner
Para poder usar TextBridge con un escáner respaldado, ejecute el programa ‘Configurar escáner’. Este programa enlaza TextBridge al controlador a nivel de sistema del escáner o al controlador de origen TWAIN. Como se muestra en la Figura 2–2, el icono del programa de instalación del escáner está disponible en la ventana TextBridge OCR.
En esta sección se presentan dos procedimientos, uno para instalar y probar el controlador de origen TWAIN y otro para instalar y probar el controlador ISIS.
De presentarse algún problema en el
funcionamiento del escáner con TextBridge, remítase al Apéndice A de esta guía.
Instalar y probar un controlador de origen TWAIN
Para instalar y probar un controlador de origen TWAIN, siga los pasos siguientes:
1. En el grupo de programas TextBridge OCR, haga doble clic en el icono ‘Configurar escáner’.
Aparece la ventana principal ‘Configurar escáner’ (Figura 2–3). Observe que el tipo de escáner predeterminado es ISIS.
el tipo de escáner predeterminado es ISIS
también puede seleccionarse TWAIN
Figura 2–3. Ventana principal ‘Configurar escáner’.
2–12 Guía del usuario TextBridge
2. Especifique el tipo de escáner.
Abra el menú ‘Tipo’ y elija ‘TWAIN’ como tipo
de escáner.
Seleccione ‘TWAIN’ únicamente si el
escáner se proporciona con un controlador de origen TWAIN.
Si el escáner se proporciona con un controlador DOS a nivel de sistema (archivo .sys) que debe mencionarse en la sentencia DEVICE del archivo config.sys, seleccione ISIS y remítase a la siguiente sección “Instalar y probar el controlador ISIS”.
Compruebe la documentación del escáner para más información sobre el controlador o controladores proporcionados.
Especifique el controlador de origen TWAIN
para usarse con TextBridge.
3. Especifique el controlador de origen TWAIN.
Abra el menú ‘Archivo’ y elija el comando
‘Seleccionar origen’. Aparece el cuadro ‘Select Source’ TWAIN (Figura 2–4).
Instalación 2–13
resaltar el origen TWAIN
hacer clic para seleccionar el origen para TextBridge
Figura 2–4. Cuadro ‘Select Source’ TWAIN.
Se muestran todos los controladores de origen
TWAIN cargados. Realce el controlador que desee utilizar con TextBridge.
Haga clic en el botón ‘’Seleccionar’ para
completar la selección.
4. Pruebe la interfaz del escáner.
Abra el menú ‘Archivo’ y seleccione el comando
‘Obtener’. La pantalla debería mostrar la interfaz nativa del usuario del origen TWAIN. Por ejemplo, en la Figura 2–5 se muestra una versión de la interfaz nativa del usuario de Logitech™ ScanMan®.
Use la UI (interfaz del usuario) nativa de
origen TWAIN para especificar y obtener una imagen. Remítase a la documentación del dispositivo.
2–14 Guía del usuario TextBridge
la interfaz nativa del origen TWAIN permite configurar y usar el dispositivo
Figura 2–5. La interfaz de origen TWAIN.
5. Salga del programa de instalación del escáner.
Abra el menú ‘Archivo’ y seleccione ‘Salir’. Ahora ya puede usar TextBridge con el dispositivo TWAIN. Remítase a los capítulos 3 y 4 para más información.
Instalar y probar el controlador ISIS
Para instalar un controlador ISIS, siga los pasos siguientes:
1. En la ventana del grupo TextBridge OCR, haga doble clic en el icono ‘Configurar escáner’.
Aparece la ventana principal para configurar el escáner (remítase a la Figura 2–3). Observe que el tipo de escáner predeterminado debería ser ISIS.
Instalación 2–15
2. Especifique el tipo de escáner.
Abra el menú ‘Tipo’ de ser necesario y elija
ISIS.
Seleccione ‘ISIS’ únicamente si el escáner
necesita un controlador DOS a nivel de sistema (archivo .sys) en la sentencia DEVICE de config.sys. TextBridge proporciona el controlador ISIS más sofisticado que debería funcionar con el controlador a nivel de sistema. Si su escáner incluye un controlador ISIS, úselo en lugar del que le ha sido proporcionado por TextBridge.
Si su escáner sólo incluye un controlador TWAIN, seleccione ‘TWAIN’ y remítase a seción anterior, “Instalar y probar un controlador de origen TWAIN”.
Remítase a la documentación del escáner para más información sobre los controladores proporcionados.
Especifique el controlador ISIS para usar con
TextBridge.
3. Abra el menú ‘Archivo’ y elija el comando ‘Seleccionar origen’.
Aparece el cuadro ‘Lista de escáneres’ de tipo ISIS (Figura 2–6).
hacer clic para agregar el escáner
Figura 2–6. Cuadro ‘Lista de escáneres’.
2–16 Guía del usuario TextBridge
seleccionar el escáner
después, hacer clic en ‘Aceptar’
4. Aparece una lista con todos los controladores de escáner disponibles.
Haga clic en el botón ‘Agregar’ en el cuadro
‘Lista de escáneres’. Seguidamente aparece un cuadro en el que se le solicita que:
Introducir disquete con controladores de escáner
Inserte el diquete 1 de los disquetes de
instalación de TextBridge en la unidad para disquetes y de ser necesario escriba la letra de la unidad (la unidad predeterminada es la A:).
Haga clic en ‘Aceptar’ para mostrar el cuadro
‘Agregar escáner’ de tipo ISIS (Figura 2–7).
Figura 2–7. Cuadro ‘Agregar escáner’.
5. Agregue el escáner.
Desde el cuadro ‘Agregar escáner’, haga clic en
el escáner que se corresponda con el suyo para seleccionarlo.
Haga clic en ‘Aceptar’. El escáner se agrega y
se cierra el cuadro ‘Agregar escáner’. El cuadro ‘Lista de escáneres’ permanece en pantalla (remítase a la Figura 2–6).
Instalación 2–17
6. De ser necesario configure el escáner para funcionar con TextBridge.
En el cuadro ‘Lista de escáneres’, haga clic en
el botón ‘Instalar’.
En algunos escáneres aparece un cuadro
que permite establecer asignaciones como la dirección de puerto, el número ID SCSI, el modo de transferencia, la velocidad de exploración, etc.
En otros escáneres aparece un cuadro en el que se indica:
La configuración de este escáner está definida con el controlador a nivel de sistema.
De ser necesario especifique las asignaciones
adecuadas para la instalación del escáner. Remítase a la documentación del escáner o de la tarjeta de interfaz para más detalles sobre cómo configurar el escáner.
Al acabar de especificar las asignaciones de la
instalación del escáner, haga clic en Aceptar para guardar las nuevas asignaciones y cierre el cuadro del escáner.
7. Haga clic en ‘Aceptar’ en el cuadro ‘Lista de escáneres’.
El cuadro ‘Lista de escáneres’ se cierra pero la ventana principal de ‘Configurar escáner’ continúa abierta.
2–18 Guía del usuario TextBridge
8. Pruebe el escáner.
Coloque una página en el alimentador de
hojas del escáner o en el lector plano.
En la ventana principal ‘Configurar escáner’,
abra el menú ‘Archivo’ y seleccione ‘Obtener’.
El escáner se activará y explorará la página. De no activarse repita los pasos de la instalación descritos anteriormente. Remítase también al Apéndice A de esta guía para más información sobre cómo solucionar problemas.
Si el escáner todavía no funciona, llame al servicio técnico de XIS.
9. Salga del programa ‘Configurar escáner’.
Abra el menú ‘Archivo’ y seleccione ‘Salir’. Ahora ya puede usar TextBridge con el escáner ISIS. Remítase a los capítulos 3 y 4 para más información.
DESINSTALAR TEXTBRIDGE
Para restaurar la PC al estado original antes de que se instalara TextBridge, siga los pasos siguientes:
1. Desde el ‘Administrador de programas’, elimine el grupo TextBridge OCR.
Seleccione el grupo de programas TextBridge
OCR haciendo clic en el grupo con el ratón.
Abra el menú ‘Archivo’ del ‘Administrador de
programas’ y seleccione ‘Eliminar’. Aparece un mensaje preguntándole:
¿Está seguro de que desea eliminar el elemento ‘TextBridge OCR’?
Haga clic en ‘Sí’.
Instalación 2–19
2. Desde el ‘Administrador de archivos’, elimine la carpeta TXBRIDGE del disco duro.
Seleccione la carpeta TXBRIDGE haciendo clic
en la carpeta con el ratón.
Abra el menú ‘Archivo’ del ‘Administrador de
archivos’ y seleccione ‘Eliminar’. Aparece el cuadro ‘Eliminar’ con el nombre completo de la ruta de acceso al directorio TXBRIDGE seleccionado.
Haga clic en ‘Aceptar’. Aparece un cuadro de
confirmación.
Haga clic en el botón ‘Sí a todo’. Aparece otro
cuadro de confirmación para un archivo (oculto) en el directorio TextBridge.
Haga clic sobre ‘Sí’.
3. Desde el ‘Administrador de archivos’, elimine los archivos de inicialización TextBridge.
Haga doble clic en el directorio Windows. Se
muestra la lista de archivos del directorio.
Deslice la lista hasta mostrar los archivos
siguientes:
TXBRIDGE.INI OCRSRV.INI
Elimine cada archivo señalándolo y haciendo
clic con el ratón, abriendo el menú ‘Archivo’ del ‘Administrador de archivos’ y haciendo clic en ‘Eliminar’. Aparece el cuadro ‘Eliminar’.
Para cada archivo a eliminar, haga clic en
‘Aceptar’. Los archivos son eliminados.
2–20 Guía del usuario TextBridge
4. Si desea puede editar el archivo CONFIG.SYS para eliminar la sentencia DEVICE del controlador a nivel de sistema del escáner.
Esta sentencia sólo puede eliminarse si no se
está ejecutando otra aplicación que usa el mismo controlador a nivel de sistema.
Con este procedimiento se ha completado la desinstalación de TextBridge de la PC.
Instalación 2–21
FUNCIONAMIENTO
3
DE TEXTBRIDGE
Una vez instalado TextBridge como se describe en el capítulo 2, puede utilizar la aplicación para digitalizar documentos en copia impresa e imágenes de página en línea en archivos de texto.
TextBridge puede explorar un documento o leer imágenes en línea TIFF y efectuar un reconocimiento óptico de caracteres (OCR).
En la ventana ‘Muestra’ puede verse una muestra de cada página donde puede verse la página, aplicar el zoom y definir una zona antes de empezar el procesamiento.
Durante el reconocimiento de caracteres, puede verificar palabras reconocidas como palabras correctas o bien corregir los errores. Al verificar el texto se mejora el uso de TextBridge para obtener un reconocimiento más preciso a medida que avanza el proceso de reconocimiento del texto.
Una vez efectuado elonocido a formato de texto que puede ser uti reconocimiento, puede convertir el texto reclizado con las aplicaciones más comunes de tratamiento de texto, hojas electrónicas, bases de datos, etc.
En este capítulo se describe y proporciona información detallada sobre cómo usar la aplicación principal de TextBridge.
Para más información sobre el Servidor de
aplicaciones TextBridge y la impresora OCR, remítase al capítulo 4.
Guía del usuario TextBridge 3–1
En este capítulo se tratan los siguientes temas:
Las preferencias TextBridge.
Explorar y convertir un documento.
Reconocer y convertir archivos TIFF.
Muestra de las páginas antes de procesarlas.
Verificar texto durante el reconocimiento.
LAS PREFERENCIAS TEXTBRIDGE
El software TextBridge OCR presenta un grupo de preferencias incorporadas que controlan el reconocimiento óptico de caracteres. Para la mayoría de documentos de buena calidad, puede usar las preferencias predeterminadas de TextBridge con las que podrá obtener un reconocimiento de caracteres excelente.
Sin embargo, para ajustar el reconocimiento a una gran variedad de documentos, TextBridge permite definir las preferencias según el documento a explorar. Antes de arrancar OCR, haga clic en el botón ‘Preferencias’ del cuadro principal. Aparece el cuadro ‘Preferencias’ (Figura 3–1).
hacer clic para definir los parámetros del escáner
Figura 3–1. Cuadro ‘Preferencias’.
3–2 Guía del usuario TextBridge
Especifique una o varias de las opciones que controlan el procesamiento de los documentos. Las opciones disponibles se describen en la Tabla 3–1.
Nota Al cambiar una opción en este cuadro, permanece
activada hasta que se vuelva a cambiar. Continúa en activo incluso al salir de TextBridge y ejecutar el programa de nuevo. Esto permite almacenar las preferencias adecuadas para aquellos documentos que son explorados con más frecuencia. Estas preferencias pueden cambiarse en cualquier momento.
Tabla 3–1. Preferencias.
Preferencia Función
Calidad del documento
Orientación de la página
• Elija ‘Estándar’ para la mayoría de documentos.
• Elija ‘Fax’ para imágenes en línea, imágenes
TIFF en calidad Fax (200x100 ó 200x200 puntos por pulgada) o si se está explorando fax en copia impresa.
• Haga clic en ‘Vertical’ para la mayoría de
documentos.
• Haga clic en ‘Horizontal’ para documentos
anchos que van a explorarse de lado y que por lo tanto se les debe dar una vuelta en memoria de 90 grados antes de empezar el reconocimiento.
• Haga clic en ‘Automática’ si el documento tiene
ambas orientaciones de página (por ejemplo, la mayoría de páginas en orientación vertical con tablas en páginas horizontales). Observe que si está explorando archivos TIFF y no está seguro de la orientación de la página puede seleccionar ‘Automática’. Con la opción ‘Automática’ seleccionada, TextBridge efectúa un paso previo al procesamiento para determinar la orientación de la página, por lo que la velocidad de procesamiento es más lenta cuando esta opción está activada.
Funcionamiento de TextBridge 3–3
Tabla 3–1. Preferencias (cont.).
Preferencia Función
Idioma En esta categoría se proporciona un menú
desplegable de los idiomas de reconocimiento que se han instalado en el sistema. TextBridge puede reconocer con gran exactitud documentos en alemán, español, francés, inglés e italiano. Seleccione el idioma principal del documentos (por ejemplo, español).
Segmen­tación auto­mática de páginas
Ignorar fotos/medios tonos
• Deje esta función desactivada para documentos
con una sola columna.
• Haga clic en el cuadro de verificación para
activarla para documentos con dos o más columnas de texto. Con la segmentación de página activada, TextBridge efectúa un paso de previo al procesamiento para analizar la forma y la ubicación de los bloques de texto en la página y reproducirlos en el orden correcto. Observe que en el archivo de texto convertido, TextBridge produce texto en formato de galerada (de una columna).
Haga clic en ‘Ignorar fotos/medios tonos’ si el documento a ser reconocido contiene fotografías o medios tonos (fotografías en trama). De lo contrario TextBridge intenta reconocer los puntos de los medios tonos como texto, reduciendo la velocidad y la precisión del reconocimiento.
3–4 Guía del usuario TextBridge
Preferencia
Tabla 3–1. Preferencias (cont.).
Función
Parámetros del escáner
Haga clic en el botón ‘Parámetros del escáner’ para visualizar el cuadro ‘Parámetros del escáner’ donde va a especificarse los controles del escáner.
• ‘Utilizar alimentador automático de documentos’ está disponible sólo para el escáner que tenga anexado un ADF (alimentador automático de documentos). Al hacer clic en esta opción para activarla, TextBridge explora y reconoce las páginas del alimentador.
• ‘Brillo’ permite controlar la cantidad de luz que el escáner emite en una página al explorarla, afectando así la claridad u oscuridad de la imagen explorada. El brillo puede ajustarse para compensar y mejorar el proceso de reconocimiento.
Si se está utilizando un escáner HP AccuPage,
la opción correcta para el brillo es ‘Automático’.
• ‘Resolución’ permite controlar el número de puntos por pulgada (ppp) a los que va a explorarse la página. Por lo general, para obtener el mejor resultado en el reconocimiento de caracteres, especifique la resolución más alta, hasta 400 puntos por pulgada, que respalde el escáner.
• ‘Tamaño de página’ permite controlar el tamaño de la zona que va a explorarse. Por lo general se especifica el tamaño más pequeño que va a acomodar el tamaño de las páginas originales: ‘Carta’ (8,5 por 11 pulgadas o 21,59 por 27,94 centímetros); ‘Legal’ (8,5 por 14 pulgadas o 21,59 por 35,56 centímetros); o ‘A4’ (8,27 por 11,69 pulgadas o 21 por 29,70 centímetros).
Funcionamiento de TextBridge 3–5
EXPLORAR Y CONVERTIR UN DOCUMENTO
Una de las tareas que TextBridge permite efectuar es explorar un documento impreso de una o varias páginas y convertirlo en un archivo de texto en línea.
Durante este proceso, TextBridge explora la primera página, efectúa un reconocimiento de caracteres y guarda el texto reconocido en un archivo temporal. Este proceso se repite para cada página y el texto reconocido se va anexando al archivo.
Al finalizar de explorar el documento, TextBridge muestra el cuadro ‘Guardar como’. En este cuadro debe especificarse el nombre del archivo de salida, el disco y directorio y el formato de texto para guardar el archivo.
Nota En la siguiente sección se asume que el escáner ha
sido conectado a la PC y encendido y que TextBridge también está instalado y en funcionamiento.
Para explorar y convertir un documento, siga los pasos siguientes:
1. Cargue la página o páginas en el escáner.
Según el modelo de escáner, puede cargarse una pila de páginas en el alimentador automático de documentos (ADF) o bien de página en página en la superficie plana del escáner.
2. Desde el cuadro principal, haga clic en la opción ‘Escáner’ del cuadro ‘Entrada de’ (Figura 3–2 en la página siguiente).
3. Para guardar una imagen de cada página en un archivo TIFF, haga clic en la casilla de verificación ‘Guardar imágenes de página’.
3–6 Guía del usuario TextBridge
especificar el escáner como la entrada
Las imágenes de página son almacenadas
como archivos TIFF con una compresión CCITT Group 3. Véase el capítulo 4 para más información sobre cómo ‘Guardar imágenes de página’.
Figura 3–2. Escáner como fuente de entrada.
4. Si lo desea, haga clic en el botón ‘Preferencias’ para definir el proceso de exploración y de reconocimiento.
Use la Tabla 3–1 como guía. En la pantalla ‘Preferencias’ puede especificarse opciones como la orientación de página, el idioma de reconoci­miento, etc. Una vez definidas estas opciones, haga clic en ‘Aceptar’ para regresar al cuadro principal.
5. Haga clic en ‘Empezar’ en el cuadro principal para empezar el proceso de exploración y de reconocimiento.
Si el escáner es un modelo TWAIN, aparece la interfaz nativa del usuario del controlador de origen. Desde este cuadro puede controlar la exploración del documento.
Si el escáner es un modelo ISIS, las páginas son exploradas y reconocidas automáticamente.
Funcionamiento de TextBridge 3–7
Cuando se elimina la interfaz nativa (TWAIN) o cuando todas las páginas son exploradas (ISIS), TextBridge muestra el cuadro ‘Agregar más páginas’ (Figura 3–3).
Figura 3–3. Cuadro ‘Agregar más páginas’.
6. Para explorar más páginas, vaya al paso 7. Para finalizar la exploración y el reconocimiento óptico de caracteres, vaya directamente al paso 8.
7. Prepare el escáner y haga clic en ‘Continuar’.
Si el escáner es un modelo TWAIN, aparece de nuevo la interfaz para permitirle proseguir con la exploración y el reconocimiento se efectúa automáticamente. Si el escáner es un modelo ISIS, TextBridge prosigue la exploración y el reconocimiento automáticamente. Al terminar, TextBridge vuelve a mostrar el cuadro ‘Agregar más páginas’ (remítase a la Figura 3–3). Prosiga a partir del paso 6.
3–8 Guía del usuario TextBridge
8. Haga clic en ‘Terminado’ en el cuadro ‘Agregar más páginas’.
TextBridge muestra ahora el cuadro ‘Guardar como’ (Figura 3–4).
Figura 3–4. Cuadro ‘Guardar como’.
9. Especifique los datos del archivo de salida.
Especifique el nombre del archivo, el nombre
del disco de destino y el directorio.
Especifique también el formato de texto de
salida en el menú ‘Mostrar archivos de tipo’.
Haga clic en ‘Aceptar’.
TextBridge convierte el texto reconocido al formato especificado, guarda el texto convertido en el archivo especificado y cierra el cuadro ‘Guardar como’. El cuadro principal continua abierto para proseguir con el siguiente trabajo.
Funcionamiento de TextBridge 3–9
RECONOCER Y CONVERTIR ARCHIVOS TIFF
Si los archivos TIFF contienen imágenes de página, puede usarse TextBridge para producir una archivo de texto para dichas imágenes. TextBridge reconoce los archivos de imagen TIFF en línea como una o más imágenes de página exploradas.
Algunos archivos TIFF contienen más de una imagen de página. Estos archivos TIFF de varias páginas son principalmente generados por un módem fax. TextBridge puede procesar archivos TIFF de una página o de varias páginas.
TextBridge puede procesar archivos TIFF (*.TIF) en las resoluciones y formatos indicados en la Tabla 3–2:
Tabla 3–2. Resoluciones y formatos respaldados
por TIFF.
Resoluciones* Formatos TIFF
100 por 200 200 por 100 200 por 200 300 por 300 400 por 200 400 por 400
* Todos los archivos TIFF procesados a un
documento deben tener la misma resolución. Si TextBridge ha procesado varios archivos que son de 200 por 200 ppp por ejemplo, y el siguiente archivo es de 300 por 300 ppp, el programa genera un mensaje de error y después muestra el cuadro ‘Guardar como’ para poder generar los resultados del reconocimiento hasta este momento en un documento.
3–10 Guía del usuario TextBridge
Sin comprimir (cabecera Intel) CCITT-3 (cabecera Intel) CCITT-4 (cabecera Intel)
Sin comprimir (cabecera Motorola) CCITT-3 (cabecera Motorola) CCITT-4 (cabecera Motorola)
Intel FAXability
Nota En el procedimiento siguiente se asume que
especificar archivos TIFF como la entrada
Si desea, TextBridge puede abrir el archivo o archivos TIFF, leer los datos de imagen en la memoria de la computadora, efectuar un reconocimiento de la imagen y después guardar el texto reconocido en archivo de texto formateado.
TextBridge está correctamente instalado en la PC y en funcionamiento.
Para reconocer y convertir uno o más archivos en línea TIFF a un archivo de texto, siga los pasos siguientes
1. Desde el cuadro principal, haga clic en ‘Archivo’ del cuadro ‘Entrada de’ (Figura 3–5).
Figura 3–5. Entrada de ‘Archivo’.
2. También puede especificar ‘Preferencias’ para controlar el proceso de reconocimiento.
Haga clic en el botón ‘Preferencias’ para
mostrar el cuadro ‘Preferencias’ (remítase a la Figura 3–1).
Cambie las opciones que desee. Remítase a la
Tabla 3–1 para más información.
Una vez especificadas las preferencias, haga
clic en ‘Aceptar’ y se regresará al cuadro principal.
Funcionamiento de TextBridge 3–11
resaltar los archivos TIFF a procesar
después, hacer clic en ‘Agregar’
los nombres de los archivos seleccionados se agregan a la cola
3. Haga clic en ‘Empezar’ del cuadro principal.
TextBridge muestra el cuadro ‘Abrir’ (Figura 3–6).
Figura 3–6. Cuadro ‘Abrir’.
4. Especifique ‘Archivos TIFF’ y después haga clic en ‘Aceptar’.
Para seleccionar un solo archivo, haga clic
sobre el archivo que desee en el cuadro con la lista de archivos, después haga clic en ‘Agregar’ para agregarlo a la lista ‘Archivos para procesar’. O simplemente haga doble clic en el archivo.
Para seleccionar un grupo de archivos, señale el primer archivo, haga clic, mantenga pulsado el botón del ratón y arrástrelo hacia la parte inferior de la lista de archivos. O bien haga clic en el primer archivo y después pulse la tecla Shift y haga clic al mismo tiempo con el ratón en el último archivo. Con el grupo de archivos seleccionados, haga clic en ‘Agregar’ para agregar los archivos a la lista para procesar.
3–12 Guía del usuario TextBridge
Para seleccionar archivos TIFF que no están
en secuencia, haga clic en el primer archivo, después pulse la tecla Control y haga clic al mismo tiempo que mantiene pulsada la tecla Control, y vaya haciendo clic en los archivos que desee de la lista.
Para agregar todos los archivos del directorio actual a la lista para procesar, haga clic en el botón ‘Agregar todo’.
Para agregar archivos de otro directorio, cambie de directorio y agregue los archivos como se ha indicado. Observe que ahora se incluye la ruta de acceso completa a los archivos son agregados en la lista para procesar.
Para eliminar archivos de la lista para procesar, puede seleccionarlos de uno en uno y hacer clic en el botón ‘Eliminar’ o bien puede seleccionar un grupo de archivos como se ha indicado anteriormente y hacer clic en el botón ‘Eliminar’.
Los archivos son procesados en el orden en que han sido agregados a la cola. A
medida que se van agregando archivos, el número de archivos es controlado en la pantalla (Figura 3–7).
Funcionamiento de TextBridge 3–13
número de archivos agregados
los archivos son procesados en el mismo orden en el que fueron agregados
Figura 3–7. Varios archivos TIFF para procesar.
Una vez agregados los archivos, haga clic en Aceptar en el cuadro ‘Abrir’ y TextBridge efectuará el reconocimiento óptico de caracteres de las imágenes de página. Al finalizarse el reconocimiento, TextBridge muestra un cuadro ‘Guardar como’ (remítase a la Figura 3–4).
5. En el cuadro ‘Guardar como’, especifique los datos sobre el archivo de salida.
Especifique el nombre del archivo, el disco de
destino y el directorio.
Especifique también el formato de texto de
salida en el menú ‘Mostrar archivos de tipo’.
Al finalizar haga clic en ‘Aceptar’.
TextBridge convierte el texto reconocido y guarda el texto convertido en un archivo con el nombre especificado y en el disco y directorio también especificados. También se muestra el cuadro principal, preparado para el siguiente trabajo.
3–14 Guía del usuario TextBridge
MUESTRA DE LAS PÁGINAS ANTES DE
PROCESARLAS
Para ver una muestra de la página antes de procesarla, TextBridge muestra la ventana ‘Muestra’ (Figura 3–8).
barra de menú con los comandos ‘Muestra’
caja de herramientas para definir zonas y zoom
página completa ajustada al tamaño de la ventana
Figura 3–8. Ventana ‘Muestra’.
En la ventana ‘Muestra’ pueden usarse las herramientas del zoom de la caja de herramientas ‘Muestra’ para alejar y acercar el zoom en la página a varios niveles de aumento:
Zoom para
acercar
Funcionamiento de TextBridge 3–15
Zoom para
alejar
Con las herramientas del zoom puede aumentar la página a resolución completa, alejar el zoom para que la página se ajuste a la ventana o bien mostrar un tamaño de imagen menor.
Si desea procesar sólo una parte de la página, puede usar la herramienta ‘Zona de texto’ para dibujar hasta 127 zonas rectangulares en varias zonas de la página:
Zona de
texto
Cada zona definida tiene un número que indica el orden en que fueron creadas y el orden en que van a ser generadas en el archivo de salida. Las zonas de solapamiento son opacas; la zona superior es a la que le pertenece el texto en común (de haberlo) con las zonas inferiores.
La herramienta ‘Seleccionar zona’ permite seleccionar las zonas que se han creado:
Seleccionar
zona
Una zona seleccionada se identifica por los delimitadores en las cuatro esquinas. Una vez seleccionada una zona, puede moverla, ajustarle el tamaño o superponerla o solaparla a otra zona.
Durante el procesamiento, las zonas pueden ajustarse página a página o pueden ajustarse las zonas para todas las páginas del documento. Al finalizar el procesamiento, TextBridge borra las zonas.
3–16 Guía del usuario TextBridge
Nota En el siguiente procedimiento se supone que si se está
usando un escáner, éste está correctamente conectado a la PC, encendido y en funcionamiento. También se supone que TextBridge está correctamente instalado y en funcionamiento.
Para mostrar primero un documento antes de procesarlo, siga los pasos siguientes:
1. Si se va a explorar texto, cargue las páginas en el escáner y vaya al paso 2. Si se está procesando un archivo TIFF, empiece en el paso 2.
2. En el cuadro principal, defina la entrada.
Seleccione ‘Archivo’ o ‘Escáner’ en el cuadro
‘Entrada de’ (remítase a las Figuras 3–2 y 3–5).
Haga clic en el cuadro ‘Muestra’ del cuadro
principal.
3. También puede hacer clic en el botón ‘Preferencias’ para definir las opciones para la exploración y del reconocimiento óptico de caracteres.
Use la Tabla 3–1 como guía. Al finalizar con las preferencias, haga clic en ‘Aceptar’ para regresar al menú principal.
Funcionamiento de TextBridge 3–17
4. Haga clic en ‘Empezar’ en el cuadro.
Si el escáner es de tipo TWAIN, aparece la interfaz nativa del escáner que le permitirá explorar. Si el escáner es el modelo ISIS, TextBridge explora automáticamente una página del escáner.
Si las imágenes de página se están leyendo desde uno o más archivos TIFF, TextBridge muestra primero el cuadro ‘Abrir’ (remítase a la Figura 3–6). En el cuadro ‘Abrir’ especifique el nombre del archivo o archivos TIFF, el directorio y la unidad, después haga clic en ‘Aceptar’.
TextBridge abre la ventana ‘Muestra’ y visualiza la primera imagen de página en línea explorada (remítase a la Figura 3–8).
5. Si desea también puede alejar o acercar la imagen de la página.
La página se visualiza primero ajustada al tamaño de la pantalla. Para aumentar la página a resolución completa, abra el menú ‘Ver’ y elija el comando ‘Zoom max’. Para acercar el zoom en la imagen de página, haga clic en el icono ‘Zoom para acercar’ de la caja de herramientas de ‘Muestra’ y haga clic en la página.
Cuando se acerca la página, las barras de desplazamiento se visualizan horizontal y verticalmente (Figura 3–9).
Para alejar el zoom, abra el menú ‘Ver’ y elija el comando ‘Zoom min’. Para alejar el zoom en etapas, haga clic en el icono ‘Zoom para alejar’ y haga clic en la página.
3–18 Guía del usuario TextBridge
zoom para acercar para evaluar la calidad de la imagen
usar las barras para desplazar para deslizar la imagen
Figura 3–9. Página de muestra con ‘Zoom para
acercar’.
6. También puede crear una o más zonas para definir las áreas de la página a ser procesadas.
Pueden definirse hasta 127 zonas:
Haga clic en la herramienta ‘Zona de texto’,
señale a una esquina de la zona a definir, haga clic y mantenga el botón izquierdo del ratón pulsado y arrastre el ratón. Aparecerá un rectángulo de zona a medida que se mueve el ratón.
Funcionamiento de TextBridge 3–19
Cuando tenga la zona definida, suelte el ratón.
Aparece un número de zona en la esquina
superior izquierda y delimitadores en el rectángulo de zona para ajustar el tamaño (Figura 3–10).
El número de zona indica el orden en que van a reconocerse los bloques de texto y el orden en que van a convertirse en el archivo de texto.
Para ajustar el tamaño de una zona, haga clic en el delimitador de una de las esquinas y arrastre el ratón.
Para mover una zona, haga clic y mantenga pulsado el botón dentro de la zona y arrastre el ratón.
Para colocar una zona a una posición relativa a otra zona, asegúrese de que la zona esté seleccionada (los delimitadores están en negro) y después, abra el menú ‘Ver’ y seleccione uno de estos dos comandos ‘Poner al principio’ o ‘Poner al final’.
Las zonas solapadas se visualizan opacas lo que indica que cualquier área de imagen compartida por más de una zona se generará como parte de la zona del principio.
Para eliminar una zona, abra el menú ‘Ver’ y elija el comando ‘Borrar zona’ (o pulse la tecla ‘Suprimir’).
3–20 Guía del usuario TextBridge
número de zona
zona seleccionada con los delimitadores para ajustar el tamaño
Figura 3–10. Zonas en ‘Muestra’.
7. Al acabar de ver una muestra de la página, arranque el proceso de reconocimiento óptico de caracteres.
Abra el menú ‘Procesar’ y seleccione ‘Esta página’ o ‘Todas la páginas’ para arrancar o proseguir con el reconocimiento.
Seleccione ‘Todas las páginas’ para cerrar la
ventana ‘Muestra‘ y procesar todas las páginas del trabajo en las zonas de la página.
Seleccione ‘Esta página’ para ver cada página primero y procesar las páginas individual­mente. TextBridge procesará la primera página, la explorará o leerá y visualizará la próxima página en la ventana ‘Muestra’. TextBridge se detendrá y pasará a modo inactivo. Prosiga desde el paso 5 para ver una muestra de la página visualizada en pantalla.
Funcionamiento de TextBridge 3–21
Al terminar de ver la muestra de la última
página del documento, seleccione el comando ‘Todas las páginas’ para cerrar la ventana ‘Muestra’ y finalizar el reconocimiento del documento.
Una vez completado el reconocimiento, TextBridge visualiza el cuadro ‘Guardar como’ (remítase a la Figura 3–4).
8. Especifique la información para el archivo de salida.
Especifique el nombre del archivo, el disco de
destino y el directorio.
Especifique también el formato de texto de
salida en el menú ‘Mostrar archivos de tipo’.
Al terminar haga clic en ‘Aceptar’.
TextBridge convierte el texto reconocido y lo guarda en un archivo con el nombre especificado y en el disco y directorios también especificados. El cuadro principal permanece preparado para el siguiente trabajo.
3–22 Guía del usuario TextBridge
VERIFICAR TEXTO DURANTE EL RECONOCIMIENTO
Para poder obtener la precisión más exacta durante el reconocimientos incluso en documentos difíciles, TextBridge presenta el verificador de palabras (Figura 3–11).
herramientas para acercar y alejar el área de la imagen
la palabra aparece aquí para ser corregida o para aceptarla
la imagen resaltada se muestra en contexto
Figura 3–11. Ventana ‘Verificador’ de palabras.
El verificador de palabras muestras aquellas palabras dudosas para que puedan ser corregidas y/o verificadas durante el reconocimiento.
Se entiende por palabras dudosas aquellas que están por debajo del nivel de seguridad de TextBridge. Durante el reconocimiento, TextBridge asigna un valor de seguridad a cada palabra. Si el valor está por debajo de este nivel y se está usando el ‘Verificador’, TextBridge mostrará la palabra dudosa.
Al corregir errores y verificar las palabras correctas, se mejora la exactitud del reconocimiento para el resto del documento. TextBridge usa las verificaciones y correcciones para mejorar el reconocimiento a medida que va reconociendo páginas.
Funcionamiento de TextBridge 3–23
La ventana ‘Verificador’ ilustrada en la Figura 3–11, es muy similar a la ventana ‘Muestra’. En una parte de la ventana ‘Verificador’, TextBridge visualiza una muestra de la imagen de la página en zoom con la palabra dudosa seleccionada para que pueda verse en contexto.
Encima del área de la imagen, las herramientas del zoom permiten acercar o alejar la imagen de la página:
Zoom para
acercar
Zoom para
alejar
Al lado de la caja de herramientas está la casilla de edición con la palabra reconocida, que está realzada
para poder ser corregida o bien verificada. A la derecha de la casilla de edición están los botones ‘Aceptar’ y ‘Deshacer’.
Para verificar palabras durante el reconocimiento, siga los pasos siguientes.
Nota En el siguiente procedimiento se supone que si se está
usando un escáner, éste está correctamente conectado a la PC, encendido y en funcionamiento. También se supone que TextBridge está correctamente instalado y en funcionamiento.
1. Si se va a explorar texto, cargue las páginas en el escáner y vaya al paso 2. Si se está procesando un archivo TIFF, empiece en el paso 2.
3–24 Guía del usuario TextBridge
2. En el cuadro principal, defina la entrada.
Seleccione ‘Archivo’ o ‘Escáner’ en el cuadro
‘Entrada de’ (remítase a las Figuras 3–2 y 3–5).
Haga clic en la casilla ‘Verificador’ del cuadro
principal.
3. También puede hacer clic en el botón ‘Preferencias’ para definir las opciones para la exploración y el reconocimiento óptico de caracteres.
Use la Tabla 3–1 como guía. Al finalizar con las preferencias, haga clic en ‘Aceptar’ y regresar al menú principal.
4. Haga clic en ‘Empezar’ en el cuadro.
Si el escáner es de tipo TWAIN, aparece la interfaz nativa del escáner y puede efectuar la exploración desde esta interfaz. Si el escáner es de tipo ISIS, TextBridge explora automáticamente una página del escáner.
Si las imágenes de página se están leyendo desde uno o más archivos TIFF, TextBridge muestra primero el cuadro ‘Abrir’ (remítase a la Figura 3–6). En el cuadro ‘Abrir’ especifique el nombre del archivo o archivos TIFF, el directorio y la unidad, después haga clic en ‘Aceptar’.
TextBridge empieza el reconocimiento. Cuando encuentra una palabra dudosa, abre la ventana ‘Verificador’ y muestra la palabra realzada en la casilla de edición ‘Palabra’ (remítase a la Figura 3–11). Debajo de la casilla de edición, la ventana ‘Verificador’ muestra la imagen de la palabra en contexto.
Funcionamiento de TextBridge 3–25
5. Verifique y/o corrija la palabra dudosa en la casilla de edición Palabra y después haga clic en el botón ‘Aceptar’.
De equivocarse durante la verificación, haga
clic en el botón ‘Deshacer’. La casilla de edición restaura la última palabra editada. Ahora puede corregir el error.
Con el comando ‘Verificar’ puede controlarse también la frecuencia de las palabras dudosas para verificar. Esta opción tiene cinco asignaciones posibles. Abra el menú Procesar, seleccione el comando Verificar y del menú seleccione una de las asignaciones: ‘Máximo’, ‘Más’, ‘Normal’, ‘Menos’, ‘El mínimo’. Al seleccionar el ‘Máximo’ o ‘Más’ van a mostrarse más palabras para su verificación. Al seleccionar ‘Menos’ o ‘El mínimo’, se mostrarán menos palabras. El valor predeterminado es ‘Normal’.
Algunos documentos contienen caracteres que no están en el teclado de la computadora (acentos, símbolos, etc.). Para verificar estos caracteres, abra el menú ‘Ver’ y seleccione ‘Mostrar caracteres especiales’ para visualizar el teclado de caracteres especiales. Para introducir un carácter especial en la casilla de edición ‘Palabra’, seleccione el carácter o caracteres del teclado y haga clic con el ratón (Figura 3–12).
hacer clic en una tecla para introducir el carácter
Figura 3–12. Teclado de caracteres especiales.
3–26 Guía del usuario TextBridge
A veces TextBridge confunde la suciedad
(marcas en la página) o líneas horizontales y los interpreta texto. En la casilla de edición de la ventana ‘Verificador’ se muestran caracteres mientras que en el área de imagen está realzado el carácter que no es texto (como líneas o marcas en la página). En estos casos, elimine el texto mostrado en la casilla de edición ‘Palabra’ y después haga clic en ‘Aceptar’. TextBridge ignora la suciedad y prosigue con la siguiente palabra dudosa.
Si la imagen de una palabra en particular no es clara en comparación con el resto del documento, es mejor necsario corregir el texto sin indicarle a TextBridge que dicha palabra es dudosa. Corrija la palabra en la casilla de edición ‘Palabra’ y después mantenga pulsada la tecla Control y pulse la tecla Intro (o haga clic en ‘Aceptar’). El texto se corrige sin que se haya indicado al sistema TextBridge que la palabra era dudosa.
La zona de imagen en la ventana ‘Verificador’ se visualiza con el zoom para acercar a medio rango. Si desea saber el lugar de la página donde está situada la palabra para verificar, haga clic en el icono ‘Zoom para alejar’ y después haga clic dentro de la zona de imagen del ‘Verificador’. Aparece la imagen de página completa en la zona de imagen de la ventana ‘Verificador’. Si por el contrario desea aumentar la muestra, use el icono ‘Zoom para acercar’.
Funcionamiento de TextBridge 3–27
6. Repita el paso 5 hasta haber verificado suficientes palabras.
Verifique como mínimo una página en un
documento con varias página para preparar el sistema para tratar todo el documento.
7. Cierre el ‘Verificador’.
Abra el menú ‘Procesar’ y seleccione el comando ‘Terminar verificación’.
El comando ‘Cerrar’ del menú de control en la
ventana ‘Verificador’ es equivalente al comando ‘Terminar verificación’.
La ventana ‘Verificador’ se cierra y el reconocimiento prosigue automáticamente. Al finalizar el reconocimiento en todas las páginas, TextBridge visualiza el cuadro ‘Guardar como’ (remítase a la Figura 3–4).
8. Especifique los datos del archivo de salida.
Especifique el nombre del archivo, el disco de
destino y el directorio.
Especifique también el formato de texto de
salida en el menú ‘Mostrar archivos de tipo’.
Al terminar haga clic en ‘Aceptar’.
TextBridge convierte el texto reconocido y lo guarda en un archivo con el nombre especificado y en el disco y directorios también especificados. El cuadro principal permanece preparado para el siguiente trabajo.
3–28 Guía del usuario TextBridge
SUGERENCIAS Y TÉCNICAS
4
En los tres primeros capítulos de esta guía se proporciona información sobre la instalación del sistema y sobre las funciones básicas que permiten familiarizarse con el funcionamiento de TextBridge.
En este capítulo se describen los métodos para mejorar el resultado del reconocimiento en TextBridge. Más concretamente se tratan los siguientes temas:
Cómo obtener un reconocimiento de texto excelente.
Sugerencias para un procesamiento más eficaz.
Guardar imágenes de página.
Ejecutar TextBridge OCR desde otras aplicaciones.
CÓMO OBTENER UN RECONOCIMIENTO DE TEXTO
EXCELENTE
El software TextBridge OCR permite obtener el mejor reconocimiento de caracteres en una gran variedad de documentos. Sin embargo, existen algunas acciones que pueden ayudarle a obtener el mejor reconocimiento de caracteres posible para un documento en particular.
Guía del usuario TextBridge 4–1
En esta sección se ofrecen algunas sugerencias para mejorar el reconocimiento de texto. A continuación se indican los temas que van a tratarse:
Uso y mantenimiento del escáner.
Ajustar el brillo del escáner.
Ajustar los colores.
Los filtros de fax.
Procesar varios documentos por separado.
El verificador de palabras.
El comando ‘Invertir’ en ‘Muestra’.
Uso y mantenimiento del escáner
El uso y mantenimiento que se haga del escáner puede suponer una gran diferencia en la calidad de la exploración:
Conocer el escáner. Lea detenidamente y documentación del escáner.
Mantenimiento del escáner. Mantenga el escáner limpio y sin polvo. El lector de vidrio (superficie plana) del escáner debe mantenerse limpio y sin marcas que puedan ser captadas durante la exploración.
4–2 Guía del usuario TextBridge
ajustar las guías para ajustar el documento y evitar que la página se mueva
Cargar el escáner correctamente. Asegúrese explorar el documento no de lado. Esto dificulta el reconocimiento de caracteres.
Si se usa un alimentador de documentos automático, asegúrese de que las guías estén alineadas correctamente con las páginas que se están explorando (Figura 4–1).
Si se usa la superficie plana, asegúrese de que la imagen de página está bien alineada con la superficie. Algunas veces la imagen está torcida en relación con el resto del texto de la página. Corrija este tipo de problema tanto como sea posible antes de empezar la exploración.
Figura 4–1. Colocación de la página en el escáner.
Sugerencias y técnicas 4–3
Ajustar el brillo del escáner
Durante la exploración, una de las asignaciones más importantes y que afecta el resultado del reconocimiento de caracteres es el brillo del escáner. Como se ilustra en la Figura 4–2, la calidad de los documentos puede variar considerablemente.
Tanto la oscuridad del texto, la claridad del fondo y la cantidad de suciedad en la página (manchas, tinta corrida, huellas, escritura a mano y otras marcas) pueden afectar la precisión del reconocimiento de caracteres.
tipo de letra manchada; aumentar el brillo
tipo de letra sobre un fondo oscuro; aumentar el brillo
tipo de letra delgado y claro; disminuir el brillo
Figura 4–2. Documentos originales y brillo.
Desde el cuadro ‘Parámetros del escáner’ (Figura 4–3), puede ajustarse el brillo para compensar la calidad de la impresión y el fondo del documento. Los ‘Parámetros del escáner’ se acceden a partir del cuadro ‘Preferencias’.
4–4 Guía del usuario TextBridge
ajustar el brillo para mejorar el reconocimiento
Si los caracteres impresos son demasiado oscuros, están muy juntos, son borrosos o están separados por un espacio muy pequeño (como en algunas revistas) seleccione el nivel de brillo ‘Más claro’. El reconoci­miento de caracteres en documentos con manchas en el fondo o con el fondo de color, puede mejorar considerablemente aumentando la asignación de brillo.
Figura 4–3. Asignaciones de brillo del escáner.
Seleccione un nivel de brillo ‘Más oscuro’ si los caracteres de la página están poco perfilados, aparecen quebrados o son muy finos.
Si el escáner respalda el brillo automático, seleccione este parámetro para obtener el mejor nivel de brillo en cada página de un documento.
Otra forma de saber si el brillo es adecuado o no para el texto que se está explorado es mostrar primero la página y acercar la imagen a una resolución completa en la ventana ‘Muestra’. Esto permite ver la salida del escáner que “ve” el sistema (Figura 4–4). Si la imagen mostrada no parece tener el brillo adecuado, puede ajustar este parámetro y volver a explorar el documento.
Sugerencias y técnicas 4–5
la página es oscura; aumente el brillo y vuelva a explorar
Figura 4–4. Ampliación de la página en ‘Muestra’.
Ajustar los colores
Todo escáner tiene uno o varios colores que no puede leer. Estos son llamados colores omitidos. Remítase a la documentación del escáner para determinar los colores omitidos de su escáner.
Si en la documentación del escáner no se
especifican los colores omitidos, examine el color de la luz del escáner al moverse por la superficie plana del escáner. El color de la luz determina el color omitido. Muchos escáneres tienen una luz verde pálida. Entonces, el color omitido es el verde pálido.
Además de los colores omitidos, puede haber otros colores con los que el escáner tenga problemas. Si el texto (o imagen) que se está explorando es de color o si está impreso sobre un fondo de color, intente ajustar la asignación de brillo.
4–6 Guía del usuario TextBridge
Si todavía no obtiene el resultado adecuado, intente
torcidas
fotocopiar la página y explorar la copia en blanco y negro.
Los filtros de fax
Una de las funciones de TextBridge es la de reconocer el texto en imágenes de fax. Las imágenes de fax son comúnmente de baja resolución (100 por 200, 200 por 100 ó 200 por 200 puntos por pulgada). Incluso los fax con una “Alta resolución” de 200 por 200 ppp son por lo general sólo leíbles parcialmente (Figura 4–5).
las imágenes de fax tienen una resolución baja y a menudo están
Figura 4–5. Imagen de fax.
Para reconocer imágenes de fax, TextBridge proporciona la asignación ‘Fax’ en el cuadro ‘Preferencias’. Este filtro de ‘Calidad del documento’ efectúa un paso previo al procesamiento que mejora la imagen de fax antes de efectuar el reconocimiento.
El interruptor de fax funciona en imágenes de fax almacenadas en archivos TIFF y en fax impresos explorados en resoluciones más altas (por ejemplo, 300 ppp).
Sugerencias y técnicas 4–7
Nota No use el filtro ‘Fax’ en otros documentos explorados o
en línea que no sean fax. De hacerlo, la exactitud del reconocimiento puede verse afectado. Si observa que el reconocimiento no es de gran calidad en imágenes de fax sintetizadas (por ejemplo, un documento creado en una aplicación de procesamiento de palabras “impreso” en un módem fax) desactive el filtro ‘Fax’ e intente verificar parte del texto durante el reconocimiento.
Procesar varios documentos por separado
El software TextBridge OCR usa una gran variedad de técnicas de inteligencia artificial para reconocer texto.
Con estas técnicas, TextBridge se instruye así mismo sobre lo que está reconociendo.
De este modo, TextBridge mejora la precisión del reconocimiento y la velocidad a medida que avanza la exploración y el reconocimiento de las páginas del documento.
Sin embargo, esta capacidad de aprender puede verse afectada si se procesan páginas de distintos documentos al mismo archivo de salida.
TextBridge espera la segunda página y las siguientes de un documento tengan el mismo tipo de letra que la reconocida en la primera página (Figura 4–6).
4–8 Guía del usuario TextBridge
procesar estas páginas como un documento
procesar estas páginas como tres documentos separados
Figura 4–6. Procesamiento de varios documentos.
Si la segunda página es un documento totalmente distinto con distintos tipos de letra y tamaño, el conocimiento adquirido sobre el texto en la primera página ya no es válido.
TextBridge debe volver a empezar el proceso de aprendizaje de nuevo para la segunda página (y sucesivas).
Si desea explorar varios documentos y obtener los mejores resultados, explore cada documento como documentos separados.
Sugerencias y técnicas 4–9
El verificador de palabras
Si el resultado obtenido en un documento en particular, no es satisfactorio use el verificador de palabras par mejorar la exactitud del reconocimiento.
Cuando el usuario interactúa con el proceso OCR en la ventana ‘Verificador’ (Figura 4–7), se está enseñando a TextBridge a reconocer los caracteres y palabras del documento. Esto mejorará la exactitud del reconocimiento.
verificar el texto para aumentar la precisión
Figura 4–7. Ventana ‘Verificador’.
Cada palabra que TextBridge es incapaz de reconocer claramente se muestra en la casilla de edición ‘Palabra’ en la parte superior de la ventana ‘Verificador’. La imagen de la palabra está resaltado en contexto en la parte inferior.
Con el ‘Verificador’ puede examinar el texto reconocido y aceptar o corregir las decisiones tomadas por TextBridge. Esto ayuda a TextBridge a mejorar el reconocimiento del texto a medida que avanza el documento.
Por lo general en un documento de varias páginas, se verifican una o dos páginas y después se finaliza la verificación. A partir de este momento TextBridge usará las correcciones y verificaciones del usuario para tomar decisiones más acertadas en el resto del documento.
4–10 Guía del usuario TextBridge
Para obtener el mejor resultado en documentos con pocas páginas, puede verificarse el documento completo.
Para más información sobre cómo usar el verificador de palabras y sus opciones, remítase al capítulo 3.
El comando Invertir en Muestra
TextBridge es capaz de reconocer archivos TIFF en línea provenientes de módem fax o de otras fuentes.
A veces, los datos de imagen son guardados con los elementos de la foto (pixels) invertidos en el archivo resultante: el fondo de la página blanco es negro y la impresión es blanca. Esto suele suceder en archivos Intel FAXability.
TextBridge no puede reconocer estos archivos. Para poder reconocer un archivo TIFF en línea es necesario que la imagen contenga el texto en negro sobre un fondo blanco.
Para poder efectuar un reconocimiento de archivos con imágenes invertidas, TextBridge proporciona el comando ‘Invertir’ en el menú ‘Ver’ de la ventana ‘Muestra’ (Figura 4–8).
invertir las páginas al revés antes de efectuar el reconocimiento
Figura 4–8. Invertir un documento.
Sugerencias y técnicas 4–11
Si no está seguro de si el archivo está invertido o no, visualícelo en la ventana ‘Muestra’ antes de empezar el reconocimiento. Si se muestra con el texto en blanco sobre un fondo negro, abra el menú ‘Ver’ y haga clic en el comando ‘Invertir’. TextBridge invierte la imagen.
Ahora ya puede empezar el proceso de reconocimiento. Observe que la inversión debe efectuarse manual­mente para cada archivo TIFF almacenado de esta forma.
Para más información sobre el uso de ‘Muestra’, remítase al capítulo 3.
SUGERENCIAS PARA UN PROCESAMIENTO MÁS
EFICAZ
Al principio de usar TextBridge, quizás le sea más fácil explorar un documento sin ajustar las preferencias predeterminadas. Las preferencias predeterminadas proporcionan muy buenos resultados en la mayoría de casos.
Sin embargo si desea obtener un rendimiento inmejorable, siga las sugerencias que se indican a continuación:
use la herramienta de zona en ‘Muestra’.
use la asignación ‘Ignorar fotos/medios tonos’.
use la orientación de página automática cuando sea necesario.
use la segmentación automática para documentos con varias columnas.
Usando estas prestaciones se asegura que el sistema va a procesar únicamente las partes de una página que son esenciales y las procesa correctamente.
A largo plazo estas prestaciones pueden ahorrarle mucho tiempo.
4–12 Guía del usuario TextBridge
Definir una zona para capturar sólo los datos deseados
Algunos documentos pueden contener logotipos, gráficos, encabezados y pies de página, así como otros elementos de página que no son necesarios captar y que hacen que el sistema vaya más despacio.
Con la herramienta para definir zonas de la ventana ‘Muestra’, puede identificarse la parte de la página que desea capturar (Figura 4–9).
Remítase al capítulo 3 para más información sobre cómo usar las herramientas de muestra.
definir zona para procesar sólo el texto que desee
Figura 4–9. Definición de una zona en ‘Muestra’.
Sugerencias y técnicas 4–13
La opción Ignorar fotos/medios tonos
En un documento impreso, una fotografía de medios tonos está compuesta por puntos negros de distintos tamaño. Normalmente, TextBridge tarda bastante tiempo ya que intenta reconocer los puntos de medios tonos como si fueran texto.
Eventualmente, TextBridge reconocer que ha estado intentando reconocer medios tonos y cesa de hacerlo. Para agilizar el proceso de reconocimiento en textos que contienen medios tonos, puede desactivarse la definición ‘Ignorar fotos/medios tonos’ antes de empezar el reconocimiento.
Con la opción ‘Ignorar fotos/medios tonos’ activada, TextBridge explora rápidamente la imagen de página y oculta los medios tonos antes de empezar el reconocimiento de caracteres (Figura 4–10). De esta forma se agiliza el reconocimiento de caracteres a la vez que se hace más eficiente.
TextBridge intenta reconocer los medios tonos como texto
con el filtro, los medios tonos son eliminados antes de empezar el reconocimiento
Figura 4–10. El filtro ‘Ignorar fotos/medios tonos’.
Para usar la opción ‘Ignorar fotos/medios’ tonos, seleccione el botón ‘Preferencias’ del menú principal. En el cuadro ‘Preferencias’, haga clic para marcar la casilla ‘Ignorar fotos/medios tonos’.
4–14 Guía del usuario TextBridge
Aunque el procedimiento de filtrar las fotos y los
medios tonos sea muy rápido, no desactive la opción si no contiene medios tonos.
La orientación automática de página
TextBridge proporciona una herramienta que determina automáticamente la orientación de una página, la gira en memoria de ser necesario y después empieza el reconocimiento (Figura 4–11).
Especifique ‘Orientación automática de página’ en el cuadro ‘Preferencias’ al que puede accederse a partir del cuadro principal. Esta opción puede ser de utilidad en casos como:
Orientamento verticale (lato in su o capovolto)
Orientamento orizzontale (pagina ruotata più o meno di 90 gradi)
o
o
Figura 4–11. La orientación de página automática.
al procesarse documentos con páginas con varias orientaciones.
al procesarse un archivo TIFF y no se sabe con certeza la orientación de la imagen que contiene.
En el primer caso, podría procesarse un documento cuyas páginas fueran en su mayoría verticales y algunas horizontales.
Sugerencias y técnicas 4–15
TextBridge explora cada página, determina si es vertical, horizontal (90 grados o 270 grados) o bien si la página está invertida, de ser este el caso la gira (0 grados), antes de empezar el reconocimiento.
En el segundo caso, si la imagen TIFF que se va a reconocer está de lado o invertida, TextBridge la girará correctamente y después efectuará el reconocimiento.
La orientación automática es un paso del
procesamiento que tiene lugar antes del reconocimiento. Por lo que para obtener el reconocimiento más rápido, use la orientación automática sólo cuando sea necesario.
La segmentación automática de página
TextBridge proporciona una herramienta que ubica automáticamente las regiones de texto en la página, define el orden y después efectúa el reconocimiento. Esta función de segmentación de página automática es crítica para el reconocimiento de páginas que tiene más de una columna y/o disposiciones de página poco comunes (Figura 4–12).
la segmentación automática analiza la distribución de la página
después, identifica y ordena las regiones
Figura 4–12. Segmentación de página y disposición
de las regiones.
4–16 Guía del usuario TextBridge
Importante Es necesario activar la segmentación de página si
van a procesarse páginas con más de una columna de texto. De lo contrario, TextBridge puede generar regiones de texto reconocido en el orden incorrecto. No utilice la segmentación de página automática en documentos con una sola columna.
La segmentación de página es un estado previo al procesamiento y ocurre antes de empezar el reconocimiento.
Observe que puede crearse una zona en ‘Muestra’ y usar la segmentación de página. La segmentación de página funcionará únicamente dentro de la zona. Por ejemplo, si se dibuja una zona alrededor de dos columnas en una página de tres columnas, la segmentación de página detectará y colocará en orden las dos columnas antes de empezar el reconocimiento.
Sugerencias y técnicas 4–17
GUARDAR IMÁGENES DE PÁGINA
Una de las opciones de las casillas de verificación en el cuadro principal es ‘Guardar imagen de página’. Esta opción, disponible al definir ‘Entrada’ por ‘Escáner’, permite guardar una imagen binaria (blanco y negro) de cada página explorada durante la sesión de reconocimiento óptico de caracteres de TextBridge.
Nota TextBridge guarda las imágenes de página como
archivos TIFF con compresión CCITT Group 3. Group 3 es un estándar especificado por CCITT (siglas de Comité Consultivo Internacional de Telefonía y Telegrafía), organización de estándares internacionales.
Al hacer clic sobre ‘Empezar’ y explorarse la primera página, TextBridge visualiza el cuadro ‘Guardar imagen de página como’ (Figura 4–13).
Figura 4–13. Cuadro ‘Guardar imagen de página
El cuadro ‘Guardar imagen de página como’ es muy parecido al cuadro ‘Guardar como’ estándar de Windows en el cual puede especificarse un nombre de archivo, el tipo de archivo, el directorio de salida y la unidad de disco.
4–18 Guía del usuario TextBridge
como’.
El nombre del archivo es el nombre base sobre el que se crea los nombres del archivo de imagen de página. También es el nombre del documento predeterminado que aparece en el cuadro ‘Guardar como’ de TextBridge cuando se ha completado el reconocimiento. El nombre del archivo es títular con la extensión .tif.
Por ejemplo, supongamos que se ha especificado el nombre “guía” en el cuadro ‘Guardar imagen de página como’. Los archivos de imagen de página van a guardarse con un nombre en el formato:
guiannnn.TIF
donde nnnn es el número de página del documento precedido de ceros (por ejemplo, 0001, 0002 etc.).
Los archivos de imagen se les asigna un nombre secuencial dentro del directorio. Si ya existe un archivo con el mismo nombre (por ejemplo, “guia0001.tif”), TextBridge asignará un nombre con el número siguiente.
Al finalizar el trabajo, el nombre del documento (por ejemplo “guia”) se visualiza automáticamente en la casilla ‘Nombre de archivo’ del cuadro ‘Guardar como’.
En el cuadro ‘Guardar imagen de página’, el directorio de trabajo inicial es el directorio desde el que se lanza la aplicación TextBridge:
C:\TXBRIDGE\BIN
Sin embargo puede especificarse cualquier otra unidad de disco y directorio al cual almacenar las imágenes de página. Este será ahora el nuevo directorio de trabajo para este trabajo y como el nombre del documento, va a visualizarse en el cuadro ‘Guardar como’ al finalizar el reconocimiento.
Sugerencias y técnicas 4–19
Para el formato de archivos de imagen de página, el menú ‘Mostrar archivos de tipo’ proporciona una sola selección, TIFF CCITT-3 Intel. Las imágenes de página son guardadas exactamente de la misma manera que son exploradas en formato binario (blanco y negro).
Observe que si se selecciona ‘Cancelar’ en el cuadro ‘Guardar imagen de página como’, el cuadro se cierra y TextBridge finaliza el trabajo. El cuadro principal permanece listo para empezar de nuevo. Por ejemplo, si no desea guardar las imágenes de página, puede desactivar la opción ‘Guardar imagen de página’ y volver a empezar el trabajo.
EJECUTAR TEXTBRIDGE DESDE OTRAS
APLICACIONES
TextBridge OCR para Windows es un grupo de aplicaciones que permiten ejecutar OCR desde cualquier aplicación Windows.
Además de la utilidad principal que se ejecuta como un programa independiente y es además el más completo, TextBridge OCR se proporciona en otros dos formatos:
Servidor de aplicaciones TextBridge, programa que actúa con un elemento de menú desde cualquier aplicación de texto Windows (tratamiento de texto, programas de edición electrónica, hoja electrónica, bases de datos, etc.).
Impresora TextBridge OCR (TextBridge OCR Printer), capacidad que permite enviar una imagen en cualquier formato a una versión de TextBridge OCR que funciona como un controlador de impresión común.
4–20 Guía del usuario TextBridge
En esta sección se proporciona información sobre el uso de TextBridge OCR en estos formatos.
Nota TextBridge respalda también la interfaz DDE. Si
desea más información póngase en contacto con el servicio técnico de Xerox Imaging Systems.
El Servidor de aplicaciones TextBridge
El ‘Servidor de aplicaciones TextBridge’ es un programa Windows que puede “anexarse” a otras aplicaciones de texto Windows por lo que puede ejecutarse desde Windows.
Una vez anexado, aparece el servidor de aplicaciones TextBridge en el menú ‘Archivo’ de la aplicación principal como el comando ‘TextBridge OCR’. Al seleccionar ‘TextBridge OCR’, aparece el cuadro de dialogo principal de TextBridge como si fuera un cuadro de la aplicación principal. Desde aquí puede instalarse y arrancar OCR como si estuviera en el programa TextBridge.
Arrancar el Servidor de aplicaciones TextBridge e inscribir las aplicaciones
El ‘Servidor de aplicaciones TextBridge’ se instala durante la instalación de TextBridge como se describe en el capítulo 2 de esta guía.
Sugerencias y técnicas 4–21
hacer doble clic para arrancar el programa
Al finalizar la instalación, el programa crea un grupo de programas TextBridge OCR que incluye el elemento ‘Servidor de aplicaciones TextBridge’ (Figura 4–14).
Figura 4–14. Elemento ‘Servidor de aplicaciones
TextBridge’.
Antes de poder ejecutar el ‘Servidor de aplicaciones TextBridge’ desde una aplicación, es necesario iniciar el programa e inscribir la aplicación.
1. Haga doble clic en el elemento ‘Servidor de aplicaciones TextBridge’ del grupo TextBridge OCR.
El programa se inicializa y aparece como un icono minimizado en el escritorio Windows.
2. Haga doble clic en el icono del escritorio Windows.
Aparece el cuadro para inscribir el ‘Servidor de aplicaciones TextBridge’ (Figura 4–15).
4–22 Guía del usuario TextBridge
seleccionar la aplicación no registrada
después, haga clic en ‘Agregar’
Figura 4–15. Cuadro de inscripción del servidor.
3. Inscriba la aplicación de ser necesario.
En la parte superior del cuadro de inscripción,
señale la aplicación que desea registrar.
Haga clic en el botón ‘Agregar’ para agregar la
aplicación a la lista de ‘Aplicaciones inscritas’ en la parte inferior de la pantalla.
Al finalizar la inscripción de las aplicaciones,
haga clic en ‘Aceptar’.
Ahora ya puede usar TextBridge OCR desde la aplicación inscrita.
Ejecutar el Servidor de aplicaciones TextBridge desde la aplicación
En el menú ‘Archivo’ de cualquier aplicación inscrita activa, el comando ‘TextBridge OCR’ aparece como el último comando antes del comando ‘Salir’.
Nota Para que el ‘Servidor de aplicaciones TextBridge’
funcione, la aplicación principal debe tener un menú ‘Archivo’ y aquí un comando ‘Salir’. La mayoría de aplicaciones Windows usan este estándar.
Sugerencias y técnicas 4–23
hacer clic para visualizar el cuadro principal
Como ejemplo, en la Figura 4–16 se muestra el comando ‘TextBridge OCR’ en el menú ‘Archivo’ de Microsoft Write®.
Figura 4–16. El comando ‘TextBridge OCR’.
Para ejecutar ‘Servidor de aplicaciones TextBridge’ e importar el texto reconocido directamente en el documento abierto de la aplicación principal, siga los pasos descritos a continuación.
1. Arrancar el ‘Servidor de aplicaciones TextBridge’.
Haga doble clic en el elemento de programa en el grupo ‘TextBridge OCR’ (remítase a la Figura 4–14).
Para arrancar el ‘Servidor de aplicaciones
TextBridge’ automáticamente al arrancar Windows, colóquelo en el grupo ‘Inicio’.
2. Asegúrese de que la aplicación principal esté inscrita.
Remítase al procedimiento de la sección anterior “Arrancar el Servidor de aplicaciones TextBridge e inscribir las aplicaciones”.
4–24 Guía del usuario TextBridge
3. Arrancar la aplicación.
Abra un nuevo documento o uno ya existente desde la aplicación principal a la cual desea importar el texto reconocido.
4. Abra el menú ‘Archivo’ de la aplicación principal y seleccione el comando ‘TextBridge OCR’.
Aparecen los mensajes de estado:
Los servicios TextBridge se están conectando...
Los servicios TextBridge se han conectado.
Aparece el cuadro principal TextBridge.
5. Configure y arranque OCR desde el cuadro principal.
En el cuadro principal, elija ‘Archivo’ o ‘Escáner’ como fuente de entrada, especifique las ‘Preferencias’ y continúe como si estuviera usando TextBridge como una aplicación independiente y guarda el texto reconocido en una aplicación de tratamiento de textos o cualquier otros formato de texto.
Las funciones de ‘Muestra’, ‘Verificador’ y
‘Guardar imágenes de página’ no están disponibles en la versión de ‘Servidor de aplicaciones TextBridge’. Si necesita estas funciones, ejecute TextBridge como una aplicación individual y guarde el texto reconocido en la aplicación de tratamiento de texto que desee.
Remítase al capítulo 3 para más información sobre cómo usar TextBridge; remítase a las secciones anteriores de este capítulo para sugerencias y técnicas.
Sugerencias y técnicas 4–25
Al completarse el reconocimiento, el ‘Servidor de aplicaciones TextBridge’ se cierra y el texto reconocido aparece en la posición del cursor en el documento abierto de la aplicación seleccionada listo para ser editado.
El ‘Servidor de aplicaciones TextBridge’ usa el
La impresora OCR
En los otros formatos, TextBridge OCR para Windows puede reconocer los archivos de imagen sólo si están almacenados en formato TIFF. Ciertas aplicaciones y en particular algunos programas de fax, almacenan las imágenes de página de fax sólo en PCX, DCX o en otro formato de propiedad.
portapaples Windows para cortar y pegar el texto reconocido a la aplicación en formato
RTF (siglas de Rich Text Format) en texto ASCII. Si la aplicación respalda el formato
RTF pegado del portapapeles, entonces se utiliza RTF. De lo contrario, el texto reconocido es pegado como texto y se pierde el formato (negrita, itálica, etc.).
Para ejecutar el OCR en imágenes que no son TIFF, puede usarse la impresora TextBridge OCR. Ésta está diseñada para que aparezca en las aplicaciones Windows como cualquier otra impresora. Permite “imprimir” una imagen desde una aplicación Windows y producir un archivo de texto reconocido y formateado.
Uno de los usos más comunes de la impresora OCR es reconocer una imagen de página directamente desde una aplicación de fax o de imagen. La impresora OCR es similar al modelo de los programas fax que usan una función similar para enviar fax. Esto es, la imagen de fax es “impresa” al módem fax y enviada a otro módem fax o a otra máquina de fax.
4–26 Guía del usuario TextBridge
La impresora OCR ofrece la ventaja de poder reconocer virtualmente cualquier formato de imagen (DCX, PCX, Corel, TIFF, etc.). Cualquier programa diseñado para gestionar imágenes puede usar la impresora OCR.
Para poder usar la impresora OCR, remítase a la siguiente sección “Agregar la impresora OCR”. Después remítase a “Usar la impresora OCR en una aplicación de imagen” para más instrucciones sobre cómo enviar una imagen y produce un archivo de texto.
Agregar la impresora OCR
Los archivos de programa de la impresora OCR son instalados cuando se instala la aplicación principal TextBridge.
Sin embargo, como con los controladores de impresora actuales, es necesario agregar la impresora OCR a la lista de impresoras disponibles a las aplicaciones Windows de la PC.
En este procedimiento se supone que ya se ha instalado TextBridge como se describe en el capítulo 2.
1. Desde el ‘Administrador de programas’ Windows, abra el grupo de programas principal y haga doble clic en el icono del ‘Panel de control’:
Se abre la ventana ‘Panel de control’ con los iconos de varios elementos del sistema.
Sugerencias y técnicas 4–27
hacer clic para ver la lista de impresoras
2. Haga doble clic en el icono ‘Impresoras’ en la ventana ‘Panel de control’.
Esto abre el cuadro ‘Impresoras’ de Windows (Figura 4–17).
Figura 4–17. Cuadro ‘Impresoras’.
3. Haga clic en el botón ‘Agregar’ del cuadro ‘Impresoras’.
El cuadro se expande y muestra la lista de impresoras que pueden agregarse.
4. Señale el elemento siguiente de la lista y después haga clic en el botón ‘Instalar’.
Instalar impresora actualizada o no listada
Esta acción muestra el cuadro ‘Instalar controladores’ en el cual se le indica que especifique la unidad y directorio del controlador de impresión.
4–28 Guía del usuario TextBridge
hacer clic para agregar la impresora OCR
5. En el cuadro ‘Instalar controladores’, introduzca la ruta de acceso al directorio TextBridge BIN:
c:\txbridge\bin
6. Haga clic en ‘Aceptar’ (o presione Intro).
Esto visualiza el cuadro ‘Agregar impresora actualizada o no listada’ (Figura 4–18).
Figura 4–18. Cuadro ‘Agregar impresora actualizada
o no listada’.
7. Seleccione la entrada de impresora OCR y haga clic en ‘Aceptar’.
El cuadro ‘Agregar impresora actualizada o no listada’ se cierra y el cuadro ‘Impresoras’ permanece abierto.
8. Haga clic en ‘Cerrar’ en el cuadro ‘Impresoras’ para finalizar el proceso de agregar.
Ahora puede usar la impresora OCR de TextBridge como se describe en la próxima sección.
Sugerencias y técnicas 4–29
Loading...