ABBYY Recognition Server - 3.0 Manual del Administrador del Sistema [es]

ABBYY
Manual del administrador del sistema
Recognition Server
3.0
Manual del administrador del sistema ABBYY Recognition Server 3.0
Tabla de contenido
Introducción ................................................................................... 4
Arquitectura ................................................................................... 5
Componentes principales.................................................................................................................................................................................................................... 5
Administrador de servidores................................................................................................................................... 5
Estación de digitalización....................................................................................................................................... 5
Estación de procesamiento ..................................................................................................................................... 5
Estación de verificación .......................................................................................................................................... 6
Estación de indización............................................................................................................................................ 6
Consola de administración remota ........................................................................................................................ 6
API basada en COM................................................................................................................................................ 6
Servicio web............................................................................................................................................................ 6
Componentes adicionales ...................................................................................................................................................................................................................6
Conector de Google Search Appliance..................................................................................................................... 6
IFilter de Microsoft Search....................................................................................................................................... 6
Flujos de trabajo, trabajos y documentos................................................................................................................................................................................. 6
Flujo de trabajo del documento...................................................................................................................................................................................................... 7
Escalabilidad..................................................................................................................................................................................................................................................9
Tolerancia a errores ..............................................................................................................................................................................................................................10
Herramientas de integración.......................................................................................................................................................................................................... 10
Scripts.................................................................................................................................................................... 10
Vales XML.............................................................................................................................................................. 10
API abierta............................................................................................................................................................ 10
Conector de Google Search Appliance ................................................................................................................................................................................... 11
IFilter para Microsoft Office SharePoint Server y Windows Desktop Search............................................................................................. 11
Instalación .................................................................................... 13
Requisitos del sistema.......................................................................................................................................................................................................................... 13
Instalación de los componentes de ABBYY Recognition Server.......................................................................................................................... 15
Selección de los componentes del programa......................................................................................................... 15
Selección de una cuenta de usuario .....................................................................................................................16
Especificación de la ruta del Administrador de servidores................................................................................... 17
Instalación de los componentes de ABBYY Recognition Server mediante la línea de comandos.............................................. 18
Instalación de ABBYY Recognition Server con Microsoft Systems Management Server (SMS).................................................... 19
Un ejemplo de implementación de ABBYY Recognition Server mediante SMS ......................................................19
Registro manual de la biblioteca de conexión de SharePoint................................................................................................................................ 23
Instalación de controladores de llave de hardware....................................................................................................................................................... 23
Instalación de IFilter de Microsoft Search............................................................................................................................................................................ 23
Instalación de ABBYY Recognition Server 3.0 IFilter mediante la línea de comandos ....................................................................... 24
Instalación de ABBYY Recognition Server 3.0 IFilter con Microsoft Systems Management Server (SMS)............................ 25
Tecnología de protección y activación de licencias ........................... 26
Activación de la licencia ....................................................................................................................................................................................................................26
¿Cómo se realiza la activación?............................................................................................................................ 26
Métodos de activación .......................................................................................................................................... 26
Desactivación............................................................................................................................................................................................................................................. 27
2
Manual del administrador del sistema ABBYY Recognition Server 3.0
Actualización de la licencia.............................................................................................................................................................................................................. 27
Administración.............................................................................. 28
Inicio................................................................................................................................................................................................................................................................ 28
Cómo registrar un nuevo servidor .............................................................................................................................................................................................28
Cómo registrar una nueva estación de procesamiento............................................................................................................................................... 29
Cómo crear un nuevo flujo de trabajo.................................................................................................................................................................................... 29
Cómo configurar la separación de documentos.............................................................................................................................................................. 30
Cómo configurar las opciones de correo electrónico.................................................................................................................................................. 30
Cómo configurar la verificación.................................................................................................................................................................................................. 32
Cómo configurar la indización de documentos............................................................................................................................................................... 33
Cómo configurar la publicación de documentos en un servidor SharePoint............................................................................................. 34
Cómo transferir la configuración de Recognition Server a otro servidor...................................................................................................... 35
Administración de licencias ............................................................................................................................................................................................................35
Administración de cuentas de usuario .................................................................................................................................................................................... 36
Cómo configurar el conector de Google Search Appliance..................................................................................................................................... 37
Cómo configurar IFilter de Microsoft Search..................................................................................................................................................................... 38
Configuración de conexión ............................................................. 41
Protocolos de conexión ......................................................................................................................................... 41
Reinicio de servicios con una cuenta de usuario.................................................................................................. 41
Ejecución de ABBYY Recognition Server en un ordenador sin conexión de red ................................................... 42
Límite de conexiones entrantes en Windows ........................................................................................................ 42
Resolución de problemas ...............................................................43
El Administrador de servidores no consigue establecer conexión con la estación de procesamiento instalada en
un ordenador diferente..........................................................................................................................................43
El Administrador de servidores no consigue establecer conexión con la estación de verificación o la Consola de
administración remota en un ordenador diferente...............................................................................................43
Sin conexión con el servidor FTP externo..............................................................................................................43
El flujo de trabajo no se inicia y aparece el siguiente mensaje de error: “No se puede acceder a algunas de las
carpetas de trabajo” ............................................................................................................................................. 44
Al procesar imágenes, aparecerá una advertencia que indicará "El Administrador de servidores no tiene
espacio disponible en el disco" en el ordenador en que se ejecuta el Administrador de servidores..................... 44
Cómo recuperar un documento de imagen que ABBYY Recognition Server está procesando.............................. 44
Se agregan dígitos entre paréntesis junto a los nombres de los archivos de salida .............................................. 44
La estación de verificación deja de funcionar durante el inicio........................................................................... 44
Si la estación de digitalización no exporta un lote, aparece el siguiente mensaje: "No se puede acceder a la carpeta de entrada del flujo de trabajo. Utilice un flujo de trabajo con una carpeta compartida si el servidor se
encuentra en otro ordenador."............................................................................................................................. 44
Recognition Server no puede recuperar mensajes del servidor de correo electrónico POP3 o enviar mensajes por
el servidor SMTP.................................................................................................................................................... 44
La separación del documento por códigos de barras no funciona correctamente............................................... 45
Aparece un mensaje de error de acceso al archivo cuando se trabaja con el programa..................................... 45
Asistencia técnica.......................................................................... 46
3
Manual del administrador del sistema ABBYY Recognition Server 3.0

Introducción

ABBYY Recognition Server es un sistema de captura de documentos potente, a la par que sencillo, que permite a las empresas establecer un proceso rentable de conversión de papel en documentos electrónicos reutilizables y con funciones de búsqueda. ABBYY Recognition Server proporciona funciones de digitalización, reconocimiento óptico de caracteres, clasificación e indización de documentos y envío de documentos a archivos, así como sistemas empresariales de administración y búsqueda de contenido.
Gracias a su arquitectura ampliable y escalable, ABBYY Recognition Server puede procesar rápidamente enormes volúmenes de documentos, a la vez que resulta sencillo de implementar y utilizar. Independientemente de las restricciones de tiempo del proyecto, ABBYY Recognition Server garantizará que el trabajo se realiza dentro del plazo previsto y con el mínimo esfuerzo.
ABBYY Recognition Server 3.0:
Se encarga de todo el proceso de captura de documentos
ABBYY Recognition Server cubre todos los pasos de la captura de documentos, desde la digitalización, pasando por la mejora de la imagen, la indización y el redireccionamiento automatizado de documentos, hasta los sistemas de archivado y administración de contenido.
Basado en la galardonada tecnología de ABBYY
ABBYY Recognition Server proporciona resultados de gran precisión, gracias a la galardonada tecnología OCR de ABBYY, que admite el reconocimiento de textos en más de 190 idiomas, incluidos ??chino, japonés, coreano y árabe. ABBYY Recognition Server convierte imágenes y documentos digitalizados a numerosos formatos de salida, adecuados para archivar, compartir y editar, como PDF, PDF/A, XML, RTF y Microsoft® Office.
Diseñado para procesar grandes volúmenes de documentos
ABBYY Recognition Server es conocido por su inigualable escalabilidad. Se trata de una solución sin igual fácilmente ampliable a CPU de varios núcleos o a varios servidores y, por tanto, capaz de trabajar con cualquier volumen de documentos, procesándolos en horas programadas o todo el día. Las funciones de administración con prioridad y programación avanzada permiten al administrador controlar el orden en que los documentos se procesan y utilizar recursos de hardware de la forma más eficaz.
Implementación rápida y facilidad de uso
ABBYY Recognition Server dispone de una interfaz intuitiva y puede configurarse y utilizarse sin necesidad de formación previa. Las etapas de procesamiento que requieren una mínima participación del usuario, como el OCR y la conversión de documentos, están automatizadas, y se proporcionan prácticas herramientas para operaciones manuales como digitalización, indización y verificación.
Compatible con escáneres y sistemas ECM
ABBYY Recognition Server complementará los dispositivos de digitalización y el software backend utilizados en la organización con potentes funciones de captura de documentos. La integración con un escáner u otra aplicación puede efectuarse de varias formas, ya sea mediante el intercambio de correos electrónicos o redireccionamiento por script y conexión cerrada vía API.
Ofrece conectores prefabricados para los sistemas Microsoft y Google Search
ABBYY Recognition Server no solo actúa como solución autónoma de captura de documentos, sino que también conecta como servidor OCR en segundo plano para sistemas de búsqueda empresariales como Google Search Appliance™, Microsoft Office SharePoint® Server y Windows® Desktop Search, proporcionando a los sistemas mencionados la capacidad de indizar y buscar contenido en los documentos de imágenes.
4
Manual del administrador del sistema ABBYY Recognition Server 3.0

Arquitectura

Componentes principales

ABBYY Recognition Server consta de ocho componentes principales: Administrador de servidores, estación de digitalización, estación de procesamiento, estación de verificación, estación de indización, Consola de administración remota, API basada en COM y servicio web.
Todos los componentes de Recognition Server pueden instalarse en el mismo ordenador o en ordenadores diferentes en la red de área local.

Administrador de servidores

Este es el componente principal. Funciona como un servicio de Windows: permite administrar licencias y todas las opciones de procesamiento, formar y administrar la cola de trabajos, distribuir los trabajos entre las estaciones de procesamiento, las estaciones de verificación y las estaciones de indización, y entregar los documentos de salida tras el procesamiento. También coordina el trabajo de otros componentes (estaciones de procesamiento, estaciones de verificación y estaciones de indización) e interactúa con la Consola de administración remota y la API abierta. El Administrador de servidores no realiza el reconocimiento; esta tarea la realizan las estaciones de procesamiento.
ABBYY Recognition Server no funcionará sin el Administrador de servidores. Para ejecutar el Administrador de servidores, necesita una licencia activa y vigente. Consulte la sección Tecnología de protección y activación de licencias para obtener más detalles.

Estación de digitalización

Este componente permite realizar digitalización por lotes y pasar las imágenes a Recognition Server para su posterior procesamiento.

Estación de procesamiento

Este componente es un servicio de Windows que realiza el reconocimiento directamente. Procesa los archivos recibidos del Administrador de servidores.
5
Manual del administrador del sistema ABBYY Recognition Server 3.0
Recognition Server permite conectar varias estaciones de procesamiento con un Administrador de servidores con el fin de aumentar la velocidad de procesamiento y maximizar el rendimiento. El Administrador de servidores distribuirá de forma equitativa la carga de trabajo entre las CPU de las estaciones de procesamiento.

Estación de verificación

Es una estación de cliente que permite hacer correcciones a los resultados del reconocimiento. La estación de verificación recibe automáticamente del Administrador de servidores las páginas reconocidas que deben verificarse. Puede conectar varias estaciones de verificación a un Administrador de servidores para acelerar el proceso de verificación.

Estación de indización

Se trata de una estación cliente que permite asignar un tipo de documento y atributos significativos a los documentos reconocidos, de tal modo que puedan ser fácilmente clasificados y encontrados más tarde en archivos y sistemas de administración de documentos. La estación de indización recibe automáticamente del Administrador de servidores las páginas reconocidas que deben ser indizadas. Puede conectar varias estaciones de indización a un Administrador de servidores para agilizar el proceso de indización.

Consola de administración remota

Es un complemento de Microsoft® Management Console (MMC) que proporciona una interfaz de administración común para configurar y supervisar Recognition Server.

API basada en COM

Este tipo de API permite integrar Recognition Server con otras aplicaciones en la red de área local. El componente API basada en COM debe instalarse en el ordenador en el que se ejecutará la aplicación cliente. También se puede distribuir junto con la aplicación cliente. Obtenga más información acerca de la distribución de la API basada en COM en el archivo de Ayuda de API abierta.

Servicio web

Este componente proporciona una API de servicios web para integrar Recognition Server con aplicaciones remotas a través del protocolo HTTP.
Se pueden instalar todos los componentes de Recognition Server en el mismo ordenador o en distintos, en la red de área local.

Componentes adicionales

ABBYY Recognition Server incluye dos componentes adicionales: el conector de Google Search Appliance y el IFilter de Microsoft Search, que permiten que el Administrador de servidores interactúe con los sistemas de búsqueda de Google y Microsoft. Los archivos de imagen cuyo contenido no puede indizarse directamente se envía a ABBYY Recognition Server para someterlos a un reconocimiento óptico de caracteres. Los datos del texto reconocido se devuelven al servidor de búsqueda y se incluyen en el índice de texto completo.

Conector de Google Search Appliance

Este componente permite interactuar con el sistema Google Search Appliance.

IFilter de Microsoft Search

Este componente permite interactuar con Microsoft Search Server, Microsoft Office SharePoint Server y Microsoft Windows Search.

Flujos de trabajo, trabajos y documentos

ABBYY Recognition Server funciona con tres entidades básicas: flujos de trabajo, trabajos y documentos.
Un flujo de trabajo es un conjunto de parámetros de procesamiento que se aplicarán a los archivos de imagen. Recognition Server puede administrar varios flujos de trabajo con diferentes parámetros. Cada flujo de trabajo corresponde a un único origen de entrada (una carpeta o un buzón de correo). Todas las imágenes que aparecen en la
6
Manual del administrador del sistema ABBYY Recognition Server 3.0
carpeta o buzón de correo de origen se procesan con los parámetros del flujo de trabajo correspondiente. (Consulte también: Cómo crear un nuevo flujo de trabajo).
ABBYY Recognition Server permite configurar una programación y una prioridad para el flujo de trabajo. Por ejemplo, a un flujo de trabajo para documentos antiguos puede otorgársele prioridad baja y programarse para su ejecución sólo durante la noche y los fines de semana, mientras que un flujo de trabajo para documentos que se necesitan con urgencia recibir prioridad alta y se configurará para su ejecución permanente. La programación se configura en la ficha Entrada del cuadro de diálogo Propiedades del flujo de trabajo de la Consola de administración remota.
Un trabajo es una unidad de procesamiento. Un trabajo incluye una imagen (o un conjunto de imágenes) y sus parámetros de procesamiento. Se crea cuando Recognition Server importa imágenes para procesar. Por lo general, un trabajo contiene un archivo de imagen y hereda los parámetros de procesamiento del flujo de trabajo en el que se creó. Sin embargo, con la ayuda de API abierta o vales XML se podrá crear un trabajo que incluirá varios archivos de imagen y parámetros diferentes de la configuración del flujo de trabajo.
Un documento se obtiene como resultado de la separación del documento y normalmente corresponde a un documento de negocio. A continuación figuran ejemplos de cómo se forman los documentos en caso de separación de documento:
Si no se aplica la separación de documento al trabajo, un documento corresponderá a un archivo de imagen de entrada. Un documento puede publicarse en varios formatos de archivo diferentes de acuerdo con la configuración de la exportación.

Flujo de trabajo del documento

Se realizan los siguientes pasos de procesamiento, comenzando por el envío de la imagen a ABBYY Recognition Server
3.0 y finalizando por la exportación:
1. Digitalización/importación
2. Reconocimiento
3. Verificación (opcional)
4. Separación de documentos (opcional)
5. Indización (opcional)
6. Exportación
7
Manual del administrador del sistema ABBYY Recognition Server 3.0
Digitalización/importación
En esta fase, las imágenes se digitalizan en la estación de digitalización o se importan mediante ABBYY Recognition Server desde una carpeta dinámica o un buzón de correo.
Una vez enviados los archivos de imagen al Administrador de servidores desde la estación de digitalización, la carpeta de entrada o el buzón de correo, el Administrador de servidores crea trabajos y los añade a la cola para su procesamiento. Si se configuran varios flujos de trabajo, ABBYY Recognition Server procesará trabajos de todos los flujos de trabajo de forma simultánea dentro de una única cola. El orden de los trabajos en la cola dependerá de la hora de creación y la prioridad.
Nota: El Administrador de servidores almacena todos los archivos de imagen en la subcarpeta Imágenes de la carpeta temporal de ABBYY Recognition Server 3.0. La ruta de la carpeta temporal del Administrador de servidores puede visualizarse y cambiarse en el cuadro de diálogo Propiedades de Recognition Server de la Consola de administración remota. Los archivos de imagen se mantienen en esa carpeta durante todo el proceso de conversión. Las estaciones de procesamiento, las estaciones de verificación y las estaciones de indización reciben copias de dichas imágenes para el procesamiento. De este modo, queda garantizado que no se pierdan archivos en caso de producirse un error durante el reconocimiento, la verificación o la indización.
Reconocimiento
El primer trabajo de la cola se envía a la primera estación de procesamiento disponible para su reconocimiento. Si hay varias estaciones de procesamiento en el sistema, el Administrador de servidores distribuirá de forma equitativa los trabajos de la cola entre estas estaciones de procesamiento. Consulte Cómo registrar una nueva estación de procesamiento.
Una estación de procesamiento puede ejecutar varios procesos de OCR. (La cantidad se puede establecer en la Consola de administración remota.) Para obtener un rendimiento óptimo, se recomienda que el número de procesos en una estación sea N+1, donde N representa el número de núcleos de CPU de la estación. Habitualmente, cada proceso de OCR toma un archivo a la vez. Por ejemplo, si una estación de procesamiento ejecuta dos procesos de OCR, reconocerá dos archivos a la vez (pueden pertenecer al mismo trabajo o a diferentes). Sin embargo, si el archivo tiene muchas páginas (por ejemplo, varias decenas) y no hay más de cinco trabajos en espera en la cola, el archivo grande se dividirá en varias partes, y estas partes se enviarán a distintos procesos de OCR con el fin de terminar el trabajo más rápidamente.
Una vez que la estación de procesamiento ha terminado de procesar el archivo, envía el archivo reconocido de regreso al Administrador de servidores y se le asigna el siguiente trabajo en la cola de espera.
Verificación
Si se activa la verificación en la configuración del flujo de trabajo, las páginas que requieren verificación quedarán en cola para verificación después del reconocimiento. Si las estaciones de verificación están conectadas, el Administrador de servidores enviará las páginas en cola a esas estaciones. Si actualmente no hay estaciones de verificación conectadas o los usuarios que han iniciado sesión no tienen permiso para verificar páginas de este flujo de trabajo, las páginas quedarán en espera en la cola con el estado "En cola para verificación". No se enviarán a procesar hasta que estén verificadas. Consulte Cómo configurar la verificación.
8
Manual del administrador del sistema ABBYY Recognition Server 3.0
Separación de documentos
Si se activa la separación de documentos en la configuración del flujo de trabajo, las páginas en la cola de trabajos se volverán a distribuir en documentos tras el reconocimiento y la verificación de acuerdo con la regla de separación. En este caso, cada trabajo que se muestra en el registro de trabajo corresponderá a uno de los documentos de salida y enumerará todos los archivos que forman dicho documento. Además de los métodos de separación de documentos integrados (por códigos de barra, páginas en blanco, etc.), se puede realizar la separación usando un script. Consulte
Cómo configurar la separación de documentos.
Indización
Si se definen los tipos de documento y atributos en la configuración del flujo de trabajo, los documentos ensamblados para este flujo de trabajo se pondrán en cola para su indización. La indización puede realizarse automáticamente con la ayuda de un script o manualmente en la estación de indización. Primero, si se define un script, la indización se realiza de acuerdo con el script. A continuación, los documentos que requieren indización manual o verificación de índice se ponen en cola para las estaciones de indización. Si hay conectadas estaciones de indización, el Administrador de servidores enviará las páginas en cola a dichas estaciones. Si no hay estaciones de indización conectadas o los usuarios que han iniciado sesión no tienen permiso para indizar documentos de este flujo de trabajo, las páginas quedarán en espera en la cola con el estado "En cola para verificación". Consulte Cómo configurar la indización de documentos.
Exportación
Una vez completados el reconocimiento, la verificación y la indización, los documentos de salida se envían de regreso al Administrador de servidores y se ponen en cola para publicarse. El Administrador de servidores entrega los documentos de salida al destino especificado en la configuración del trabajo. Una vez publicados los archivos de salida en la carpeta de salida, la copia de la imagen se elimina de la carpeta temporal del Administrador de servidores.
Si se define el script de gestión de exportaciones para los trabajos publicados con éxito, se activará cuando los documentos de salida y el archivo de resultado XML se publiquen en la carpeta de salida. El script de gestión de importaciones puede utilizarse para enviar los documentos de salida a un destino apropiado dependiendo del tipo de documento, los atributos del documento, estadísticas de reconocimiento, etc.
Se puede definir un script para trabajos fallidos para gestionar imágenes que no se han podido procesar y se han colocado en la carpeta de excepciones.

Escalabilidad

Un Administrador de servidores puede manejar decenas de estaciones de procesamiento conectadas a él y distribuir la carga de trabajo entre ellas. Esto hace que el sistema en su totalidad sea altamente escalable y pueda responder a demandas de procesamiento de grandes volúmenes. Mediante la conexión de varias estaciones de procesamiento, puede aumentar la velocidad de procesamiento hasta cubrir varios cientos de páginas por minuto.
Nota: La imagen muestra el aumento de velocidad según mediciones realizadas en pruebas internas en ABBYY. El rendimiento del sistema puede variar según la complejidad y calidad de las imágenes, el hardware del servidor y de las estaciones, y la configuración de la red.
9
Manual del administrador del sistema ABBYY Recognition Server 3.0

Tolerancia a errores

Dado que ABBYY Recognition Server 3.0 se ejecuta completamente sin supervisión, posee algunas características de tolerancia a errores que aseguran la integridad del sistema:
El sistema se inicia de forma automática con el inicio de Windows. Por ejemplo, si ocurre una pérdida de
alimentación temporal, ABBYY Recognition Server estará activado y en funcionamiento de forma automática luego de que se reinicie el ordenador.
Los documentos se procesan de modo que no se pierdan datos en caso de una falla del sistema. Todos las
imágenes que se encontraban en proceso cuando ocurrió la falla permanecerán en la cola y se volverán a procesar una vez que se reinicie el sistema.
El Administrador de servidores realiza comprobaciones en forma periódica para asegurarse de que las
estaciones de procesamiento estén en ejecución y disponibles. Si una estación de procesamiento deja de funcionar de forma temporaria por algún motivo, el Administrador de servidores volverá a establecer la conexión después de que vuelva a funcionar. No se requiere la participación del administrador para volver a conectar una estación de procesamiento.
Si una estación de procesamiento, estación de verificación o indización experimenta un fallo mientras se
procesa un documento, el documento se redireccionará automáticamente a otra estación disponible. Si no se encuentra ninguna estación disponible en ese momento, la imagen permanecerá en la cola y esperará a la primera estación disponible.

Herramientas de integración

Scripts

ABBYY Recognition Server 3.0 proporciona una forma fácil de personalizar el flujo de trabajo e integrarse con sistemas externos con la ayuda de scripts. El programa permite usar scripts para la separación de documentos, la detección e indización automática del tipo de documento y el posprocesamiento de los documentos publicados y sus atributos. Los scripts de procesamiento de documentos se definen en la configuración del flujo de trabajo y pueden utilizar varios parámetros de documentos, como texto reconocido y sus coordenadas, propiedades de archivos de imagen y estadísticas de reconocimiento.

Vales XML

ABBYY Recognition Server 3.0 brinda una manera conveniente de personalizar la configuración del trabajo a través de los denominados vales XML Un vale XML es un archivo XML que incluye un conjunto de parámetros de procesamiento para el trabajo. Los parámetros configurados en el vale XML anulan la configuración del flujo de trabajo. Si un vale XML acompaña a uno o varios archivos de entrada, dichos archivos se procesarán mediante los parámetros configurados en el vale. Los vales XML se pueden usar para definir prácticamente todos los parámetros de trabajo, tales como prioridad, idiomas de reconocimiento, formatos de salida, nombre de archivo y ruta de salida, etc.
Los vales XML pueden crearse manualmente (en un editor de texto) o de forma programada mediante la API abierta.
Los vales XML pueden usarse para la integración de ABBYY Recognition Server con sistemas y dispositivos para usuarios (por ejemplo, las opciones de procesamiento que el usuario configura en el panel del escáner que pueden transferirse a ABBYY Recognition Server en un vale XML).

API abierta

ABBYY Recognition Server ofrece dos tipos de API abierta para la integración con sistemas externos: API basada en COM y API de servicios web. Ambas API ofrecen la siguiente función:
envío de imágenes para el procesamiento
creación y envío de vales XML para el procesamiento
obtención de notificaciones acerca de la finalización del trabajo e información acerca de los resultados del
trabajo
La API basada en COM usa tecnología RPC y puede usarse para la integración con otros sistemas en la red de área local.
10
Manual del administrador del sistema ABBYY Recognition Server 3.0
La API de servicios web posibilita la comunicación con sistemas remotos a través de HTTP y; por lo tanto, permite la integración remota a través de Internet.
Para obtener más información sobre la API abierta y los vales XML, consulte el archivo de Ayuda de API abierta.
Nota: Puede usar la API abierta y los vales XML sólo si tiene activado el módulo de complementos de API abierta en su licencia de ABBYY Recognition Server 3.0.

Conector de Google Search Appliance

Encontrar la información necesaria repartida en diferentes recursos en línea y almacenes de documentos electrónicos en una gran empresa puede ser un gran desafío a menos que utilice un sistema de búsqueda corporativo como Google Search Appliance. Google Search Appliance indiza los documentos de varias ubicaciones de almacenamiento en la red, de tal modo que los usuarios puedan encontrar rápidamente cualquier documento mediante palabras clave. Sin embargo, mucha información valiosa se almacena normalmente en formato de imagen (como TIFF digitalizado o archivos PDF) y, por tanto, no puede ser indizada por el motor de búsqueda de Google. Entre estos archivos encontramos faxes, contratos digitalizados y archivos de periódicos y revistas. ABBYY Recognition Server y Google Search Appliance se complementan a la perfección para permitir indizar tanto archivos de texto/páginas web como documentos digitalizados en TIFF, JPEG, DjVu y otros formatos. ABBYY Recognition Server desbloquea los documentos en formato de imagen aplicando tecnología OCR y facilita a Google Search Appliance el acceso a su contenido.
ABBYY Recognition Server y Google Search Appliance interactúan mediante el conector de Google Search Appliance, instalado como parte del componente Administrador de servidores. El conector rastrea las carpetas de red y envía los documentos en formatos gráficos a ABBYY Recognition Server. ABBYY Recognition Server reconoce los documentos entrantes y fuerza el envío de una fuente XML con el texto reconocido a Google Search Appliance para su indización. Una vez completado este proceso, ya pueden realizarse búsquedas en los documentos.

IFilter para Microsoft Office SharePoint Server y Windows Desktop Search

Buscar información es una parte crucial del flujo de trabajo de cualquier oficina. A medida que la empresa crece, los documentos se reparten entre los departamentos, las carpetas de archivos y los sistemas ECM, y las búsquedas consumen cada vez más tiempo. Microsoft® ofrece instrumentos eficaces para organizar la búsqueda en empresas a diferentes niveles, desde almacenamiento de contenido centralizado a escritorios individuales. Microsoft Office SharePoint Server dispone de potentes funciones para buscar en bibliotecas y carpetas de SharePoint; Windows Desktop Search resulta útil para buscar archivos en ordenadores de sobremesa.
Sin embargo, SharePoint Server y Windows Desktop Search sólo indizan contenidos de archivos en determinados formatos de documento, como HTML, RTF, DOC y XLS. La información contenida en archivos de imagen como JPEG, o los populares PDF y TIFF, se mantiene oculta. Esto significa que el contenido de documentos digitalizados, faxes, cartas y contratos, resulta invisible para el servidor, y estos documentos pueden no mostrarse en los resultados de la búsqueda.
ABBYY Recognition Server, con su componente IFilter, amplía las funciones de búsqueda de Microsoft en documentos de imágenes. Este componente "desbloquea" el contenido de los archivos de imagen mediante OCR y hace que sea
11
Manual del administrador del sistema ABBYY Recognition Server 3.0
posible indizarlo con SharePoint Server y Windows Desktop Search. Con ABBYY Recognition Server IFilter, la búsqueda de documentos en la empresa adquiere un carácter realmente global.
ABBYY Recognition Server se integra con Microsoft Office SharePoint Server y Windows Desktop Search como se describe a continuación:
1. ABBYY Recognition Server se instala en un ordenador servidor (el cual puede estar separado de la máquina que
aloja SharePoint). Un componente especial, ABBYY Recognition Server IFilter, se instala encima del SharePoint Server o los escritorios del usuario para proporcionar comunicación entre el sistema de búsqueda y el Recognition Server. El IFilter es un componente ligero que apenas consume recursos del sistema para garantizar que el rendimiento de su host permanece en un nivel alto.
2. Cada ABBYY IFilter recibe documentos de imagen del rastreador de búsqueda de SharePoint o Windows
Desktop correspondiente y los pasa al Recognition Server.
3. ABBYY Recognition Server, en segundo plano, lleva a cabo un reconocimiento óptico de caracteres de alta
calidad en las imágenes y envía el texto reconocido de vuelta al IFilter.
4. El motor de búsqueda de Microsoft acepta el contenido del documento de ABBYY IFilter y crea un índice. A
continuación, la imagen se vuelve visible mediante búsqueda de texto completo.
Con Microsoft Office SharePoint Server:
Con Windows Desktop Search:
12
Manual del administrador del sistema ABBYY Recognition Server 3.0

Instalación

ABBYY Recognition Server 3.0 incluye un programa de instalación especializado que automatiza el proceso de instalación. Para asegurar una correcta instalación, siempre use el CDROM para instalación de ABBYY Recognition Server. El programa de instalación le permite instalar los componentes de ABBYY Recognition Server en un ordenador o en varios.

Requisitos del sistema

Administrador de servidores
PC con Intel® Pentium®/Celeron®/Xeon™/Core™, AMD K6/Athlon™/Duron™/Sempron™/Opteron™ o un
procesador compatible con una velocidad mínima de 500 MHz
Sistema operativo: Microsoft® Windows® 7, Windows Server® 2008, Windows Vista®, Windows Server
2003, Windows XP
Memoria: 1 GB de RAM
Espacio en el disco duro: 20 MB para la instalación y 1 GB para el funcionamiento del programa*
La cuenta con la que se está ejecutando el servidor debe tener permisos de lectura y escritura para las siguientes
ramas del Registro:
o HKEY_CLASSES_ROOT o HKEY_LOCAL_MACHINE\Software\ABBYY o HKEY_CURRENT_USER\Software\ABBYY
Microsoft .NET Framework 2.0 o posterior, para poder guardar los archivos en Microsoft SharePoint Server.
Microsoft Outlook 2000 o posterior, para procesar y enviar mensajes de correo electrónico de Microsoft
Exchange Server.
Estación de digitalización
PC con procesador Intel® Core™2/2 Quad/Pentium®/Celeron®/Xeon™, AMD
K6/Turion™/Athlon™/Duron™/Sempron™ o compatible con una velocidad mínima de 2 GHz
Sistema operativo: Microsoft Windows 7, Windows Server 2008, Windows Vista, Windows Server 2003,
Windows XP (para interfaces localizadas, es necesario que se admita el idioma correspondiente)
Memoria: Mínimo 512 MB de RAM; recomendado 1 GB
Espacio en el disco duro: 1 GB (incluidos 125 MB para instalación)
Escáner compatible con TWAIN, WIA o ISIS
Tarjeta de vídeo y pantalla con una resolución de 1024×768
Teclado, ratón u otro dispositivo puntero
Estación de procesamiento
PC con Intel Pentium/Celeron/Xeon/Core, AMD K6/Athlon/Duron/Sempron/Opteron o un procesador
compatible con una velocidad mínima de 500 MHz
Sistema operativo: Microsoft Windows 7, Windows Server 2008, Windows Vista, Windows Server 2003,
Windows XP
Memoria: 512 MB de RAM más 300 MB adicionales para cada proceso de reconocimiento
Espacio en el disco duro: 600 MB para la instalación y 1 GB para el funcionamiento del programa*
13
Manual del administrador del sistema ABBYY Recognition Server 3.0
Estación de verificación
PC con Intel Pentium/Celeron/Xeon/Core, AMD K6/Athlon/Duron/Sempron/Opteron o un procesador
compatible con una velocidad mínima de 500 MHz
Sistema operativo: Microsoft Windows 7, Windows Server 2008, Windows Vista, Windows Server 2003,
Windows XP (para interfaces localizadas, es necesario que se admita el idioma correspondiente)
Memoria: 128 MB de RAM
Espacio en el disco duro: 250 MB para la instalación y 100 MB para el funcionamiento del programa*
Estación de indización
PC con Intel Pentium/Celeron/Xeon/Core, AMD K6/Athlon/Duron/Sempron/Opteron o procesador
compatible con una velocidad del reloj de 500 MHz o superior
Sistema operativo: Microsoft Windows 7, Windows Server 2008, Windows Vista, Windows Server 2003,
Windows XP (para interfaces localizadas, es necesario que se admita el idioma correspondiente)
Memoria: 768 MB de RAM
Espacio en el disco duro: 500 MB para la instalación y 1 GB para el funcionamiento del programa*
Consola de administración remota
PC con Intel Pentium/Celeron/Xeon/Core, AMD K6/Athlon/Duron/Sempron/Opteron o un procesador
compatible con una velocidad mínima de 200 MHz
Sistema operativo: Microsoft Windows 7, Windows Server 2008, Windows Vista, Windows Server 2003,
Windows XP
Memoria: 128 MB de RAM
Espacio en el disco duro: 30 MB
Microsoft .NET Framework 2.0 o posterior, para poder guardar los archivos en Microsoft SharePoint Server
API basada en COM
PC con Intel Pentium/Celeron/Xeon/Core, AMD K6/Athlon/Duron/Sempron/Opteron o un procesador
compatible con una velocidad mínima de 200 MHz
Sistema operativo: Microsoft Windows 7, Windows Server 2008, Windows Vista, Windows Server 2003,
Windows XP
Memoria: 128 MB de RAM
Espacio en el disco duro: 15 MB
Servicio web
PC con Intel Pentium/Celeron/Xeon/Core, AMD K6/Athlon/Duron/Sempron/Opteron o un procesador
compatible con una velocidad mínima de 200 MHz
Sistema operativo: Microsoft Windows 7, Windows Server 2008, Windows Vista, Windows Server 2003,
Windows XP
Memoria: 128 MB de RAM
Espacio en el disco duro: 15 MB y 100 MB para el funcionamiento del programa*
Microsoft IIS 5.1 o posterior
Microsoft .NET Framework 2.0 o posterior
Conector de Google Search Appliance
14
Loading...
+ 32 hidden pages