TENDENCIAS DE TRANSFORMACIÓN DIGITAL

Contáctenos Demostración gratuita

¿Puede extraer datos de documentos impresos?

Uno de los mayores desafíos que enfrentan las empresas, las agencias gubernamentales, las organizaciones sin fines de lucro, los investigadores y otros es traducir documentos impresos en productos digitales. Esto puede resultar especialmente complicado cuando se trata de documentos impresos o marcados a mano.

Quizás se pregunte si existe una forma de automatizar la tarea. Afortunadamente, el software de captura de datos de documentos le permite escanear documentos y convertir su información en datos estandarizados. Aquí hay cuatro cosas que querrá saber sobre este tipo de software de captura de documentos.

Reconocimiento de caracteres

El reconocimiento de caracteres es un proceso que calcula la probabilidad de que cualquier objeto en particular en una página represente una letra, un signo de puntuación, un símbolo o una marca en particular. Si ha encontrado el reconocimiento de caracteres en alguna parte, probablemente fue en forma de OCR. El reconocimiento de caracteres de objetos se encarga principalmente de escanear textos y convertirlos en documentos digitales. Es una forma común que tienen los archiveros de hacer que los periódicos, las genealogías, los libros y otros textos antiguos estén disponibles como páginas web, archivos PDF y productos digitales similares.

ICR

Una solución cada vez más popular es lo que se llama ICR. El reconocimiento inteligente de caracteres utiliza técnicas de aprendizaje automático e inteligencia artificial para proporcionar resultados superiores. Como era de esperar, las tecnologías ICR tienden a ser más intensivas en procesadores. El software de captura de documentos que emplea ICR tardará más en hacer el trabajo, pero también puede manejar una gama más amplia de tareas.

Manejo de datos en la página

Una posible tarea de ICR es reconocer datos. La persona promedio puede mirar una tabla dibujada a mano en un libro mayor y reconocerla como esencialmente una versión primitiva de una hoja de cálculo moderna. ICR permite que las máquinas hagan lo mismo. El sistema reconoce los datos formateados incluso en forma manuscrita y los trata en consecuencia.

En particular, esta es una versión más avanzada de las tecnologías de escaneo que se utilizan para muchas pruebas estandarizadas y boletas electorales. La gran diferencia es que una solución basada en ICR puede hacer conjeturas fundamentadas sobre lo que hay en cualquier página. Por el contrario, los sistemas de escaneo requieren que todo sea perfecto. Este es el problema clásico cuando las tecnologías más simples no reconocen una entrada porque alguien llenó la burbuja con un bolígrafo del color incorrecto. ICR suele ser capaz de dar el salto de la lógica que haría un humano y resolverlo.

Automatización con escáneres

Generalmente, el principal límite en la velocidad de la automatización es el hardware. Sin embargo, hay escáneres alimentados por máquina que pueden pasar rápidamente por pilas de papel. Si combina su software de captura de datos de documentos con una máquina de este tipo y una computadora rápida, puede pasar cientos o incluso miles de páginas por hora.

Para obtener más información, comuníquese con una empresa que proporcione software de captura de datos de documentos.

Publicaciones principales