¿Es una tecnología que implica leer personajes impresos en computadora o impresos a mano mecanografiados de documentos ordinarios y traducir las imágenes en el formulario de la computadora puede procesar?

2016/1/3

Estás describiendo Reconocimiento de caracteres ópticos (OCR) .

OCR es una tecnología que permite que las computadoras "lean" el texto de las imágenes, convirtiéndolo en texto legible por máquina. Esto significa que la computadora puede entender, editar, buscar y manipular el texto, al igual que puede con el texto que se escribió directamente en una computadora.

Aquí hay un desglose de cómo funciona:

* Captura de imágenes: Una imagen del documento es tomada, ya sea por un escáner o una cámara.

* Preprocesamiento: La imagen se limpia eliminando el ruido, corrigiendo las distorsiones y segmentando el texto en caracteres individuales.

* Reconocimiento de caracteres: Los caracteres individuales se analizan y se comparan con una base de datos de caracteres conocidos para identificarlos.

* Salida de texto: El texto reconocido se produce en un formato digital, como texto plano o un documento de procesamiento de textos.

Aplicaciones de OCR:

* Digitalización de documentos: Convertir documentos en papel en archivos electrónicos de búsqueda.

* Extracción de datos: Extracción de datos de formularios, facturas y otros documentos para el análisis.

* Procesamiento de formulario automatizado: Completar formularios automáticamente reconociendo datos escritos a mano o impresos.

* Software de traducción: Traducir texto en imágenes.

* Accesibilidad: Hacer texto en imágenes accesibles a personas con discapacidad visual.

¡Avísame si tienes alguna otra pregunta!