Sunday, July 31, 2011

Software de OCR - Reconocimiento óptico de caracteres de reconocimiento óptico de Crud?

Reconocimiento óptico de caracteres (OCR) se refiere a una tecnología de software y procesos que implican la traducción de un texto impreso en la computadora de búsqueda de texto.

Hecho correctamente, el OCR permite a los usuarios buscar y recuperar las palabras individuales dentro de un archivo o página. Además, cuando un conjunto de archivos está indexado, los usuarios pueden buscar por palabras clave a través de una biblioteca de documentos de todo y recuperar cada página con una precisión exacta. OCR permite a los usuarios realizar búsquedas en segundos, las búsquedas que una vez que podría tomar varias horas o días en completarse.

Sin embargo, esta tecnología no ha funcionado bien en los documentos de la calidad de esa edad o pobres que contenía fuentes mixtas o combinaciones de texto y gráficos. Hasta ahora!

Debido a varios avances tecnológicos recientes, ahora es posible obtener seis sigma precisión personaje de nivel de este tipo de colecciones de documentos.

Aunque es importante tener en cuenta que la calidad y condición de los documentos en papel siguen siendo factores clave en el éxito de la conversión OCR, los resultados mejorado dramáticamente se puede obtener mediante la mejora de la calidad de la imagen escaneada antes de su procesamiento.

Eliminación de ruido de las fronteras, manchas y sesga ahora son comunes en los escáneres de documentos más avanzados.

Por otra parte, de color avanzadas tecnologías de filtro puede ser usado para reducir los colores de fondo de página, junto con la luz de múltiples tecnologías de captura de imágenes para eliminar cualquier sombra de pliegues página que podría afectar la calidad de imagen o la precisión del reconocimiento.

Una vez que el escaneo de documentos y el procesamiento se completa, una capa de texto OCR en realidad puede ser adicional y oculta detrás de cada imagen. Un filtro de orientación adicional se puede utilizar para asegurarse de que la mejor imagen se presenta a los motores de OCR.

Para lograr la mayor precisión posible la conversión, los caracteres de la imagen puede ser procesada usando multi-motor de OCR tecnologías de votación que el rango de cada personaje para determinar el ajuste de texto mejor reconocimiento. Entonces una vez que una palabra se genera, se filtra a través de un léxico de propiedad para garantizar la máxima calidad.

los más avanzados escáneres de documentos.

Por otra parte, de color avanzadas tecnologías de filtro puede ser usado para reducir los colores de fondo de página, junto con la luz de múltiples tecnologías de captura de imágenes para eliminar cualquier sombra de pliegues página que podría afectar la calidad de imagen o la precisión del reconocimiento.

Una vez que el escaneo de documentos y el procesamiento se completa, una capa de texto OCR en realidad puede ser adicional y oculta detrás de cada imagen. Un filtro de orientación adicional se puede utilizar para asegurarse de que la mejor imagen se presenta a los motores de OCR.

Para lograr la mayor precisión posible la conversión, los caracteres de la imagen puede ser procesada usando multi-motor de OCR tecnologías de votación que el rango de cada personaje para determinar el ajuste de texto mejor reconocimiento. Entonces una vez que una palabra se genera, se filtra a través de un léxico de propiedad para garantizar la máxima calidad.

No comments:

Post a Comment