2.K. Escaneado

9. Escanear documentos (OCR)

En bastantes ocasiones los documentos se escanean para convertirlos en datos de texto, y poder editarlos con una aplicación de procesamiento de textos.

La tecnología que permite a los ordenadores "leer" texto procedente de objetos materiales se llama OCR (reconocimiento óptico de caracteres). El OCR necesita una representación gráfica del texto que va a interpretar, que suele proceder de una imagen escaneada.

Mejora del reconocimiento de caracteres

Usar la barra deslizante Umbral para cambiar el valor del umbral, mientras se supervisa los resultados de los cambios en la ventana Previo. El ajuste del valor del umbral puede facilitar al OCR el reconocimiento de caracteres.

 

Este ajuste Umbral sólo está disponible cuando el ajuste de Tipo imagen seleccionado es Blanco y negro.

Una vez escaneado el documento, importe la imagen escaneada al software OCR.

Posibles problemas con el reconocimiento de texto

La calidad del texto del documento original influye en los resultados del OCR.

Deberían evitarse, en la medida de lo posible, los siguientes tipos de originales porque pueden dificultar el reconocimiento:

  • Originales copiados de otras copias
  • Faxes
  • Texto con caracteres con poco espacio entre ellos o de interlineado reducido
  • Texto incluido en tablas o subrayado
  • Fuentes cursivas o itálicas, y fuentes de un tamaño inferior a 8 puntos

El programa de OCR no puede reconocer los caracteres escritos a mano.