Escanear texto OCR (facturas, albaranes…) con nuestro módulo ADI

El módulo ADI es, de todos los que se pueden incluir en nuestro gestor documental, el más recurrente y útil de todos y, por tanto, el que tiene más éxito entre nuestros clientes, pero no por ello hay que quedarse con el mensaje de que dicho módulo nos va a solucionar todos nuestros problemas de extracción de datos variables de formularios en PDF.

Para llegar a escanear texto OCR necesitamos…

Como todos ya conocéis, para escanear texto OCR con nuestro módulo ADI necesitamos configurar previamente unas plantillas que tendríamos que parametrizar antes de extraer cualquier texto, ya que necesitamos localizar las coordenadas de los datos de un documento concreto(ejemplo: factura de proveedor).

En el momento que cambiemos de proveedor y su factura tenga otro formato, va a requerir el diseño de otra plantilla…quien dice este ejemplo dice otro cualquiera…

Conoce más a fondo DF-SERVER digitalización de procesos

Las plantillas van asociadas a un formato específico con los datos en unas localizaciones específicas…de ahí que sea un módulo muy útil en casos de manipulación de documentación repetitiva (el más común es el de las facturas o albaranes).

¿Cómo se configuran las plantillas del módulo ADI?

  • El paso previo a la elaboración de la plantilla será crear un perfil documental asociado a esa plantilla, en la cual configuraremos cada uno de los índices de los datos que queremos sacar: ejemplo “fecha factura”, “número factura” o “total factura”.  
  • Acto seguido cogeremos uno de los documentos (factura, albarán…etc) para utilizar como modelo para la plantilla. 
  • Finalmente iremos localizando con cada índice su ubicación en el documento mediante referencias cercanas o áreas referenciadas (ojo con las referencias: que sean apartados o elementos que salgan siempre en ese archivo, de lo contrario…si al escanear el texto el OCR no encuentra la palabra o palabras de referencia, no ubicará el dato en el documento y no extraerá el índice).