EL MÓDULO ADI (La extracción por OCR Zonal)

ADI

El módulo ADI es, de todos los que se pueden incluir en nuestro gestor documental, el más recurrente y útil de todos y, por tanto, el que tiene más éxito entre nuestros clientes, pero no por ello hay que quedarse con el mensaje de que dicho módulo nos va a solucionar todos nuestros problemas de extracción de datos variables de formularios en PDF. Como todos ya conocéis, la configuración de extracción del OCR zonal se ejecuta mediante plantillas que hay que parametrizar previamente, pues estamos localizando unas coordenadas concretas de datos a extraer en un modelo de documento concreto (ejemplo: factura de proveedor), pero en el momento que cambiemos de proveedor y su factura tenga otro formato, va a requerir el diseño de otra plantilla…quien dice este ejemplo dice otro cualquiera…las plantillas van asociadas a un formato específico con los datos en unas localizaciones específicas…de ahí que sea un módulo muy útil en casos de manipulación de documentación repetitiva (el más común es el de las facturas o albaranes).

El paso previo a la elaboración de la plantilla será crear un perfil documental asociado a esa plantilla que vamos a realizar y configurar cada uno de los índices de los datos que queremos sacar: ejemplo “fecha factura”, “número factura” o “total factura”.  Acto seguido cogeremos uno de los documentos (factura, albarán…etc) para utilizar como modelo para la plantilla e iremos localizando con cada índice su ubicación en el documento mediante referencias cercanas o áreas referenciadas (ojo con las referencias: que sean apartados o elementos que salgan siempre en ese archivo, de lo contrario…si el OCR no encuentra la palabra o palabras de referencia no ubicará el dato en documento y no extraerá el índice).

0