Extraer datos de un pdf es sencillo con nuestras herramientas A.D.I y A.I.R

Extraer datos de pdf con nuestros módulos ADI y AIR

Desde la llegada del módulo A.I.R., habéis encontrado un abanico lleno de nuevas posibilidades a la hora de extraer datos de una factura en pdf de forma automática, aunque eso no quita que todavía existan muchas dudas y cuestiones al respecto de cuándo recomendar una opción u otra o…para qué puede utilizar mi cliente un módulo u otro.

Con este artículo pretendemos despejar todas vuestras consultas e inquietudes para definir, presentar y aconsejar los módulos de la forma más apropiada.

Extraer datos de cualquier formulario en PDF con el módulo A.D.I

En rasgos generales el módulo A.D.I. nos permite la extracción referencial en base al contenido del documento o posiciones concretas del dato en formularios estandarizados en PDF. Estos pueden ser cualquier tipo de documento: facturas, albaranes, pedidos, etc.

La configuración de extracción del OCR zonal se ejecuta mediante plantillas previamente parametrizadas que localizan unas coordenadas concretas de la posición del dato/s que queremos recoger tomando mano de palabras de referencia. Ej: en una factura de compras queremos sacar los datos de fecha factura, número factura y total factura.

Conoce más a fondo DF-SERVER digitalización de procesos

Estas plantillas con sus correspondientes coordenadas se asocian a un formato de documento concreto, por lo que si, por ejemplo, queremos sacar esos mismos datos de la factura de otro proveedor, obviamente con un formato de documento distinto, deberemos generar otra plantilla diferente.

El paso previo a la configuración de la plantilla será la creación de un perfil documental que asociemos a ese modelo de plantilla y, por supuesto, la creación de los índices de los datos que queremos sacar. Una vez tenemos estos dos elementos indispensables, deberemos utilizar un modelo de documento para esa plantilla y empezar a localizar las ubicaciones de los datos utilizando referencias en dicho documento que sepamos que siempre están ahí, para que el sistema siempre las pueda reconocer cada vez que procesamos un archivo con ese mismo formato.

Extraer datos de facturas en PDF con el módulo A.I.R

El módulo A.I.R. (Automatic Invoice Recognition) en cambio, no funciona con plantillas, he ahí la gran diferencia entre ambos. En este caso lo que estamos aplicando es una metodología de reconocimiento mediante algoritmo matemático para los datos contables sobre los distintos documentos procesados que, en este caso, sí y sólo sí, serán FACTURAS. El A.I.R. también asocia la factura a un perfil documental y recoge aquellos metadatos asociados a ese perfil. Además, reconoce y calcula los datos contables que vamos a utilizar para la contabilización de la factura: tipo de factura, número y fecha factura, total factura e IVAS.

En caso de reconocer algún dato de forma incorrecta, la persona que revisa la factura deberá corregir fácilmente la ubicación de este y,  de esta manera, el sistema irá “aprendiendo” la posición correcta del dato a extraer, así la próxima vez que se procese una factura de ese mismo formato ya no se cometerá el error.

Este módulo es especialmente aconsejable cuando el volumen de proveedores con los que contamos (y de ahí el volumen de diferentes formatos de factura) es considerablemente elevado y dificulta la posibilidad de generación de plantillas.

Conclusión

A pesar de la automatización de estas tareas de extracción de datos; bien sea por plantillas o por reconocimiento automático, la REVISIÓN y VALIDACIÓN de los datos de las facturas procesadas debe ser un paso obligatorio en toda organización antes de enviar dichos datos al ERP para su contabilización.

¡IMPORTANTE! Cada uno de estos módulos no invalida al otro, no son incompatibles, sino todo lo contrario, podrían trabajar en conjunto a la hora de la recogida de los datos por medio de las diferentes vías.

RESUMIENDO:

  • Coste económico más bajo, menos proveedores, configuración de plantillas: MÓDULO A.D.I.
  • Coste económico más alto, más proveedores, sin configuración de plantillas: MÓDULO A.I.R.

NOTA: NECESIDAD DE REVISIÓN Y VALIDACIÓN DE LOS DATOS: SIEMPRE CON LOS DOS MÓDULOS.

Síguenos en:

¿Quieres conocer nuestro producto totalmente gratis?