Qué es Document AI: Inteligencia Artificial de Google para automatizar la gestión de documentos

Conecta con nosotros

Recibos, albaranes, facturas, correos electrónicos, contratos… Las empresas acumulan documentos de todo tipo. Y estos a su vez incluyen multitud de información, muy valiosa para las compañías. 

Pero esa información, así guardada, pierde parte de su potencial. Es decir, a día de hoy si queremos procesarla digitalmente no nos servirá de nada. Por ejemplo, un programa de facturación no sabrá interpretar una factura almacenada en PDF. 

La razón es que los ordenadores y softwares que utilizamos necesitan “datos estructurados” para funcionar. Sin embargo, toda esta información almacenada en facturas, contratos, emails… se consideran “datos no estructurados”. ¿Y qué son datos estructurados? Básicamente puede decirse que son datos organizados en campos y que han sido etiquetados o categorizados. 

¿Está mi empresa digitalizada?

Muchas empresas entienden que la digitalización consiste en pasar de un formato físico a la nube la mayoría de sus documentos. Sin embargo, el cambio de formato no es determinante. Lo relevante es extraer los datos de los documentos para poder procesarlos. Y aquí es donde surge un grave problema.

¿Quién vuelca todos los datos de facturas de proveedores en el software de facturación? ¿Cómo se pueden gestionar eficientemente todos los correos de queja que recibe un departamento de atención al cliente de retail? ¿Hay forma de reducir el tiempo en la tramitación de partes de accidente?

Hasta ahora, para realizar estas tareas –y otras similares– es necesario el trabajo de una o varias personas dentro de una organización. Dicho de otro modo, las empresas necesitan miles de horas anuales para poder sacar provecho de los datos que ya poseen. Esto implica un alto coste de recursos humanos y de tiempo que la mayoría de las compañías no pueden asumir.

La Inteligencia Artificial puede ser la respuesta a esta problemática. La clave es automatizar la extracción de esa información durante el proceso de digitalización. Pero, además, convertir esos datos no estructurados en campos organizados que puedan ser procesados por programas informáticos.

Qué es Document AI 

La Inteligencia Artificial está cada día más presente en nuestro día a día: sus aplicaciones acaparan toda clase de dispositivos. Y si hay una empresa pionera en ofrecer soluciones de IA y Machine Learning esa es Google. Precisamente, a finales de septiembre de 2020 presentó múltiples novedades en uno de sus productos con más proyección: Document AI

Document AI es una solución de Procesamiento de Lenguaje Natural (NLP) de Google Cloud Platform basado en la tecnología de reconocimiento óptico de caracteres (OCR) de Vision. Este servicio puede reconocer textos, imágenes y caracteres en más de 200 idiomas.

Con Document AI se pueden extraer datos no estructurados a partir de la imagen de un documento: factura, formulario, ticket… El servicio interpreta la información utilizando Machine Learning y la estructura en formato clave:valor o en una tabla. De esta forma ya es posible utilizar los datos para automatizar procesos de negocio que tradicionalmente requieren una intervención manual. 

Además de todas las posibilidades ya descritas, con Document AI es posible:

  • Localizar documentos, a través de los datos que contenga.
  • Identificar patrones o tendencias.
  • Crear estadísticas y generar conocimiento. 

Con todo ello, no sólo se reducen costes de operación, sino que se gana en escalabilidad en aquellos procesos que requieren una intervención manual (onboarding, atención al cliente, etc).

El potencial de los servicios que se engloban bajo Document AI es que automatiza una o varias partes del proceso de digitalización. Este proceso incluye desde la extracción de información hasta su clasificación, pasando por su correcto almacenaje. 

Qué otros obstáculos resuelve

Hay varias circunstancias que vienen a sumar complejidad al procesado de datos no estructurados y a su automatización:

  1. Volumen de información. A menudo los lotes de documentación a digitalizar que poseen las empresas suelen ser bastante grandes. Por ejemplo, si una entidad bancaria quisiera digitalizar y procesar los datos de todas sus escrituras hipotecarias sería una ardua tarea.
  2. Diversidad. Hay documentos que cambian a lo largo del tiempo. Ya sea en cuanto a la forma de recoger los datos, como al contenido de los mismos debido a cambios normativos. También ocurre que un mismo documento puede presentarse en diferentes formatos. Así ocurre con las facturas, cuyo modelo cambia de una empresa a otra. Es decir, todas recogen la misma información, pero la presentan de modo diferente, con lo que que añade un extra de dificultad a la hora de localizar los campos de los diferentes datos.
  3. Verificación. A veces es necesario contrastar con fuentes externas para poder validar la información. Por ejemplo, para comprobar que el formato de un documento como un DNI es correcto. 
  4. Búsqueda semántica. Hay documentos que contienen información pero no presentan un formato específico, como un email. También hay otros cuyos campos son muy genéricos, como el formulario de una queja. En esos casos, los datos claves se extraen por el contexto, por lo que el proceso se dificulta.  
     
Como funciona Document AI

Cómo funciona Document AI 

Las soluciones englobadas en Document AI intervienen en cada una de las fases en las que pueden dividirse el proceso de Automatización.

Digitaliza los documentos

El proceso de extracción de información se produce al mismo tiempo que el escaneado del documento. Esto es posible gracias a las técnicas OCR. De esta forma, al digitalizar una factura, se puede directamente capturar los datos que aparecen en ella.

La extracción de datos se produce igualmente de forma automática en documentos que ya son digitales. Además, tras las últimas actualizaciones de Document AI se aplica a otros formatos como imágenes, mensajes de voz, vídeos...

Clasificación semántica de los datos

Document AI identifica patrones sin necesidad de que existan campos específicos. Gracias a ello, puede clasificar información no estructurada de manera inteligente, como lo haría un humano. Por ejemplo, es capaz de diferenciar entre un mail que es un pedido comercial del que es una queja. 

Gestión y procesado de la información

Una vez que los datos están extraídos y bien clasificados, es posible gestionarlos. En efecto, se podrán procesar mediante cualquier software con una finalidad, para obtener un objetivo. Document AI permite establecer workflows o flujos de trabajo que permiten pasar a la acción. Para ello es necesario que la solución específica de Document AI esté integrada correctamente con todos los sistemas involucrados.

Te ponemos un ejemplo: una persona sufre un accidente de tráfico y quiere dar parte a su compañía aseguradora. Gracias a Document AI y sus integraciones, esta persona podrá enviar por WhatsApp una foto del formulario cumplimentado a mano. A continuación, el sistema extraerá los datos principales para remitirlos, ya filtrados, al departamento que se encarga de esta gestión. Con esta automatización, no sólo el cliente ahorra tiempo en el trámite, sino que la propia compañía simplifica su proceso, haciéndolo más eficiente.

Document AI por dentro

Bajo la denominación Document AI se engloban tres servicios principales:

  • General Document AI, con APIs relacionadas con la extracción de documentos. Un ejemplo de ello es Vision API que interpreta información textual escrita a mano.
  • Custom Document AI, basados en AutoML y en modelos personalizados de Machine Learning. De esta forma una empresa puede tanto crear como entrenar modelos propios para sus documentos, formularios y casos de uso.
  • Specialized Document AI, que son modelos preconstruidos por Google especializados en un tipo concreto de documentos (recibos, facturas…). 

No obstante, cada uno de ellos, integra a su vez servicios más concretos, ya sean modelos pre-entrenados por Google, disponibles a través de APIs o la posibilidad de entrenar nuestros propios modelos a través de AutoML.

Asimismo, las APIs y modelos de Machine Learning de Document AI se integran con otros servicios de Google:

  • Dialogflow: para crear asistentes virtuales operativos que sean capaces de interpretar documentos facilitados por los usuarios, como partes de accidentes, tickets de compra, facturas, etc…
  • NLP con ello se puede analizar el sentimiento general expresado en un bloque de texto o identificar entidades como personas, organizaciones, localizaciones... 

Cómo sacar el máximo partido a Document AI 

En definitiva, las posibilidades que ofrece Document AI son múltiples, pero muchas empresas encuentran dificultades a la hora de sacar partido de ella. Es más, en ocasiones conocen su problemática y también los productos existentes, pero carecen de perspectiva para hallar una solución que se ajuste a sus circunstancias.

Por ello, es importante contar con un partner que ayude a llevar estas soluciones a otro nivel. En Emergya, como partner Premier de Google Cloud, conocemos todas estas herramientas y sabemos aplicarlas para hallar soluciones específicas y funcionales. Cada día ayudamos a nuestros clientes  a sacarles partido, poniendo toda la tecnología de Google Cloud a trabajar para su negocio.
 

¿Tienes algún proyecto innovador en mente y no sabes cómo llevarlo a cabo? Escríbenos o llámanos, y te ayudaremos a hacerlo realidad
base pixel px
Convert
Enter PX px
or
Enter EM em
Result