Document Understanding: características generativas

document-understanding

latest

false

Guía del usuario de Document Understanding

Importante :

La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Características generativas

Configura y utiliza características de IA generativa en Document Understanding, con disponibilidad dependiendo de la plataforma de Automation Cloud en uso.

Nota:

La disponibilidad de las características depende de la plataforma en la nube que utilices. Para obtener más información, consulta la página Elegir el tipo de implementación.

La IA generativa es una forma de tecnología de IA que aprovecha los modelos de aprendizaje automático (ML) para crear y generar nuevo contenido, datos o información.

La clave para la mayoría de las tareas de IA generativas son los grandes modelos de idioma (LLM). Estos son modelos ML que se entrenan en una gran cantidad de datos de texto, diseñados para generar texto similar al humano. Los LLM también pueden comprender y responder a las solicitudes completando oraciones o párrafos de forma similar a la humana.

Anotación generativa

Aplicados principalmente durante el proceso de anotación automática de documentos en el paso Construcción, estos modelos generativos aceleran el diseño de taxonomía y ayudan a entrenar modelos de forma eficiente.

La anotación previa en Document Understanding se realiza utilizando una combinación de modelos generativos y especializados, en función del esquema del tipo de documento. El esquema define claramente los campos que deseas extraer de un tipo de documento en particular.

Para obtener una comprensión más profunda de cómo funciona la anotación generativa y cómo puedes utilizarla de forma eficiente en tus proyectos, consulta la Página Anotar documentos.

Extracción generativa

La extracción generativa es una característica crucial dentro de Document Understanding^TM que utiliza el poder de los modelos de IA generativa. Estos modelos se configuran utilizando actividades y se utilizan principalmente en tiempo de ejecución para la extracción de datos.

La extracción generativa es capaz de descifrar y extraer información específica de documentos no estructurados o semiestructurados. Por ejemplo, puede escanear una factura y recuperar con precisión detalles como la fecha, el importe facturado y el nombre de la empresa. Esto permite la recopilación de información rápida, eficiente y altamente precisa de varios tipos de documentos.

Consejo:

Para obtener más información sobre cómo utilizar las actividades de extracción generativa de forma más eficiente, consulta la página Extractor generativo: buenas prácticas .

Nota:

Asegúrate de que usas las siguientes versiones mínimas de actividades cuando utilices Document Understanding en entornos de Automation Cloud y Test Cloud Sector Público:

IntelligentOCR.Activities 6.22 y más recientes
DocumentUnderstanding.ML.Activities 1.31.1 y más recientes

Hay varias actividades para ayudarte a aprovechar las características de extracción generativa:

Paquete de actividades de Document Understanding:
- Extraer datos de documentos, parámetro de solicitud después de elegir el extractor generativo.
Paquete de actividades ML de Document Understanding:
- Extracción generativa
Paquete de actividades de IntelligentOCR:
- Ámbito de extracción de datos, parámetro ApplyAutoValidation.

También puedes utilizar las API de Document Understanding para aprovechar las características de extracción generativa.

Modelos compatibles

Los extractores generativos disponibles en el proyecto Generativo predefinido pueden utilizarse para los documentos descritos en la siguiente tabla:

Nota:

Los extractores de diseño complejo de documento largo y diseño complejo de documento corto no están disponibles actualmente en Automation Cloud^TM para entornos del sector público (FedRamp).

Tabla 1. Escenarios admitidos para extractores generativos

Extractor	Escenario recomendado	Proveedor	Disponibilidad de la región	Soporte multimodal¹
Extractor de diseño simple de documentos largos	Recomendado para documentos de forma larga con principalmente texto y encabezados. Por ejemplo, puedes utilizar el extractor de diseño simple de documentos largos en documentos como acuerdos de arrendamiento, acuerdos de servicio maestro u otros documentos similares.	Azure OpenAI	Australia, Unión Europea, India, Japón, Singapur, Reino Unido, Estados Unidos, Canadá	❌
Extractor de diseño complejo de documentos largos (vista previa)	Recomendado para documentos de forma larga con diseños complejos, como imágenes, texto escrito a mano, elementos de formulario o diseños distintivos como cuadros de llamada flotantes. Puedes utilizar este extractor en documentos de forma larga como las pólizas de seguro, que generalmente tienen diseños complejos.	Azure OpenAI	Estados Unidos, Unión Europea, Japón, Singapur	✅
Extractor de diseño complejo de documentos cortos (vista previa)	Recomendado para documentos más cortos (de un máximo de 20 páginas) con imágenes, texto escrito a mano, elementos de formulario o diseños complejos, como cuadros de llamada flotantes. Puedes utilizar este extractor en documentos como documentos de identificación gubernamentales o formularios de entrada de atención médica que normalmente tienen diseños más cortos pero más complejos.	Azure OpenAI	Estados Unidos, Unión Europea, Japón, Singapur	✅

¹ El soporte multimodal se refiere a la capacidad de extraer diferentes tipos de entradas de datos, como texto, imágenes, texto escrito a mano, etc.

Clasificación generativa

La clasificación generativa utiliza modelos de IA para clasificar automáticamente los documentos inmediatamente después de cargarlos.

Este proceso de clasificación automática aprovecha los modelos de aprendizaje automático para "leer" el contenido de un documento, comprender su contexto y, en consecuencia, clasificarlo en categorías predefinidas. De esta manera, el sistema puede gestionar y organizar varios tipos de documentos de forma eficiente.

Al clasificar con precisión documentos no estructurados o semiestructurados, la clasificación generativa mejora el flujo de trabajo de procesamiento de documentos, ahorra tiempo y mejora la gestión general de documentos.

Consejo:

Para obtener más información sobre cómo utilizar las actividades de clasificación generativa de forma más eficiente, consulta la página Clasificador generativo - Buenas prácticas .

Nota:

Asegúrate de que usas las siguientes versiones mínimas de actividades cuando utilices Document Understanding en entornos de Automation Cloud y Test Cloud Sector Público:

IntelligentOCR.Activities 6.22 y más recientes
DocumentUnderstanding.ML.Activities 1.31.1 y más recientes

Hay varias actividades para ayudarte a aprovechar las características de clasificación generativa:

Paquete de actividades de Document Understanding:
- Clasificar documento
Paquete de actividades ML de Document Understanding:
- Clasificador generativo

También puedes utilizar las API de Document Understanding para aprovechar las características de clasificación generativa.

Validación generativa

La validación generativa es una característica distintiva en Document Understanding que desempeña un papel importante durante el proceso de validación. Esta característica se utiliza principalmente después del paso de extracción para validar la puntuación de confianza para la extracción realizada utilizando modelos especializados.

Cuando la puntuación de confianza de un modelo de aprendizaje automático para una extracción de documentos es baja, se utiliza la validación generativa para cotejar la salida. Este proceso de validación implica tanto los modelos de aprendizaje automático especializados como generativos que trabajan en conjunto para garantizar la precisión.

Si ambos modelos producen el mismo resultado, se puede omitir la validación humana, lo que conduce a una mejora significativa en la eficiencia temporal de la validación. Este proceso no solo ahorra un tiempo valioso en el paso de validación de documentos, sino que también mejora el rendimiento de tus modelos empleando un modelo generativo secundario para cotejar el resultado, garantizando un nivel de precisión más alto.

Nota:

Asegúrate de que usas las siguientes versiones mínimas de actividades cuando utilices Document Understanding en entornos de Automation Cloud y Test Cloud Sector Público:

IntelligentOCR.Activities 6.22 y más recientes
DocumentUnderstanding.ML.Activities 1.31.1 y más recientes

Hay varias actividades para que puedas aprovechar las características de validación generativa:

Paquete de actividades de Document Understanding:
- Extraer datos de documentos, parámetro de validación automática
Paquete de actividades de IntelligentOCR:
- Ámbito de extracción de datos, parámetros ApplyAutoValidationy AutoValidationConfidenceThreshold

También puedes utilizar las API de Document Understanding para aprovechar las características de validación generativa.

En esta página

Anotación generativa
Extracción generativa
Actividades relacionadas
Modelos compatibles
Clasificación generativa
Actividades relacionadas
Validación generativa
Actividades relacionadas

¿Te ha resultado útil esta página?

AnteriorLlamadas a API

Sig.Consumir modelos de diferentes entornos

Anotación generativa​

Extracción generativa​

Actividades relacionadas​

Modelos compatibles​

Clasificación generativa​

Actividades relacionadas​

Validación generativa​

Actividades relacionadas​

¿Te ha resultado útil esta página?

Anotación generativa

Extracción generativa

Actividades relacionadas

Modelos compatibles

Clasificación generativa

Actividades relacionadas

Validación generativa

Actividades relacionadas