- Información general
- Primeros pasos
- Crear modelos
- Consumir modelos
- Paquetes ML
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- Recibos Japón: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Puntos finales públicos
- Idiomas admitidos
- Paneles de insights
- Datos y seguridad
- Licencia
- Tutorial
Guía del usuario de proyectos modernos de Document Understanding
Características generativas
La IA generativa es una forma de tecnología de IA que aprovecha los modelos de aprendizaje automático (ML) para crear y generar nuevo contenido, datos o información.
La clave para la mayoría de las tareas de IA generativas son los grandes modelos de idioma (LLM). Estos son modelos ML que se entrenan en una gran cantidad de datos de texto, diseñados para generar texto similar al humano. Los LLM también pueden comprender y responder a las solicitudes completando oraciones o párrafos de forma similar a la humana.
Aplicados principalmente durante el proceso de anotación automática de documentos en el paso Crear , estos modelos generativos aceleran el diseño de taxonomía y ayudan a entrenar modelos de manera eficiente.
La anotación previa en Document Understanding se realiza utilizando una combinación de modelos generativos y especializados, en función del esquema del tipo de documento. El esquema define claramente los campos que desea extraer de un tipo de documento en particular.
Para obtener una comprensión más profunda de cómo funciona la Anotación generativa y cómo puedes usarla de manera eficiente en tus proyectos, consulta la página Anotar documentos .
La extracción generativa es una característica crucial dentro de Document UnderstandingTM que utiliza el poder de los modelos de IA generativos. Estos modelos se configuran mediante actividades y se utilizan principalmente en tiempo de ejecución para la extracción de datos.
La extracción generativa es capaz de descifrar y extraer información específica de documentos no estructurados o semiestructurados. Por ejemplo, puede escanear una factura y recuperar con precisión detalles como la fecha, el importe facturado y el nombre de la empresa. Esto permite recopilar información de forma rápida, eficiente y muy precisa a partir de varios tipos de documentos.
- Paquete de actividades de Document Understanding:
- Extraer datos del documento, parámetro Solicitar después de elegir el extractor generativo.
- Paquete de actividades ML de Document Understanding:
- Paquete de actividades IntelligentOCR:
- Ámbito de extracción de datos, parámetro AplicarValidaciónAutomática .
También puedes utilizar las API de Document Understanding para aprovechar las características de extracción generativa.
La clasificación generativa utiliza modelos de IA para clasificar automáticamente los documentos inmediatamente después de cargarlos.
Este proceso de clasificación automática aprovecha los modelos ML para "leer" el contenido de un documento, comprender su contexto y, en consecuencia, clasificarlo en categorías predefinidas. De esta manera, el sistema puede gestionar y organizar múltiples tipos de documentos de forma eficiente.
Al clasificar con precisión los documentos no estructurados o semiestructurados, la clasificación generativa mejora el flujo de trabajo de procesamiento de documentos, ahorra tiempo y mejora la gestión general de documentos.
- Paquete de actividades de Document Understanding:
- Paquete de actividades ML de Document Understanding:
También puedes utilizar las API de Document Understanding para aprovechar las características de clasificación generativa.
La validación generativa es una característica distintiva de Document Understanding que desempeña un papel importante durante el proceso de validación. Esta característica se utiliza principalmente después del paso de extracción para validar la puntuación de confianza para la extracción realizada utilizando modelos especializados.
Cuando la puntuación de confianza de un modelo ML para una extracción de documentos es baja, se utiliza la validación generativa para cotejar la salida. Este proceso de validación implica que tanto los modelos ML especializados como los generativos trabajen juntos para garantizar la precisión.
Si ambos modelos producen el mismo resultado, se puede omitir la validación humana, lo que lleva a una mejora significativa en la eficiencia del tiempo de validación. Este proceso no solo ahorra un tiempo valioso en el paso de validación de documentos, sino que también mejora el rendimiento de tus modelos al emplear un modelo generativo secundario para verificar de forma cruzada la salida, lo que garantiza un mayor nivel de precisión.
- Paquete de actividades de Document Understanding:
- Extraer datos del documento, parámetro de validación automática
- Paquete de actividades IntelligentOCR:
- Parámetros Ámbito de extracción de datos, ApplyAutoValidation y AutoValidationConfidenceThreshold
También puedes utilizar las API de Document Understanding para aprovechar las características de validación generativa.