- Información general
- Introducción
- Extraer datos de documentos no estructurados
- Crear e implementar modelos
- Cuotas
- Creación de modelos
- Validación del modelo
- Implementación del modelo
- Preguntas frecuentes

Guía del usuario de documentos no estructurados y complejos
La capacidad de documentos no estructurados y complejos mejora la capacidad de manipular documentos no estructurados complejos y utiliza IA generativa para asignar campos y grupos de campos como se define en el esquema de extracción y predecirlos con confianza y precisión. Esta característica avanzada es experta en la extracción de datos de elementos complejos como tablas, cuadros o gráficos, y estructura la salida de forma efectiva.
El proceso implica:
- Revisar las predicciones iniciales del modelo.
- Modificar las instrucciones de solicitud de forma iterativa en función de los resultados de la revisión.
- Anotar documentos para recopilar información básica para la validación y perfeccionar el rendimiento de la extracción de datos.
Extraer datos de documentos no estructurados, como contratos, facturas largas u otros documentos similares, requiere un enfoque sistemático e inteligente debido a las variaciones en el formato, el idioma y el diseño.
El proceso comienza con unas instrucciones claras que guían al modelo de extracción en la identificación, interpretación y extracción de la información relevante. Estas instrucciones, a menudo denominadas ingeniería o extracciones de solicitud, desempeñan un papel crítico para garantizar que el modelo de IA interpreta y procesa el contenido de forma precisa.
Estas instrucciones incluyen:
- Definir campos de datos de destino, como fechas, nombres, cantidades, cláusulas y así sucesivamente.
- Proporcionar señales contextuales o ejemplos para que la IA reconozca patrones similares.
Al combinar ingeniería de solicitud detallada, comentarios iterativos y la potencia de razonamiento de la IA generativa, este enfoque mejora significativamente la extracción de información estructurada de documentos no estructurados y variables.