- Información general
- Creación de modelos
- Validación del modelo
- Implementación del modelo
- Consumir modelos
- API
- Preguntas frecuentes
Guía del usuario de Documentos complejos y no estructurados
Esta característica está disponible en la vista previa en la región Japón.
Información general
El modelo de diseño para idiomas extendidos es una opción de preprocesamiento inteligente de IXP que mejora la precisión de la extracción. Es un paso de normalización opcional que se utiliza junto con el modelo de extracción principal que ayuda a mejorar la forma en que se representan los documentos antes de que el LLM los procese, especialmente para los documentos en los que la posición de la información en la página importa, como tablas, formularios, diseños de varias columnas o documentos basados en casillas de verificación.
Antes de que el modelo de extracción procese el contenido, el Modelo de diseño (idiomas extendidos) analiza la estructura visual del documento, incluso cómo están dispuestos el texto y otros elementos en la página. Está diseñado específicamente para mejorar la precisión de los documentos que utilizan conjuntos de caracteres extendidos y diseños complejos, en los que otras opciones de preprocesamiento pueden capturar la estructura del documento con menos precisión.
Beneficios
La característica Modelo de diseño (idiomas extendidos) aporta los siguientes beneficios:
- Preprocesamiento centrado en la estructura: mejora la forma en que se interpreta el diseño de los documentos durante la extracción, sin cambiar de solicitud ni de modelo. Es especialmente eficaz cuando la precisión depende más de la estructura del documento que del significado del contenido.
- Asignación de filas/columnas más precisa: conserva las relaciones en las que la estructura es crítica.
- Extracción mejorada de casillas de verificación: detecta y asigna de forma más fiable los campos de las casillas de verificación.
- Integración perfecta de flujos de trabajo: funciona dentro del proceso de IXP existente para probar, validar, puntuar y comparar versiones.
Usar el Modelo de diseño
Para utilizar el modelo de diseño, haz lo siguiente:
- Navega a la pestaña Construir.
- Selecciona Configuración del modelo.
- En Preprocesamiento inteligente, selecciona Modelo de diseño (idiomas extendidos).
Cuándo utilizar el Modelo de diseño
Utiliza esta característica cuando la precisión de la extracción con las opciones de preprocesamiento Ninguno, Modelo de tabla: mini o Modelo de tabla sea inferior a la esperada.
Esta característica es especialmente eficaz en los siguientes escenarios:
- Estados financieros e informes densos: estados de corretaje, solicitudes de préstamo, informes de servicio y otros documentos en los que varias filas, secciones y tablas anidadas deben permanecer alineadas.
- Formularios con muchas casillas de verificación: formularios de seguros, sanitarios, incorporación y regulados con muchas casillas de verificación adyacentes o repetidas, donde normalmente se falla en la correcta asignación de casilla de verificación al campo.
- Documentos operativos de partidas: listas de embalaje, órdenes de inserción, órdenes de servicio, manifiestos y documentos similares en los que el reconocimiento correcto de filas es más importante que la comprensión semántica amplia.
- Conjuntos de documentos de bajo rendimiento: familias de documentos en los que la extracción estándar tiene un rendimiento inferior, especialmente cuando los errores se deben a desajustes de fila/columna o casilla de verificación en lugar de incidencias con las instrucciones.
Ejemplo de preprocesamiento del Modelo de diseño (idiomas extendidos)
La siguiente imagen contiene un ejemplo de una extracción que consulta el LLM sin utilizar el Modelo de diseño (idiomas extendidos). Single-Closing y No Cash Out aparecen incorrectamente como solicitados por el solicitante.
La siguiente imagen contiene un ejemplo de una extracción mediante el Modo de diseño (idiomas extendidos), donde los valores de ambos campos se extraen correctamente. No se aplicó ningún cambio de instrucción.