ixp
latest
false
  • Información general
    • Introducción
    • Extraer datos de documentos no estructurados
    • Crear e implementar modelos
    • Cuotas
  • Creación de modelos
    • Información general
    • Gestionar proyectos
    • Carga de documentos de ejemplo​
    • Revisar predicciones
    • Validar predicciones de extracción
    • Configuración del modelo
  • Validación del modelo
  • Implementación del modelo
  • Preguntas frecuentes
UiPath logo, featuring letters U and I in white

Guía del usuario de Documentos complejos y no estructurados

Última actualización 3 de nov. de 2025

Configuración del modelo

Información general

Puedes configurar el LLM subyacente, así como sus ajustes en la opción Configuración de modelo en la pestaña Crear.



Los ajustes disponibles son:
  • Preprocesamiento inteligente:
    • Ninguno
    • Modelo de tabla: mini
    • Modelo de tabla
  • Modelo de extracción:
    • GPT-4o
    • Géminis
  • Opciones avanzadas:
    • Atribución
    • Temperatura
    • P principal
    • Semilla
    • Sanción de frecuencia
    • Anulación de solicitud

Ajusta esta configuración para mejorar la precisión de las predicciones del modelo y mejorar su rendimiento.

Preprocesamiento inteligente

Las opciones de preprocesamiento inteligentes mejoran el rendimiento de la predicción cuando los documentos son difíciles de interpretar para los modelos, debido a un formato complejo.

Esto incluye las siguientes opciones:
  • Ninguno: esta opción predeterminada es adecuada para la mayoría de los documentos sin contenido tabular.
  • Modelo de tabla: mini: optimizado para contenido tabular y latencia. Esta opción es la más adecuada para documentos con tablas simples o varias tablas.
  • Modelo de tabla: optimizado para contenido tabular más complejo. Esta opción es la más adecuada para documentos con tablas anidadas complejas, tablas con celdas fusionadas, viñetas o tablas que se extienden en varias páginas.
    Nota:
    • Aunque esto funciona mejor en tablas complejas, aumenta la latencia de las predicciones.
    • Esta característica se basa en modelos de Gemini a través de AI Trust Layer.

Ejemplo de preprocesamiento inteligente

La siguiente imagen contiene un ejemplo de una extracción que consulta LLM sin utilizar el modo de modelo de tabla, donde los valores de la columna this period se confunden con los de la columna year to date.

La siguiente imagen contiene un ejemplo de una extracción mediante el modo de modelo de tabla, donde los valores de ambas columnas this period y year to date, se extraen correctamente.

Modelos de extracción

La opción Modelo de extracción representa el LLM subyacente utilizado para la extracción.

Los modelos disponibles son:
  • GPT-4o
  • Géminis

Elegir el modelo más adecuado

Diferentes modelos se comportarán de forma diferente para diferentes casos de uso, pero se recomienda utilizar Gemini siempre que sea posible. Varias otras funciones de antes y después del procesamiento, que ayudan a optimizar el rendimiento y la experiencia de usuario, también se basan en Gemini.

GPT-4o tiene una restricción de 50 páginas y solo puede procesar más utilizando la característica de llamada iterativa actualmente vista previa.

Gemini puede procesar documentos en Extracción y Procesamiento Inteligentes (IXP) de hasta 200 páginas en una sola llamada, con recuentos de páginas más altos compatibles en la vista previa. El límite de Géminis puede variar ligeramente en función de la densidad de los valores de campo dentro del documento. El modelo Gemini tiene un límite de entrada de 200 páginas de forma predeterminada, en comparación con el límite de entrada de 50 páginas de GPT-4o. Además, Gemini tiene una ventana de contexto de salida más alta, lo que le permite manejar más valores de campo.

Cambiar de un modelo a otro

Para cambiar de un modelo a otro, utiliza la lista desplegable de la opción Modelo de extracción y selecciona Guardar. Esto desencadenará la creación de una nueva versión del proyecto y la generación de nuevas predicciones automáticamente.

Importante: para proyectos maduros, las taxonomías, en particular las instrucciones, y las predicciones confirmadas, en particular para campos inferidos, normalmente se optimizan para un tipo de modelo sobre el otro. Es probable que después de cambiar, las puntuaciones de rendimiento puedan caer, ya que se puede requerir alguna iteración en las instrucciones y volver a revisar las predicciones para deshacer las optimizaciones específicas del modelo que pueden estar afectando al rendimiento del otro modelo.

Si necesitas cambiar el modelo por razones de rendimiento, comprueba primero si el modelo alternativo puede resolver el problema central que el modelo actual no puede resolver. Si puedes, optimiza el nuevo modelo para mejorar las métricas de rendimiento en Measure.

Opciones avanzadas

Las opciones avanzadas te permiten personalizar la configuración de tus modelos, seleccionar qué método de atribución utilizar y utilizar la anulación de solicitud.

Nota: el uso de la anulación de solicitud solo se recomienda en casos excepcionales.

Expande la configuración para ver todas las opciones disponibles:

  • Atribución: el método utilizado para atribuir predicciones a la parte o texto relevante en el documento. Selecciona una de las siguientes opciones:
    • Basado en reglas: utiliza un extenso conjunto de reglas y heurísticas para hacer coincidir los intervalos correctos en una página con los valores predichos del modelo. Esta es una opción de baja latencia, pero sacrifica el rendimiento en términos de atribuciones correctas en comparación con la opción basada en modelo.
    • Basado en modelo: utiliza una llamada de LLM adicional para hacer coincidir correctamente los valores predichos con los intervalos correctos en la página, ya que estos valores a menudo se pueden repetir en diferentes partes de la página. Esta es la opción de mayor rendimiento en términos de atribuciones correctas, pero añade algo de latencia a las predicciones. Esta opción se basa en el uso de modelos de Gemini.
  • Temperatura: la temperatura de muestreo que se utilizará. Selecciona un número entre 0,0 y 2,0. Cuanto más altos sean los valores, más aleatorio será el resultado​.
  • P principal: muestras solo de tokens con la masa de probabilidad top_p. Selecciona un número entre 0,0 y 1,0.
  • Semilla: si se especifica, las solicitudes repetidas con la misma semilla y parámetros deben devolver el mismo resultado.
  • Sanción de frecuencia: selecciona un número entre -2,0 y 2,0. Los valores positivos reducen la probabilidad de que el modelo repita los tokens que ya han aparecido en el texto.
  • Anulación de solicitud: anula la solicitud del sistema predeterminada con un nuevo valor. Esta opción está deshabilitada de forma predeterminada. Una vez habilitadas, las opciones Anexar solicitud de instrucciones de tarea y Anexar solicitud de instrucciones de campo están habilitadas para la configuración.
Nota: el equipo de UiPath® ha investigado y optimizado los valores predeterminados de la configuración del modelo como Temperatura, P principal y Frecuencia.Como resultado, no es necesario ajustar estos valores a menos que sepas qué configuraciones específicas necesitas.

  • Información general
  • Preprocesamiento inteligente
  • Ejemplo de preprocesamiento inteligente
  • Modelos de extracción
  • Opciones avanzadas

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo
Confianza y seguridad
© 2005-2025 UiPath. Todos los derechos reservados.