ixp
latest
false
  • Información general
    • Introducción
    • Extraer datos de documentos no estructurados
    • Crear e implementar modelos
    • Cuotas
  • Creación de modelos
  • Validación del modelo
  • Implementación del modelo
  • API
  • Preguntas frecuentes
    • Preguntas frecuentes
Importante :
La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.
UiPath logo, featuring letters U and I in white

Guía del usuario de Documentos complejos y no estructurados

Última actualización 11 de mar. de 2026

Preguntas frecuentes

Acceso y disponibilidad

Dónde la capacidad tiene disponibilidad general

La capacidad Documentos complejos y no estructurados está disponible en las siguientes regiones:

  • Europa
  • Estados Unidos
  • Estados Unidos (región diferida)
  • Japón
  • Canadá
  • Australia
  • Reino Unido

También puedes encontrar la lista de regiones en Servicios globales en cloud.

¿Está disponible la capacidad para usuarios de la comunidad?

Sí, la capacidad está disponible para los usuarios de Community, que solo tienen acceso a una funcionalidad restringida, y todos los tenants o proyectos están sujetos a límites predefinidos de tiempo de diseño y tiempo de ejecución. Para obtener más información, consulta las secciones Tiempo de diseño y Tiempo de ejecución .

¿Cuáles son las opciones de implementación de IXP?¿La capacidad está disponible de manera local?

Actualmente, las capacidades Communications Mining y Documentos complejos y no estructurados de IXP solo están disponibles en UiPath® Automation Cloud™.

Document Understanding está disponible en las implementaciones de Automation Cloud, Automation Suite y Standalone. Para obtener más información sobre las opciones de implementación de Document Understanding, consulta Elegir el tipo de implementación.

¿Está disponible esta capacidad en todas las regiones?

Actualmente, la capacidad Documentos complejos y no estructurados está disponible en general en los tenants de Estados Unidos y Europa, y está disponible en vista previa privada en las regiones de Canadá, Japón y Australia.

¿Qué idiomas se admiten en la capacidad?

Los usuarios pueden cargar documentos y crear modelos en cualquier idioma compatible con el modelo seleccionado dentro de Extracción y procesamiento inteligentes (IXP).

¿Qué formatos de archivo se admiten en la capacidad?

Actualmente, la capacidad admite los formatos de archivo PNG, JPG o JPEG, PDF y TIF o TIFF.

Datos y seguridad

¿IXP utiliza IA especializada o generativa?

Communications Mining utiliza características de IA especializada y de IA generativa. Todas las funciones de IA generativa se pueden desactivar si es necesario.

Document Understanding uutiliza características de IA especializada y de IA generativa. Todas las funciones de IA generativa se pueden desactivar si es necesario.

Extracción generativa para Documentos complejos y no estructurados utiliza IA generativa a través de modelos lingüísticos de gran tamaño (LLM) de terceros. No es posible utilizar esta capacidad sin IA generativa.

¿Está disponible UiPath Helix en Extracción y Procesamiento Inteligentes (IXP)?

UiPath Helix Extractor 1.0 (IXP-Comms) está disponible en Communications Mining cuando se utiliza la característica de extracción generativa.

UiPath Helix Extractor 1.0 (IXP-Docs) y UiPath Helix Extractor 2.0 (IXP-Docs) están disponibles en Document Understanding, solo en la experiencia moderna. No está disponible en la experiencia clásica de Document Understanding.

Ninguno de los dos está disponible en la capacidad de extracción generativa para Documentos complejos y no estructurados.

¿IXP pasa AI Trust Layer (AITL)?

Sí, todas las capacidades de Extracción y Procesamiento Inteligentes (IXP) que utilizan LLM de terceros pasan por UiPath AITL. UiPath Helix es el modelo familiar propietario de UiPath y las llamadas de Helix no pasan por AITL, ya que son internas para el entorno de UiPath.

¿Qué LLM utiliza la capacidad?

Los modelos GPT-4o Vision y Gemini están disponibles en la capacidad de Documentos complejos y no estructurados. El modelo Gemini está disponible como característica de preprocesamiento inteligente para datos tabulares y para impulsar la atribución basada en modelo.

¿Esta capacidad admite la suscripción BYO?

Actualmente no, pero la suscripción BYO se admitirá en futuras versiones.

Migración

¿Puedo migrar mi caso de uso de la experiencia clásica de Document Understanding a la capacidad Documentos complejos y no estructurados de IXP?

Aún no, pero la funcionalidad de importación y exportación estará disponible en futuras versiones.

¿Puedo migrar mi caso de uso de la experiencia moderna de Document Understanding a la capacidad Documentos complejos y no estructurados de IXP?

Aún no, pero la funcionalidad de importación y exportación estará disponible en futuras versiones.

¿Puedo migrar mi caso de uso de las actividades de Extractor generativo de Document Understanding a la capacidad Documentos complejos y no estructurados de IXP?

Aún no, pero la funcionalidad de importación y exportación estará disponible en futuras versiones.

Tiempo de diseño

¿Existe algún límite de tiempo de diseño para la capacidad?

Los límites de tiempo de diseño incluyen:

  • Número de campos por grupo de campos: hasta 32 campos.
  • Número de caracteres por nombre de campo: hasta 128 caracteres.
  • Número de caracteres por instrucción de solicitud: hasta 2048 caracteres. Esto es aplicable a todas las solicitudes, incluidas las instrucciones generales, las instrucciones de grupo de campos, las instrucciones de campo y las instrucciones de tipo de campo.

¿Puedo crear campos genéricos en la capacidad de documentos?

No, no hay concepto de campos genéricos en IXP. Todos los campos deben pertenecer a un grupo de campos. Cada grupo de campos representa una tabla independiente, donde los campos significan columnas de la tabla. Sin embargo, es posible definir un grupo de campos de nivel principal que representa un tipo de documento y añadir campos más generales como una tabla en este grupo de campos.

¿Los modelos de Documentos complejos y no estructurados de IXP mejoran el rendimiento con el etiquetado o las anotaciones?

No, el modelo aún no aprende directamente de las anotaciones del usuario. La forma de mejorar actualmente el rendimiento de tu modelo es modificar tus instrucciones de solicitud o la configuración del modelo. Un modelo con capacidad de ajuste fino que aprende de las anotaciones estará disponible en una versión futura.

¿Por qué necesito anotar documentos si no mejora el rendimiento del modelo?

Sigue siendo importante validar y anotar documentos para establecer verdades básicas para la evaluación del rendimiento del modelo, que se capturan en las métricas de rendimiento integradas en la página Medir.

¿Cuántos documentos necesito cargar para realizar la prueba de mis instrucciones de solicitud?

Debes cargar una muestra representativa de tus documentos para cubrir todas las variaciones posibles. Esto debería ser de al menos 20-30 documentos diferentes. Se recomienda revisar las predicciones iniciales en 2 a 3 documentos y decidir si necesitas modificar tus instrucciones de solicitud antes de aumentar gradualmente la muestra de prueba a 10, 20, 30 o X documentos, donde esto será un proceso iterativo.

¿Cuántos documentos necesito anotar para obtener métricas de rendimiento fiables?

Se recomienda validar al menos 10 documentos o 10 ejemplos, o ambos, para cada campo, para que el modelo pueda proporcionarte estadísticas de validación significativas. Este es el número mínimo de anotaciones y dependerá de los requisitos específicos del caso de uso.

Tiempo de ejecución

¿Los modelos de Documentos complejos y no estructurados se consumen a través de robots o API independientes de Document Understanding?

Los modelos de Documentos complejos y no estructurados se pueden consumir tanto a través de robots como de la API independiente de Document Understanding Automation Cloud.

¿Cómo puedo consumir salidas de Documentos complejos y no estructurados?

Las salidas del modelo se pueden consumir a través de las API, actividades de Document Understanding o actividades de IntelligentOCR. Asegúrate de lo siguiente:

  • Instala el paquete IOCR v6.23.2-vista previa o más reciente y selecciona la actividad Extractor de Proyecto de Document Understanding.
  • Instala el paquete v2.13.2-vista previa o más reciente de Document Understanding y selecciona la actividad Extraer datos del documento.

¿La capacidad Documentos complejos y no estructurados de IXP proporciona puntuaciones de confianza? ¿Cómo se calculan?

Sí, proporcionamos puntuaciones de confianza en la respuesta del modelo y en Action Center (runtime), pero no en la interfaz de usuario de Extracción y Procesamiento Inteligentes (IXP) (design-time). Utilizamos las probabilidades de token devueltas por el LLM para estimar las confianzas de campo y nivel de extracción.

¿Se pueden consumir las salidas del modelo de Documentos complejos y no estructurados desde implementaciones híbridas, es decir, en Orchestrator o Automation Suite locales y en el modelo Cloud IXP?

Sí, se admite a través de aplicaciones externas. Para obtener más información, consulta Aplicaciones OAuth.

¿Se pueden consumir las salidas del modelo de Documentos complejos y no estructurados de IXP de diferentes organizaciones o tenants, que son de producción, desarrollo o UAT?

Sí, se admite a través de aplicaciones externas. Para obtener más información, consulta Aplicaciones OAuth.

¿Funciona la estación de validación con la capacidad Documentos complejos y no estructurados?

Sí, funciona de la misma manera que los proyectos modernos o clásicos de Document Understanding. Sin embargo, todas las extracciones deben validarse como tablas.

¿El modelo de Documentos complejos y no estructurados aprende en función de la validación HITL de Action Center?

No, actualmente no hay un bucle de retroalimentación entre Action Center y los modelos de Documentos complejos y no estructurados. Se planea admitir esto en futuras versiones junto con modelos ajustables.

Límites del procesamiento de documentos

En la práctica, Extracción y Procesamiento Inteligentes (IXP) puede extraer de forma fiable hasta aproximadamente 1200 valores de campo por documento.

Esto significa que si un documento requiere que se extraigan más de 1200 valores de campo, el modelo puede alcanzar su límite de tokens. Esto puede suceder incluso si el documento está dentro de los límites de páginas que se indican en esta sección. El trabajo de investigación y desarrollo está en curso para admitir límites de valor de campo más altos en versiones futuras.

Si se superan los límites de tokens, las predicciones pueden estar incompletas o vacías, independientemente del número de páginas. Por ejemplo, un documento de 80 páginas con 1400 valores de campo extraídos puede desencadenar una advertencia de límite de tokens en la interfaz de usuario. En runtime, cuando se supera el límite de tokens, la respuesta de la API lo mostrará devolviendo valores de confianza de ocurrencia y extracción de 0.

Si se superan los límites de páginas, solo se procesan las páginas que están dentro de los límites especificados a continuación. Ambos comportamientos se aplican tanto a Gemini como a GPT-4o.

Los límites de Runtime / runtime incluyen:

  • Número de páginas por documento:

    • Para Gemini, hasta 500 páginas.
    • Para GPT-4o, 50 páginas y hasta 150 páginas usando el proceso de llamada iterativa de vista previa Privada.
  • Límites de tokens : los documentos con muchos datos con más de 200 extracciones, como las tablas largas, probablemente alcanzarán el límite de tokens si tienen un número típico de campos por extracción. Si GPT4-o alcanza su límite, puedes utilizar la característica de vista previa privada de llamadas iterativas para aumentar la salida del campo. Sin embargo, Gemini tiene un límite de token de salida más alto de forma predeterminada, por lo que ambos modelos pueden devolver cantidades similares de valores de campo: Gemini en una sola llamada y GPT a través de varias llamadas.

    Nota:

    Para solicitar acceso a la función de vista previa privada de llamadas iterativas, ponte en contacto con tu gestor de cuentas.

Mantenimiento y supervisión

¿La capacidad oferta alguna herramienta de supervisión?¿Son diferentes de los proyectos modernos de Document Understanding? ¿Hay dependencia de Insights?

Actualmente, la capacidad Documentos complejos y no estructurados no proporcionan ninguna capacidad de supervisión, como la página Supervisar en Proyectos modernos. Se compartirán detalles adicionales sobre las capacidades de supervisión en futuras versiones.

¿Podemos supervisar el consumo de AI Unit para los proyectos de Documentos complejos y no estructurados?

Sí, puedes hacer esto a mediante los paneles de AI Unit de Extracción y procesamiento inteligentes (IXP) de Insights y los paneles de AI Unit de tenant. Para obtener más detalles, consulta los Paneles de consumo de AI Units de Extracción y Procesamiento Inteligentes (IXP).

¿Podemos detectar automáticamente la disminución del rendimiento, por ejemplo, la deriva de datos, puntuaciones F1 más bajas, etc.?

Por ahora, no proporcionamos ninguna notificación o alerta de rendimiento del modelo.

¿Con qué frecuencia necesitan los usuarios actualizar sus modelos o instrucciones de solicitud?

Esto depende de cada caso de uso, pero debes refinar tus instrucciones de solicitud cuando tus extracciones tengan un rendimiento inferior.

¿Te ha resultado útil esta página?

Conectar

¿Necesita ayuda? Soporte

¿Quiere aprender? UiPath Academy

¿Tiene alguna pregunta? Foro de UiPath

Manténgase actualizado