- Información general
- Creación de modelos
- Validación del modelo
- Implementación del modelo
- API
- Preguntas frecuentes
- Preguntas frecuentes

Guía del usuario de Documentos complejos y no estructurados
¿Cómo obtienen acceso los clientes y los socios a la capacidad de Documentos complejos y no estructurados de IXP?
Los clientes y socios pueden registrar su interés en el Portal Insider, ya que la capacidad de Documentos complejos y no estructurados está actualmente disponible en el programa de vista previa. Revisamos regularmente los registros y se notifica a los clientes y socios seleccionados para que se unan al programa de vista previa. Asegúrate de proporcionar tantos detalles sobre el caso de uso como sea posible.
¿Cuándo estará oficialmente disponible la capacidad de forma general?
La fecha prevista para el lanzamiento oficial de la capacidad Documentos complejos y no estructurados es a finales de julio de 2025. Los clientes seleccionados pueden participar en una disponibilidad general controlada durante el resto del período de vista previa. Todos los casos de uso controlados y disponibles de forma general deberán contar con la aprobación del equipo de producto y el respaldo de sus respectivos equipos de cuentas.
¿Está disponible la capacidad para usuarios de la comunidad?
Sí, la capacidad está disponible para los usuarios de Community, que solo tienen acceso a una funcionalidad restringida, y todos los tenants o proyectos están sujetos a límites predefinidos de tiempo de diseño y tiempo de ejecución. Para obtener más información, consulta las secciones Tiempo de diseño y Tiempo de ejecución .
¿Cuáles son las opciones de implementación de IXP?¿La capacidad está disponible de manera local?
Actualmente, las capacidades Communications Mining y Documentos complejos y no estructurados de IXP solo están disponibles en UiPath® Automation Cloud™.
Document Understanding está disponible en las implementaciones de Automation Cloud, Automation Suite y Standalone. Para obtener más información sobre las opciones de implementación de Document Understanding, consulta Elegir el tipo de implementación.
¿Está disponible esta capacidad en todas las regiones?
Actualmente, la capacidad Documentos complejos y no estructurados está disponible en general en los tenants de Estados Unidos y Europa, y está disponible en vista previa privada en las regiones de Canadá, Japón y Australia.
¿Qué idiomas se admiten en la capacidad?
Los usuarios pueden cargar documentos y crear modelos en cualquier idioma compatible con el modelo seleccionado dentro de Extracción y procesamiento inteligentes (IXP).
¿Qué formatos de archivo se admiten en la capacidad?
Actualmente, la capacidad admite los formatos de archivo PNG, JPG o JPEG, PDF y TIF o TIFF.
¿IXP utiliza IA especializada o generativa?
Communications Mining utiliza características de IA especializada y de IA generativa. Todas las funciones de IA generativa se pueden desactivar si es necesario.
Document Understanding uutiliza características de IA especializada y de IA generativa. Todas las funciones de IA generativa se pueden desactivar si es necesario.
Extracción generativa para Documentos complejos y no estructurados utiliza IA generativa a través de modelos lingüísticos de gran tamaño (LLM) de terceros. No es posible utilizar esta capacidad sin IA generativa.
Are CommPath and DocPath available in IXP?
CommPath está disponible en Communications Mining cuando se utiliza la característica Extracción generativa.
DocPath is available in Document Understanding, only in the Modern experience. It is not available in the Document Understanding Classic experience.
Ninguno de los dos está disponible en la capacidad de extracción generativa para Documentos complejos y no estructurados.
¿IXP pasa AI Trust Layer (AITL)?
Yes, all IXP capabilities that use third-party LLMs go through the UiPath AITL. CommPath and DocPath are the proprietary models of UiPath and do not go through the AITL.
¿Qué LLM utiliza la capacidad?
Los modelos GPT-4o Vision y Gemini están disponibles en la capacidad de Documentos complejos y no estructurados. El modelo Gemini está disponible como característica inteligente de preprocesamiento para datos tabulares.
¿Esta capacidad admite la suscripción BYO?
Actualmente no, pero la suscripción BYO se admitirá en futuras versiones.
¿Puedo migrar mi caso de uso de la experiencia clásica de Document Understanding a la capacidad Documentos complejos y no estructurados de IXP?
Aún no, pero la funcionalidad de importación y exportación estará disponible en futuras versiones.
¿Puedo migrar mi caso de uso de la experiencia moderna de Document Understanding a la capacidad Documentos complejos y no estructurados de IXP?
Aún no, pero la funcionalidad de importación y exportación estará disponible en futuras versiones.
¿Puedo migrar mi caso de uso de las actividades de Extractor generativo de Document Understanding a la capacidad Documentos complejos y no estructurados de IXP?
Aún no, pero la funcionalidad de importación y exportación estará disponible en futuras versiones.
¿Existe algún límite de tiempo de diseño para la capacidad?
Los límites de tiempo de diseño incluyen:
- Número de campos por grupo de campos: hasta 32 campos.
- Número de caracteres por nombre de campo: hasta 128 caracteres.
- Número de caracteres por instrucción de solicitud: hasta 2048 caracteres. Esto es aplicable a todas las solicitudes, incluidas las instrucciones generales, las instrucciones de grupo de campos, las instrucciones de campo y las instrucciones de tipo de campo.
¿Puedo crear campos genéricos en la capacidad de documentos?
No, no hay concepto de campos genéricos en IXP. Todos los campos deben pertenecer a un grupo de campos. Cada grupo de campos representa una tabla independiente, donde los campos significan columnas de la tabla. Sin embargo, es posible definir un grupo de campos de nivel principal que representa un tipo de documento y añadir campos más generales como una tabla en este grupo de campos.
¿Los modelos de Documentos complejos y no estructurados de IXP mejoran el rendimiento con el etiquetado o las anotaciones?
No, el modelo aún no aprende directamente de las anotaciones del usuario. La forma de mejorar actualmente el rendimiento de tu modelo es modificar tus instrucciones de solicitud o la configuración del modelo. Estamos investigando diferentes soluciones, incluido aprendizaje en contexto, mejoras de los comentarios de instrucciones y modelos ajustables.
¿Por qué necesito anotar documentos si no mejora el rendimiento del modelo?
Sigue siendo importante validar y anotar documentos para establecer verdades básicas para la evaluación del rendimiento del modelo, que se capturan en las métricas de rendimiento integradas en la página Medir.
¿Cuántos documentos necesito cargar para realizar la prueba de mis instrucciones de solicitud?
Debes cargar una muestra representativa de tus documentos para cubrir todas las variaciones posibles. Esto debería ser de al menos 20-30 documentos diferentes. Se recomienda revisar las predicciones iniciales en 2 a 3 documentos y decidir si necesitas modificar tus instrucciones de solicitud antes de aumentar gradualmente la muestra de prueba a 10, 20, 30 o X documentos, donde esto será un proceso iterativo.
¿Cuántos documentos necesito anotar para obtener métricas de rendimiento fiables?
Se recomienda validar al menos 10 documentos o 10 ejemplos, o ambos, para cada campo, para que el modelo pueda proporcionarte estadísticas de validación significativas. Este es el número mínimo de anotaciones y dependerá de los requisitos específicos del caso de uso.
¿Los modelos de Documentos complejos y no estructurados se consumen a través de robots o API independientes de Document Understanding?
Los modelos de Documentos complejos y no estructurados se pueden consumir tanto a través de robots como de la API independiente de Document Understanding Automation Cloud.
¿Cómo puedo consumir salidas de Documentos complejos y no estructurados?
Las salidas del modelo se pueden consumir a través de las API, actividades de Document Understanding o actividades de IntelligentOCR. Asegúrate de lo siguiente:
- Instala el paquete IOCR v6.23.2-vista previa o más reciente y selecciona la actividad Extractor de Proyecto de Document Understanding.
- Instala el paquete v2.13.2-vista previa o más reciente de Document Understanding y selecciona la actividad Extraer datos del documento.
¿La capacidad Documentos complejos y no estructurados de IXP proporciona puntuaciones de confianza? ¿Cómo se calculan?
Sí, proporcionamos puntuaciones de confianza en la respuesta del modelo y en Action Center (tiempo de ejecución), pero no en la interfaz de usuario de Extracción y Procesamiento Inteligentes (IXP) (tiempo de diseño). Utilizamos las probabilidades de token devueltas por el LLM para estimar las confianzas de campo y nivel de extracción.
¿Se pueden consumir las salidas del modelo de Documentos complejos y no estructurados desde implementaciones híbridas, es decir, en Orchestrator o Automation Suite locales y en el modelo Cloud IXP?
Sí, se admite a través de aplicaciones externas. Para obtener más información, consulta Aplicaciones OAuth.
¿Se pueden consumir las salidas del modelo de Documentos complejos y no estructurados de IXP de diferentes organizaciones o tenants, que son de producción, desarrollo o UAT?
Sí, se admite a través de aplicaciones externas. Para obtener más información, consulta Aplicaciones OAuth.
¿Funciona la estación de validación con la capacidad Documentos complejos y no estructurados?
Sí, funciona de la misma manera que los proyectos modernos o clásicos de Document Understanding. Sin embargo, todas las extracciones deben validarse como tablas.
¿El modelo de Documentos complejos y no estructurados aprende en función de la validación HITL de Action Center?
No, actualmente no hay un bucle de retroalimentación entre Action Center y los modelos de Documentos complejos y no estructurados. Se planea admitir esto en futuras versiones junto con modelos ajustables.
En la práctica, Extracción y Procesamiento Inteligentes (IXP) puede extraer de forma fiable hasta aproximadamente 1200 valores de campo por documento.
Esto significa que si un documento requiere que se extraigan más de 1200 valores de campo, el modelo puede alcanzar su límite de tokens. Esto puede ocurrir incluso si el documento está dentro de los límites de páginas enumerados en esta sección. El trabajo de investigación y desarrollo está en curso para admitir límites de valor de campo más altos en futuras versiones.
Si se superan los límites de tokens, las predicciones pueden estar incompletas o vacías independientemente del número de páginas. Por ejemplo, un documento de 80 páginas con 1400 valores de campo extraídos puede desencadenar una advertencia de límite de tokens en la interfaz de usuario. En tiempo de ejecución, cuando se supera el límite de tokens, la respuesta de la API lo mostrará devolviendo valores de confianza de ocurrencia y extracción de 0.
Si se superan los límites de páginas, solo se procesan las páginas dentro de los límites especificados a continuación. Ambos comportamientos se aplican tanto a Gemini como a GPT-4o.
Los límites de tiempo de ejecución incluyen:
- Número de páginas por documento:
- Para Gemini, hasta 500 páginas.
- Para GPT-4o, 50 páginas y hasta 150 páginas utilizando la característica de vista previa privada de llamadas iterativas.
- Límites de tokens : los documentos con muchos datos con más de 200 extracciones, como las tablas largas, probablemente alcanzarán el límite de tokens. Si GPT4-o alcanza su límite, puedes utilizar la característica de vista previa privada de llamadas iterativas para aumentar la salida del campo. Sin embargo, Gemini tiene un límite de token de salida más alto de forma predeterminada, por lo que ambos modelos pueden devolver cantidades similares de valores de campo: Gemini en una sola llamada y GPT a través de varias llamadas.
¿La capacidad oferta alguna herramienta de supervisión?¿Son diferentes de los proyectos modernos de Document Understanding? ¿Hay dependencia de Insights?
Actualmente, la capacidad Documentos complejos y no estructurados no proporcionan ninguna capacidad de supervisión, como la página Supervisar en Proyectos modernos. Se compartirán detalles adicionales sobre las capacidades de supervisión en futuras versiones.
¿Podemos supervisar el consumo de AI Unit para los proyectos de Documentos complejos y no estructurados?
Actualmente, no hay disponible ningún seguimiento del consumo por proyecto. Una vez completamente integrado, es probable que el consumo aparezca en el panel de consumo de AI Unit y en un panel de Documentos complejos y no estructurados
¿Podemos detectar automáticamente la disminución del rendimiento, por ejemplo, la deriva de datos, puntuaciones F1 más bajas, etc.?
Por ahora, no proporcionamos ninguna notificación o alerta de rendimiento del modelo.
¿Con qué frecuencia necesitan los usuarios actualizar sus modelos o instrucciones de solicitud?
Esto depende de cada caso de uso, pero debes refinar tus instrucciones de solicitud cuando tus extracciones tengan un rendimiento inferior.