- Información general
- Primeros pasos
- Crear modelos
- Consumir modelos
- Detalles del modelo
- Puntos finales públicos
- 1040: tipo de documento
- 1040 Anexo C: tipo de documento
- 1040 Anexo D: tipo de documento
- 1040 Anexo E: tipo de documento
- 1040x: tipo de documento
- 3949a: tipo de documento
- 4506T: tipo de documento
- 709: tipo de documento
- 941x: tipo de documento
- 9465: tipo de documento
- ACORD125: tipo de documento
- ACORD126: tipo de documento
- ACORD131: tipo de documento
- ACORD140: tipo de documento
- ACORD25: tipo de documento
- Estados de cuenta bancarios: tipo de documento
- Facturas de carga: tipo de documento
- Certificado de incorporación: tipo de documento
- Certificado de origen: tipo de documento
- Comprobaciones: tipo de documento
- Certificado de producto secundario: tipo de documento
- CMS 1500: tipo de documento
- Declaración de conformidad de la UE: tipo de documento
- Estados financieros: tipo de documento
- FM1003: tipo de documento
- I9: tipo de documento
- Tarjetas de identificación: tipo de documento
- Facturas: tipo de documento
- Facturas2: tipo de documento
- Facturas Australia: tipo de documento
- Facturas China: tipo de documento
- Facturas Hebreo: tipo de documento
- Facturas India: tipo de documento
- Facturas Japón: tipo de documento
- Remisión de facturas: tipo de documento
- Listas de embalaje: tipo de documento
- Nóminas: tipo de documento
- Pasaportes: tipo de documento
- Órdenes de compra: tipo de documento
- Recibos: tipo de documento
- Recibos2: tipo de documento
- Recibos Japón: tipo de documento
- Notificaciones de remesas: tipo de documento
- UB04: tipo de documento
- Divulgación de cierre de hipotecas en EE. UU.: tipo de documento
- Facturas de servicios públicos: tipo de documento
- Títulos de vehículos: tipo de documento
- W2: tipo de documento
- W9: tipo de documento
- Idiomas admitidos
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Datos y seguridad
- Registro
- Licencia
- Tutorial
- Solución de problemas

Guía del usuario de proyectos modernos de Document Understanding
El modelo lingüístico de gran tamaño (LLM) de DocPath es nuestra última tecnología de modelo de extracción de datos, diseñada para reemplazar los modelos de generación actuales utilizados en UiPath® Document UnderstandingTM. Aunque DocPath funciona de forma similar a los modelos anteriores, se entrenó utilizando una amplia variedad de documentos. Esto le permite procesar tipos de documentos comunes con poca o ninguna formación necesaria. Lo que distingue a DocPath LLM es su arquitectura generativa, que mejora significativamente la precisión y simplifica la extracción. Además, también puedes ajustar el modelo con tus conjuntos de datos únicos.
Para obtener más información sobre la arquitectura de DocPath y las técnicas utilizadas para el entrenamiento, consulta la página de DocPath de nuestro blog de IA.
Actualmente, UiPath DocPath solo está disponible para tenants con sede en EE. UU. (excluyendo GxP y Government Cloud) en proyectos modernos de Document Understanding.
- Los puntos finales públicos para los modelos de extracción en Europa se basan en DocPath, excepto para los estados financieros.
- Los siguientes puntos finales públicos para modelos de extracción se basan en DocPath en la región de Japón:
- Facturas China
- Facturas Japón
- Recibos de Japón
DocPath LLM ofrece numerosas mejoras con respecto a los modelos anteriores. Mejora la precisión, especialmente con las tablas, se adapta a varios diseños de documentos para reducir los esfuerzos de anotación y aumenta las tasas de automatización.
- Precisión mejorada: DocPath LLM ofrece una mayor tasa de precisión y una puntuación F1 superior para documentos semiestructurados como facturas, recibos y órdenes de compra. Esto garantiza una extracción de datos precisa y consistente.
- Anotación sin esfuerzo: el modelo reduce el trabajo manual al requerir solo una anotación por documento, eliminando la necesidad de anotar cada instancia de campo en cada página.
- Automatización mejorada: con una mayor correlación entre el nivel de confianza y la precisión, DocPath LLM mejora las tasas de automatización al tiempo que reduce el número de documentos enviados a Action Center para el mismo nivel de precisión.
Según nuestras pruebas internas, DocPath superó a su predecesor en rendimiento. Redujo la tasa de falsos positivos en alrededor de un 15 %, y la tasa de falsos negativos se redujo en casi un 17 %.
El DocPath LLM está disponible exclusivamente para proyectos modernos de Document Understanding. A pesar de la introducción de DocPath, todas las versiones existentes del proyecto seguirán utilizando las versiones actuales del modelo. Esto garantiza una transición fluida sin ninguna interrupción de los flujos de trabajo de producción en curso.
Para empezar a entrenar un tipo de documento existente en DocPath, anule la confirmación y confirme todos los campos en algunos documentos.
Los nombres de campo que elijas pueden afectar en gran medida al rendimiento del modelo. Para garantizar resultados óptimos, utiliza el lenguaje natural y la gramática adecuada para los nombres de campo. Solo debes utilizar acrónimos ampliamente reconocidos como Número (No), Cuenta (Acct), Dirección (Addr) y Apartamento (Apt). Actualmente, solo se admiten idiomas de Europa occidental, así que asegúrate de que los nombres de campo elegidos se alineen con estos idiomas. Evita utilizar nombres no descriptivos, como "Columna 3", a menos que el documento utilice específicamente esa terminología.
UiPath DocPath actualmente solo admite idiomas de escritura latina. Si necesitas entrenar un modelo en lenguajes de script no latinos, elige el tipo de modelo heredado. Si se selecciona el modelo heredado, elige el modelo base adecuado para tu tipo de documento.
Para elegir entre el tipo de modelo DocPath o heredado, ve a la pestaña Configuración en Document Type Manager y selecciona el tipo de modelo necesario de la lista desplegable Tipo de modelo .
- Los campos extraídos deben coincidir exactamente con el texto de los documentos. Este proceso no incluye resumir u otros tipos de análisis de texto.
- Los siguientes tipos de documentos no se basan actualmente en DocPath y siguen funcionando en la generación anterior:
- Estados financieros
- Facturas China
- Facturas en hebreo
- Facturas Japón
El tipo de documento se entrenará utilizando el modelo heredado.
UiPath DocPath no admite actualmente lenguajes de script no latinos.