- Información general
- Primeros pasos
- Crear modelos
- Consumir modelos
- Paquetes ML
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- Recibos Japón: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Puntos finales públicos
- Idiomas admitidos
- Paneles de insights
- Datos y seguridad
- Licencia
- Tutorial
UiPath® DocPath
El modelo de lenguaje grande (LLM) de DocPath es nuestra última tecnología de modelo de extracción de datos, diseñada para reemplazar los modelos de generación actuales utilizados en UiPath® Document UnderstandingTM. Aunque DocPath funciona de forma similar a los modelos anteriores, se entrenó utilizando una amplia variedad de documentos. Esto le permite procesar tipos de documentos comunes con poca o ninguna formación necesaria. Lo que distingue a DocPath LLM es su arquitectura generativa, que mejora significativamente la precisión y simplifica la extracción. Además, también puedes ajustar el modelo con tus conjuntos de datos únicos.
Para obtener más información sobre la arquitectura de DocPath y las técnicas utilizadas para el entrenamiento, consulta la página de DocPath de nuestro blog de IA.
Actualmente, UiPath DocPath solo está disponible para tenants con sede en EE. UU. Está previsto que el soporte para otras regiones se implemente a principios de 2025.
DocPath LLM ofrece numerosas mejoras con respecto a los modelos anteriores. Mejora la precisión, especialmente con las tablas, se adapta a varios diseños de documentos para reducir los esfuerzos de anotación y aumenta las tasas de automatización.
- Precisión mejorada: DocPath LLM ofrece una mayor tasa de precisión y una puntuación F1 superior para documentos semiestructurados como facturas, recibos y órdenes de compra. Esto garantiza una extracción de datos precisa y coherente.
- Anotación sin esfuerzo: el modelo reduce el trabajo manual al requerir solo una anotación por documento, eliminando la necesidad de anotar cada instancia de campo en cada página.
- Automatización mejorada: con una mayor correlación entre el nivel de confianza y la precisión, DocPath LLM mejora las tasas de automatización al tiempo que reduce el número de documentos enviados a Action Center para el mismo nivel de precisión.
Según nuestras pruebas internas, DocPath superó a su predecesor en rendimiento. Redujo la tasa de falsos positivos en alrededor de un 15 %, y la tasa de falsos negativos se redujo en casi un 17 %.
El LLM de DocPath está disponible exclusivamente para los proyectos modernos de Document Understanding. A pesar de la introducción de DocPath, todas las versiones existentes del proyecto seguirán utilizando las versiones actuales del modelo. Esto garantiza una transición perfecta sin ninguna interrupción de los flujos de trabajo de producción en curso.
Para comenzar a entrenar un tipo de documento existente en DocPath, anule la confirmación y confirme todos los campos en algunos documentos.
Los nombres de campo que elijas pueden afectar en gran medida al rendimiento del modelo. Para garantizar resultados óptimos, utiliza un lenguaje natural y una gramática adecuada para los nombres de los campos. Solo debes utilizar acrónimos ampliamente reconocidos como Número (No), Cuenta (Acct), Dirección (Addr) y Apartamento (Apt). Actualmente, solo se admiten los idiomas de Europa occidental, así que asegúrate de que los nombres de los campos elegidos se alinean con estos idiomas. Absténgase de utilizar nombres no descriptivos, como "Columna 3", a menos que el documento utilice específicamente esa terminología.
- Los campos extraídos deben coincidir exactamente con el texto de los documentos. Este proceso no incluye resúmenes u otros tipos de análisis de texto.
- El entrenamiento personalizado no es aplicable a los siguientes tipos de documentos. Si intentas utilizar DocPath para estos, se producirá un error:
- Facturas China
- Facturas en hebreo
- Facturas Japón