document-understanding
latest
false
UiPath logo, featuring letters U and I in white

Guía del usuario de proyectos modernos de Document Understanding

Última actualización 14 de feb. de 2025

UiPath® DocPath

El modelo lingüístico de gran tamaño (LLM) de DocPath es nuestra última tecnología de modelo de extracción de datos, diseñada para reemplazar los modelos de generación actuales utilizados dentro de UiPath® Document UnderstandingTM. Aunque DocPath funciona de forma similar a los modelos anteriores, se entrenó utilizando una amplia variedad de documentos. Esto le permite procesar tipos de documentos comunes con poco o ningún entrenamiento necesario. Lo que diferencia a DocPath LLM es su arquitectura generativa, que mejora significativamente la precisión y simplifica la extracción. Además, también puedes ajustar el modelo con tus conjuntos de datos exclusivos.

Para obtener más información sobre la arquitectura de DocPath y las técnicas utilizadas para el entrenamiento, consulta la página DocPath en nuestro blog de IA.

Disponibilidad

Actualmente, UiPath DocPath solo está disponible para tenants en Estados Unidos.El soporte para otras regiones está previsto que comience a principios de 2025.

Mejoras con respecto a la generación anterior

DocPath LLM ofrece numerosas mejoras sobre los modelos anteriores. Mejora la precisión, especialmente con tablas, se adapta a varios diseños de documentos para reducir los esfuerzos de anotación y aumenta las tasas de automatización.

Las mejoras clave incluyen:
  • Mejor precisión: DocPath LLM ofrece una tasa de exactitud más alta y una puntuación F1 superior para documentos semiestructurados como facturas, recibos y órdenes de compra.Esto garantiza una extracción de datos precisa y consistente.
  • Anotación sin esfuerzo: el modelo reduce el trabajo manual al requerir solo una anotación por documento, eliminando la necesidad de anotar cada instancia de campo en cada página.
  • Automatización mejorada: con una mayor correlación entre el nivel de confianza y la precisión, DocPath LLM mejora las tasas de automatización al tiempo que reduce el número de documentos enviados a Action Center para el mismo nivel de precisión.

A partir de nuestras pruebas internas, DocPath superó a su predecesor en rendimiento. Redujo la tasa de falsos positivos en alrededor de un 15 % y la tasa de falsos negativos cayó en casi un 17 %.

Cómo usar DocPath

El DocPath LLM está disponible exclusivamente para proyectos modernos de Document Understanding. A pesar de la introducción de DocPath, todas las versiones existentes del proyecto seguirán utilizando las versiones actuales del modelo.Esto garantiza una transición sin interrupciones en los flujos de trabajo de producción en curso.

Para comenzar a entrenar un tipo de documento existente en DocPath, desconfirma y confirma todos los campos en unos pocos documentos.

  1. Elige el tipo de documento que deseas usar en DocPath.
  2. Selecciona un documento.
  3. Selecciona todos los campos del documento y elige Eliminar.


  4. Anota todos los campos del documento y selecciona Confirmar.
    Nota: repite los pasos 3 y 4 hasta que se inicie el entrenamiento en el tipo de documento elegido.


Cómo comprobar si DocPath está habilitado

Después de entrenar tus modelos en DocPath, verifica la versión del modelo para asegurarte de que DocPath esté habilitado.
  1. Ve a la página Publicar y crea una nueva versión del proyecto.
  2. Selecciona el icono de tres puntos junto a la versión del proyecto y elige Editar versión para comprobar la versión del modelo.
    Nota: todas las versiones de modelos 24.7 y superiores son modelos de UiPath DocPath.


Optimización de resultados

Los nombres de campo que elijas pueden afectar en gran medida al rendimiento del modelo. Para garantizar resultados óptimos, utiliza el lenguaje natural y la gramática adecuada para los nombres de campo. Solo debes utilizar acrónimos ampliamente reconocidos como Número (No), Cuenta (Acct), Dirección (Addr) y Apartamento (Apt). Actualmente, solo se admiten idiomas de Europa occidental, así que asegúrate de que los nombres de campo elegidos se alineen con estos idiomas. Evita utilizar nombres no descriptivos, como "Columna 3", a menos que el documento utilice específicamente esa terminología.

Limitaciones conocidas de UiPath® DocPath

Las siguientes limitaciones se aplican actualmente a UiPath DocPath:
  • Los campos extraídos deben coincidir exactamente con el texto de los documentos. Este proceso no incluye resumir u otros tipos de análisis de texto.
  • Los siguientes tipos de documentos no se basan actualmente en DocPath y siguen funcionando en la generación anterior:
    • Estados financieros
    • Facturas China
    • Facturas en hebreo
    • Facturas Japón

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White