activities
latest
false
UiPath logo, featuring letters U and I in white

Actividades de Document Understanding

Última actualización 5 de dic. de 2024

Clasificar documento

UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument

Descripción

Puedes utilizar esta actividad para clasificar documentos, seleccionando un clasificador deseado y un documento que te gustaría clasificar.

Nota: la actividad Clasificar datos del documento utiliza puntos finales públicos.

Los idiomas admitidos para los modelos generativos son los mismos que los del motor OCR utilizado. Para obtener más información, consulta la página Idiomas compatibles con OCR .

A menos que esta actividad sea la primera parte de la actividad de Document Understanding de un flujo de trabajo de Studio, la entrada debe ser Datos del documento. El archivo solo debe utilizarse como entrada si la actividad es la primera parte de Document Understanding de un flujo de trabajo de Studio.

Compatibilidad de proyectos

Windows | Multiplataforma

Configuración

Panel del Diseñador
  • Entrada: proporciona el archivo de entrada o el objeto Datos del documento.
    Importante: el número máximo de páginas que puede tener un archivo es 500. Los archivos que superan este límite no se pueden clasificar.
    Consejo: cuando tus archivos no se almacenan como variable de IResourcetipo, hay una opción para realizar una conversión. Utiliza LocalResource.FromPath(<reference_to_the_file>) en el campo de propiedad Entrada para esto.
    Considera un escenario en el que iteras a través de una lista de archivos utilizando una actividad Para cada. Supongamos que currentItem es tu variable iterativa. Para convertir currentItem en IResource, pega LocalResource.FromPath(currentItem) en el campo Entrada.
  • Proyecto de Document Understanding : requiere que selecciones tu proyecto de Document Understanding en el menú desplegable. Las opciones disponibles son:
    • Predefinido : proyecto que utiliza modelos especializados preentrenados recomendados para escenarios estándar.
    • Proyecto existente del tenant y la carpeta a la que está conectado
    • Puedes crear un nuevo proyecto seleccionando el icono + .
    Nota: si has creado más de 500 proyectos en tu tenant y utilizas la actividad Clasificar Documento, UiPath Studio o Studio Web no mostrará ningún proyecto más allá de los 500 iniciales.Por lo tanto, esos proyectos no se pueden utilizar.
  • Clasificador : si utilizas el proyecto predefinido , puedes seleccionar el clasificador de Document Understanding deseado en el menú desplegable.
    Nota: Los datos enviados al Clasificador generativo se enviarán a una instancia de Modelo LLM que no es de acceso público, no saldrá de él y, una vez procesados, no se almacenarán ni se utilizarán para el entrenamiento.
    • Para el proyecto Predefinido tienes dos opciones:
      • Clasificación ML: clasificador basado en ML.
      • Clasificador generativo: el tipo de clasificador generativo.
        Importante:

        Esta característica forma parte actualmente de un proceso de auditoría y no debe considerarse parte de la autorización de FedRAMP hasta que finalice la revisión. Consulta aquí la lista completa de características actualmente en revisión.

        • Solicitud : instrucciones para identificar tipos de documentos, proporcionadas como pares clave-valor, donde la clave representa el nombre del tipo de documento y el valor una descripción del mismo, lo que ayuda al clasificador a identificar dichos documentos.
          • Tipo de documento: proporciona el nombre del tipo de documento que se utilizará como resultado de la clasificación (límite de 30 caracteres).
          • Solicitud generativa : requiere que proporciones instrucciones para el Clasificador generativo sobre cómo identificar el tipo de documento. El número máximo de caracteres permitidos es 1000.
  • Versión (vista previa): utiliza esta propiedad cuando utilices un proyecto moderno de Document Understanding existente. Selecciona la etiqueta que corresponde a la versión del proyecto desde la que quieres procesar los datos. Por ejemplo, si eliges la etiqueta Producción asignada a la Versión 3, la actividad procesa los datos de la Versión 3 de tu proyecto en el entorno de producción.

    El valor predeterminado para Versión es Staging. Si la etiqueta Staging no existe en tu proyecto seleccionado, el valor predeterminado es Production.

    Después de seleccionar una etiqueta, la actividad muestra una lista de tipos de documentos compatibles para esa versión.

Panel de propiedades

Opciones avanzadas

  • Confianza mínima: especifica el umbral de confianza mínimo en función del que se asigna un tipo de documento durante la clasificación. Si la puntuación de confianza de un documento cae por debajo de este umbral, su tipo de documento se informa como "desconocido".
    Consejo: la mayoría de los tipos de documentos generan una predicción con un nivel de confianza. Establecer esta propiedad evita falsos positivos considerando solo las predicciones con un nivel de confianza por encima del umbral. Puedes identificar un nivel de confianza óptimo probando varios documentos dentro de tu flujo de trabajo, grabando los resultados en una hoja de cálculo Excel, por ejemplo, y luego analizar qué valor de umbral es el más preciso.

Entrada

  • Tiempo de espera (segundos) : tiempo máximo de ejecución (en segundos) para la llamada al modelo generativo. Si la operación supera este tiempo de espera, se finaliza automáticamente para evitar retrasos o bloqueos. Esta propiedad solo se muestra si el Clasificador generativo está seleccionado como clasificador.

Salida

  • Datos del documento: todos los datos de campo validados extraídos del archivo.

Uso del clasificador generativo

Para empezar rápidamente con las capacidades generativas de la actividad Clasificar documento, realiza los siguientes pasos:

  1. Añadir una actividad Clasificar documento
  2. En la lista desplegable Proyecto , selecciona Predefinido.
  3. Para Clasificador, selecciona Clasificador generativo.

    La propiedad Solicitud aparece en el cuerpo de la actividad.

  4. En el campo Solicitud , proporciona tus instrucciones como pares clave-valor de diccionario, donde:
    • La clave representa el tipo de documento (ejemplo: CV).
    • El valor representa la solicitud generativa: la descripción utilizada por el clasificador generativo para identificar los tipos de documentos.

      Por ejemplo, consulta la siguiente tabla para ver una muestra de pares clave-valor:

      Tabla 1. Pares clave-valor utilizados como solicitud para el clasificador generativo
      Document typeSolicitud generativa
      CV"Encuentre palabras clave comunes de CV como "Educación", "Habilidades" y "Experiencia"."
      Factura"Encuentre nombres de campo comunes como "Número de factura", "Facturar a" o "Importe total"."
    Figura 1. Pares de clave-valor utilizados como solicitud para el clasificador generativo

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.