activities
latest
false
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.
UiPath logo, featuring letters U and I in white

Actividades de Document Understanding

Última actualización 5 de dic. de 2024

Clasificar ámbito de documento

UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope

Descripción

Proporciona un ámbito para las actividades del clasificador, proporcionando todos los archivos necesarios para realizar la clasificación de documentos. Acepta al menos un clasificador y intermediarios entre ellos, lo que garantiza que todos los parámetros se reenvíen a las actividades de clasificación secundarias.

Compatibilidad de proyectos

Windows-Legacy | Windows

Configuración

Panel de propiedades

Común

  • NombreParaMostrar: el nombre de la actividad para ser mostrado.

Entrada

  • ModeloDeObjetoDeDocumento: el modelo de objetos de documento (DOM) que deseas utilizar para validar el documento en contra. Este modelo se almacena en una variable Document y se puede recuperar desde la actividad Digitalizar documento. Consulta Digitalizar documento para aprender a utilizar la actividad. Este campo solo admite variables de Document.
  • RutaDeDocumento: la ruta al documento que deseas validar. Este campo solo admite cadenas y variables String.
    Nota: los tipos de archivo compatibles con este campo de propiedad son .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmpy .pdf.
  • TextoDeDocumento: el texto del propio documento, almacenado en una variable String. Puedes recuperar este valor desde la actividad Digitalizar Documento. Consulta Digitalizar Documento para aprender a utilizar esta actividad. Este campo solo admite cadenas y variables String.
  • Taxonomía : la taxonomía contra la que se va a procesar el documento, almacenada en una variable DocumentTaxonomy . Este campo solo admite variables DocumentTaxonomy .

Otros

  • Privado : si se selecciona, los valores de variables y argumentos ya no se registran en el nivel Detallado.
Salida
  • Resultados declasificación : los resultados de ejecutar los archivos del clasificador en el archivo especificado, almacenados en un objeto IReadOnlyList<ClassificationResult> . Este campo solo admite variables IReadOnlyList<ClassificationResult> .

El objeto ResultadoDeClasificación contiene la siguiente información:

  • IDDeTipoDeDocumento : el identificador correspondiente al tipo de documento que coincide con la taxonomía.
  • IDDelDocumento : el nombre de archivo del documento procesado.
  • TipoDeContenido : el tipo de contenido incluido en el documento procesado.
  • Confianza: confianza de clasificación, que se muestra como valor numérico entre 0 y 1.
  • Confianza de Ocr: confianza de OCR para los caracteres que forman parte de la referencia informada, que se muestra como un valor numérico entre 0 y 1.
  • Referencia : pruebas para la clasificación, tanto en la versión de texto del documento (hasta TextStartIndex y TextLength), como en el Modelo de objeto de documento (hasta Tokens y los cuadros resaltados de cada página desde la que se selecciona la prueba ).
  • LímitesDeDocumento : información a qué parte del documento pertenece la clasificación, con StartPage (Int32, de base 0), PageCount (Int32), TextStartIndex (Int32, de base 0), TextLength (Int32).
  • NombreDeClasificador: lo rellena automáticamente la actividadClasificar ámbito del documento con el nombre para mostrar del clasificador que informa el Resultado de clasificaciónactual.

    Nota: ClassificationResults tiene todo el contenido ordenado en orden descendente por puntuación de confianza, lo que significa que el que está arriba tiene la confianza más alta.

Uso del asistente para configurar clasificadores

El Asistente para configurar clasificadores te permite configurar la forma en que se aplican los clasificadores a cada tipo de documento y qué resultados son aceptables.

Siga los pasos a continuación para configurar el asistente:

  1. Añade una actividad Clasificar ámbito de documento a tu flujo de trabajo.
  2. Añade una o más actividades de clasificador dentro de la actividad Ámbito de Clasificación de Documentos.
    1. Asigna nombres sugerentes a tus Clasificadores.
    2. Ordena los Clasificadores dentro del ámbito, de izquierda a derecha, en el orden de prioridad de aceptación.
    3. Configura tus clasificadores seleccionando Configurar clasificadores.
      Ahora puedes ver el asistente
      Figura 1. Descripción general del asistente Configurar clasificadores

  3. Selecciona las casillas de verificación para los pares de clasificador y tipo de documento que deseas activar. Dejar un tipo de documento sin marcar para un clasificador determinado puede darse en uno de los siguientes escenarios:
    • El clasificador no está entrenado o configurado para identificar ese tipo de documento en particular
    • El clasificador no rinde como se espera para ese tipo de documento en particular y si tales resultados son devueltos por el clasificador, deben ignorarse.
  4. Si un clasificador tiene su propia taxonomía, utiliza los cuadros de texto situados junto a cada casilla de verificación para establecer la correspondencia correcta entre las dos taxonomías. Por ejemplo, si el Clasificador1 se ha configurado para devolver la clase INV de una Factura, pero la taxonomía de tu proyecto contiene un tipo de documento llamado "Factura recibida", entonces la casilla correspondiente a "Factura recibida" y a ese Clasificador1 en particular debería contener la cadena INV.
  5. Establece un umbral de confianza mínimo, de 0 a 100, para cada clasificador en el ámbito de clasificación de documentos.Cualquier resultado de clasificación con una confianza inferior a este umbral no se almacenará en la salida de la actividad Ámbito de clasificación de documentos.
    Consejo: la mayoría de los tipos de documentos generan una predicción con un nivel de confianza. Establecer esta propiedad evita falsos positivos considerando solo las predicciones con un nivel de confianza por encima del umbral. Puedes identificar un nivel de confianza óptimo probando varios documentos dentro de tu flujo de trabajo, registrando los resultados en una hoja de cálculo de Excel, por ejemplo, y luego analizar qué valor de umbral es el más preciso. Aplica el umbral ajustando la propiedad Confianza mínima en tu ámbito actual.
  6. Selecciona Guardar una vez que se configuran todos los clasificadores.
    Figura 2. El asistente de configuración de clasificadores configurado para utilizar un clasificador diferente para cada tipo de documento

Integración de Document Understanding

La actividad Clasificar ámbito de documento forma parte de Document Understanding Solutions. Consulta la Guía de Document Understanding para obtener más información.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.