Document Understanding
2020.10
False
Resumen de la clasificación de documentos - Independiente 2020.10
Logotipo
Document Understanding independiente
Última actualización 25 de may. de 2023

Resumen de la clasificación de documentos

¿Qué es la clasificación de documentos?

La clasificación de documentos es un componente del marco de Document Understanding que ayuda a identificar los tipos de archivos que el robot está procesando.

Un archivo puede clasificarse en uno o varios tipos de documentos, en función de su contenido y de los métodos de clasificación usados:

  • si un archivo contiene un solo tipo de documento lógico (por ejemplo, es una factura o un historial médico en su totalidad), el componente de clasificación debe configurarse en consecuencia y devolver un solo resultado de clasificación;
  • si un archivo contiene múltiples tipos de documentos lógicos (por ejemplo, contiene una factura de la página 1 a la página 5, un historial médico en las siguientes 10 páginas, y un contrato de seguro desde la página 16 hasta el final), entonces, el componente de clasificación debería devolver múltiples resultados de clasificación, cada uno correspondiente al rango de páginas correcto del archivo de entrada.

Los tipos de documentos que se intentan clasificar son los definidos en el proyecto Taxonomía.

Cuándo se debe usar la clasificación de documentos

Por un lado, si un proyecto necesita procesar archivos del mismo tipo de documento y siempre están presentes como una instancia por archivo (por ejemplo, una factura en un archivo), entonces la clasificación no es necesaria y puede omitirse en su totalidad.

Por otra parte, si el proyecto se ocupa de dos o más tipos de documentos (por ejemplo, el flujo de trabajo debe procesar facturas e historiales médicos que no pueden distinguirse antes del procesamiento), o se espera que los archivos a veces contengan dos o más tipos de documentos distintos dentro de ellos (por ejemplo, un archivo contiene 3 facturas), se recomienda encarecidamente la clasificación.

Cómo usar el componente de clasificación de documentos

La clasificación se realiza a través de la actividad Clasificar ámbito de documento. Para clasificar los documentos, puedes usar uno o varios clasificadores, ya que la actividad de ámbito tiene la función de configurar y ejecutar uno o varios algoritmos de clasificación de documentos y de ofrecer una opción de configuración fácil y unitaria para todas tus necesidades.

En resumen, esto es lo que hace Clasificar ámbito de documento:

  • Proporciona las configuraciones necesarias para que puedan ejecutarse todos los Clasificadores (algoritmos de clasificación).
  • Acepta uno o más clasificadores.
  • Permite el filtrado del tipo de documento, la asignación de la taxonomía y la configuración del umbral mínimo de confianza a nivel del clasificador.
  • Comunica la información de clasificación de forma unificada, independientemente de la fuente de clasificación.

Clasificar ámbito de documento te permite configurarlo mediante el asistente Configurar los clasificadores. Es posible personalizar:

  • qué tipos de documentos se aceptan de cada clasificador,
  • cuál es el umbral de confianza mínimo para un resultado dado que sea aceptable para cada clasificador,
  • cuál es la asignación de la taxonomía, a nivel de tipo de documento, entre la taxonomía del proyecto y la taxonomía interna del clasificador (si la hubiera).

Ten en cuenta que el orden de los clasificadores en Clasificar ámbito de documentos es importante:

  • Los clasificadores se ejecutan con prioridad, de izquierda a derecha;
  • un resultado de clasificación devuelto por un clasificador es aceptado si informa de uno de los tipos de documentos aceptables y tiene un umbral de confianza igual o superior al umbral de confianza mínimo establecido para ese clasificador;
  • se ejecuta un clasificador solo con los rangos de páginas que han quedado sin clasificar por los clasificadores anteriores (por lo que puede invocarse varias veces en una ejecución).

Clasificadores disponibles

En función de los requisitos del caso de uso, puedes elegir entre varios métodos de clasificación, denominados clasificadores.

Los clasificadores se encuentran en los paquetes de UiPath.IntelligentOCR.Activities, al igual que en otros paquetes de UiPath (UiPath.DocumentUnderstanding.ML.Activities) o de terceros (UiPath.Abbyy.Activities).

Los clasificadores disponibles son:

Siempre puedes crear tu propio clasificador con los contratos públicos de Document Processing, pudiendo así implementar cualquier algoritmo que se ajuste a tu caso de uso.

Logotipo
Obtén la ayuda que necesitas
Logotipo
RPA para el aprendizaje - Cursos de automatización
Logotipo
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2023 UiPath. All rights reserved.