- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Paquetes ML
- Procesos
- Administrador de documentos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Resumen de la clasificación de documentos
La clasificación de documentos es un componente del marco de Document Understanding que ayuda a identificar los tipos de archivos que el robot está procesando.
Un archivo puede clasificarse en uno o varios tipos de documentos, en función de su contenido y de los métodos de clasificación usados:
- si un archivo contiene un solo tipo de documento lógico (por ejemplo, es una factura o un historial médico en su totalidad), el componente de clasificación debe configurarse en consecuencia y devolver un solo resultado de clasificación;
- si un archivo contiene múltiples tipos de documentos lógicos (por ejemplo, contiene una factura de la página 1 a la página 5, un historial médico en las siguientes 10 páginas, y un contrato de seguro desde la página 16 hasta el final), el componente de clasificación debería devolver múltiples resultados de clasificación, cada uno correspondiente al rango de páginas correcto del archivo de entrada.
Los tipos de documentos que se intentan clasificar son los definidos en el proyecto Taxonomía.
Por un lado, si un proyecto necesita procesar archivos del mismo tipo de documento y siempre están presentes como una instancia por archivo (por ejemplo, una factura en un archivo), entonces la clasificación no es necesaria y puede omitirse en su totalidad.
Por otra parte, si el proyecto se ocupa de dos o más tipos de documentos (por ejemplo, el flujo de trabajo debe procesar facturas e historiales médicos que no pueden distinguirse antes del procesamiento), o se espera que los archivos a veces contengan dos o más tipos de documentos distintos dentro de ellos (por ejemplo, un archivo contiene 3 facturas), se recomienda encarecidamente la clasificación.
La clasificación se realiza a través de la actividad Clasificar ámbito de documento. Para clasificar los documentos, puedes usar uno o varios clasificadores, ya que la actividad de ámbito tiene la función de configurar y ejecutar uno o varios algoritmos de clasificación de documentos y de ofrecer una opción de configuración fácil y unitaria para todas tus necesidades.
En resumen, esto es lo que hace Clasificar ámbito de documento:
- Proporciona las configuraciones necesarias para que puedan ejecutarse todos los Clasificadores (algoritmos de clasificación).
- Acepta uno o más clasificadores.
- Permite el filtrado del tipo de documento, la asignación de la taxonomía y la configuración del umbral mínimo de confianza a nivel del clasificador.
- Comunica la información de clasificación de forma unificada, independientemente de la fuente de clasificación.
Clasificar ámbito de documento te permite configurarlo mediante el asistente Configurar los clasificadores. Es posible personalizar:
- qué tipos de documentos se aceptan de cada clasificador,
- cuál es el umbral de confianza mínimo para un resultado dado que sea aceptable para cada clasificador,
- cuál es la asignación de la taxonomía, a nivel de tipo de documento, entre la taxonomía del proyecto y la taxonomía interna del clasificador (si la hubiera).
Ten en cuenta que el orden de los clasificadores en Clasificar ámbito de documentos es importante:
- Los clasificadores se ejecutan con prioridad, de izquierda a derecha;
- un resultado de clasificación devuelto por un clasificador es aceptado si informa de uno de los tipos de documentos aceptables y tiene un umbral de confianza igual o superior al umbral de confianza mínimo establecido para ese clasificador;
- se ejecuta un clasificador solo con los rangos de páginas que han quedado sin clasificar por los clasificadores anteriores (por lo que puede invocarse varias veces en una ejecución).
En función de los requisitos del caso de uso, puedes elegir entre varios métodos de clasificación, denominados clasificadores.
Los clasificadores se encuentran en los paquetes de UiPath.IntelligentOCR.Activities, al igual que en otros paquetes de UiPath (UiPath.DocumentUnderstanding.ML.Activities) o de terceros (UiPath.Abbyy.Activities).
Los clasificadores disponibles son:
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de CapturaFlexible
- Clasificador de aprendizaje automático
Siempre puedes crear tu propio clasificador con los contratos públicos de Document Processing, pudiendo así implementar cualquier algoritmo que se ajuste a tu caso de uso.