- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Resumen de la clasificación de documentos
La clasificación de documentos es un componente del marco Document UnderstandingTM que ayuda a identificar qué tipos de archivos está procesando el robot.
Un archivo puede clasificarse en uno o varios tipos de documentos, en función de su contenido y de los métodos de clasificación usados:
- si un archivo contiene un solo tipo de documento lógico (por ejemplo, es una factura o un historial médico en su totalidad), el componente de clasificación debe configurarse en consecuencia y devolver un solo resultado de clasificación;
- si un archivo contiene múltiples tipos de documentos lógicos (por ejemplo, contiene una factura de la página 1 a la página 5, un historial médico en las siguientes 10 páginas, y un contrato de seguro desde la página 16 hasta el final), el componente de clasificación debería devolver múltiples resultados de clasificación, cada uno correspondiente al rango de páginas correcto del archivo de entrada.
Los tipos de documentos que se intentan clasificar son los definidos en el proyecto Taxonomía.
Por un lado, si un proyecto necesita procesar archivos del mismo tipo de documento y siempre están presentes como una instancia por archivo (por ejemplo, una factura en un archivo), entonces la clasificación no es necesaria y puede omitirse en su totalidad.
Por otra parte, si el proyecto se ocupa de dos o más tipos de documentos (por ejemplo, el flujo de trabajo debe procesar facturas e historiales médicos que no pueden distinguirse antes del procesamiento), o se espera que los archivos a veces contengan dos o más tipos de documentos distintos dentro de ellos (por ejemplo, un archivo contiene 3 facturas), se recomienda encarecidamente la clasificación.
La clasificación se realiza a través de la actividad Clasificar ámbito de documento. Para clasificar los documentos, puedes usar uno o varios clasificadores, ya que la actividad de ámbito tiene la función de configurar y ejecutar uno o varios algoritmos de clasificación de documentos y de ofrecer una opción de configuración fácil y unitaria para todas tus necesidades.
En resumen, esto es lo que hace Clasificar ámbito de documento:
- Proporciona a todos los clasificadores (algoritmos de clasificación) las configuraciones necesarias para que se ejecuten.
- Acepta uno o más clasificadores.
- Permite el filtrado del tipo de documento, la asignación de la taxonomía y la configuración del umbral mínimo de confianza a nivel del clasificador.
- Comunica la información de clasificación de forma unificada, independientemente de la fuente de clasificación.
Clasificar ámbito de documento te permite configurarlo mediante el asistente Configurar los clasificadores. Es posible personalizar:
- qué tipos de documentos se aceptan de cada clasificador,
- cuál es el umbral de confianza mínimo para un resultado dado que sea aceptable para cada clasificador,
- cuál es la asignación de la taxonomía, a nivel de tipo de documento, entre la taxonomía del proyecto y la taxonomía interna del clasificador (si la hubiera).
Ten en cuenta que el orden de los clasificadores en Clasificar ámbito de documentos es importante:
- Los clasificadores se ejecutan con prioridad, de izquierda a derecha;
- un resultado de clasificación devuelto por un clasificador es aceptado si informa de uno de los tipos de documentos aceptables y tiene un umbral de confianza igual o superior al umbral de confianza mínimo establecido para ese clasificador;
- se ejecuta un clasificador solo con los rangos de páginas que han quedado sin clasificar por los clasificadores anteriores (por lo que puede invocarse varias veces en una ejecución).
En función de los requisitos del caso de uso, puedes elegir entre varios métodos de clasificación, denominados clasificadores.
Los clasificadores se pueden encontrar en los paquetes UiPath.IntelligentOCR.Activities o UiPath.DocumentUnderstanding.ML.Activities.
Los clasificadores disponibles son:
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de aprendizaje automático
- Clasificador generativo
Siempre puedes crear tu propio clasificador con los contratos públicos de Document Processing, pudiendo así implementar cualquier algoritmo que se ajuste a tu caso de uso.