- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Visión general de clasificación de documentos
El entrenamiento de clasificación de documentos es un componente del marco Document UnderstandingTM que ayuda a cerrar el bucle de comentarios para los clasificadores que son capaces de aprender de los comentarios humanos.
Puedes crear procesos de Document Understanding que no contengan ningún componente de entrenamiento. Esto puede ocurrir por múltiples razones, de las cuales algunas son:
- los clasificadores que estás usando no son compatibles con el reentrenamiento
- no deseas realizar un reentrenamiento, ya que prefieres que el proceso use siempre el mismo entrenamiento
- quieres actualizar el entrenamiento del clasificador sin conexión y estás gestionando sus actualizaciones fuera de tu proceso de DU.
Sin embargo, el entrenamiento de tus clasificadores como parte del uso regular del proceso es muy beneficioso en la mayoría de los casos, porque los clasificadores pueden obtener sus propios datos de entrenamiento y realizar sus propias actualizaciones ingiriendo la información de validación humana, sin requerir que actualices tus flujos de trabajo ya existentes. Se convierten, por así decirlo, en algoritmos de autoaprendizaje que pueden enseñarse a sí mismos a actuar mejor en el futuro, basándose en lo que los humanos han validado como datos correctos.
El entrenamiento de la clasificación se realiza a través de la actividad Entrenar el alcance de los clasificadores. Puedes entrenar uno o más clasificadores, ya que la actividad de ámbito tiene la función de configurar y ejecutar uno o más algoritmos para el entrenamiento de la clasificación de una sola vez.
El entrenamiento de la clasificación suele ejecutarse tras la validación de la clasificación de documentos: solo los comentarios confirmados por humanos deben enviarse a los clasificadores para el entrenamiento, para garantizar la precisión de los datos de entrenamiento recibidos por los algoritmos.
El entrenamiento de la clasificación debe ejecutarse tanto en el caso de una clasificación fallida (ninguna clasificación automática, o una clasificación automática que fue corregida por el trabajador), como en el caso de una clasificación con éxito (ninguna corrección hecha por el usuario en la etapa de validación, todos los resultados automáticos confirmados). Esto se debe a que ambos casos son útiles para que los algoritmos aprendan.
Se pueden entrenar tanto los clasificadores que se han usado en la fase de clasificación de documentos, como los clasificadores que no se han usado para la predicción de la clasificación. Este último enfoque se usa para recopilar datos de entrenamiento y entrenar un clasificador desde cero, con la intención de ponerlo en práctica más adelante añadiéndolo a los flujos de trabajo de Document Understanding.
En resumen, esto es lo que hace Entrenar el alcance de los clasificadores:
- Proporciona a todos los entrenadores de clasificadores (algoritmos de entrenamiento) las configuraciones necesarias para su ejecución.
- Acepta uno o más entrenadores clasificadores.
- Permite filtrar el tipo de documento y asignar la taxonomía entre la taxonomía del proyecto y cualquier taxonomía interna del clasificador.
Entrenar el alcance de los clasificadores te permite configurarlo mediante el asistente Configurar los clasificadores. Es posible personalizar:
- qué tipos de documentos se envían para el entrenamiento a qué entrenador clasificador,
- cuál es la asignación de la taxonomía, a nivel de tipo de documento, entre la taxonomía del proyecto y la taxonomía interna del clasificador (si la hubiera).
Encontrará clasificadores y sus respectivas actividades de entrenador en los paquetes UiPath.IntelligentOCR.Activities y UiPath.DocumentUnderstanding.ML.Activities.
Los entrenadores clasificadores disponibles son:
- Entrenador del clasificador basado en palabras clave: actividad de entrenador para el clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabras clave: actividad de entrenador para el clasificador inteligente de palabras clave
- Entrenador del clasificador de aprendizaje automático: actividad de entrenador para el clasificador de aprendizaje automático.