- Información general
- Primeros pasos
- Actividades
- Paneles de Insights
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 4506T: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación - Paquete ML
- Certificado de origen - Paquete ML
- Cheques: paquete ML
- Certificado de producto secundario - Paquete ML
- CMS 1500: paquete ML
- Declaración de conformidad UE - Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas - Paquete ML
- Listas de embalaje: paquete ML
- Recibos de pago: paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Limitaciones de tráfico
- Configuración de OCR
- Procesos
- Servicios de OCR
- Aprendizaje profundo
- Licencia
Visión general de clasificación de documentos
El entrenamiento de la clasificación de documentos es un componente del marco de Document Understanding que ayuda a cerrar el bucle de retroalimentación para los clasificadores que son capaces de aprender de los comentarios humanos.
Puedes crear procesos de Document Understanding que no contengan ningún componente de entrenamiento. Esto puede ocurrir por múltiples razones, de las cuales algunas son:
- los clasificadores que estás usando no son compatibles con el reentrenamiento
- no deseas realizar un reentrenamiento, ya que prefieres que el proceso use siempre el mismo entrenamiento
- quieres actualizar el entrenamiento del clasificador sin conexión y estás gestionando sus actualizaciones fuera de tu proceso de DU.
Sin embargo, el entrenamiento de tus clasificadores como parte del uso regular del proceso es muy beneficioso en la mayoría de los casos, porque los clasificadores pueden obtener sus propios datos de entrenamiento y realizar sus propias actualizaciones ingiriendo la información de validación humana, sin requerir que actualices tus flujos de trabajo ya existentes. Se convierten, por así decirlo, en algoritmos de autoaprendizaje que pueden enseñarse a sí mismos a actuar mejor en el futuro, basándose en lo que los humanos han validado como datos correctos.
El entrenamiento de la clasificación se realiza a través de la actividad Entrenar el alcance de los clasificadores. Puedes entrenar uno o más clasificadores, ya que la actividad de ámbito tiene la función de configurar y ejecutar uno o más algoritmos para el entrenamiento de la clasificación de una sola vez.
El entrenamiento de la clasificación suele ejecutarse tras la validación de la clasificación de documentos: solo los comentarios confirmados por humanos deben enviarse a los clasificadores para el entrenamiento, para garantizar la precisión de los datos de entrenamiento recibidos por los algoritmos.
El entrenamiento de la clasificación debe ejecutarse tanto en el caso de una clasificación fallida (ninguna clasificación automática, o una clasificación automática que fue corregida por el trabajador), como en el caso de una clasificación con éxito (ninguna corrección hecha por el usuario en la etapa de validación, todos los resultados automáticos confirmados). Esto se debe a que ambos casos son útiles para que los algoritmos aprendan.
Se pueden entrenar tanto los clasificadores que se han usado en la fase de clasificación de documentos, como los clasificadores que no se han usado para la predicción de la clasificación. Este último enfoque se usa para recopilar datos de entrenamiento y entrenar un clasificador desde cero, con la intención de ponerlo en práctica más adelante añadiéndolo a los flujos de trabajo de Document Understanding.
En resumen, esto es lo que hace Entrenar el alcance de los clasificadores:
- Proporciona a todos los entrenadores de clasificadores (algoritmos de entrenamiento) las configuraciones necesarias para su ejecución.
- Acepta uno o más entrenadores clasificadores.
- Permite filtrar el tipo de documento y asignar la taxonomía entre la taxonomía del proyecto y cualquier taxonomía interna del clasificador.
Entrenar el alcance de los clasificadores te permite configurarlo mediante el asistente Configurar los clasificadores. Es posible personalizar:
- qué tipos de documentos se envían para el entrenamiento a qué entrenador clasificador,
- cuál es la asignación de la taxonomía, a nivel de tipo de documento, entre la taxonomía del proyecto y la taxonomía interna del clasificador (si la hubiera).
Classifiers and their respective trainer activities can be found in the UiPath.IntelligentOCR.Activities packages, and UiPath.DocumentUnderstanding.ML.Activities.
Los entrenadores clasificadores disponibles son:
- Keyword Based Classifier Trainer: trainer activity for the Keyword Based Classifier
- Intelligent Keyword Classifier Trainer: trainer activity for the Intelligent Keyword Classifier
- Machine Learning Classifier Trainer: trainer activity for the Machine Learning Classifier.