- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Paquetes ML
- Procesos
- Gestor de datos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Clasificador inteligente de palabra clave
El clasificador inteligente de palabras claves es un clasificador que usa el vector de palabras que aprende de los archivos de ciertos tipos de documentos para realizar la clasificación de los mismos.
El algoritmo se crea en torno al concepto de contenido repetido para un mismo tipo de documento y parte de la premisa de que los tipos de documentos tienen una serie de palabras que suelen aparecer en esos tipos de documentos, lo que permite un cálculo de similitud vectorial.
Al clasificar un archivo en un tipo de documento, el clasificador inteligente de palabras claves:
- encuentra el vector de palabras más parecido a un archivo,
- informa sobre el tipo de documento con mayor puntuación, con las palabras principales subyacentes que coinciden.
El clasificador inteligente de palabras claves también tiene la capacidad de dividir los archivos, lo que significa que puede clasificar más de una clase para un archivo dado, para rangos de páginas separados.
Deberías plantearte el uso de este clasificador si:
- tus archivos contienen uno o más tipos de documentos dentro de un mismo archivo
- tus tipos de documentos son relativamente fáciles de diferenciar en cuanto al contenido.
Coloca la actividad entrenador del clasificador inteligente de palabras claves en Entrenar el alcance de los clasificadores, y configúrala en consecuencia.
No podemos imponer la coherencia de los archivos de entrenamiento en los entrenamientos paralelos en la actividad. El proceso de Document Understanding ofrece dos posibles soluciones a esta incidencia. Ambos consisten en el control del tráfico:
- bloquea archivos (implementado de forma predeterminada en el proceso): renombra el archivo usando la extensión
.lock
, modifica y guarda el archivo, luego renombra el archivo de nuevo, eliminando la extensión.lock
- configuración manual de una cola especial: crea una cola vacía en Orchestrator e integra tus dos actividades del proyecto.
Para obtener más información sobre cómo entrenar un Clasificador, consulta esta página que describe el proceso de uso del asistente para la Gestión del aprendizaje.
Obtén más información sobre el Clasificador inteligente de palabras clave siguiendo este enlace.