- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador de CapturaFlexible
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 4506T: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Document Understanding implementado en Automation Suite
- Instalar y utilizar
- Primera experiencia de ejecución
- Implementar UiPathDocumentOCR
- Implementar un paquete ML listo para usar
- Paquetes sin conexión 2023.10.12+patch1
- Paquetes sin conexión 2023.10.12
- Paquetes sin conexión 2023.10.11
- Paquetes sin conexión 2023.10.10
- Paquetes sin conexión 2023.10.9
- Paquetes sin conexión 2023.10.8
- Paquetes sin conexión 2023.10.7+patch1
- Paquetes sin conexión 2023.10.7
- Paquetes sin conexión 2023.10.6
- Paquetes sin conexión 2023.10.5
- Paquetes sin conexión 2023.10.4
- Paquetes sin conexión 2023.10.3
- Paquetes sin conexión 2023.10.2
- Paquetes sin conexión 2023.10.1
- Paquetes sin conexión 2023.10.0
- Utiliza Document Manager
- Utilizar el marco
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Guía del usuario de Document Understanding
Clasificador inteligente de palabra clave
Qué es el clasificador inteligente de palabras claves
The Intelligent Keyword Classifier is a classifier that uses the word vector it learns from files of certain document types to perform document classification.
El algoritmo se crea en torno al concepto de contenido repetido para un mismo tipo de documento y parte de la premisa de que los tipos de documentos tienen una serie de palabras que suelen aparecer en esos tipos de documentos, lo que permite un cálculo de similitud vectorial.
Al clasificar un archivo en un tipo de documento, el clasificador inteligente de palabras claves:
- encuentra el vector de palabras más parecido a un archivo,
- informa sobre el tipo de documento con mayor puntuación, con las palabras principales subyacentes que coinciden.
El clasificador inteligente de palabras claves también tiene la capacidad de dividir los archivos, lo que significa que puede clasificar más de una clase para un archivo dado, para rangos de páginas separados.
Unlike the Keyword Based Classifier, you do not need to manually select references in the document when training the Intelligent Keyword Classifier and any such references provided at training time will be ignored.
Cuándo usarlo
Deberías plantearte el uso de este clasificador si:
- tus archivos contienen uno o más tipos de documentos dentro de un mismo archivo
- tus tipos de documentos son relativamente fáciles de diferenciar en cuanto al contenido.
Starting with version 6.9.0, the splitting performance for the Intelligent Keyword Classifier activity has been improved. For optimized splitting performance, use version 6.9.0 or higher.
Requisitos especiales
You need to use your Automation CloudTM Document UnderstandingTM API Key, or host your own instance of the Intelligent Keyword Classifier in AI Center on-prem, to use this classifier.
Cómo entrenarlo
Place the Intelligent Keyword Classifier Trainer activity in a Train Classifiers Scope, and configure it accordingly.
No podemos imponer la coherencia de los archivos de entrenamiento en los entrenamientos paralelos en la actividad. El proceso de Document Understanding ofrece dos posibles soluciones a esta incidencia. Ambos consisten en el control del tráfico:
- bloquea archivos (implementado de forma predeterminada en el proceso): renombra el archivo usando la extensión
.lock, modifica y guarda el archivo, luego renombra el archivo de nuevo, eliminando la extensión.lock - configuración manual de una cola especial: crea una cola vacía en Orchestrator e integra tus dos actividades del proyecto.
For more information on how to train a Classifier, check this page that describes the process of using the Manage Learning wizard.
Más información
Learn more about Intelligent Keyword Classifier, by following this link.