- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- FieldValueDetails Class
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Clase BasicDataPoint: vista previa
- Clase ExtractionResultHandler: vista previa
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Configurar la conexión externa
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Crear artefactos de validación de documentos
- Recuperar artefactos de validación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Entrenador del extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Redactar documento
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Extractor con aprendizaje automático
- Entrenador de extractor con aprendizaje automático
- Clasificador de aprendizaje automático
- Entrenador del clasificador de aprendizaje automático
- Clasificador generativo
- Extractor generativo
- Configurar autenticación
- Validar documentos con acciones de la aplicación
- Validación manual para digitalizar documentos
- Extracción de datos basada en anclajes utilizando el extractor inteligente de formularios
- Estación de validación
- Actividades generativas: buenas prácticas
- Extractor generativo: buenas prácticas
- Clasificador generativo: buenas prácticas
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope
Descripción
Proporciona un ámbito para las actividades del clasificador, proporcionando todos los archivos necesarios para realizar la clasificación de documentos. Acepta al menos un clasificador y intermediarios entre ellos, lo que garantiza que todos los parámetros se reenvíen a las actividades de clasificación secundarias.
Compatibilidad de proyectos
Windows-Legacy | Windows
Configuración
Panel de propiedades
Común
- Nombre para mostrar: el nombre para mostrar de la actividad.
Entrada
- ModeloDeObjetoDelDocumento : el modelo de objeto del documento (DOM) que quieres utilizar para validar el documento. Este modelo se almacena en una variable
Documenty se puede recuperar desde la actividad Digitalizar documento . Consulta Digitalizar documento para aprender a utilizar la actividad. Este campo solo admite variablesDocument. - RutaDelDocumento : la ruta al documento que quieres validar. Este campo solo admite cadenas y variables
String.Nota:The supported file types for this property field are
.png,.gif,.jpe,.jpg,.jpeg,.tiff,.tif,.bmp, and.pdf. - TextoDeDocumento : el texto del propio documento, almacenado en una variable
String. Puedes recuperar este valor de la actividad Digitalizar documento . Consulta Digitalizar documento para aprender a utilizar esta actividad. Este campo solo admite cadenas y variablesString. - Taxonomy - The Taxonomy against which the document is to be processed, stored in a
DocumentTaxonomyvariable. This field supports onlyDocumentTaxonomyvariables.
Otros
- Privado : si se selecciona, los valores de variables y argumentos ya no se registran en el nivel Detallado.
Salida
- ClassificationResults - The results of running the classifier files on the specified file, stored in a
IReadOnlyList<ClassificationResult>object. This field supports onlyIReadOnlyList<ClassificationResult>variables.
El objeto ResultadoDeClasificación contiene la siguiente información:
- DocumentTypeId - The ID corresponding to the document type matched from the Taxonomy.
- DocumentId - The file name of the processed document.
- ContentType - The type of content contained in the processed document.
- Confianza : la confianza de la clasificación, que se muestra como un valor numérico entre
0y1. - ConfianzaOcr : confianza de OCR para los caracteres que forman parte de la referencia notificada, que se muestra como un valor numérico entre
0y1. - Reference - Evidencing for the classification, both in the text version of the document (through
TextStartIndexandTextLength), and in the Document Object Model (throughTokensand the highlight boxes for each page from which the evidencing is selected). - DocumentBounds - Information on what part of the document the classification pertains to, with
StartPage(Int32, 0-based),PageCount(Int32),TextStartIndex(Int32, 0-based),TextLength(Int32). - ClassifierName - Automatically populated by the Classify Document Scope activity with the display name of the classifier reporting the current ClassificationResult.
Nota:
The
ClassificationResultshas all the content sorted in descending order by confidence score, which means the one at the top has the highest confidence.
Uso del asistente para configurar clasificadores
The Configure Classifiers Wizard allows you to configure the way the classifiers are applied to each document type, and what results are acceptable.
Siga los pasos a continuación para configurar el asistente:
-
Add a Classify Document Scope activity to your workflow.
-
Añade una o más actividades de clasificador dentro de la actividad Ámbito de Clasificación de Documentos.
-
Asigna nombres sugerentes a tus Clasificadores.
-
Ordena los Clasificadores dentro del ámbito, de izquierda a derecha, en el orden de prioridad de aceptación.
-
Configura tus clasificadores seleccionando Configurar clasificadores.
Ahora puede ver el Asistente
Figura 1. Descripción general del asistente Configurar clasificadores

-
-
Selecciona las casillas de verificación para los pares de clasificador y tipo de documento que deseas activar. Dejar un tipo de documento sin marcar para un clasificador determinado puede darse en uno de los siguientes escenarios:
- El clasificador no está entrenado o configurado para identificar ese tipo de documento en particular
- El clasificador no rinde como se espera para ese tipo de documento en particular y si tales resultados son devueltos por el clasificador, deben ignorarse.
-
Si un clasificador tiene su propia taxonomía, utiliza los cuadros de texto junto a cada casilla de verificación para establecer la asignación de taxonomía correcta entre las dos taxonomías. Por ejemplo, si Clasificador1 se ha configurado para devolver la clase
INVpara una factura, pero la taxonomía de tu proyecto contiene un tipo de documento llamado "Factura entrante", entonces la casilla correspondiente a "Factura entrante" y ese Clasificador1 en particular debe contener la cadenaINV. -
Establece un umbral de confianza mínimo, de 0 a 100, para cada clasificador en el ámbito de clasificación de documentos.Cualquier resultado de clasificación con una confianza inferior a este umbral no se almacenará en la salida de la actividad Ámbito de clasificación de documentos.
Consejo:La mayoría de los tipos de documentos generan una predicción con un nivel de confianza. Establecer esta propiedad evita falsos positivos al considerar solo las predicciones con un nivel de confianza por encima del umbral. Puedes identificar un nivel de confianza óptimo probando varios documentos dentro de tu flujo de trabajo, registrando los resultados en una hoja de cálculo de Excel, por ejemplo, y luego analizando qué valor de umbral es el más preciso. Aplica el umbral ajustando la propiedad Confianza mínima en tu ámbito actual.
-
Selecciona Guardar una vez que se configuran todos los clasificadores.
Figura 2. El asistente de configuración de clasificadores configurado para utilizar un clasificador diferente para cada tipo de documento

Integración de Document Understanding
La actividad Clasificar ámbito de documento forma parte de Document Understanding Solutions. Consulta la Guía de Document Understanding para obtener más información.