- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- FieldValueDetails Class
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Clase BasicDataPoint: vista previa
- Clase ExtractionResultHandler: vista previa
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Configurar la conexión externa
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Crear artefactos de validación de documentos
- Recuperar artefactos de validación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Entrenador del extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Redactar documento
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Extractor con aprendizaje automático
- Entrenador de extractor con aprendizaje automático
- Clasificador de aprendizaje automático
- Entrenador del clasificador de aprendizaje automático
- Clasificador generativo
- Extractor generativo
- Configurar autenticación
- Validar documentos con acciones de la aplicación
- Validación manual para digitalizar documentos
- Extracción de datos basada en anclajes utilizando el extractor inteligente de formularios
- Estación de validación
- Actividades generativas: buenas prácticas
- Extractor generativo: buenas prácticas
- Clasificador generativo: buenas prácticas
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument
Descripción
Puedes utilizar esta actividad para clasificar documentos, seleccionando un clasificador deseado y un documento que te gustaría clasificar.
La actividad Clasificar documento utiliza puntos finales públicos.
Los idiomas compatibles para los modelos generativos son los mismos que los del motor OCR utilizado. Para obtener más información, consulta la página Idiomas compatibles con OCR .
A menos que esta actividad sea la primera parte de la actividad de Document Understanding de un flujo de trabajo de Studio, la entrada debe ser Datos del documento. El archivo solo debe utilizarse como entrada si la actividad es la primera parte de Document Understanding de un flujo de trabajo de Studio.
Limitaciones conocidas
El tipo de proyecto generativo predefinido y los extractores correspondientes no están disponibles en Automation Suite.
Compatibilidad de proyectos
Windows | Multiplataforma
Configuración
Panel del Diseñador
- Entrada : proporciona el archivo de entrada o el objeto Datos del documento.
Importante:
El número máximo de páginas que puede tener un archivo es de 500. Los archivos que superan este límite no se clasifican.
Consejo:Cuando tus archivos no se almacenan como una variable de tipo
IResource, hay una opción para realizar una conversión. UsaLocalResource.FromPath(<reference_to_the_file>)en el campo Propiedad de entrada para esto. Considera un escenario en el que estás iterando a través de una lista de archivos utilizando una actividad Para cada . Supongamos quecurrentItemes tu variable de iteración. Para convertircurrentItemenIResource, pegaLocalResource.FromPath(currentItem)en el campo Entrada . - Proyecto de Document Understanding : requiere que selecciones tu proyecto de Document Understanding en el menú desplegable. Las opciones disponibles son:
- Predefinido: proyecto que utiliza modelos especializados preentrenados recomendados para escenarios estándar.
- Generativo predefinido: proyecto que utiliza modelos generativos preentrenados que aceptan instrucciones como entrada para la clasificación o extracción de datos del documento.
- Proyecto existente del tenant y la carpeta a los que estás conectado
- Puedes crear un nuevo proyecto seleccionando el icono +.
Nota:
Si has creado más de 500 proyectos en tu tenant y utilizas la actividad Clasificar documento, UiPath Studio o Studio Web no mostrará ningún proyecto más allá de los 500 iniciales. Por lo tanto, esos proyectos no se pueden utilizar.
- Clasificador: si utilizas el proyecto predefinido, puedes seleccionar tu clasificador de Document Understanding deseado en el menú desplegable.
Nota:
Los datos enviados al Clasificador generativo se enviarán a una instancia de Modelo LLM que no está disponible públicamente, no lo abandonará y, una vez procesado, no se almacenará ni se utilizará para el entrenamiento.
- Para el proyecto predefinido, tienes dos opciones:
- Clasificación ML: clasificador basado en ML.
- Clasificador generativo: el tipo de clasificador generativo.
- Detalles del tipo de documento: instrucciones para identificar tipos de documentos, proporcionadas como pares clave-valor, donde la clave representa el nombre del tipo de documento y el valor una descripción del mismo, lo que ayuda al clasificador a identificar dichos documentos.
- Tipo de documento : proporciona el nombre del tipo de documento que se utilizará como resultado de la clasificación (límite de 30 caracteres).
- Instrucción : requiere que proporciones instrucciones para el Clasificador generativo sobre cómo identificar el tipo de documento. El número máximo de caracteres permitidos es 1000.
- Detalles del tipo de documento: instrucciones para identificar tipos de documentos, proporcionadas como pares clave-valor, donde la clave representa el nombre del tipo de documento y el valor una descripción del mismo, lo que ayuda al clasificador a identificar dichos documentos.
- Para el proyecto generativo predefinido solo puedes utilizar el clasificador generativo.
- Para el proyecto predefinido, tienes dos opciones:
- Versión : utiliza esta propiedad cuando utilices un proyecto moderno de Document Understanding existente. Selecciona la etiqueta que corresponde a la versión del proyecto desde la que quieres procesar los datos. Por ejemplo, si eliges la etiqueta Producción asignada a la Versión 3, la actividad procesa los datos de la Versión 3 de tu proyecto en el entorno de producción. El valor predeterminado para Versión es Staging. Si la etiqueta Staging no existe en tu proyecto seleccionado, entonces el valor predeterminado es Production. Después de seleccionar una etiqueta, la actividad muestra una lista de tipos de documentos compatibles para esa versión.
Panel de propiedades
Opciones avanzadas
- Confianza mínima : especifica el umbral de confianza mínimo en función del cual se asigna un tipo de documento durante la clasificación. Si la puntuación de confianza de un documento cae por debajo de este umbral, su tipo de documento se informa como "desconocido".
Consejo:
La mayoría de los tipos de documentos generan una predicción con un nivel de confianza. Establecer esta propiedad evita falsos positivos al considerar solo las predicciones con un nivel de confianza por encima del umbral. Puedes identificar un nivel de confianza óptimo probando varios documentos dentro de tu flujo de trabajo, registrando los resultados en una hoja de cálculo de Excel, por ejemplo, y luego analizando qué valor de umbral es el más preciso.
- Conexión externa en tiempo de diseñoLa conexión externa en tiempo de diseño te permite aprovechar la actividad utilizando recursos de Document Understanding de otros proyectos o tenants. Antes de configurar estas propiedades, asegúrate de haber cumplido los requisitos previos mencionados en la página Configurar conexión externa de runtime . Una vez completados estos pasos, puedes proceder a configurar la conexión externa de runtime.
-
ID de la aplicación: introduce el ID de la aplicación externa que creaste anteriormente.
-
Secreto de la aplicación: introduce el secreto de la aplicación externa que creaste anteriormente.
-
URL del tenant: introduce la URL del tenant donde creaste la aplicación externa. Este es el tenant desde el que utilizará los recursos en tiempo de diseño.
La URL debe tener el siguiente formato:
https://<baseURL>/<OrganizationName>/<TenantName>.
-
Entrada
- Tiempo de espera (segundos) : tiempo máximo de ejecución (en segundos) para la llamada al modelo generativo. Si la operación supera este tiempo de espera, se finaliza automáticamente para evitar retrasos o bloqueos. Esta propiedad solo se muestra si el Clasificador generativo está seleccionado como clasificador.
Salida
- Datos del documento : todos los datos de campo validados extraídos del archivo.
Conexión externa de runtime
La conexión externa de runtime te permite ejecutar la actividad a través de robots locales. Antes de configurar estas propiedades, asegúrate de haber cumplido los requisitos previos mencionados en la página Configurar conexión externa de runtime . Una vez completados estos pasos, puedes proceder a configurar la conexión externa de runtime.
- Activo de credenciales de Runtime
- Utiliza este campo cuando necesites acceder a los recursos de Document Understanding mientras el robot está conectado a un Orchestrator local o desde un tenant diferente. Puedes elegir introducir un Activo de credenciales, con fines de autenticación, de una de las siguientes maneras:
-
En la lista desplegable, selecciona el activo de credenciales deseado del Orchestrator al que está conectado el UiPath® Robot.
-
Introduce manualmente la ruta al activo de credenciales de Orchestrator donde almacenas las credenciales de la aplicación externa para acceder al proyecto.
El formato de la ruta debe ser:
<OrchestratorFolderName>/<AssetName>.
- URL del tenant de runtime : utiliza este campo, junto con el campo Activo de credenciales de runtime . Introduce la URL del tenant al que se conectará el robot para ejecutar la clasificación. La URL debe tener el siguiente formato:
https://<baseURL>/<OrganizationName>/<TenantName>.
Uso del clasificador generativo
Para empezar rápidamente con las capacidades generativas de la actividad Clasificar documento, realiza los siguientes pasos:
- Añadir una actividad Clasificar documento
- En la lista desplegable Proyecto, selecciona Predefinido o Generativo predefinido.
- Para Clasificador, selecciona Clasificador generativo. La propiedad Detalles del tipo de documento aparece en el cuerpo de la actividad.
- En la colección Detalles del tipo de documento, proporciona tus instrucciones como pares clave-valor del diccionario, donde:
-
La clave representa el tipo de documento (ejemplo: CV).
-
El valor representa la solicitud generativa: la descripción utilizada por el clasificador generativo para identificar los tipos de documentos. Por ejemplo, consulta la siguiente tabla para ver una muestra de pares clave-valor:
Tabla 1. Pares de clave-valor utilizados como solicitud para el clasificador generativo
Clave Valor CV "Encuentre palabras clave comunes de CV como "Educación", "Habilidades" y "Experiencia"." Factura "Encuentre nombres de campo comunes como "Número de factura", "Facturar a" o "Importe total"." Figura 1. Pares de clave-valor utilizados como solicitud para el clasificador generativo

-