- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- FieldValueDetails Class
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Clase BasicDataPoint: vista previa
- Clase ExtractionResultHandler: vista previa
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Configurar la conexión externa
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Crear artefactos de validación de documentos
- Recuperar artefactos de validación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Entrenador del extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Redactar documento
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Extractor con aprendizaje automático
- Entrenador de extractor con aprendizaje automático
- Clasificador de aprendizaje automático
- Entrenador del clasificador de aprendizaje automático
- Clasificador generativo
- Extractor generativo
- Configurar autenticación
- Validar documentos con acciones de la aplicación
- Validación manual para digitalizar documentos
- Extracción de datos basada en anclajes utilizando el extractor inteligente de formularios
- Estación de validación
- Actividades generativas: buenas prácticas
- Extractor generativo: buenas prácticas
- Clasificador generativo: buenas prácticas
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer
Descripción
Permite la recopilación de datos que se han procesado a través de la Estación de validación para que puedan importarse a Document Manager. Esta actividad solo se puede utilizar dentro de la actividad Entrenar el ámbito de los extractores .
Compatibilidad de proyectos
Windows-Legacy | Windows
Configuración
Panel del Diseñador
Almacenamiento local
- Output Folder - The directory where the collected data is stored. Once the data is stored, it can be imported into machine learning training tools.
Seleccionar conjunto de datos privado para el proyecto
- Conjunto de datos : el conjunto de datos donde se pueden cargar los datos de entrenamiento. Si el robot está conectado a un tenant que tiene AI Center habilitado, puedes ver todos los conjuntos de datos de AI Center en el menú desplegable y seleccionar la carpeta donde cargar los documentos validados utilizando el menú desplegable.
- Project - The project where the training data can be uploaded.
Nota:
La selección de proyectos y conjuntos de datos solo se habilita cuando se conecta a Orchestrator. Consulta Gestionar conjuntos de datos para obtener más información sobre los conjuntos de datos públicos/privados.
Proporcionar un punto final de conjunto de datos público
- Dataset ApiKey - The authentication key of the dataset.
- Punto final del conjunto de datos : el punto final del conjunto de datos donde se pueden cargar los datos de entrenamiento. Una vez que un conjunto de datos es público, se puede acceder a él fuera del entorno de UiPath® a través de un punto final y utilizando la clave API. Haz esto si quieres cargar conjuntos de datos en una instancia de AI Center a la que no estás conectado (por ejemplo, en el caso de implementaciones híbridas en las que AI Center está en la nube y el robot está conectado a un tenant local).
Panel de propiedades
Común
- Nombre para mostrar: el nombre para mostrar de la actividad.
Almacenamiento local
- Output Folder - The directory where the collected data is stored. Once the data is stored, it can be imported into machine learning training tools.
Otros
- Privado : si se selecciona, los valores de variables y argumentos ya no se registran en el nivel Detallado.
Proporcionar un punto final de conjunto de datos público
- Dataset ApiKey - The authentication key of the dataset.
- Punto final del conjunto de datos : el punto final del conjunto de datos donde se pueden cargar los datos de entrenamiento. Una vez que un conjunto de datos es público, se puede acceder a él fuera del entorno de UiPath® a través de un punto final y utilizando la clave API. Haz esto si quieres cargar conjuntos de datos en una instancia de AI Center a la que no estás conectado (por ejemplo, en el caso de implementaciones híbridas en las que AI Center está en la nube y el robot está conectado a un tenant local).
Seleccionar conjunto de datos privado para el proyecto
- Conjunto de datos : el conjunto de datos donde se pueden cargar los datos de entrenamiento. Si el robot está conectado a un tenant que tiene AI Center habilitado, puedes ver todos los conjuntos de datos de AI Center en el menú desplegable y seleccionar la carpeta donde cargar los documentos validados utilizando el menú desplegable.
- Project - The project where the training data can be uploaded.
Nota:
La selección de proyectos y conjuntos de datos solo se habilita cuando se conecta a Orchestrator. Consulta Gestionar conjuntos de datos para obtener más información sobre los conjuntos de datos públicos/privados.
Servidor
- RetryOnFailure - Retry on transient failure. This field only supports Boolean values (True, False). The default value is True.
- Timeout (milliseconds) - Specifies the amount of time (in milliseconds) to wait for a response from the server before an error is thrown. The default value is 100000 milliseconds (100 seconds).
Uso del asistente de entrenamiento de Machine Learning Extractor
El Entrenador de extractor con aprendizaje automático recopila los comentarios humanos por ti, en un directorio de tu elección. Una vez que recopiles datos y quieras volver a entrenar un modelo ML, puedes comprimir el contenido del directorio y cargarlo en Document Manager para recopilar y filtrar datos.
Cómo utilizar
Para utilizar la actividad Entrenador de extractores de aprendizaje automático, realiza los siguientes pasos:
-
Utiliza el asistente del Gestor de taxonomía para definir tus campos y tipos de documento.
-
Añade un entrenador de extractor de aprendizaje automático en una actividad de ámbito de entrenamiento de extractores.
-
En el asistente del extractor de aprendizaje automático que se abre automáticamente, introduce información para el campo PuntoFinal.Puedes elegir uno de los puntos finales públicos. Visita Puntos finales públicos para obtener más información sobre los endpoints públicos.
-
Selecciona la casilla de verificación para Actualizar los argumentos de actividad si deseas utilizar también los valores introducidos como argumentos de entrada para la actividad, más concretamente para el Punto final.
-
Selecciona Obtener capacidades. El asistente se cierra después de esta operación
-
Enter a value for Output Folder.
-
Select the Configure Extractors option in the Train Extractors Scope. A wizard is displayed.
Figura 1. El asistente Configurar extractores

-
El Entrenador del extractor con aprendizaje automático ya está listo para su configuración. Expande el tipo de documento para el que deseas aplicarlo y comienza a seleccionar los campos que deseas entrenar, seleccionando las casillas de verificación junto a los campos adecuados.
-
Rellena los cuadros de texto manualmente o seleccionando, de la lista desplegable disponible, los datos correctos que deseas asignar a cada campo. La lista desplegable contiene todos los campos que el Entrenador de extractor de aprendizaje automático, utilizando el punto final introducido en el asistente Extractor de aprendizaje automático, declara como capacidad de extracción.
Nota:Si seleccionas la casilla de verificación pero dejas el cuadro de texto vacío, este último se rellenará automáticamente con el ID de tipo de documento de la taxonomía local. Los cambios se aplican después de guardar. Si quieres evitar el uso de una cadena larga para el ID de campo, te recomendamos que introduzcas manualmente un valor en caso de que no tengas acceso a la taxonomía interna del extractor.
-
Para comprobar si utilizas las últimas capacidades del extractor, puedes seleccionar las capacidades del extractor Obtener o actualizar las capacidades del extractor que abre el asistente Extractor de aprendizaje automático.
-
Seleccionar una de las opciones de una lista desplegable confirma automáticamente ese campo.
-
To train an extractor based on its extraction result, you can set the exact alphanumeric value in the Framework Alias field previously used for an extractor.
-
Selecciona Guardar una vez que todos los campos estén configurados correctamente.
Importante:You cannot choose the same option for two distinct fields.
Integración de Document Understanding
La actividad Entrenador del extractor con aprendizaje automático forma parte de Document Understanding Solutions. Consulta la Guía de Document Understanding para obtener más información.