- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Notas relacionadas
- Acerca del paquete de actividades ML Document Understanding
- Compatibilidad de proyectos
- Extractor con aprendizaje automático
- Entrenador de extractor con aprendizaje automático
- Clasificador de aprendizaje automático
- Entrenador del clasificador de aprendizaje automático
- Clasificador generativo
- Extractor generativo
- Configurar autenticación
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Configurar autenticación
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
Entrenador de extractor con aprendizaje automático
UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer
Permite la recopilación de datos que han sido procesados a través de la estación de validación para que puedan ser importados a Document Manager. Esta actividad solo puede utilizarse dentro de la actividad Entrenar el alcance de los Extractores.
Panel del Diseñador
Almacenamiento local
- Carpeta de salida : el directorio donde se almacenan los datos recopilados. Una vez que se almacenan los datos, se pueden importar en herramientas de entrenamiento de aprendizaje automático.
Seleccionar conjunto de datos privado para el proyecto
- Conjunto de datos: el conjunto de datos donde se pueden cargar los datos de entrenamiento. Si el robot está conectado a un tenant que tiene AI Center habilitado, puedes ver todos los conjuntos de datos de AI Center en el menú desplegable y seleccionar la carpeta donde cargar los documentos validados usando el menú desplegable.
- Proyecto : el proyecto en el que se pueden cargar los datos de entrenamiento.
Nota: la selección de proyectos y conjuntos de datos solo se habilita cuando se conecta a Orchestrator. Consulta Gestionar conjuntos de datos para obtener más información sobre los conjuntos de datos públicos/privados.
Proporcionar un punto final de conjunto de datos público
- Clave de API del conjunto dedatos : la clave de autenticación del conjunto de datos.
- Punto final del conjunto de datos: el punto final del conjunto de datos donde se pueden cargar los datos de entrenamiento. Una vez que un conjunto de datos es público, se puede acceder a él fuera del entorno UiPath® a través de un punto final y utilizando una clave API. Hazlo si quieres cargar los conjuntos de datos en una instancia de AI Center a la que no estás conectado (por ejemplo, en el caso de las implementaciones híbridas en las que el AI Center está en la nube y el robot está conectado a un tenant local).
Panel de propiedades
Común
- NombreParaMostrar: el nombre de la actividad para ser mostrado.
Almacenamiento local
- Carpeta de salida : el directorio donde se almacenan los datos recopilados. Una vez que se almacenan los datos, se pueden importar en herramientas de entrenamiento de aprendizaje automático.
Otros
- Privado : si se selecciona, los valores de variables y argumentos ya no se registran en el nivel Detallado.
Proporcionar un punto final de conjunto de datos público
- Clave de API del conjunto dedatos : la clave de autenticación del conjunto de datos.
- Punto final del conjunto de datos: el punto final del conjunto de datos donde se pueden cargar los datos de entrenamiento. Una vez que un conjunto de datos es público, se puede acceder a él fuera del entorno UiPath® a través de un punto final y utilizando una clave API. Hazlo si quieres cargar los conjuntos de datos en una instancia de AI Center a la que no estás conectado (por ejemplo, en el caso de las implementaciones híbridas en las que el AI Center está en la nube y el robot está conectado a un tenant local).
Seleccionar conjunto de datos privado para el proyecto
- Conjunto de datos: el conjunto de datos donde se pueden cargar los datos de entrenamiento. Si el robot está conectado a un tenant que tiene AI Center habilitado, puedes ver todos los conjuntos de datos de AI Center en el menú desplegable y seleccionar la carpeta donde cargar los documentos validados usando el menú desplegable.
-
Proyecto : el proyecto en el que se pueden cargar los datos de entrenamiento.
Nota: la selección de proyectos y conjuntos de datos solo se habilita cuando se conecta a Orchestrator. Consulta Gestionar conjuntos de datos para obtener más información sobre los conjuntos de datos públicos/privados.
Servidor
- VolverAIntentarSiFalla: volver a intentar tras error transitorio. Este campo solo admite valores booleanos (Verdadero, Falso). El valor predeterminado es Verdadero.
- Tiempo de espera (milisegundos): especifica la cantidad de tiempo (en milisegundos) que se debe esperar una respuesta del servidor antes de arrojar un error. El valor predeterminado es 100 000 milisegundos (100 segundos).
El Entrenador de extractor con aprendizaje automático recopila los comentarios de las personas en el directorio seleccionado. Una vez que recopiles datos y deseas reentrenar un modelo ML, puedes comprimir el contenido del directorio y cargarlo en Document Manager para reunir y filtrar datos.
Para utilizar la actividad Entrenador de extractores de aprendizaje automático, realiza los siguientes pasos:
- Utiliza el asistente del Gestor de taxonomía para definir tus campos y tipos de documento.
- Añade un entrenador de extractor de aprendizaje automático en una actividad de ámbito de entrenamiento de extractores.
- En el asistente del extractor de aprendizaje automático que se abre automáticamente, introduce información para el campo PuntoFinal.Puedes elegir uno de los puntos finales públicos. Visita Puntos finales públicos para obtener más información sobre los endpoints públicos.
- Selecciona la casilla de verificación para Actualizar los argumentos de actividad si deseas utilizar también los valores introducidos como argumentos de entrada para la actividad, más concretamente para el Punto final.
- Selecciona Obtener capacidades.
El asistente se cierra después de esta operación
- Introduce un valor en Carpeta de salida.
- Selecciona la opción Configurar extractores en el Ámbito de los extractores de entrenamiento.
Se muestra un asistente.
Figura 1. El asistente Configurar extractores
- El Entrenador del extractor con aprendizaje automático ya está listo para su configuración. Expande el tipo de documento para el que deseas aplicarlo y comienza a seleccionar los campos que deseas entrenar, seleccionando las casillas de verificación junto a los campos adecuados.
- Rellena los cuadros de texto manualmente o seleccionando, de la lista desplegable disponible, los datos correctos que deseas asignar a cada campo. La lista desplegable contiene todos los campos que el Entrenador de extractor de aprendizaje automático, utilizando el punto final introducido en el asistente Extractor de aprendizaje automático, declara como capacidad de extracción.
Nota: si seleccionas la casilla de verificación pero dejas el cuadro de texto vacío, este último se rellenará automáticamente con el ID de tipo de documento de la taxonomía local. Los cambios se aplican después de guardar. Si quisieras evitar el uso de una cadena larga para el ID del campo, te recomendamos que introduzcas manualmente un valor en caso de que no tengas acceso a la taxonomía interna del extractor.
- Para comprobar si utilizas las últimas capacidades del extractor, puedes seleccionar las capacidades del extractor Obtener o actualizar las capacidades del extractor que abre el asistente Extractor de aprendizaje automático.
- Seleccionar una de las opciones de una lista desplegable confirma automáticamente ese campo.
- Para entrenar un extractor basándose en su resultado de extracción, puedes establecer el valor alfanumérico exacto en el campo Alias del marco utilizado anteriormente para un extractor.
- Selecciona Guardar una vez que todos los campos estén configurados correctamente.
Importante: No puedes elegir la misma opción para dos campos distintos.
Integración de Document Understanding
La actividad Entrenador de extractor por aprendizaje automático forma parte de Document Understanding Solutions. Consulta la Guía de Document Understanding para obtener más información.