- Primeros pasos
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de CapturaFlexible
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Resumen de la extracción de datos
- Asistente para Configurar extractores del ámbito de extracción de datos
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Extractor con aprendizaje automático
- Extractor CapturaFlexible
- Actividades relacionadas con la extracción de datos
- Paquetes ML
- Procesos
- Gestor de datos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Asistente para Configurar extractores del ámbito de extracción de datos
El asistente para Configurar extractores, al que se accede a través de Ámbito de extracción de datos, permite elegir qué extractores se aplican a cada tipo de documento y campo.
Puede abrirse desde el cuerpo de la actividad, haciendo clic en el botón Configurar extractores. El botón del asistente estará disponible después de arrastrar al menos un extractor al cuerpo de la actividad Ámbito de extracción de datos.Este asistente muestra todos los tipos de documentos definidos en la taxonomía y sus respectivos campos y permite elegir qué extractor se desea utilizar para cada uno.
Cada tipo de documento puede ampliarse y sus campos pueden visualizarse en el asistente y seleccionarse para la extracción.
El campo Alias del marco puede utilizarse para asignar un extractor a uno o varios entrenadores. Por ejemplo, puedes asignar el alias R2D2 a un Extractor con aprendizaje automático y utilizar el mismo alias para un Entrenador del extractor con aprendizaje automático. De este modo, se crea un vínculo entre el extractor y el entrenador, con fines de entrenamiento para el extractor. Cada extractor tiene un alias único, mientras que varios entrenadores pueden compartir el mismo alias.
El campo Confianza mínima puede configurarse con un valor entre 0 y 100 y representa el umbral de confianza por encima del cual se tienen en cuenta los datos extraídos. Si el resultado de un campo seleccionado tiene un nivel de confianza inferior al umbral de confianza, este no se incluirá en el resultado final.
El botón Obtener o actualizar las capacidades del extractor, para los extractores que admitan esta funcionalidad, puede utilizarse para asignar fácilmente tus campos de taxonomía con los campos disponibles del extractor o actualizarlos en caso de que los campos del extractor hayan cambiado.
Las casillas de verificación situadas junto a cada campo de cualquier columna, si están seleccionadas, hacen que se solicite al extractor un valor para el campo especificado. Si no están marcadas, el campo se ignora al extraer los datos.
Los campos de texto junto a cada campo de documento te permiten asignar campos definidos en tu taxonomía con los campos definidos en la taxonomía interna del extractor, si la hubiera.
El número de columnas del asistente varía en función del número de extractores presentes en la actividad de ámbito. El nombre de cada columna viene dado por el nombre para mostrar de cada actividad de extractor.
Si se utilizan múltiples extractores en la actividad, el orden de los extractores en al ámbito define la prioridad. Por ejemplo, en la imagen anterior, si el Extractor 1 devuelve un valor aceptable (por encima del nivel de Confianza mínima) para un campo solicitado en particular, entonces ese campo no se solicitará cuando se ejecuten el Extractor 2 y el Extractor 3.Si Extractor 1 y Extractor 2 devuelven valores por debajo del nivel de Confianza mínima para ese campo en particular, o no devuelven nada, los resultados de Extractor 3 se tendrán en cuenta siempre que cumplan con las condiciones de aceptabilidad de la confianza.