- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Configurar autenticación
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Cargar taxonomía
UiPath.IntelligentOCR.Activities.TaxonomyManagement.LoadTaxonomy
taxonomy.json
creado con la ayuda del Gestor de taxonomía en una variable que puede ser utilizada posteriormente con otras actividades.
Común
- NombreParaMostrar: el nombre de la actividad para ser mostrado.
Otros
- Privado : si se selecciona, los valores de variables y argumentos ya no se registran en el nivel Detallado.
Salida
-
Taxonomía : la taxonomía que quieres cargar, almacenada en una variable
DocumentTaxonomy
. Esta salida se puede usar posteriormente en actividades que reciban una taxonomía como entrada.Importante: Si utilizas una GPU Intel Xe y Gestor de taxonomía no se muestra correctamente te recomendamos actualizar el controlador gráfico a la versión más reciente. Para obtener más información, visita esta página.
Serialize()
DocumentTaxonomy
, el método Serialize()
devuelve una representación del objeto JSON
, de modo que pueda almacenarse y recuperarse para su uso posterior.
Deserialize(String)
DocumentTaxonomy.Deserialize(jsonString)
devuelve un objeto DocumentTaxonomy
, dotado de los datos codificados en JSON que se han pasado como parámetro.
GetFields(String)
DocumentTaxonomy
, el método GetFields()
llamado con una cadena DocumentTypeId
devuelve una lista de campos definidos en ese tipo de documento.
El Gestor de taxonomía se puede usar para crear y editar un archivo de Taxonomía específico para tu proyecto de automatización actual. Este archivo de Taxonomía contiene tipos de documentos definidos por el usuario, organizados en Grupos y Categorías.
Puedes seguir usando el archivo de Taxonomía convirtiéndolo en un tipo de datos .NET con la actividad Cargar taxonomía, y luego pasarlo como entrada para actividades como:
- Clasificar ámbito de documento
- Entrenar el alcance de los clasificadores
- Entrenar el alcance de los Extractores
- Mostrar Estación de Validación
Al Gestor de taxonomía solo se puede acceder después de instalar un paquete UiPath.IntelligentOCR.Activities superior o igual a v1.6.0 como dependencia para tu proyecto. Una vez instalado el paquete, aparecerá el botón Gestor de taxonomía en la cinta de opciones, en la sección de Asistentes.
La ventana del Gestor de taxonomía te permite crear tipos de documentos organizados por grupos y categorías. Cuando se abre por primera vez en un proyecto, no se define ningún grupo, categoría o tipo de documento.
El primer paso consiste en crear un grupo o un tipo de documento. La diferencia entre ambos es que un grupo implica una estructura jerárquica, mientras que un tipo de documento puede crearse como un archivo único. Un proyecto complejo implica la creación de grupos, categorías y tipos de documentos, mientras que un proyecto sencillo puede requerir solo uno o dos tipos de documentos.
Crear un grupo
Cuando se crea un grupo, también es necesaria una categoría para el tipo de documento que se desea crear en el grupo. Esto se consigue utilizando el botón Grupo. Una vez que hayas elegido un nombre para tu grupo, puedes guardarlo mediante el botón Guardar o simplemente pulsando Intro.
Crear una categoría
Una vez definido y seleccionado un grupo, puedes crear una Categoría y/o un Tipo de documento dentro del grupo, mediante los botones definidos para ello.
Crear un tipo de documento
Un Tipo de documento puede crearse como parte de un grupo o como documento único. Cuando se crea en un grupo, asegúrate de que el grupo está seleccionado y haz clic en el botón Tipo de documento.
Si el Tipo de documento se crea como un único archivo, comprueba que no hay ningún grupo seleccionado y haz clic en el botón Tipo de documento. Después de hacer clic en el botón Tipo de documento, introduce un nombre para el archivo y haz clic en el botón Guardar.
Si seleccionas un tipo de documento ya creado, podrás cambiar su nombre, copiar su ID único al portapapeles, reasignarlo a otro grupo o categoría, o a ninguno de ellos. También puedes introducir un código para el tipo de documento.
Group.Category.Document
y se puede copiar en el portapapeles. El código de ID del tipo de documento es una funcionalidad opcional y se puede utilizar para encontrar sus documentos o asignar sus documentos a los tipos de documentos que defina en la taxonomía.
Crear campos
Cuando se selecciona el Tipo de documento, el botón Campo está disponible para que pueda crear un nuevo campo. Una vez que se hace clic en el botón Campo , puede introducir un nombre y seleccionar su tipo en la lista desplegable.
La categoría Campo tiene dos pestañas, Detalles y Reglas. La pestaña Detalles proporciona información sobre el campo seleccionado, como el nombre del campo, la tecla de acceso rápido asignada o el tipo de campo, mientras que la pestaña Reglas te permite crear reglas que debe cumplir el resultado de la extracción del campo.
Los tipos de campo disponibles son:
- Texto
- Número
- Fecha: la elección de este tipo también permite especificar un formato previsto, que es opcional.
Nota:
Si quieres añadir un formato previsto, utiliza un formato compatible con MSDN.
Este formato lo pueden utilizar los extractores y la actividad Ámbito de extracción de datos lo utiliza cuando intenta analizar una fecha en sus componentes: día, mes y año.
- Nombre
- Dirección
- Establecer: elegir este tipo te permite añadir al campo múltiples valores desde una lista preestablecida.
- Booleano
- Tabla: la elección de este tipo permite editar la estructura de la tabla, ya que se pueden añadir columnas y editar su nombre y tipo.
Pestaña Detalles
Después de crear el nuevo campo, haga clic en él para ver más información. De forma predeterminada, al abrir un campo, aparece la pestaña Detalles, que le permite modificar el nombre, el color o la tecla de acceso rápido del campo. También puedes especificar si es de varios valores (Es de varios valores) o si permite procesar valores sin pruebas en el documento (Requiere referencia). La opción de valores múltiples permite que un campo tenga varios valores, sin estar restringido a una lista específica.
- Es multivalor: si un campo se establece como multivalor, puedes tener más de un valor informado para ese campo en particular. Ejemplo: quieres extraer una "Lista de directores" donde puedas tener un número variable de entradas. Imagina un campo multivalor como una tabla de una sola columna.
- Requiere una referencia: cuando un campo requiere referencia, puedes añadirle un valor solo si seleccionas algo del documento que ves en Estación de validación. Para los campos especiales en los que quieres capturar valores que tal vez no sean visibles en el documento, puedes cambiar Requiere una referencia a desactivado. El efecto será que el usuario pueda añadir un valor sin especificar un lugar del documento de donde provienen esos valores.
- Solo lectura: si se habilita, el validador humano puede ver cualquier nota del validador establecida en el campo ResultadoDeExtracción en la Estación de validación, como un mensaje. Si está deshabilitado (estado predeterminado), el validador humano también puede editar esa nota en la Estación de validación y, por lo tanto, comunicar al robot información sobre la decisión tomada.
- Texto: si se selecciona Texto , la nota del validador se muestra como un mensaje de texto (o texto editable cuando la edición está habilitada) en la Estación de validación. El validador humano puede ver, editar o añadir un mensaje de hasta 200 caracteres en la Estación de validación.
- Opciones: si seleccionas Opciones, puedes configurar una serie de botones de radio que el validador humano puede ver y, si no es de solo lectura, seleccionar en la Estación de validación. Puedes añadir un máximo de 10 opciones.
GetFieldValidatorNotes(<fieldId>)
y SetFieldValidatorNotes(<fieldId>, <validatorNote>)
.
Los campos creados pueden eliminarse mediante el botón Eliminar que aparece junto a ellos o reordenarse mediante la función de arrastrar y soltar.
También se puede eliminar un campo de la ventana Detalles seleccionando el botón Eliminar .
Volviendo sobre estos pasos puedes crear múltiples grupos, categorías y tipos de documento, que podrás filtrar utilizando el campo Buscar.
Pestaña de reglas
Las reglas de campo están aquí para ayudarte a optimizar los resultados de la extracción y validarlos automáticamente cuando se ejecuta tu flujo de trabajo. Su función es aumentar la eficiencia de la extracción y ayudarle a validar fácilmente los campos que requieren atención en la Estación de validación resaltándolos. Puede crear varias reglas que se apliquen a un campo.
Una regla se define estableciendo el tipo de evaluador y el nivel de severidad.
Tipo de evaluador
Utilice el Tipo de evaluador para especificar cómo deben evaluarse las reglas definidas. Hay dos tipos de evaluadores entre los que puede elegir: Y, O.
Tipo de evaluador |
Descripción |
Ejemplo |
---|---|---|
AND |
Utilice este tipo de evaluador cuando sea necesario ejecutar todas las reglas. |
Regla : el número de factura comienza con A y termina con X.
|
O |
Solo es necesario ejecutar una de las reglas. |
Regla : el número de factura que comienza con A OR es 123.
|
Nivel de severidad
Indica la severidad de todas las reglas definidas para un campo. No puede establecer un nivel MUST si se ha incumplido la regla en la sesión de la Estación de validación. Hay dos niveles de severidad entre los que puede elegir: MUST, SHOULD.
La regla creada se activa una vez que se identifica el nivel de severidad establecido.
Cuando desee enviar una regla, una regla MUST requiere un 100% de éxito; de lo contrario, la operación de envío fallará. Una regla SHOULD le permite Enviarla incluso si la regla se ha incumplido.
Siempre puedes comprobar si se rompe una regla utilizando el método auxiliar de la clase de ExtractionResult, que reside en el paquete de actividades UiPath.DocumentProcessing.Contracts.
Nivel de severidad |
Descripción |
---|---|
MUST |
Utilice este nivel de severidad cuando la regla creada sea imprescindible para incluirla en el proceso de extracción del resultado. |
SHOULD |
Utiliza este nivel de severidad cuando la regla creada sea opcional. |
Una vez que haya seleccionado el tipo de evaluador y el nivel de severidad, debe establecer un tipo aplicable a su regla recién creada. Hay varias opciones. Aquí hay una lista completa con todos los disponibles:
- No esta vacío
- Valores posibles
- Comienza con
- Termina en
- Contiene
- Longitud fija
- Es un correo electrónico
- Expresiones regulares
Nota: El tipo de campo para el que creó una regla dicta el número de posibles tipos de regla entre los que puede seleccionar uno. Por ejemplo, un campo de tipo Texto muestra todos los tipos de reglas posibles, mientras que un campo de tipo Fecha muestra solo dos tipos de reglas, los valores No está vacío y Posibles.
Tipo de reglas
Tipo de regla | Descripción | Tipo de campo | Nivel de severidad | Tipo de evaluador |
---|---|---|---|---|
No esta vacío | El valor extraído no puede estar vacío, por lo que el campo es obligatorio. Si falta el valor, requiere validación / entrada manual. | Aplicable a campos de tipo:
|
MUST SHOULD | AND
O |
Valores posibles | El usuario define todos los valores posibles y los datos extraídos son uno de los valores agregados como entrada al crear la regla (p. Ej. El tipo de empleador puede ser "a tiempo completo", "a tiempo parcial" o "prácticas"). | Aplicable a campos de tipo:
|
MUST SHOULD | AND
O |
Expresión | Definir expresiones matemáticas que actúen como regla para extraer datos. | Aplicable a campos de tipo:
Se requiere una condición al configurar la regla. Elija una de las siguientes opciones:
Se requiere una expresión matemática. Utilice los operadores predefinidos para definir su expresión. Aquí tiene algunos ejemplos:
|
MUST SHOULD | AND
O |
Comienza con | Esta es una regla fija, lo que significa que el valor extraído debe comenzar con uno de los valores añadidos por el usuario. | Aplicable a campos de tipo:
|
MUST SHOULD | AND
O |
Termina en | Esta es una regla fija que significa que el valor extraído debe terminar con uno de los valores añadidos por el usuario. | Aplicable a campos de tipo:
|
MUST SHOULD | AND
O |
Contiene | Esta es una regla fija, lo que significa que el valor extraído debe contener uno de los valores añadidos por el usuario. | Aplicable a campos de tipo:
|
MUST SHOULD | AND
O |
Longitud fija | Esta es una regla fija, lo que significa que el valor extraído debe tener una longitud fija determinada. | Aplicable a campos de tipo:
|
MUST SHOULD | AND
O |
Es un correo electrónico | Esta es una regla fija que significa que el valor extraído debe escribirse en un formato de correo electrónico. | Aplicable a campos de tipo:
|
MUST SHOULD | AND
O |
Expresiones regulares | Esta es una regla fija que significa que el valor extraído debe contener una expresión regular similar a uno de los valores añadidos por el usuario. | Aplicable a campos de tipo:
|
MUST SHOULD | AND
O |
Usando reglas
Tomemos un ejemplo práctico para entender mejor la aplicabilidad de estas reglas. Así es como puede crear una nueva regla o un conjunto de reglas para un campo:
Otras opciones
Edición
Puedes editar el nombre de cualquier grupo, categoría o tipo de documento que hayas creado. Para ello, selecciona uno de los tres niveles de configuración y edita el campo Nombre.
Eliminación
También se pueden eliminar grupos, categorías y tipos de documentos. Hay dos opciones disponibles:
- haga clic en el botón
- haga clic en el Botón Eliminar de la parte superior derecha de la ventana.
En ambos casos, se mostrará una ventana emergente que le pedirá que confirme la acción de eliminación. Haga clic en Eliminar para aprobar la acción como se muestra en los GIF anteriores.
Personalización y accesibilidad
Automáticamente, se asignan una tecla de acceso rápido y un color al campo recién creado. Puedes utilizarlos para una mejor visibilidad y una navegación más rápida a través de tu taxonomía. Puedes personalizarlos haciendo clic en la tecla de acceso rápido o en el campo de código de color.
Un campo personalizado con color y tecla de acceso rápido puede indicar a la Estación de validación y al Gestor de plantillas que utilicen el color asignado al mostrar el campo y que utilicen la tecla de acceso rápido asignada como método abreviado para proporcionar valores a los campos. Aquí encontrarás más información sobre cómo utilizar los atajos de campo para asignar valores a un campo.
Navegar por el Gestor de taxonomía usando los atajos del teclado. Active la opción Alternar atajos de teclado para evitar la activación accidental de los atajos de teclado. Los nodos también se pueden contraer con un solo clic.
A continuación, se muestra una mejor presentación de todos los atajos de teclado disponibles.
taxonomy.json
específico de tu proyecto.