- Información general
- Primeros pasos
- Actividades
- Paneles de insights
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Visión general de taxonomía
- Gestor de taxonomía
- Actividades relacionadas con taxonomía
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Detalles del modelo
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Limitaciones de tráfico
- Configuración de OCR
- Procesos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Datos y seguridad
- Lógica de licencias y tarificación

Document Understanding classic user guide
Gestor de taxonomía
In case you use an Intel Xe GPU and Taxonomy Manager is not displayed properly, we recommend updating the graphics driver to the latest version. For more information, please visit this page.
El Gestor de taxonomía se puede usar para crear y editar un archivo de Taxonomía específico para tu proyecto de automatización actual. Este archivo de Taxonomía contiene tipos de documentos definidos por el usuario, organizados en Grupos y Categorías.
You can further use the Taxonomy file by converting it into a.NET data type with the Load Taxonomy activity, and then passing it as input for activities such as:
- Clasificar ámbito de documento
- Entrenar el alcance de los clasificadores
- Entrenar el alcance de los Extractores
- Mostrar Estación de Validación
Al Gestor de taxonomía solo se puede acceder después de instalar un paquete UiPath.IntelligentOCR.Activities superior o igual a v1.6.0 como dependencia para tu proyecto. Una vez instalado el paquete, aparecerá el botón Gestor de taxonomía en la cinta de opciones, en la sección de Asistentes.

Usar Gestor de taxonomía
La ventana del Gestor de taxonomía te permite crear tipos de documentos organizados por grupos y categorías. Cuando se abre por primera vez en un proyecto, no se define ningún grupo, categoría o tipo de documento.
Figure 1. The Taxonomy Manager before mapping any document types or fields

Establecer la estructura
El primer paso consiste en crear un grupo o un tipo de documento. La diferencia entre ambos es que un grupo implica una estructura jerárquica, mientras que un tipo de documento puede crearse como un archivo único. Un proyecto complejo implica la creación de grupos, categorías y tipos de documentos, mientras que un proyecto sencillo puede requerir solo uno o dos tipos de documentos.
Crear un grupo
Cuando se crea un grupo, también es necesaria una categoría para el tipo de documento que se desea crear en el grupo. Esto se consigue utilizando el botón Grupo. Una vez que hayas elegido un nombre para tu grupo, puedes guardarlo utilizando el botón Guardar o utilizando la tecla Intro.
Crear una categoría
Una vez que se define y selecciona un grupo, puedes crear una Categoría y/o un Tipo de documento dentro del grupo, utilizando sus botones correspondientes.Selecciona Guardar o utiliza la tecla Intro para guardar la configuración.
Crear un tipo de documento
A Document Type can be created either as part of a group or as a single document. When created inside a group, make sure that the group is selected, then select Document Type.
If the Document Type is created as a single file, make sure that no group is selected and select Document Type. After selecting Document Type, enter a name for the file and select Save.
When a Document Understanding Action is submitted from Orchestrator while using Studio version 2020.10, make sure that the taxonomy has no document types created without a category.
Selecting an already created Document Type lets you change its name, copy its unique ID to clipboard, or reassign it to another group or category. You can also input a code for the document type.
Once a document type is saved, a Document Type ID is generated for it. Opening the document for editing displays the ID next to the Document Type Name tab. The Document Type ID has a structure of the type Group.Category.Document and can be copied to the clipboard. The Document Type ID code is an optional functionality and it can be used to find your documents or map your documents to the Document Types that you define in the taxonomy.
Configurar los ajustes de visualización para el tipo de documento
After you create the document type, you can configure its display settings. Select the document type in the Taxonomy Manager, and go to Display settings. You can change the following configurations:
-
OCR confidence threshold: Set a minimum confidence threshold at the document type level. When the document is displayed in the Validation Station, both the OCR confidence level and the Extraction confidence level for a field, would have to be higher than the threshold you configure in the Taxonomy Manager. The default value for OCR confidence threshold is 90%.
-
Date display format: The date format displayed for the document type.
El valor predeterminado es
YYYY-MM-DD. -
Number decimal separator: The number decimal separator you want to use for the document type.
-
Number thousand separator: The number thousand separator you want to use for the document type.
Crear campos
When the Document Type is selected, the Field button becomes available to create a new field. Once the Field button is selected, you can enter a name for it and select its type from the dropdown list.
The Field category has two tabs: Details and Rules. The Details tab provides information about the selected field, such as Field Name, assigned hotkey, or field type, while the Rules tab allows you to create rules that need to be fulfilled by the extraction result for the field.
Están disponibles los siguientes tipos de campo:
- Texto
- Número
- Cantidad monetaria
- Date - Choosing this type also lets you specify an expected format, which is optional.
Nota:
If you want to add an expected format, use an MSDN (MicroSoft Developer Network) compliant format. This format may be used by extractors and is used by the Data Extraction Scope activity when trying to parse a Date into its constituent Day, Month, and Year parts.
- Nombre
- Address
- Set - Choosing this type lets you add multiple values to the field from a pre-established list.
- Booleano
- Table - Choosing this type lets you edit the structure of the table, as you can add columns and edit their name and type.
- FieldGroup - Choosing this type enables you to display hierarchical field structures in Validation Station, allowing logical organization of extracted data. FieldGroups preserve the hierarchical structure of extracted data, making large, multi-page document packets easier and faster to validate.
Pestaña Detalles
Después de crear el nuevo campo, selecciónalo para ver más información. De forma predeterminada, al abrir un campo, se muestra la pestaña Detalles que te permite modificar el nombre, el color o la tecla de acceso rápido del campo. También puedes especificar si es multivalor (Es multivalor) o si permite que se procesen valores sin evidencia en el documento (Requiere referencia). La opción multivalor permite que un campo tenga varios valores, sin estar restringido a una lista específica.
Para obtener más información sobre cómo utilizar los dos campos, consulta las siguientes descripciones:
- Is Multi-Value: If a field is set as multi-value, you can have more than one value reported for that particular field. For example, you want to extract a "List of Directors" where you can have variable number of entries. Imagine a multi-value field like a single-column table.
- Requires reference: When a field requires reference, you can add a value to it only if you select something from the document you see in Validation Station. For special fields in which you want to capture values that are maybe not visible in the document, you can switch Requires Reference to Off. Effect will be that user can add a value without specifying a place in the document where that values comes from.
También puedes seleccionar el Tipo de Campo de la lista desplegable o añadir un valor predeterminado.Utiliza el campo Valor Predeterminado para definir valores que se rellenarán en el resultado de la extracción, en caso de que no haya valor para el campo identificado en el documento.
Configuración de validación
Under Validation settings, you have the option to set an Extraction confidence threshold. This threshold is considered when validating the field in the Validation Station. To set an extraction confidence threshold, go to Extraction confidence threshold and input a value ranging from 0 to 100.
Figure 2. Overview of the Details tab of a field

You can choose to enable Validator notes from the Details tab. By setting up validator notes, human validator can add notes about the decision they have taken during validation. You can configure the following settings:
- Read-only: If enabled, the human validator can view any validator notes set on the ExtractionResult field in Validation Station, as a message. If disabled (default state), the human validator can also edit that note in Validation Station and thus communicate back to the robot information about the decision taken.
- Text: If Text is selected, the validator note is displayed as a text message (or editable text when editing is enabled) in Validation Station. The human validator can view, edit, or add a maximum of 200 characters message in Validation Station.
- Options: If you select Options, you can configure a series of radio buttons that the human validator can view and, if not read-only, select in Validation Station. You can add a maximum of 10 options.
Consejo:
Check the ExtractionResult Class page from the UiPath.DocumentProcessing.Contracts section for more information on the two methods related to validator notes,
GetFieldValidatorNotes(<fieldId>)andSetFieldValidatorNotes(<fieldId>, <validatorNote>).
Los campos creados pueden eliminarse mediante el botón Eliminar que aparece junto a ellos o reordenarse mediante la función de arrastrar y soltar.
Un campo también puede eliminarse desde la ventana Detalles seleccionando Eliminar.
Retracing these steps, you can create multiple groups, categories, and document types, which you can then filter by using the Search field.
Pestaña de reglas
Las reglas de campo te ayudan a optimizar los resultados de extracción y validarlos automáticamente al ejecutar su flujo de trabajo.Su rol es aumentar la eficiencia de extracción y ayudarte a validar fácilmente los campos que necesitan atención en la Estación de validación, resaltándolos.Puedes crear varias reglas que se apliquen a un campo.
You define a rule by setting the Evaluator type and the Criticality level.
Tipo de evaluador
Use the Evaluator Type to specify how the defined rules should be evaluated. There are two evaluator types that you can choose from: AND, OR.
| Tipo de evaluador | Descripción | Ejemplo |
|---|---|---|
| AND | Utilice este tipo de evaluador cuando sea necesario ejecutar todas las reglas. | Rule : Invoice Number starts with A And ends with X.
|
| O | Solo es necesario ejecutar una de las reglas. | Rule : Invoice number starts with A OR is 123.
|
Nivel de severidad
Indicates the criticality of all rules defined for a field. You cannot set a MUST level if the rule is broken in the Validation Station session. There are two criticality levels that you can choose from: MUST, SHOULD.
La regla creada se activa una vez que se identifica el nivel de severidad establecido.
When you want to submit a rule, a MUST rule requires 100% success, otherwise the Submit operation fails. A SHOULD rule allows you to Submit it even if the rule is broken.
You can always check if a rule is broken by using the helper method from the ExtractionResult Class class, that resides in the UiPath.DocumentProcessing.Contracts activity package.
Table 2. Table displaying Criticality levels and their descriptions
| Descripción | |
|---|---|
| MUST | Utilice este nivel de severidad cuando la regla creada sea imprescindible para incluirla en el proceso de extracción del resultado. |
| SHOULD | Utiliza este nivel de severidad cuando la regla creada sea opcional. |
Once you have selected the Evaluator Type and the Criticality Level, you must set a type applicable for your newly created rule. There are several options you can choose from. Here's a complete list with all the available ones:
- No esta vacío
- Valores posibles
- Comienza con
- Termina en
- Contiene
- Longitud fija
- Es un correo electrónico
- Expresiones regulares
Nota:
The field type for which you created a rule dictates the number of possible rule types from which you can select one. For example, a field of type Text displays all the possible rule types, while a field of type Date displays only two rule types, Is not empty and Possible values.
Tipo de reglas
La siguiente tabla muestra detalles para cada tipo de regla disponible, clasificadas dependiendo del nivel de criticidad y el tipo de evaluador.
| Descripción | Tipo de campo | Nivel de severidad | Tipo de evaluador | |
|---|---|---|---|---|
| No esta vacío | El valor extraído no puede estar vacío, por lo que el campo es obligatorio. Si falta el valor, requiere validación / entrada manual. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Valores posibles | El usuario define todos los valores posibles y los datos extraídos son uno de los valores añadidos como entrada al crear la regla (por ejemplo, el tipo de empleado es "tiempo completo", "tiempo parcial" o "becario"). | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Expresión | Definir expresiones matemáticas que actúen como regla para extraer datos. | Applicable to fields of type number. A condition is required while configuring the rule. Choose one of the following options:
| MUST SHOULD | AND O |
| Comienza con | Esta es una regla fija, lo que significa que el valor extraído debe comenzar con uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Termina en | Esta es una regla fija que significa que el valor extraído debe terminar con uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Contiene | Esta es una regla fija, lo que significa que el valor extraído debe contener uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Longitud fija | Esta es una regla fija, lo que significa que el valor extraído debe tener una longitud fija determinada. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Es un correo electrónico | Esta es una regla fija que significa que el valor extraído debe escribirse en un formato de correo electrónico. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Expresiones regulares | Esta es una regla fija que significa que el valor extraído debe contener una expresión regular similar a uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
Usando reglas
Tomemos un ejemplo práctico para comprender mejor la aplicabilidad de estas reglas. Crearemos un conjunto de reglas para el campo Dirección del documento. Consulta los siguientes pasos de ejemplo para aprender a crear una nueva regla o un conjunto de reglas para un campo:
- Selecciona un campo en el panel de Taxonomía.
- Ve a la pestaña Reglas.
- Selecciona Añadir nuevo, para añadir una nueva regla.
- Type in the
full addressrule, for which the Type is Contains, and the Expression isst, str, street. - Elige el tipo de evaluador. En este ejemplo, selecciona OR.
- Elige el nivel de criticidad. En este ejemplo, selecciona MUST.
- Selecciona Añadir nuevo.
- Escribe en la regla
phone number, para la que el Tipo es No está vacío. - Selecciona Añadir nuevo.
- Type in the
city or staterule, for which the Type is Contains, and the Expression iscity, state.
La siguiente imagen animada muestra los pasos descritos anteriormente.
Figura 3. Imagen animada que muestra cómo añadir tres reglas para un campo

Otras opciones
Edición
You can Edit the name of any group, category, or document type that you have created. This can be done by selecting one of the three levels of configuration and editing the Name field.
Eliminación
También se pueden eliminar grupos, categorías y tipos de documentos. Hay dos opciones disponibles:
- Select Delete
, at the parent element of the object you want to delete. - Select Delete
while selecting the object you want to delete.
En ambos casos, se muestra una ventana emergente pidiéndote que confirmes la acción de eliminación. Selecciona Eliminar para aprobar la acción.
Personalización y accesibilidad
Automáticamente, se asignan una tecla de acceso rápido y un color al campo recién creado. Puedes utilizarlos para una mejor visibilidad y una navegación más rápida a través de tu taxonomía. Puedes personalizarlos haciendo clic en la tecla de acceso rápido o en el campo de código de color.
A customized field with color and hotkey can instruct the Validation Station and the Template Manager to use the assigned color when displaying the field and to use the assigned hotkey as a shortcut for providing values to fields. See the Validation Station page for more information about how to use the field shortcuts to assign values to a field.
Para asignar un color y una tecla de acceso rápido para un campo, selecciona el campo, elige un código de color en el campo Color y luego selecciona una tecla de acceso rápido específica en el menú de Tecla de acceso rápido.
Navega por el Gestor de taxonomía utilizando los atajos de teclado. Selecciona Mostrar atajos de teclado disponibles y activa la opción Activar/desactivar atajos de teclado para evitar la activación accidental de los atajos de teclado.Los nodos también pueden contraerse.
The changes you make in the Taxonomy Manager are automatically saved into the taxonomy.json file specific to your project.