- Información general
- Primeros pasos
- Actividades
- Paneles de insights
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Visión general de taxonomía
- Gestor de taxonomía
- Actividades relacionadas con taxonomía
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Detalles del modelo
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Limitaciones de tráfico
- Configuración de OCR
- Procesos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Datos y seguridad
- Lógica de licencias y tarificación

Guía del usuario clásica de Document Understanding
Gestor de taxonomía
En caso de que utilices una GPU Intel Xe y el Gestor de taxonomía no se muestre correctamente, recomendamos actualizar el controlador gráfico a la última versión. Para obtener más información, visita esta página.
El Gestor de taxonomía se puede usar para crear y editar un archivo de Taxonomía específico para tu proyecto de automatización actual. Este archivo de Taxonomía contiene tipos de documentos definidos por el usuario, organizados en Grupos y Categorías.
Puedes seguir utilizando el archivo de taxonomía convirtiéndolo en un tipo de datos .NET con la actividad Cargar taxonomía y luego pasándolo como entrada para actividades como:
- Clasificar ámbito de documento
- Entrenar el alcance de los clasificadores
- Entrenar el alcance de los Extractores
- Mostrar Estación de Validación
Al Gestor de taxonomía solo se puede acceder después de instalar un paquete UiPath.IntelligentOCR.Activities superior o igual a v1.6.0 como dependencia para tu proyecto. Una vez instalado el paquete, aparecerá el botón Gestor de taxonomía en la cinta de opciones, en la sección de Asistentes.

Usar Gestor de taxonomía
La ventana del Gestor de taxonomía te permite crear tipos de documentos organizados por grupos y categorías. Cuando se abre por primera vez en un proyecto, no se define ningún grupo, categoría o tipo de documento.
Figura 1. El Gestor de taxonomía antes de asignar cualquier tipo de documento o campo

Establecer la estructura
El primer paso consiste en crear un grupo o un tipo de documento. La diferencia entre ambos es que un grupo implica una estructura jerárquica, mientras que un tipo de documento puede crearse como un archivo único. Un proyecto complejo implica la creación de grupos, categorías y tipos de documentos, mientras que un proyecto sencillo puede requerir solo uno o dos tipos de documentos.
Crear un grupo
Cuando se crea un grupo, también es necesaria una categoría para el tipo de documento que se desea crear en el grupo. Esto se consigue utilizando el botón Grupo. Una vez que hayas elegido un nombre para tu grupo, puedes guardarlo utilizando el botón Guardar o utilizando la tecla Intro.
Crear una categoría
Una vez que se define y selecciona un grupo, puedes crear una Categoría y/o un Tipo de documento dentro del grupo, utilizando sus botones correspondientes.Selecciona Guardar o utiliza la tecla Intro para guardar la configuración.
Crear un tipo de documento
Un tipo de documento puede crearse como parte de un grupo o como un único documento. Cuando se crea dentro de un grupo, asegúrate de que el grupo está seleccionado y luego selecciona Tipo de documento.
Si el Tipo de documento se crea como un único archivo, asegúrate de que no se selecciona ningún grupo y selecciona Tipo de documento. Después de seleccionar Tipo de documento, introduce un nombre para el archivo y selecciona Guardar.
Cuando se envía una acción de Document Understanding desde Orchestrator mientras se utiliza la versión 2020.10 de Studio, asegúrate de que la taxonomía no tenga tipos de documentos creados sin una categoría.
Seleccionar un tipo de documento ya creado te permite cambiar su nombre, copiar su ID único en el portapapeles o reasignarlo a otro grupo o categoría. También puedes introducir un código para el tipo de documento.
Once a document type is saved, a Document Type ID is generated for it. Opening the document for editing displays the ID next to the Document Type Name tab. The Document Type ID has a structure of the type Group.Category.Document and can be copied to the clipboard. The Document Type ID code is an optional functionality and it can be used to find your documents or map your documents to the Document Types that you define in the taxonomy.
Configurar los ajustes de visualización para el tipo de documento
Después de crear el tipo de documento, puedes configurar sus ajustes de visualización. Selecciona el tipo de documento en el Gestor de taxonomía y ve a Configuración de visualización. Puedes cambiar las siguientes configuraciones:
-
Umbral de confianza de OCR: establece un umbral de confianza mínimo en el nivel de tipo de documento. Cuando el documento se muestra en la estación de validación, tanto el nivel de confianza de OCR como el nivel de confianza de extracción para un campo, tendrían que ser más altos que el umbral configurado en el Gestor de taxonomía. El valor predeterminado para el umbral de confianza de OCR es del 90 %.
-
Formato de visualización de fecha: el formato de fecha mostrado para el tipo de documento.
El valor predeterminado es
YYYY-MM-DD. -
Separador decimal numérico: el separador decimal numérico que quieres utilizar para el tipo de documento.
-
Separador de miles: el separador de miles que quieres utilizar para el tipo de documento.
Crear campos
Cuando se selecciona el Tipo de documento, el botón Campo está disponible para crear un nuevo campo. Una vez seleccionado el botón Campo , puedes introducir un nombre para él y seleccionar su tipo en la lista desplegable.
La categoría Campo tiene dos pestañas: Detalles y Reglas. La pestaña Detalles proporciona información sobre el campo seleccionado, como el Nombre del campo, la tecla de acceso rápido asignada o el tipo de campo, mientras que la pestaña Reglas te permite crear reglas que deben cumplirse por el resultado de la extracción del campo.
Están disponibles los siguientes tipos de campo:
- Texto
- Número
- Cantidad monetaria
- Fecha : elegir este tipo también te permite especificar un formato esperado, que es opcional.
Nota:
Si quieres añadir un formato esperado, utiliza un formato compatible con MSDN (MicroSoft Developer Network). Este formato puede ser utilizado por los extractores y lo utiliza la actividad Ámbito de extracción de datos cuando intenta analizar una Fecha en sus partes constituyentes Día, Mes y Año.
- Nombre
- Address
- Conjunto : elegir este tipo te permite añadir varios valores al campo desde una lista preestablecida.
- Booleano
- Tabla : elegir este tipo te permite editar la estructura de la tabla, ya que puedes añadir columnas y editar su nombre y tipo.
- GrupoDeCampos : elegir este tipo te permite mostrar estructuras de campo jerárquicas en la Estación de validación, lo que permite la organización lógica de los datos extraídos. Los grupos de campos conservan la estructura jerárquica de los datos extraídos, lo que hace que los paquetes de documentos grandes de varias páginas sean más fáciles y rápidos de validar.
Pestaña Detalles
Después de crear el nuevo campo, selecciónalo para ver más información. De forma predeterminada, al abrir un campo, se muestra la pestaña Detalles que te permite modificar el nombre, el color o la tecla de acceso rápido del campo. También puedes especificar si es multivalor (Es multivalor) o si permite que se procesen valores sin evidencia en el documento (Requiere referencia). La opción multivalor permite que un campo tenga varios valores, sin estar restringido a una lista específica.
Para obtener más información sobre cómo utilizar los dos campos, consulta las siguientes descripciones:
- Es multivalor: si un campo se establece como multivalor, puedes tener más de un valor informado para ese campo en particular. Por ejemplo, quieres extraer una "Lista de directores" donde puedes tener un número variable de entradas. Imagina un campo multivalor como una tabla de una sola columna.
- Requiere referencia: cuando un campo requiere referencia, puedes añadirle un valor solo si seleccionas algo del documento que ves en la Estación de validación. Para los campos especiales en los que deseas capturar valores que quizás no sean visibles en el documento, puedes cambiar Requiere referencia a Desactivado. El efecto será que el usuario puede añadir un valor sin especificar un lugar en el documento de donde provienen esos valores.
También puedes seleccionar el Tipo de Campo de la lista desplegable o añadir un valor predeterminado.Utiliza el campo Valor Predeterminado para definir valores que se rellenarán en el resultado de la extracción, en caso de que no haya valor para el campo identificado en el documento.
Configuración de validación
En Configuración de validación, tienes la opción de establecer un Umbral de confianza de extracción. Este umbral se tiene en cuenta al validar el campo en la Estación de validación. Para establecer un umbral de confianza de extracción, ve a Umbral de confianza de extracción e introduce un valor comprendido entre 0 y 100.
Figura 2. Descripción general de la pestaña Detalles de un campo

Puedes elegir habilitar las notas del validador desde la pestaña Detalles . Al configurar las notas del validador, el validador humano puede añadir notas sobre la decisión que ha tomado durante la validación. Puedes configurar los siguientes ajustes:
- Solo lectura: si está habilitado, el validador humano puede ver cualquier nota del validador establecida en el campo ResultadoDeExtracción en la Estación de validación, como un mensaje. Si está deshabilitado (estado predeterminado), el validador humano también puede editar esa nota en la Estación de validación y, por lo tanto, comunicar al robot información sobre la decisión tomada.
- Texto: si se selecciona Texto , la nota del validador se muestra como un mensaje de texto (o texto editable cuando la edición está habilitada) en la Estación de validación. El validador humano puede ver, editar o añadir un mensaje de un máximo de 200 caracteres en la estación de validación.
- Opciones: si seleccionas Opciones, puedes configurar una serie de botones de radio que el validador humano puede ver y, si no son de solo lectura, seleccionar en la Estación de validación. Puedes añadir un máximo de 10 opciones.
Consejo:
Consulta la página Clase ExtractionResult de la sección UiPath.DocumentProcessing.Contracts para obtener más información sobre los dos métodos relacionados con las notas del validador,
GetFieldValidatorNotes(<fieldId>)ySetFieldValidatorNotes(<fieldId>, <validatorNote>).
Los campos creados pueden eliminarse mediante el botón Eliminar que aparece junto a ellos o reordenarse mediante la función de arrastrar y soltar.
Un campo también puede eliminarse desde la ventana Detalles seleccionando Eliminar.
Retracing these steps, you can create multiple groups, categories, and document types, which you can then filter by using the Search field.
Pestaña de reglas
Las reglas de campo te ayudan a optimizar los resultados de extracción y validarlos automáticamente al ejecutar su flujo de trabajo.Su rol es aumentar la eficiencia de extracción y ayudarte a validar fácilmente los campos que necesitan atención en la Estación de validación, resaltándolos.Puedes crear varias reglas que se apliquen a un campo.
You define a rule by setting the Evaluator type and the Criticality level.
Tipo de evaluador
Use the Evaluator Type to specify how the defined rules should be evaluated. There are two evaluator types that you can choose from: AND, OR.
| Tipo de evaluador | Descripción | Ejemplo |
|---|---|---|
| AND | Utilice este tipo de evaluador cuando sea necesario ejecutar todas las reglas. | Rule : Invoice Number starts with A And ends with X.
|
| O | Solo es necesario ejecutar una de las reglas. | Regla : el número de factura comienza con A O es 123.
|
Nivel de severidad
Indicates the criticality of all rules defined for a field. You cannot set a MUST level if the rule is broken in the Validation Station session. There are two criticality levels that you can choose from: MUST, SHOULD.
La regla creada se activa una vez que se identifica el nivel de severidad establecido.
When you want to submit a rule, a MUST rule requires 100% success, otherwise the Submit operation fails. A SHOULD rule allows you to Submit it even if the rule is broken.
Siempre puedes comprobar si una regla se ha incumplido utilizando el método auxiliar de la clase ExtractionResult Class , que reside en el paquete de actividades UiPath.DocumentProcessing.Contracts.
Tabla 2. Tabla que muestra los niveles de criticidad y sus descripciones
| Descripción | |
|---|---|
| MUST | Utilice este nivel de severidad cuando la regla creada sea imprescindible para incluirla en el proceso de extracción del resultado. |
| SHOULD | Utiliza este nivel de severidad cuando la regla creada sea opcional. |
Once you have selected the Evaluator Type and the Criticality Level, you must set a type applicable for your newly created rule. There are several options you can choose from. Here's a complete list with all the available ones:
- No esta vacío
- Valores posibles
- Comienza con
- Termina en
- Contiene
- Longitud fija
- Es un correo electrónico
- Expresiones regulares
Nota:
El tipo de campo para el que creaste una regla dicta el número de tipos de reglas posibles entre los que puedes seleccionar uno. Por ejemplo, un campo de tipo Texto muestra todos los tipos de reglas posibles, mientras que un campo de tipo Fecha muestra solo dos tipos de reglas, No está vacío y Valores posibles .
Tipo de reglas
La siguiente tabla muestra detalles para cada tipo de regla disponible, clasificadas dependiendo del nivel de criticidad y el tipo de evaluador.
| Descripción | Tipo de campo | Nivel de severidad | Tipo de evaluador | |
|---|---|---|---|---|
| No esta vacío | El valor extraído no puede estar vacío, por lo que el campo es obligatorio. Si falta el valor, requiere validación / entrada manual. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Valores posibles | El usuario define todos los valores posibles y los datos extraídos son uno de los valores añadidos como entrada al crear la regla (por ejemplo, el tipo de empleado es "tiempo completo", "tiempo parcial" o "becario"). | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Expresión | Definir expresiones matemáticas que actúen como regla para extraer datos. | Aplicable a campos de tipo número. Se requiere una condición al configurar la regla. Elige una de las siguientes opciones:
| MUST SHOULD | AND O |
| Comienza con | Esta es una regla fija, lo que significa que el valor extraído debe comenzar con uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Termina en | Esta es una regla fija que significa que el valor extraído debe terminar con uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Contiene | Esta es una regla fija, lo que significa que el valor extraído debe contener uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Longitud fija | Esta es una regla fija, lo que significa que el valor extraído debe tener una longitud fija determinada. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Es un correo electrónico | Esta es una regla fija que significa que el valor extraído debe escribirse en un formato de correo electrónico. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
| Expresiones regulares | Esta es una regla fija que significa que el valor extraído debe contener una expresión regular similar a uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
| MUST SHOULD | AND O |
Usando reglas
Tomemos un ejemplo práctico para comprender mejor la aplicabilidad de estas reglas. Crearemos un conjunto de reglas para el campo Dirección del documento. Consulta los siguientes pasos de ejemplo para aprender a crear una nueva regla o un conjunto de reglas para un campo:
- Selecciona un campo en el panel de Taxonomía.
- Ve a la pestaña Reglas.
- Selecciona Añadir nuevo, para añadir una nueva regla.
- Escribe la regla
full address, para la que el Tipo es Contiene y la Expresión esst, str, street. - Elige el tipo de evaluador. En este ejemplo, selecciona OR.
- Elige el nivel de criticidad. En este ejemplo, selecciona MUST.
- Selecciona Añadir nuevo.
- Escribe en la regla
phone number, para la que el Tipo es No está vacío. - Selecciona Añadir nuevo.
- Escribe la regla
city or state, para la que el Tipo es Contiene y la Expresión escity, state.
La siguiente imagen animada muestra los pasos descritos anteriormente.
Figura 3. Imagen animada que muestra cómo añadir tres reglas para un campo

Otras opciones
Edición
You can Edit the name of any group, category, or document type that you have created. This can be done by selecting one of the three levels of configuration and editing the Name field.
Eliminación
También se pueden eliminar grupos, categorías y tipos de documentos. Hay dos opciones disponibles:
- Seleccionar Eliminar
, en el elemento principal del objeto que quieres eliminar. - Seleccionar Eliminar
mientras selecciona el objeto que desea eliminar.
En ambos casos, se muestra una ventana emergente pidiéndote que confirmes la acción de eliminación. Selecciona Eliminar para aprobar la acción.
Personalización y accesibilidad
Automáticamente, se asignan una tecla de acceso rápido y un color al campo recién creado. Puedes utilizarlos para una mejor visibilidad y una navegación más rápida a través de tu taxonomía. Puedes personalizarlos haciendo clic en la tecla de acceso rápido o en el campo de código de color.
Un campo personalizado con color y tecla de acceso rápido puede indicar a la Estación de validación y al Gestor de plantillas que utilicen el color asignado al mostrar el campo y que utilicen la tecla de acceso rápido asignada como acceso directo para proporcionar valores a los campos. Consulta la página Estación de validación para obtener más información sobre cómo utilizar los atajos de campo para asignar valores a un campo.
Para asignar un color y una tecla de acceso rápido para un campo, selecciona el campo, elige un código de color en el campo Color y luego selecciona una tecla de acceso rápido específica en el menú de Tecla de acceso rápido.
Navega por el Gestor de taxonomía utilizando los atajos de teclado. Selecciona Mostrar atajos de teclado disponibles y activa la opción Activar/desactivar atajos de teclado para evitar la activación accidental de los atajos de teclado.Los nodos también pueden contraerse.
The changes you make in the Taxonomy Manager are automatically saved into the taxonomy.json file specific to your project.