- Información general
- Primeros pasos
- Actividades
- Paneles de insights
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Visión general de taxonomía
- Gestor de taxonomía
- Actividades relacionadas con taxonomía
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Limitaciones de tráfico
- Configuración de OCR
- Procesos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Datos y seguridad
- Licencia

Guía del usuario de Document Understanding
El Gestor de taxonomía se puede usar para crear y editar un archivo de Taxonomía específico para tu proyecto de automatización actual. Este archivo de Taxonomía contiene tipos de documentos definidos por el usuario, organizados en Grupos y Categorías.
Puedes seguir usando el archivo de Taxonomía convirtiéndolo en un tipo de datos .NET con la actividad Cargar taxonomía, y luego pasarlo como entrada para actividades como:
- Clasificar ámbito de documento
- Entrenar el alcance de los clasificadores
- Entrenar el alcance de los Extractores
- Mostrar Estación de Validación
Al Gestor de taxonomía solo se puede acceder después de instalar un paquete UiPath.IntelligentOCR.Activities superior o igual a v1.6.0 como dependencia para tu proyecto. Una vez instalado el paquete, aparecerá el botón Gestor de taxonomía en la cinta de opciones, en la sección de Asistentes.
La ventana del Gestor de taxonomía te permite crear tipos de documentos organizados por grupos y categorías. Cuando se abre por primera vez en un proyecto, no se define ningún grupo, categoría o tipo de documento.
El primer paso consiste en crear un grupo o un tipo de documento. La diferencia entre ambos es que un grupo implica una estructura jerárquica, mientras que un tipo de documento puede crearse como un archivo único. Un proyecto complejo implica la creación de grupos, categorías y tipos de documentos, mientras que un proyecto sencillo puede requerir solo uno o dos tipos de documentos.
Crear un grupo
Cuando se crea un grupo, también es necesaria una categoría para el tipo de documento que se desea crear en el grupo. Esto se consigue utilizando el botón Grupo. Una vez que hayas elegido un nombre para tu grupo, puedes guardarlo utilizando el botón Guardar o utilizando la tecla Intro.
Crear una categoría
Una vez que se define y selecciona un grupo, puedes crear una Categoría y/o un Tipo de documento dentro del grupo, utilizando sus botones correspondientes.Selecciona Guardar o utiliza la tecla Intro para guardar la configuración.
Crear un tipo de documento
Un tipo de documento puede crearse como parte de un grupo o como un único documento. Cuando se cree dentro de un grupo, asegúrate de que el grupo esté seleccionado y, a continuación, selecciona Tipo de documento.
Si el Tipo de documento se crea como un único archivo, asegúrate de que no se selecciona ningún grupo y selecciona Tipo de documento. Después de seleccionar Tipo de documento, introduce un nombre para el archivo y selecciona Guardar.
Seleccionar un tipo de documento ya creado te permite cambiar su nombre, copiar su ID único en el portapapeles o reasignarlo a otro grupo o categoría. También puedes introducir un código para el tipo de documento.
Group.Category.Document y se puede copiar en el portapapeles. El código de ID del tipo de documento es una funcionalidad opcional y se puede utilizar para encontrar sus documentos o asignar sus documentos a los tipos de documentos que defina en la taxonomía.
Configurar los ajustes de visualización para el tipo de documento
- Umbral de confianza de OCR: establece un umbral de confianza mínimo en el nivel de tipo de documento.
Cuando el documento se muestra en la estación de validación, tanto el nivel de confianza de OCR como el nivel de confianza de extracción para un campo tendrían que ser más altos que el umbral que configures en el Gestor de taxonomía.
El valor predeterminado para el umbral de confianza de OCR es del 90 %.
- Formato de visualización de fecha: el formato de fecha mostrado para el tipo de documento.
El valor predeterminado es
YYYY-MM-DD. - Separador decimal numérico: el separador decimal numérico que quieres utilizar para el tipo de documento.
- Separador de miles: el separador de miles que quieres utilizar para el tipo de documento.
Crear campos
Cuando se selecciona el Tipo de documento, el botón Campo está disponible para crear un nuevo campo. Una vez seleccionado el botón Campo , puedes introducir un nombre para él y seleccionar su tipo en la lista desplegable.
La categoría Campo tiene dos pestañas: Detalles y Reglas. La pestaña Detalles proporciona información sobre el campo seleccionado, como el nombre del campo, la tecla de acceso rápido asignada o el tipo de campo, mientras que la pestaña Reglas te permite crear reglas que deben cumplirse con el resultado de la extracción del campo.
Están disponibles los siguientes tipos de campo:
- Texto
- Número
- Fecha: elegir este tipo también te permite especificar un formato esperado, que es opcional.
Nota:
Si quieres añadir un formato esperado, utiliza un formato compatible con MSDN (MicroSoft Developer Network).
Este formato lo pueden utilizar los extractores y la actividad Ámbito de extracción de datos lo utiliza cuando intenta analizar una fecha en sus componentes: día, mes y año.
- Nombre
- Address
- Conjunto: elegir este tipo te permite añadir varios valores al campo de una lista preestablecida.
- Booleano
- Tabla: elegir este tipo te permite editar la estructura de la tabla, ya que puedes añadir columnas y editar su nombre y tipo.
Pestaña Detalles
Después de crear el nuevo campo, selecciónalo para ver más información. De forma predeterminada, al abrir un campo, se muestra la pestaña Detalles que te permite modificar el nombre, el color o la tecla de acceso rápido del campo. También puedes especificar si es multivalor (Es multivalor) o si permite que se procesen valores sin evidencia en el documento (Requiere referencia). La opción multivalor permite que un campo tenga varios valores, sin estar restringido a una lista específica.
- Es multivalor: si un campo se establece como multivalor, puedes tener más de un valor informado para ese campo en particular. Por ejemplo, deseas extraer una "Lista de directores" donde puedes tener un número variable de entradas. Imagina un campo multivalor como una tabla de una sola columna.
- Requiere referencia: cuando un campo requiere referencia, puedes añadirle un valor solo si seleccionas algo del documento que ves en Estación de Validación.Para los campos especiales en los que deseas capturar valores que quizás no sean visibles en el documento, puedes cambiar Requiere referencia a Desactivado.El efecto será que el usuario pueda añadir un valor sin especificar un lugar del documento de donde provienen esos valores.
También puedes seleccionar el Tipo de Campo de la lista desplegable o añadir un valor predeterminado.Utiliza el campo Valor Predeterminado para definir valores que se rellenarán en el resultado de la extracción, en caso de que no haya valor para el campo identificado en el documento.
Configuración de validación
En Configuración de validación, tienes la opción de establecer un Umbral de confianza de extracción. Este umbral se tiene en cuenta al validar el campo en la Estación de validación. Para establecer un umbral de confianza de extracción, ve a Umbral de confianza de extracción e introduce un valor entre 0 y 100.
- Solo lectura: si se habilita, el validador humano puede ver cualquier nota del validador establecida en el campo ResultadoDeExtracción en la Estación de validación, como un mensaje. Si está deshabilitado (estado predeterminado), el validador humano también puede editar esa nota en la Estación de validación y, por lo tanto, comunicar al robot información sobre la decisión tomada.
- Texto: si se selecciona Texto , la nota del validador se muestra como un mensaje de texto (o texto editable cuando la edición está habilitada) en la Estación de validación. El validador humano puede ver, editar o añadir un mensaje de hasta 200 caracteres en la Estación de validación.
- Opciones: si seleccionas Opciones, puedes configurar una serie de botones de radio que el validador humano puede ver y, si no es de solo lectura, seleccionar en la Estación de validación. Puedes añadir un máximo de 10 opciones.
GetFieldValidatorNotes(<fieldId>) y SetFieldValidatorNotes(<fieldId>, <validatorNote>).
Los campos creados pueden eliminarse mediante el botón Eliminar que aparece junto a ellos o reordenarse mediante la función de arrastrar y soltar.
Un campo también puede eliminarse desde la ventana Detalles seleccionando Eliminar.
Volviendo sobre estos pasos puedes crear múltiples grupos, categorías y tipos de documento, que podrás filtrar utilizando el campo Buscar.
Pestaña de reglas
Las reglas de campo te ayudan a optimizar los resultados de extracción y validarlos automáticamente al ejecutar su flujo de trabajo.Su rol es aumentar la eficiencia de extracción y ayudarte a validar fácilmente los campos que necesitan atención en la Estación de validación, resaltándolos.Puedes crear varias reglas que se apliquen a un campo.
Una regla se define estableciendo el tipo de evaluador y el nivel de severidad.
Tipo de evaluador
Utilice el Tipo de evaluador para especificar cómo deben evaluarse las reglas definidas. Hay dos tipos de evaluadores entre los que puede elegir: Y, O.
|
Tipo de evaluador |
Descripción |
Ejemplo |
|---|---|---|
|
AND |
Utilice este tipo de evaluador cuando sea necesario ejecutar todas las reglas. |
Regla : el número de factura comienza con A y termina con X.
|
|
O |
Solo es necesario ejecutar una de las reglas. |
Regla : el número de factura que comienza con A OR es 123.
|
Nivel de severidad
Indica la severidad de todas las reglas definidas para un campo. No puede establecer un nivel MUST si se ha incumplido la regla en la sesión de la Estación de validación. Hay dos niveles de severidad entre los que puede elegir: MUST, SHOULD.
La regla creada se activa una vez que se identifica el nivel de severidad establecido.
Cuando desee enviar una regla, una regla MUST requiere un 100% de éxito; de lo contrario, la operación de envío fallará. Una regla SHOULD le permite Enviarla incluso si la regla se ha incumplido.
Siempre puedes comprobar si se rompe una regla utilizando el método auxiliar de la clase de ExtractionResult, que reside en el paquete de actividades UiPath.DocumentProcessing.Contracts.
|
Descripción | |
|---|---|
|
MUST |
Utilice este nivel de severidad cuando la regla creada sea imprescindible para incluirla en el proceso de extracción del resultado. |
|
SHOULD |
Utiliza este nivel de severidad cuando la regla creada sea opcional. |
Una vez que haya seleccionado el tipo de evaluador y el nivel de severidad, debe establecer un tipo aplicable a su regla recién creada. Hay varias opciones. Aquí hay una lista completa con todos los disponibles:
- No esta vacío
- Valores posibles
- Comienza con
- Termina en
- Contiene
- Longitud fija
- Es un correo electrónico
- Expresiones regularesNota: el tipo de campo para el cual creaste una regla dicta el número de tipos de reglas posibles entre los que puedes seleccionar uno.Por ejemplo, un campo de tipo Texto muestra todos los tipos de reglas posibles, mientras que un campo de tipo Fecha muestra solo dos tipos de reglas, No está vacío y Valores posibles.
Tipo de reglas
| Descripción | Tipo de campo | Nivel de severidad | Tipo de evaluador | |
|---|---|---|---|---|
| No esta vacío | El valor extraído no puede estar vacío, por lo que el campo es obligatorio. Si falta el valor, requiere validación / entrada manual. | Aplicable a campos de los siguientes tipos:
|
MUST SHOULD | AND
O |
| Valores posibles | El usuario define todos los valores posibles y los datos extraídos son uno de los valores añadidos como entrada al crear la regla (por ejemplo, el tipo de empleado es "tiempo completo", "tiempo parcial" o "becario"). | Aplicable a campos de los siguientes tipos:
|
MUST SHOULD | AND
O |
| Expresión | Definir expresiones matemáticas que actúen como regla para extraer datos. | Aplicable a campos de tipo número.
Se requiere una condición al configurar la regla. Elija una de las siguientes opciones:
Se requiere una expresión matemática. Utiliza los operadores predefinidos para definir tu expresión. Consulta los siguientes ejemplos:
|
MUST SHOULD | AND
O |
| Comienza con | Esta es una regla fija, lo que significa que el valor extraído debe comenzar con uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
|
MUST SHOULD | AND
O |
| Termina en | Esta es una regla fija que significa que el valor extraído debe terminar con uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
|
MUST SHOULD | AND
O |
| Contiene | Esta es una regla fija, lo que significa que el valor extraído debe contener uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
|
MUST SHOULD | AND
O |
| Longitud fija | Esta es una regla fija, lo que significa que el valor extraído debe tener una longitud fija determinada. | Aplicable a campos de los siguientes tipos:
|
MUST SHOULD | AND
O |
| Es un correo electrónico | Esta es una regla fija que significa que el valor extraído debe escribirse en un formato de correo electrónico. | Aplicable a campos de los siguientes tipos:
|
MUST SHOULD | AND
O |
| Expresiones regulares | Esta es una regla fija que significa que el valor extraído debe contener una expresión regular similar a uno de los valores añadidos por el usuario. | Aplicable a campos de los siguientes tipos:
|
MUST SHOULD | AND
O |
Usando reglas
- Selecciona un campo en el panel de Taxonomía.
- Ve a la pestaña Reglas.
- Selecciona Añadir nuevo, para añadir una nueva regla.
- Escribe en la regla
full address, para la que el Tipo es Contiene, y la Expresión esst, str, street. - Elige el tipo de evaluador.
En este ejemplo, selecciona OR.
- Elige el nivel de criticidad.
En este ejemplo, selecciona MUST.
- Selecciona Añadir nuevo.
- Escribe en la regla
phone number, para la que el Tipo es No está vacío. - Selecciona Añadir nuevo.
- Escribe en la regla
city or state, para la que el Tipo es Contiene, y la Expresión escity, state.
La siguiente imagen animada muestra los pasos descritos anteriormente.
Otras opciones
Edición
Puedes editar el nombre de cualquier grupo, categoría o tipo de documento que hayas creado. Para ello, selecciona uno de los tres niveles de configuración y edita el campo Nombre.
Eliminación
También se pueden eliminar grupos, categorías y tipos de documentos. Hay dos opciones disponibles:
- Selecciona Eliminar
, en el elemento principal del objeto que deseas eliminar.
- Selecciona Eliminar
mientras seleccionas el objeto que deseas eliminar.
En ambos casos, se muestra una ventana emergente pidiéndote que confirmes la acción de eliminación. Selecciona Eliminar para aprobar la acción.
Personalización y accesibilidad
Automáticamente, se asignan una tecla de acceso rápido y un color al campo recién creado. Puedes utilizarlos para una mejor visibilidad y una navegación más rápida a través de tu taxonomía. Puedes personalizarlos haciendo clic en la tecla de acceso rápido o en el campo de código de color.
Un campo personalizado con color y tecla de acceso rápido puede indicar a la Estación de validación y al Gestor de plantillas que utilicen el color asignado al mostrar el campo y que utilicen la tecla de acceso rápido asignada como acceso directo para proporcionar valores a los campos. Consulta la página Estación de validación para obtener más información sobre cómo utilizar los atajos de campo para asignar valores a un campo.
Para asignar un color y una tecla de acceso rápido para un campo, selecciona el campo, elige un código de color en el campo Color y luego selecciona una tecla de acceso rápido específica en el menú de Tecla de acceso rápido.
Navega por el Gestor de taxonomía utilizando los atajos de teclado. Selecciona Mostrar atajos de teclado disponibles y activa la opción Activar/desactivar atajos de teclado para evitar la activación accidental de los atajos de teclado.Los nodos también pueden contraerse.
taxonomy.json específico de tu proyecto.