- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- FieldValueDetails Class
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Clase BasicDataPoint: vista previa
- Clase ExtractionResultHandler: vista previa
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Configurar la conexión externa
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Crear artefactos de validación de documentos
- Recuperar artefactos de validación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Entrenador del extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Redactar documento
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Extractor con aprendizaje automático
- Entrenador de extractor con aprendizaje automático
- Clasificador de aprendizaje automático
- Entrenador del clasificador de aprendizaje automático
- Clasificador generativo
- Extractor generativo
- Configurar autenticación
- Validar documentos con acciones de la aplicación
- Validación manual para digitalizar documentos
- Extracción de datos basada en anclajes utilizando el extractor inteligente de formularios
- Estación de validación
- Actividades generativas: buenas prácticas
- Extractor generativo: buenas prácticas
- Clasificador generativo: buenas prácticas
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado

Actividades de Document Understanding
Extractor inteligente de formularios
UiPath.IntelligentOCR.Activities.DataExtraction.IntelligentFormExtractor
Descripción
The Intelligent Form Extractor activity is deprecated and out of support. It has been removed from its respective package, which means you can only use it in workflows where it was previously added before this deprecation.
While workflows that contain the Intelligent Form Extractor activity continue to function normally, you can't add the activity to any new workflows. We recommend using the Form Extractor activity instead.
Analyses, extracts, matches, and reports the required information from a document by taking into consideration the words' position, including handwritten and signed fields. This activity can be used only together with the Data Extraction Scope activity.
Utiliza los siguientes recursos para definir y configurar tu extractor inteligente de formularios:
- Template Manager wizard;
- Taxonomy Manager;
- Anchors setup and configuration.
Compatibilidad de proyectos
Windows-Legacy | Windows
Propiedades
Panel de propiedades
Común
- Nombre para mostrar: el nombre para mostrar de la actividad.
Entrada
- ApiKey - Specifies the API key of the account.
- Endpoint - The URL to UiPath® server. By default, the endpoint is
https://du.uipath.com/svc/intelligentforms. For more information, visit Document Understanding Public Endpoints. - MinOverlapPercentage - Specifies the minimum overlap area (in percentage) between a box in the document and a box in the template required to make an extraction. The percentage value can be set between
0and100. The default value is65. - Timeout - Specifies the amount of time (in milliseconds) to wait for a response from the server before an error is thrown. The default value is 100000 milliseconds (100 seconds).
Otros
-
Privado : si se selecciona, los valores de variables y argumentos ya no se registran en el nivel Detallado.
Importante:By using the cloud-based version of this document data extraction software with any UiPath® Community API Key, the documents processed with the software are stored and used by UiPath® along with any personal data they may contain for service monitoring. Documents processed using any UiPath® server endpoint with Enterprise API Keys are not stored by UiPath®. No documents are processed by UiPath® if the software is set up and used on your premises.
Nota:Después de crear una plantilla, la actividad puede mostrar una advertencia que le informa de que es posible que se haya superado el número permitido de áreas escritas a mano en una página.
El flujo de trabajo aún se puede ejecutar y se produce un error solo si se ha superado el número de áreas escritas a mano (más de 60 / página).
Asistente del Administrador de plantillas
Te permite crear, editar, gestionar y exportar/importar plantillas para los tipos de documento definidos en la taxonomía.
Crear una plantilla
-
Add an Intelligent Form Extractor activity to your workflow, within a Data Extraction Scope.
-
Configure the extractor by selecting Manage Templates. The Template Manager window opens.
Figure 1. Overview of the Template Manager wizard

-
Select Create Template for creating a new template. Figure 2. Overview of the Create Template wizard
Nota:If the UiPath.IntelligentOCR.Activities package has been updated to v5.1.0, then the ForceApplyOCR parameter has been replaced with the ApplyOcrOnPDF. Here is the compatibility between the old and new parameters:
- ForceApplyOCR = True is replaced by ApplyOcrOnPDF = Yes;
- ForceApplyOCR = False is replaced by ApplyOcrOnPDF = Auto;
- ForceApplyOCR = Empty is replaced by ApplyOcrOnPDF = Auto;
- ForceApplyOCR =
<user-defined variable>is replaced by ApplyOcrOnPDF = Auto.
-
Select the document type for your template from the Document Type dropdown list.
Nota:All Document Types are based on the Taxonomy. Make sure to add or create a taxonomy inside the project's folder.
-
Add the name of the template in the Template name field. Choose a relevant name that reflects the version or the layout of your document.
-
Add the document's path in the Template document field.
-
Navigate to the file's path by using the Browse button.
-
Select an OCR from the OCR Engine dropdown list, and configure it according to its needs.
-
Select Configure to trigger the template editing. The Apply OCR on PDF option establishes if the OCR process should be applied or not to PDF documents. Three options are available in the dropdown list: True, False, and Auto. If set to True, the OCR is applied to all PDF pages of the document. If set to False, only digitally typed text is extracted. The default value is Auto, determining if the document requires to apply the OCR algorithm depending on the input document. Each OCR engine comes with its own set of custom options. Visit OCR engines for more details about all options available for each OCR engine. If you have already created a template, then it can be edited, exported, or removed. The Delete and Export options become available only when at least one template is selected. The Edit and Remove options for an individual template are always available.
Figure 3. Example of a configured template in the Template Manager wizard

If a field is checked in both Signature and Handwritten boxes in the Template Manager of the Intelligent Form Extractor activity, then a pop-up message appears informing you that a field can be added only in one box, not both.
Configurar el procesamiento de campos booleanos
For documents that include check boxes, you can add known synonyms for the Yes and No options, or you can start from a list compiled by us (see the Add recommended suggestions). These values are used for Boolean content interpretation, which is mapping a captured value to a Yes or No reported value.
Next to Synonym for Yes, and Synonym for No, select Add recommended to generate the suggestions.
Figure 4. Animated image showing the selection of Add recommended and generating suggestions

The Case sensitive check box needs to be checked if the synonyms you have added are case sensitive.
Exportar e importar plantillas
You can import templates created and exported from other workflows. Use these features to share templates between projects. Once a document type is configured using the Intelligent Form Extractor, you don't need to reconfigure the templates in a new implementation.
Procedimiento de exportación
Estos son los pasos que debes seguir para exportar una plantilla:
-
Crea una o varias plantillas siguiendo los pasos explicados al principio de esta página.
-
Selecciona las plantillas que quieres exportar.
-
Select an Export option:
-
Export with original filesExporting with original files attaches them to the export.
-
Exportar sin archivos originales
Figure 5. The available Export options available in the Template Manager wizard

-
-
Guarda el archivo de la plantilla con el nombre deseado.
-
A message is displayed once the template is saved. Select OK.
Figure 6. The "X template(s) successfully exported" message
Nota:If you cannot share the content of the documents you have built your templates on, then use the Export without original files option. You are still able to share and import the template archive in other projects, but you cannot edit or view them anymore.
If you want to edit the templates once imported in a different project, make sure to use the Export with original files option when exporting and then importing them.
Procedimiento de importación
Estos son los pasos que debes seguir para importar una plantilla:
-
Seleccionar Importar.
Figure 7. The action of selecting Import

-
Select an archive. The import wizard appears and presents all document types and all templates available in the selected export archive. Select the templates you wish to import and choose the right Import option:
-
Importar con archivos originales
-
Import without original filesFigure 8. The available Import options in the Template Manager wizard
Nota:- Cuando se importan plantillas, los tipos de documento se crean automáticamente en la taxonomía del proyecto. Si un ya existe un tipo de documento con el mismo nombre, se creará otro añadiendo un número al nombre del tipo de documento.
- Si estás importando plantillas que han sido exportadas sin los archivos originales, o si eliges importar plantillas sin los archivos originales, entonces no dispondrás de opciones de visualización o edición para esas plantillas.
-
Situaciones especiales al importar una plantilla
Cuando se importa una plantilla, pueden ocurrir varias situaciones especiales. La siguiente lista explica cada tipo de importación y sus particularidades:
-
New document type: If a new document type is imported, then a new field is added in the wizard configuration, informing you that a new template is to be created.
-
Duplicate document type: If an identical document type is imported, then the following warning message appears: "This template already exists and it will be overwritten."
-
Extended template: If a document type template that includes extra fields than the already existing one, is imported, then the following warning message appears: "This document type will be updated as follows: The following field(s) do not exist and will be created."
-
Extended document type: If the user imports a document type that includes extra fields than the already existing one, then the following warning message appears: "This document type will be updated as follows: The following field(s) don't have configurations to import".
-
Document type with identical name but different content: If the user imports a document type that has the same name as the existing one but different fields, then the following warning message appears: "This document type will be updated as follows":
- "Los siguientes campos no existen y se crearán"
- "Los siguientes campos no tienen configuraciones para importar"
-
Document type with missing table: If the user imports a document type that doesn't include a table, then the following warning message appears: "This document type will be updated as follows: The following field(s) don't have configurations to import."
-
Document type with extended table: If the user imports a document type that includes a table with extra columns, then the following warning message appears: "This document will be updated as follows: The following field(s) do not exist and will be created."
-
Document type with reduced table: If the user imports a document type that includes a table with missing columns, then the following warning message appears: "This document will be updated as follows: The following field(s) don't have configurations to import".
-
Table template with different document types: If the user imports a document type template that includes a table with different document types, then a new template is created. If your taxonomy includes a table that has a field with a different document type, then the following message appears:
El campo con ID
xyzse ha encontrado tanto en la taxonomía importada como en la taxonomía existente, pero sus tipos son incompatibles (ambos deberían ser tablas o bien ninguno de ellos).
Asistente del Editor de Plantillas
Consideraciones generales
The Template Editor is built on top of the functionality present in the Validation station. To access it, select Edit
for a template.
Visit Validation Station to learn about the basic usage of the Validation Station.
Besides the options available in the right part of the Validation Station screen, there are the following options in the Template Editor:
: establece el modo de selección de anclaje.
: borra toda la selección de anclaje
When creating a new template, an explanation text appears when first opening the Template Editor. In case you want to access the text again, go in the document view section on the right side, select More Options, and then Show explanation text.
Figure 9. The action of showing the explanation text

Configurar anclajes
Anchors can be defined once the Template Editor is opened from the Template Manager and can be found among the Selection Mode options.
When defining or editing a page-level template, although it is optional, the first thing that needs to be performed is the Page 1 Matching Info selection. This step is mandatory only for fixed form templates.
Situated on the left side of the screen, the Page 1 Matching Info selection requires a text input (tokens only are accepted) from the first page of the template that is always in the same position within that particular template layout and forms a unique graph of words (considering relative distances and angles between words) across all the templates defined for a particular document type.
In other words, the Page 1 Matching Info (and all other Page Matching Info fields) are "fingerprints" of a particular page and are extensively used in identifying the right matching template at runtime.
For this reason, for the Page 1 Matching Info field, it is strongly recommended to select 10 to 20 words, preferably longer, spread across the entire page area.
The other Page Matching Info fields (one for each template page) must be filled in only if you are attempting data extraction from that particular page, and do not require cross-template uniqueness anymore. If no fields need to be extracted from a particular page, defining the page-level matching info for that page is not mandatory.
Configurar campos simples
For all fields other than Tables, configuring the template consists of selecting a Custom Area and assigning it to a particular field.
For fixed form configurations, data fields can only be configured using Custom Area selections.
For a field you can define one or more such Custom Areas, using the Add option. If two or more Custom Areas are defined for a single field, then at runtime, if the field is defined in the Taxonomy as Single Value, all values are concatenated into a single reported value. If the field is defined as Multi Value, then each value is reported individually.
The icon beside each field indicates the type of supported selection: Tokens or Custom area.
Figure 10. Animated image showing the types of supported selections for sample fields

If an empty area is selected, the selection is automatically set as Custom area. If text is detected inside the selected area, you are asked to choose the type of the selection between Tokens or Custom area.
Use the Validation Station selection mode feature to lock your selection between Tokens and Custom Areas.
Configurar tablas
As mentioned above, there are fields where information can be added only by using Tokens (like the Page Matching Info fields) or only by using a Custom Area (like simple fields). For Table fields, you can do the following:
- Define each cell one by one, once the Table Editor is expanded, by adding Custom Area selection to each cell individually.
- Utiliza la funcionalidad de marcado de tabla, marcando el área de la tabla, dibujando separadores de filas y columnas y luego asignando la tabla así marcada al campo. Asegúrate de que el área extraída tiene el mismo número de columnas y filas que el área de la plantilla.
Para utilizar la funcionalidad de marcado de tabla:
- Select More Options for the table field
- Select Extract new table.
- Selecciona la tabla que deseas extraer.
- For every field above each table column, select the column name that you want it to represent. You can also choose to Extract header.
- Lastly, select Save new table.
Figure 11. Animated image of an example using the table markup functionality

Configuración de anclajes
Un método distintivo para definir los límites de un área personalizada de la que se extraerán datos es utilizar anclajes de campo. Estos permiten orientar la extracción de datos en función de las configuraciones a nivel de campo, lo que permite una mayor flexibilidad a la hora de definir las reglas de extracción de formularios.
Consequently, at run-time, the Intelligent Form Extractor knows how to perform the following:
- identificar si coincide una plantilla de nivel de página, y extraer información acorde con la mejor correspondencia de plantilla de nivel de página que reconozca;
- identificar si coincide alguna configuración basada en anclajes, y extraer información según su aplicación en el documento que se va a procesar;
- calcular las puntuaciones de confianza adecuadas para todas las coincidencias posibles, a fin de poder notificar el mejor resultado (coincidencia de mayor probabilidad) de todas las opciones disponibles.
Crear una nueva configuración de anclaje
-
Make sure you are in the Anchor Selection mode.
-
Dibuja un cuadro alrededor del área de valor.
-
Selecciona una etiqueta (anclaje principal) para tu área de valor utilizando uno de los siguientes métodos:
- Selecciona la primera palabra y luego utiliza
Ctrl + Selectpara la última palabra de la selección. - Selecciona, arrastra y luego suelta para capturar un rango de palabras.
Nota:
A Label can only contain consecutive words from the same visual line.
- Selecciona la primera palabra y luego utiliza
-
Selecciona los anclajes adicionales que identificarían de forma exclusiva tu etiqueta. Se aplica el mismo principio de selección.
-
Assign your anchor construct to the appropriate field by selecting Extract Value for that particular field.
Figure 12. Example of creating multiple anchors for a field
Nota:You can also use the previous examples from this page to learn how to create a template and define extraction areas and anchors.
Editar una configuración de anclaje existente
-
Selecciona la configuración de anclaje.
-
Realiza cambios en ella (borra cualquier anclaje, la etiqueta, incluso el área de valor si lo deseas, añade nuevos elementos, etc.).
-
Select More Options for a field anchor, and then use the Change Extracted Value option to update your field association. Figure 13. Example of changing the extracted value for a field
Nota:- Si eliminas el área de destino, se borrarán todos los anclajes y tendrás que empezar de nuevo.
- Si eliminas la Etiqueta (anclaje principal), el primer anclaje creado se convierte en la nueva Etiqueta.
Eliminar una configuración de anclaje existente
Para eliminar una configuración de anclaje, puedes:
-
Select More Options for a field anchor and use the Mark as Missing option for a saved value.
Figure 14. Example of using the Mark as Missing option to delete an anchor setting

-
Select More Options for a field anchor and use the Remove Value option, case of a list of anchors defined for a given field.
Figure 15. Example of using the Remove Value option to delete an anchor setting

Mezclar y combinar configuraciones
Puedes definir tantas plantillas como quieras para el mismo tipo de documento. Puedes tener múltiples plantillas a nivel de página, múltiples anclajes para el mismo campo, incluso plantillas que contengan tanto anclajes a nivel de página como a nivel de campo.
- A la hora de definir anclajes a nivel de campo, asegúrate de que tu etiqueta está próxima a tu área de valor y de que cuenta con anclajes adicionales si la misma construcción de texto puede encontrarse en varios lugares dentro del mismo documento.
- The bigger the length of your labels and anchors is, the more precision you get. The value area is always computed based on its relative position against your Label (main anchor). Choose your main anchors accordingly. Having field-level anchors allows fields to move within the template and still be captured, offering more flexibility in document layout changes.
Integración de Document Understanding
The Intelligent Form Extractor activity is part of the Document Understanding solutions. Visit the Document Understanding Guide for more information.