- Información general
- Primeros pasos
- Crear modelos
- Consumir modelos
- Detalles del modelo
- Puntos finales públicos
- 1040: tipo de documento
- 1040 Anexo C: tipo de documento
- 1040 Anexo D: tipo de documento
- 1040 Anexo E: tipo de documento
- 1040x: tipo de documento
- 3949a: tipo de documento
- 4506T: tipo de documento
- 709: tipo de documento
- 941x: tipo de documento
- 9465: tipo de documento
- ACORD125: tipo de documento
- ACORD126: tipo de documento
- ACORD131: tipo de documento
- ACORD140: tipo de documento
- ACORD25: tipo de documento
- Estados de cuenta bancarios: tipo de documento
- Facturas de carga: tipo de documento
- Certificado de incorporación: tipo de documento
- Certificado de origen: tipo de documento
- Comprobaciones: tipo de documento
- Certificado de producto secundario: tipo de documento
- CMS 1500: tipo de documento
- Declaración de conformidad de la UE: tipo de documento
- Estados financieros: tipo de documento
- FM1003: tipo de documento
- I9: tipo de documento
- Tarjetas de identificación: tipo de documento
- Facturas: tipo de documento
- Facturas2: tipo de documento
- Facturas Australia: tipo de documento
- Facturas China: tipo de documento
- Facturas Hebreo: tipo de documento
- Facturas India: tipo de documento
- Facturas Japón: tipo de documento
- Remisión de facturas: tipo de documento
- Listas de embalaje: tipo de documento
- Nóminas: tipo de documento
- Pasaportes: tipo de documento
- Órdenes de compra: tipo de documento
- Recibos: tipo de documento
- Recibos2: tipo de documento
- Recibos Japón: tipo de documento
- Notificaciones de remesas: tipo de documento
- UB04: tipo de documento
- Divulgación de cierre de hipotecas en EE. UU.: tipo de documento
- Facturas de servicios públicos: tipo de documento
- Títulos de vehículos: tipo de documento
- W2: tipo de documento
- W9: tipo de documento
- Idiomas admitidos
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Registro
- Lógica de licencias y tarificación
- Tutorial
- Solución de problemas

Document Understanding modern projects user guide
Crear
Esta sección proporciona las siguientes experiencias:
- Carga los documentos y los clasifica automáticamente.
- Carga los documentos directamente en tipos de documentos.
- Gestionar archivos del proyecto (añadir, eliminar archivos).
- Anota documentos.
- Añade o elimina campos.
- Ten una experiencia guiada en el entrenamiento de modelos de clasificación y extracción utilizando las recomendaciones.
Anotar documentos
After successfully creating your project and uploading your documents to a specific document type, they are automatically pre-annotated. This is done using specialized models, based on the document type's schema. The schema clearly defines the fields you want to extract from a particular document type. To find the document type's schema, go to the Annotation page and check the Fields section.

For more in-depth information on how to annotate your documents, check the Annotate documents how-to page.
Excepciones para revisión
Puedes utilizar documentos que se han validado en la estación de validación para mejorar aún más el rendimiento de tus modelos.
If there are any changes after the validation step, the Exceptions for review button is displayed for the impacted document type.
Figure 1. Exceptions for review button

For more in-depth information on how to retrain your models, check the Retrain extractors how-to page.
Editar configuración de campo
You can edit the settings for multiple fields from Document type manager.
To get to there, select the three-dot icon ⋮ next to the document type you want to edit and select Document type manager from the menu.
Figure 2. Select Document type manager

Editar o añadir nuevos campos
To add a new field, select Add field and fill in the needed information. You can add or edit the following options for each field:
-
Field name: the unique name for the field.
-
Content type: the content type of the field:
- String: used for company names or addresses, as well as payment terms, or for any other field where you want to build the parsing or formatting logic manually, in the RPA workflow.
- Number: used for amounts or quantities, with intelligent parsing of the decimal/thousands separators.
- Date: parse, format and unify the output using the YYYY-MM-DD format.
- Phone: use for phone number. Formatting removes letters and parentheses, and replaces spaces with dashes.
- ID Number: used for alphanumeric codes, numbers of IDs. It's similar to the string content type, but removes any characters coming before the
:character. If the Id number you need to extract can contain:characters, usestringcontent type instead to avoid data loss.
-
Shortcut: the shortcut key for the field. One key or a combination of two keys is allowed.
-
Advanced settings: the available options differ depending on the Content type of the selected field. Select the Advanced settings button for the desired field to edit: Figure 3. Document type advanced settings

- Field ID: the unique id for the field.
- Post processing:
- first_span: if the model predicts more than one instance of a field in a document, make it return the first one.
- longest_value: if the model predicts more than one instance of a field in a document, make it return the value consisting of the largest number of characters.
- highest_confidence: if the model predicts more than one instance of a field in a document, make it return the value with the highest confidence.Scoring: the measure used to determine the accuracy when running evaluations of model predictions is only available for fields with content type String:
- exact_match: prediction will only be deemed to be correct (score of 1) if it exactly matches the true value. If it differs by even a single character, then it is deemed to be incorrect (score of 0). This is the default setting for all fields except for String fields.
- levenshtein: prediction will be deemed to be partially correct according to the Levenshtein distance between the prediction and the true value. For example, if a 10 letter value is predicted correctly except for the last 2 characters, then the score of that prediction is be 0.8.
- Date format: this field is only available for fields with content type Date and it indicates how ambiguous dates are parsed and returned:
- Automático
- US style: YYYY-DD-MM
- Non-US style: YYYY-MM-DD
- Multi-line: fields which span multiple text lines (addresses or descriptions) need to have this checked, otherwise only the first line is returned.
- Multi-value: field returns a list with all the values detected in the document.
Los cambios en la configuración del tipo de documento no se reflejan en la nueva versión del proyecto si publicas una nueva versión del proyecto antes de volver a activar un entrenamiento.
Workaround: To avoid this, retrain the document type after making modifications to the document type fields. You can do this by tagging or confirming additional documents for that type before publishing a new version.
Configuración del modelo
You can change the document type settings from the Model settings view. To do so, select Model settings.
Figure 4. Model settings

Puedes cambiar la siguiente configuración:
- Base model: Dataset size estimations used in the Recommended Actions depend on the base model used to train. Using the most similar base model to your Document Type will reduce the amount of annotation work required.
- Number of languages: Dataset size estimation used in the Recommended Actions depend on the number of languages in the dataset. More languages generally require annotating more data.
Buscar nombres de campo
You can search through the available field names. To do so, use the search bar from the top left corner of the Document type manager interface. For a more efficient search, use the Filter feature to filter by Content type.
Figure 5. Search field names

Eliminar campos
Select the Delete next to the field you want to delete.
Figure 6. Delete a field

You can also select several (or all) fields and delete them at once. To do so, select the check mark next to the fields you want to delete and then click Delete.
Figure 7. Delete several fields at once

Buscar documentos
You can search uploaded documents by document name. To do so, use the search bar from the left corner of the Build section. For a more efficient search, use the Filter feature to filter by:
- Tipo de documento: elige el tipo de documento deseado de la lista desplegable.
- Fecha de carga: elige un intervalo de fechas en el que se cargó el documento.
- Estado: elige el estado del documento.
- Etiqueta: elige las etiquetas que deseas filtrar.
Figure 8. Filter documents

Puntuación del proyecto y del modelo
You can check your project's overall score from the top right corner. This score factors in the classifier and extractor scores for all document types. Select Project score to display the Measure section. You can check more in-depth performance measurements in that section.
Puedes comprobar la puntuación para cada tipo de documento de la sección Tipo de documento por separado. La puntuación influye en el rendimiento general del modelo, así como en el tamaño y la calidad del conjunto de datos.
You need to upload at least 10 documents to get a project score. For a document type score, you need at least 10 documents under the same document type.

Puedes comprobar la puntuación de tus modelos si seleccionas la etiqueta de puntuación. La calificación del modelo es una funcionalidad destinada a ayudarte a visualizar el rendimiento de un modelo de clasificación. Se expresa como una puntuación del modelo de 0 a 100 de la siguiente manera:
- Deficiente (0-49)
- Promedio (50-69)
- Bueno (70-89)
- Excelente (90-100)
Select Detailed model scores to go to the Measure section for detailed information.
