- Información general
- Primeros pasos
- Building Models
- Consuming Models
- Paquetes ML
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 4506T: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación - Paquete ML
- Certificado de origen - Paquete ML
- Cheques: paquete ML
- Certificado de producto secundario - Paquete ML
- CMS 1500: paquete ML
- Declaración de conformidad UE - Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas - Paquete ML
- Listas de embalaje: paquete ML
- Recibos de pago: paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Puntos finales públicos
- Idiomas admitidos
- Datos y seguridad
- Licencia
Crear
- Carga los documentos y los clasifica automáticamente.
- Carga los documentos directamente en tipos de documentos.
- Gestiona archivos desde el proyecto (añadir, eliminar archivos y añadir, cambiar etiquetas).
- Anota documentos.
- Añade o elimina campos.
- Añade o elimina reglas empresariales.
- Ten una experiencia guiada en el entrenamiento de modelos de clasificación y extracción utilizando las recomendaciones.
Después de crear correctamente tu proyecto y cargar tus documentos, puedes anotarlos desde la sección Crear.
Puedes empezar a anotar documentos desde una sección de tipo de documento haciendo clic en Anotar.
Los documentos cargados que forman parte de un tipo de documento conocido se preetiquetan automáticamente. Puedes validar esto desde la vista Anotar.
- El preetiquetado es correcto y debe validarse.
- Falta el preetiquetado y debe marcarse como tal.
- El preetiquetado no es correcto y debe editarse.
Si todos los campos de un documento están etiquetados correctamente, haz clic en Confirmar para validar todos los campos al mismo tiempo.
Una vez validado un documento, se marcará con un escudo verde en la lista de documentos.
Preetiquetado correcto
Falta el preetiquetado
Preetiquetado incorrecto
Si el preetiquetado no es correcto, puedes corregir el campo de forma manual.Puedes etiquetar de forma manual el campo creando un nuevo campo. Para ello, puedes seleccionar la información necesaria arrastrando y soltando un cuadro de selección directamente en el documento y seleccionando el Nombre de campo deseado de la lista desplegable.
Puedes cambiar la configuración del tipo de documento desde la vista Anotar.
Para ello, haz clic en el icono de tres puntos ⁝ a la derecha del nombre del tipo de documento y selecciona Configuración.
- Modelo base: las estimaciones del tamaño del conjunto de datos utilizadas en las acciones recomendadas dependen del modelo base utilizado para el entrenamiento. Usar el modelo base más similar a su tipo de documento reducirá la cantidad de trabajo de anotación requerido.
- Número de diseños: las estimaciones del tamaño del conjunto de datos utilizadas en las acciones recomendadas dependen del número de diseños del conjunto de datos. Más diseños generalmente requieren anotar más datos.
- Número de idiomas: la estimación del tamaño del conjunto de datos utilizada en las acciones recomendadas depende de la cantidad de idiomas en el conjunto de datos. Más idiomas generalmente requieren anotar más datos.
You can edit the settings for multiple fields from Document type manager.
To get to there, select the three-dot icon ⋮ next to the document type you want to edit and select Document type manager from the menu.
- Field name: the unique name for the field.
- Content type: the content type of the field:
- String: used for company names or addresses, as well as payment terms, or for any other field where you want to build the parsing or formatting logic manually, in the RPA workflow.
- Number: used for amounts or quantities, with intelligent parsing of the decimal/thousands separators.
- Date: parse, format and unify the output using the YYYY-MM-DD format.
- Phone: use for phone number. Formatting removes letters and parentheses, and replaces spaces with dashes.
- ID Number: used for alphanumeric codes, numbers of IDs. It's similar to the string content type, but removes any characters coming before the
:
character. If the Id number you need to extract can contain:
characters, usestring
content type instead to avoid data loss.
- Shortcut: the shortcut key for the field. One key or a combination of two keys is allowed.
- Advanced settings: the available options differ depending on the Content type of the selected field. Select the Advanced settings button for the desired field to edit:
Figure 2. Document type advanced settings
- Field ID: the unique id for the field.
- Post processing:
- first_span: if the model predicts more than one instance of a field in a document, make it return the first one.
- longest_value: if the model predicts more than one instance of a field in a document, make it return the value consisting of the largest number of characters.
- highest_confidence: if the model predicts more than one instance of a field in a document, make it return the value with the highest confidence.
- exact_match: prediction will only be deemed to be correct (score of 1) if it exactly matches the true value. If it differs by even a single character, then it is deemed to be incorrect (score of 0). This is the default setting for all fields except for String fields.
- levenshtein: prediction will be deemed to be partially correct according to the Levenshtein distance between the prediction and the true value. For example, if a 10 letter value is predicted correctly except for the last 2 characters, then the score of that prediction is be 0.8.
- Date format: this field is only available for fields with content type Date and it indicates how ambiguous dates are parsed and returned:
- Automático
- US style: YYYY-DD-MM
- Non-US style: YYYY-MM-DD
- Multi-line: fields which span multiple text lines (addresses or descriptions) need to have this checked, otherwise only the first line is returned.
- Multi-value: field returns a list with all the values detected in the document.
You can change the document type settings from the Model settings view. To do so, select Model settings.
Puedes cambiar la siguiente configuración:
- Modelo base: las estimaciones del tamaño del conjunto de datos utilizadas en las acciones recomendadas dependen del modelo base utilizado para el entrenamiento. Usar el modelo base más similar a su tipo de documento reducirá la cantidad de trabajo de anotación requerido.
- Número de diseños: las estimaciones del tamaño del conjunto de datos utilizadas en las acciones recomendadas dependen del número de diseños del conjunto de datos. Más diseños generalmente requieren anotar más datos.
- Número de idiomas: la estimación del tamaño del conjunto de datos utilizada en las acciones recomendadas depende de la cantidad de idiomas en el conjunto de datos. Más idiomas generalmente requieren anotar más datos.
You can search through the available field names. To do so, use the search bar from the top left corner of the Document type manager interface. For a more efficient search, use the Filter feature to filter by Content type.
- Tipo de documento: elige el tipo de documento deseado de la lista desplegable.
- Fecha de carga: elige un intervalo de fechas en el que se cargó el documento.
- Estado: elige el estado del documento
Puedes comprobar la puntuación general de tu proyecto desde la esquina superior derecha. Esta puntuación influye en las puntuaciones del clasificador y del extractor para todos los tipos de documentos. Haz clic en Puntuación del proyecto para mostrar la sección Medida. Puedes comprobar más mediciones del rendimiento en profundidad en esa sección.
Puedes comprobar la puntuación para cada tipo de documento de la sección Tipo de documento por separado. La puntuación influye en el rendimiento general del modelo, así como en el tamaño y la calidad del conjunto de datos.
- Deficiente (0-49)
- Promedio (50-69)
- Bueno (70-89)
- Excelente (90-100)
Selecciona Puntuaciones del modelo detalladas para ir a la sección Medir para obtener información detallada.