Actividades
Más reciente
False
Imagen de fondo del banner
Actividades de Document Understanding
Última actualización 29 de abr. de 2024

Datos del documento

Los datos del documento son un recurso que sirve tanto como variable de entrada como de salida, dentro de tus flujos de trabajo de Document Understanding. El objeto Datos del documento contiene toda la información necesaria sobre un solo documento. Si clasificas un documento, el objeto incluye el Tipo de documento. Si extraes datos, el objeto contiene los campos extraídos correspondientes. Independientemente de la actividad, los datos del documento contienen de forma coherente el texto del documento y el DOM (modelo de objeto del documento).

Con Datos de documento puedes: recopilar toda la información necesaria sobre un documento en una variable, guardar datos en cada propiedad del objeto y reutilizarlos para otras actividades en el flujo de trabajo.

Los datos del documento contienen información sobre los siguientes atributos:

  • TipoDeDocumento: proporciona datos sobre el tipo de documento identificado, rellenados por actividades como Clasificar documento o Crear tarea de validación de clasificación
  • Datos: contiene los valores de campo extraídos, rellenados por actividades como Extraer datos de documento o Crear tarea de validación de documentos
  • DetallesDeArchivo: contiene detalles sobre IResource.
  • SubDocumentos: incluye una colección de datos de documentos, rellenada por actividades como Crear tarea de validación de clasificación.
  • MetadatosDeDocumento: contiene información sobre el procesamiento del documento, como:
    • Idioma del texto detectado
    • Campos extraídos como tabla de datos
    • Modelo de objeto de documento (DOM): contiene el modelo de objeto de documento que utilizan todas las actividades.
    Los MetadatosDeDocumento son actualizados por la actividad que primero procesa el documento. Una vez rellenados, los metadatos se comparten y utilizan con todas las actividades posteriores que reciben el objeto Datos del documento.
    Consejo: a menos que una actividad sea la primera parte de la actividad de Document Understanding de un flujo de trabajo de Studio, utiliza Datos del document como entrada. Utiliza la variable Archivo como entrada solo si la actividad es la primera parte de Document Understanding de un flujo de trabajo de Studio.

Propiedades

Las propiedades de la variable Datos del documento pueden rellenarse y consumirse por una o varias actividades. Dependiendo de la actividad que rellena la variable, las propiedades pueden diferir.

Nombre del atributoPropiedadDescripciónActividades que rellenan el valor
Tipo de documentoNombreParaMostrar (utilizado para modelos personalizados)Nombre del tipo de documentoClasificar documento
ID (utilizado para modelos listos para usar)Nombre del tipo de documento
ConfianzaConfianza de clasificación
URLURL de dónde es accesible el Tipo de documento; puede ser personalizado o predefinido, al que se hace referencia a través del proyecto respectivo en el centro de Document Understanding.
CamposValor de campoValor de extracción del campo
Puntuación de confianza de extracciónPuntuación de confianza de la extracción, como lo proporciona el modelo
Puntuación de confianza de OCRPuntuación de confianza proporcionada por el motor OCR
Detalles del archivoNombreCompletoNombre completo del archivoActividades que crean el objeto Datos del documento, que recibe un archivo como entrada
ExtensiónExtensión del archivo
Intervalo de páginasRango de páginas del archivo
SubdocumentosN/AColección de datos del documento
Nota: esto no se rellena actualmente y se añadirá en el futuro junto con las capacidades de validación de clasificación y división.
Clasificar documento
MetadatosN/AInformación sobre el procesamiento del documentoActividades que crean el objeto Datos del documento y reciben un archivo como entrada.
DOMN/AEl modelo de objeto del documento, utilizado por todas las actividades
TextoN/ATodo el texto extraído
Idioma detectadoN/AEl idioma detectado en el documento
Confianza divididaN/ASi el documento está dividido, el modelo de división devuelve el documento
Nota: esto no se rellena actualmente y se añadirá en el futuro junto con las capacidades de validación de clasificación y división.
Clasificar documento
Resultados como tabla de datosN/ACampos exportados como tabla de datosExtraer datos del documento

Pasar datos de documentos a actividades

Cuando utilizas Datos de documento, el primer objeto de salida se crea a partir de tu archivo de entrada. Después de crear este objeto, te recomendamos que lo pases a tus próximas actividades. Al pasarlo a tus próximas actividades, puedes reutilizar el Texto y el DOM de tu archivo original. Este enfoque evita tener que volver a digitalizar el archivo cada vez.

Consumir los resultados de la extracción para campos de valor único y multivalor

Si configuras un campo de tipo de documento para que tenga varios valores, el sistema espera varios valores. Un ejemplo podría ser una pregunta de opción múltiple en un formulario. Los resultados aparecen en el atributo multivalor del campo, devuelto como una lista. Si el campo de tipo de documento está configurado para ser de valor único, el sistema devuelve el resultado en el atributo de valor del campo de forma predeterminada.

La siguiente tabla muestra cómo los datos del documento devuelven campos de valor único y multivalor:

Tipo de campono tiene valorTiene un valorTiene dos o más valoresDocumentData.Data.FieldName.ValueDocumentData.Data.FieldName.MultiValues
Valor único NoN/D""null
Valor únicoNoN/D<value that was identified><valor que se identificó>null
Valor múltipleNoNo""[] (matriz vacía)
Valor múltipleNoNo<value that was identified><valor que se identificó>[<matriz con un valor idéntico al .Value>]
Valor múltipleNoNo<first value that was identified><primer valor que se identificó>[<matriz con valores n , siendo el primer valor idéntico al .Value>]

Devolver campos extraídos como una tabla de datos

Puedes devolver los campos que extrajiste de un documento como una tabla de datos, utilizando el objeto Datos del documento. A continuación, puedes utilizar la variable Tabla de datos dentro de las actividades de Excel.

Para devolver los campos extraídos como una tabla de datos, elige la salida ResultsAsDatatable para la actividad Extraer datos del documento .

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.