Actividades
Más reciente
False
Imagen de fondo del banner
Actividades de integraciones clásicas
Última actualización 22 de abr. de 2024

Analyze Multipage Document

La actividad Analizar documento de varias páginas utiliza las API StartDocumentAnalysis y GetDocumentAnalysis de Amazon Textract para analizar un documento de varias páginas almacenado en un depósito S3 (Bucket,DocumentName y Version). Si tu documento incluye una tabla, tienes la opción de indicar si la primera fila contiene encabezados de columna (DiscoverColumnHeaders) y/o ignorar las filas vacías (IgnoreEmptyRows).

Después de analizar el documento, la actividad devuelve las propiedades del documento en un objeto PageDetailCollection (Páginas) que puede usar como variables de entrada en otras actividades fuera del paquete de actividades de Amazon Textract.

La actividad Analizar documento de varias páginas es básicamente una combinación de las actividades Iniciar análisis del documento, Obtener el estado de análisisdel documento y Obtener análisis del documento en una sola actividad.

Importante: en versiones anteriores de esta actividad, el parámetro de salida (Páginas) devuelve un objeto PageDetail[] . En 2.0 esto se ha cambiado a PageDetailCollection para permitirnos devolver la propiedad RawJson para la llamada al método, lo que no era posible con una matriz.

Cómo funciona

Los siguientes pasos y diagrama de secuencia de mensajes son un ejemplo de cómo funciona la actividad desde el momento de diseño (es decir, las dependencias de la actividad y las propiedades de entrada / salida) hasta el tiempo de ejecución.

  1. Completa los pasos de configuración .
  2. Agregue la actividad de Amazon Scope a su proyecto.
  3. Agregue Analizar documento de una sola página dentro de la actividad de ámbito de Amazon .
  4. Introduce valores para las propiedades de entrada de almacenamiento de S3 .
  5. Crea e introduce una variable PageDetailCollection para tu propiedad de salida .
  6. Ejecuta la actividad.

    • Tus propiedades de entrada se envían a la API AnalizarDocumento .
    • La API devuelve el valor PageDetail a su variable de propiedad de salida.


Propiedades

Los valores para las siguientes propiedades se especifican al agregar esta actividad a tu proyecto en UiPath Studio.



Común

NombreParaMostrar

El nombre para mostrar de la actividad.

Atributos

Detalles

Tipo

String

Obligatorio

Valor predeterminado

Analyze Multipage Document

Valores permitidos

Introduce una variable String o String .

Notas

N/D

Entrada

A diferencia de Obtener estado de análisis del documento, que requiere un mecanismo de retraso externo para sondear el servicio en busca de cambios de estado, Analizar documento de varias páginas incluye las siguientes propiedades de entrada opcionales para establecer un retraso de comprobación de estado inicial (InitialDelay) y un intervalo de comprobación de estado (StateCheckInterval).

InitialDelay

La cantidad de tiempo de espera antes de que la actividad llame a la API GetDocumentAnalchestra de Amazon Textract para recuperar el valor JobStatus.

Atributos

Detalles

Tipo

Int32 (milisegundos)

Obligatorio

No

Valor predeterminado

15000 (no se muestra)

Valores permitidos

Introduce una variable Int32 o Int32 .

Notas

Introduzca su valor en milisegundos (por ejemplo, 30 000 durante 30 segundos); tu valor debe ser mayor o igual a 15 000.

Al analizar un documento grande, se recomienda introducir el tiempo estimado que tarda el servicio Amazon Textract en completar su análisis. Por ejemplo, si su documento tarda hasta 2 minutos en analizarse, debe introducir 120000 como valor y usar la propiedad StateCheckInterval para indicar la frecuencia con la que desea comprobar el estado actualizado si el trabajo no se completa en los 2 minutos estimación.

StatusCheckInterval

La cantidad de tiempo de espera entre llamadas a la API GetDocumentAnalchestra de Amazon Textract para recuperar el valor JobStatus.

Atributos

Detalles

Tipo

Int32 (milisegundos)

Obligatorio

No

Valor predeterminado

10000 (no se muestra)

Valores permitidos

Introduce una variable Int32 o Int32 .

Notas

Introduzca su valor en milisegundos (por ejemplo, 15 000 durante 30 segundos); tu valor debe ser mayor o igual a 10 000.

El objetivo de esta propiedad es ayudar a administrar el número de llamadas que su actividad realiza a la API de Amazon Textract.

Opciones

TipoDeAnálisis

Especifica los tipos de análisis a realizar. Usa Tablas para devolver información sobre las tablas que se detectan en el documento de entrada y Formularios para devolver datos de formulario detectados.

Atributos

Detalles

Tipo

ENUM

Obligatorio

No.

Valor predeterminado

Todos

Valores permitidos

Todos, Tablas, Formularios

Notas

N/D

DiscoverColumnHeaders

Indica si las tablas del documento incluyen encabezados de columna.

Atributos

Detalles

Tipo

Casilla de verificación

Obligatorio

No

Valor predeterminado

no seleccionados

Valores permitidos

Seleccionado o no seleccionado

Notas

N/D

IgnorarFilasVacías

Indica si las filas vacías en las tablas del documento deben ignorarse al analizar el documento.

Atributos

Detalles

Tipo

Casilla de verificación

Obligatorio

No

Valor predeterminado

no seleccionados

Valores permitidos

Seleccionado o no seleccionado

Notas

N/D

Almacenamiento S3

Depósito

El nombre del depósito de S3 en el que se almacena el documento.

Atributos

Detalles

Tipo

String

Obligatorio

Valor predeterminado

Vacío

Valores permitidos

Introduce una variable String o String .

Notas

La región de AWS para el depósito de S3 que contiene el documento debe coincidir con la región que seleccionó en la actividad de ámbito de Amazon .

Para que Amazon Textract procese un archivo en un depósito de S3, el usuario debe tener permiso para acceder al depósito de S3; para obtener más información, consulta el paso 6 en la sección Crear usuario de IAM de la guía de configuración .

Nombre del documento

El nombre que distingue entre mayúsculas y minúsculas del archivo del depósito especificado que desea analizar.

Atributos

Detalles

Tipo

String

Obligatorio

Valor predeterminado

Vacío

Valores permitidos

Introduce una variable String o String .

Notas

Formatos de documentos compatibles: PNG, JPEG y PDF.

Versión

Si el depósito tiene habilitado el control de versiones, puede especificar la versión del objeto.

Atributos

Detalles

Tipo

String

Obligatorio

No

Valor predeterminado

Vacío

Valores permitidos

Introduce una variable String o String .

Notas

N/D

Otros

Privado

Si se selecciona, los valores de variables y argumentos no estarán registrados a un nivel detallado.

Atributos

Detalles

Tipo

Casilla de verificación

Obligatorio

No

Valor predeterminado

no seleccionados

Valores permitidos

Seleccionado o no seleccionado

Notas

N/D

Salida

Páginas

Las propiedades extraídas del documento especificado se devuelven como una matriz.

Atributos

Detalles

Tipo

PageDetailCollection

Obligatorio

No (recomendado si planea usar los datos de salida en actividades posteriores)

Valor predeterminado

Vacío

Valores permitidos

Introducir una variable PageDetailCollection

Notas

Cada objeto de la matriz representa los resultados de una página individual. Este es un cambio con respecto a las versiones anteriores que devolvieron un objeto PageDetail[] .

Consulta Detalles de la página para obtener la descripción del objeto DetalleDePágina y sus propiedades.

Ejemplo

La siguiente imagen muestra un ejemplo de la relación de dependencia de la actividad y los valores de las propiedades de entrada / salida.

Para obtener instrucciones paso a paso y ejemplos, consulta las guías de inicio rápido .





  • Cómo funciona
  • Propiedades
  • Común
  • Entrada
  • Opciones
  • Almacenamiento S3
  • Otros
  • Salida
  • Ejemplo

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.