marketplace

latest

false

Importante :

Este contenido se ha traducido mediante traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Guía de usuario de Marketplace

Última actualización 10 de oct. de 2025

Analyze Multipage Document

La actividad Analizar documento de varias páginas utiliza las API StartDocumentAnalchestra y GetDocumentAnalchestra de AmazonTextractpara analizar undocumentode varias páginas almacenado en un depósito de S3 (Depósito, NombreDelDocumento y Versión). Si tu documento incluye una tabla, tienes la opción de indicar si la primera fila contiene encabezados de columna (DetectarEncabezadosDeColumna) y / o ignorar las filas vacías (IgnorarRutasVacías).

Después de analizar el documento, la actividad devuelve las propiedades del documento en un objeto PageDetailCollection (Páginas) que puede usar como variables de entrada en otras actividades fuera del paquete de actividades de Amazon Textract.

La actividad Analizar documento de varias páginas es básicamente una combinación de las actividades Iniciar análisis del documento, Obtener el estado de análisisdel documento y Obtener análisis del documento en una sola actividad.

Importante: en versiones anteriores de esta actividad, el parámetro de salida (Páginas) devuelve un objeto PageDetail[] . En 2.0 esto se ha cambiado a PageDetailCollection para permitirnos devolver la propiedad RawJson para la llamada al método, lo que no era posible con una matriz.

Cómo funciona

Los siguientes pasos y diagrama de secuencia de mensajes son un ejemplo de cómo funciona la actividad desde el momento de diseño (es decir, las dependencias de la actividad y las propiedades de entrada / salida) hasta el tiempo de ejecución.

Completa los pasos de configuración .
Agregue la actividad de Amazon Scope a su proyecto.
Agregue Analizar documento de una sola página dentro de la actividad de ámbito de Amazon .
Introduce valores para las propiedades de entrada de almacenamiento de S3 .
Crea e introduce una variable PageDetailCollection para tu propiedad de salida .
Ejecuta la actividad.
- Tus propiedades de entrada se envían a la API AnalyzeDocument .
- La API devuelve el valor PageDetail a su variable de propiedad de salida.

Propiedades

Los valores para las siguientes propiedades se especifican al agregar esta actividad a tu proyecto en UiPath Studio.

Común

NombreParaMostrar

El nombre para mostrar de la actividad.

Atributos	Detalles
Tipo	`String`
Obligatorio	Sí
Valor predeterminado	Analyze Multipage Document
Valores permitidos	Introduce una variable `String` o `String` .
Notas	N/D

Entrada

A diferencia de Obtener estado de análisis del documento, que requiere un mecanismo de retraso externo para sondear el servicio en busca de cambios de estado, Analizar documento de varias páginas incluye las siguientes propiedades de entrada opcionales para establecer un retraso de comprobación de estado inicial (InitialDelay) y un intervalo de comprobación de estado (StateCheckInterval).

InitialDelay

La cantidad de tiempo de espera antes de que la actividad llame a la API GetDocumentAnalchestra de Amazon Textract para recuperar el valor JobStatus.

Atributos	Detalles
Tipo	`Int32` (milisegundos)
Obligatorio	No
Valor predeterminado	15000 (no se muestra)
Valores permitidos	Introduce una variable `Int32` o `Int32` .
Notas	Introduzca su valor en milisegundos (por ejemplo, 30 000 durante 30 segundos); tu valor debe ser mayor o igual a 15 000. Al analizar un documento grande, se recomienda introducir el tiempo estimado que tarda el servicio Amazon Textract en completar su análisis. Por ejemplo, si su documento tarda hasta 2 minutos en analizarse, debe introducir 120000 como valor y usar la propiedad StateCheckInterval para indicar la frecuencia con la que desea comprobar el estado actualizado si el trabajo no se completa en los 2 minutos estimación.

StatusCheckInterval

La cantidad de tiempo de espera entre llamadas a la API GetDocumentAnalchestra de Amazon Textract para recuperar el valor JobStatus.

Atributos	Detalles
Tipo	`Int32` (milisegundos)
Obligatorio	No
Valor predeterminado	10000 (no se muestra)
Valores permitidos	Introduce una variable `Int32` o `Int32` .
Notas	Introduzca su valor en milisegundos (por ejemplo, 15 000 durante 30 segundos); tu valor debe ser mayor o igual a 10 000. El objetivo de esta propiedad es ayudar a administrar el número de llamadas que su actividad realiza a la API de Amazon Textract.

Opciones

TipoDeAnálisis

Especifica los tipos de análisis a realizar. Usa Tablas para devolver información sobre las tablas que se detectan en el documento de entrada y Formularios para devolver datos de formulario detectados.

Atributos	Detalles
Tipo	ENUM
Obligatorio	No.
Valor predeterminado	Todos
Valores permitidos	Todos, Tablas, Formularios
Notas	N/D

DiscoverColumnHeaders

Indica si las tablas del documento incluyen encabezados de columna.

Atributos	Detalles
Tipo	Casilla de verificación
Obligatorio	No
Valor predeterminado	no seleccionados
Valores permitidos	Seleccionado o no seleccionado
Notas	N/D

IgnorarFilasVacías

Indica si las filas vacías en las tablas del documento deben ignorarse al analizar el documento.

Atributos	Detalles
Tipo	Casilla de verificación
Obligatorio	No
Valor predeterminado	no seleccionados
Valores permitidos	Seleccionado o no seleccionado
Notas	N/D

Almacenamiento S3

Depósito

El nombre del depósito de S3 en el que se almacena el documento.

Atributos	Detalles
Tipo	`String`
Obligatorio	Sí
Valor predeterminado	Vacío
Valores permitidos	Introduce una variable `String` o `String` .
Notas	La región de AWS para el depósito de S3 que contiene el documento debe coincidir con la región que seleccionó en la actividad de ámbito de Amazon . Para que Amazon Textract procese un archivo en un depósito de S3, el usuario debe tener permiso para acceder al depósito de S3; para obtener más información, consulta el paso 6 en la sección Crear usuario de IAM de la guía de configuración .

Nombre del documento

El nombre que distingue entre mayúsculas y minúsculas del archivo del depósito especificado que desea analizar.

Atributos	Detalles
Tipo	`String`
Obligatorio	Sí
Valor predeterminado	Vacío
Valores permitidos	Introduce una variable `String` o `String` .
Notas	Formatos de documentos compatibles: PNG, JPEG y PDF.

Versión

Si el depósito tiene habilitado el control de versiones, puede especificar la versión del objeto.

Atributos	Detalles
Tipo	`String`
Obligatorio	No
Valor predeterminado	Vacío
Valores permitidos	Introduce una variable `String` o `String` .
Notas	N/D

Otros

Privado

Si se selecciona, los valores de variables y argumentos no estarán registrados a un nivel detallado.

Atributos	Detalles
Tipo	Casilla de verificación
Obligatorio	No
Valor predeterminado	no seleccionados
Valores permitidos	Seleccionado o no seleccionado
Notas	N/D

Salida

Páginas

Las propiedades extraídas del documento especificado se devuelven como una matriz.

Atributos	Detalles
Tipo	`PageDetailCollection`
Obligatorio	No (recomendado si planea usar los datos de salida en actividades posteriores)
Valor predeterminado	Vacío
Valores permitidos	Introducir una variable `PageDetailCollection`
Notas	Cada objeto de la matriz representa los resultados de una página individual. Este es un cambio con respecto a las versiones anteriores que devolvieron un objeto `PageDetail[]` . Consulta Detalles de la página para obtener la descripción del objeto DetalleDePágina y sus propiedades.