marketplace

latest

false

Importante :

Este conteúdo foi traduzido com auxílio de tradução automática. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Guia do usuário do Marketplace

Última atualização 20 de jan de 2025

Analyze Multipage Document

A atividade Analyze Multipage Document usa as APIs StartDocumentAnalysis e GetDocumentAnalysis do Amazon Textract para analisar documentos de várias páginas armazenados em um bucket S3 (Bucket,DocumentNamee Version). Se seu documento inclui uma tabela, você tem a opção de indicar se a primeira linha contém cabeçalhos de coluna (DiscoveryColumnHeaders) e/ou ignorar linhas vazias (IgnoreEmptyRows).

Após analisar o documento, a atividade retorna as propriedades do documento em um objeto PageDetailCollection (Páginas) que você pode usar como variáveis de entrada em outras atividades fora do pacote de atividades Amazon Textract.

A atividade Analisar Documento de Multipágina é essencialmente uma combinação das atividades Iniciar Análise de Documento, Obter Status de Análise de Documentoe Obter Análise de Documento em uma única atividade.

Importante: em versões anteriores desta atividade, o parâmetro de saída (Páginas) retornava um objeto PageDetail[] . Na versão 2.0, isso foi alterado para PageDetailCollection para nos permitir retornar a propriedade RawJson para a chamada do método, o que não era possível com uma matriz.

Como funciona

As etapas a seguir e o diagrama de sequência de mensagens são um exemplo de como a atividade funciona desde o tempo de design (ou seja, as dependências da atividade e as propriedades de entrada/saída) até o tempo de execução.

Conclua as etapas de Configuração .
Adicione a atividade Amazon Scope ao seu projeto.
Adicione a Analisar Documento de Página Única dentro da atividade Amazon Scope .
Insira valores para as propriedades de entrada do S3 Storage .
Crie e insira uma variável PageDetailCollection para sua propriedade Saída .
Execute a atividade.
- Suas propriedades de entrada são enviadas para a API AnalyzeDocument .
- A API retorna o valor PageDetail para sua variável de propriedade de saída.

Propriedades

Os valores para as seguintes propriedades são especificados ao adicionar esta atividade ao seu projeto no UiPath Studio.

Comum

NomeDeExibição

O nome de exibição da atividade.

Atributos	Detalhes
Tipo	`String`
Required	Sim
Valor padrão	Analyze Multipage Document
Valores permitidos	Insira uma variável `String` ou `String` .
Observações	N/A

Entrada

Ao contrário de Obter status de análise de documento, que requer um mecanismo de atraso externo para pesquisar o serviço quanto a alterações de status, Analisar documento de várias páginas inclui as seguintes propriedades de entrada opcionais para definir um atraso de verificação de status inicial (InitialDelay) e o intervalo de verificação de status (CheckStatusInterval).

InitialDelay

O tempo de espera antes que a atividade chame a API Amazon Textract GetDocumentAnalysis para recuperar o valor JobStatus.

Atributos	Detalhes
Tipo	`Int32` (milissegundos)
Required	Não
Valor padrão	15000 (não mostrado)
Valores permitidos	Insira uma variável `Int32` ou `Int32` .
Observações	Insira seu valor em milissegundos (por exemplo, 30.000 por 30 segundos); seu valor deve ser maior ou igual a 15000 . Ao analisar um documento grande, é recomendável inserir o tempo estimado que leva para o serviço Amazon Textract concluir sua análise. Por exemplo, se seu documento leva até 2 minutos para analisar, você deve inserir 120000 como seu valor e usar a propriedade StatusCheckInterval para indicar com que frequência deseja verificar o status atualizado se o trabalho não for concluído dentro dos 2 minutos estimativa.

StatusCheckInterval

O tempo de espera entre as chamadas para a API Amazon Textract GetDocumentAnalysis para recuperar o valor de JobStatus.

Atributos	Detalhes
Tipo	`Int32` (milissegundos)
Required	Não
Valor padrão	10.000 (não mostrado)
Valores permitidos	Insira uma variável `Int32` ou `Int32` .
Observações	Insira seu valor em milissegundos (por exemplo, 15.000 para 30 segundos); seu valor deve ser maior ou igual a 10000. O objetivo dessa propriedade é ajudar a gerenciar o número de chamadas que sua atividade faz para a API Amazon Textract.

Opções

TipoDeAnálise

Especifica os tipos de análise a serem realizados. Use Tabelas para retornar informações sobre as tabelas detectadas no documento de entrada e Formulários para retornar dados de formulários detectados.

Atributos	Detalhes
Tipo	ENUM
Required	Não.
Valor padrão	Todos
Valores permitidos	Todas, Tabelas, Formulários
Observações	N/A

DiscoverColumnHeaders

Indica se as tabelas no documento incluem cabeçalhos de coluna.

Atributos	Detalhes
Tipo	Caixa de seleção
Required	Não
Valor padrão	não selecionado
Valores permitidos	Selecionado ou Não Selecionado
Observações	N/A

IgnorarLinhasVazias

Indica se as linhas vazias nas tabelas do documento devem ser ignoradas ao analisar o documento.

Atributos	Detalhes
Tipo	Caixa de seleção
Required	Não
Valor padrão	não selecionado
Valores permitidos	Selecionado ou Não Selecionado
Observações	N/A

Armazenamento S3

Bucket

O nome do bucket S3 em que o documento é armazenado.

Atributos	Detalhes
Tipo	`String`
Required	Sim
Valor padrão	Vazio
Valores permitidos	Insira uma variável `String` ou `String` .
Observações	A região da AWS para o bucket S3 que contém o documento deve corresponder à região que você selecionou na atividade do Amazon Scope . Para que o Amazon Textract processe um arquivo em um bucket S3, o usuário deve ter permissão para acessar o bucket S3; Para obter mais informações, consulte a etapa 6 na seção Criar usuário de IAM do Guia de configuração .

Nome do Documento

O nome do arquivo que diferencia maiúsculas de minúsculas no Bucket especificado que você deseja analisar.

Atributos	Detalhes
Tipo	`String`
Required	Sim
Valor padrão	Vazio
Valores permitidos	Insira uma variável `String` ou `String` .
Observações	Formatos de documento suportados: PNG, JPEG e PDF.

Versão

Se o bucket tiver o controle de versão habilitado, você poderá especificar a versão do objeto.

Atributos	Detalhes
Tipo	`String`
Required	Não
Valor padrão	Vazio
Valores permitidos	Insira uma variável `String` ou `String` .
Observações	N/A

Diversos

Particular

Se selecionado, os valores das variáveis e argumentos não são mais registrados no nível Verbose.

Atributos	Detalhes
Tipo	Caixa de seleção
Required	Não
Valor padrão	não selecionado
Valores permitidos	Selecionado ou Não Selecionado
Observações	N/A

Saída

Páginas

As propriedades extraídas do documento especificado são retornadas como uma matriz.

Atributos	Detalhes
Tipo	`PageDetailCollection`
Required	Não (recomendado se você planejar usar os dados de saída em atividades subsequentes)
Valor padrão	Vazio
Valores permitidos	Insira uma variável `PageDetailCollection`
Observações	Cada objeto da array representa os resultados de uma página individual. Essa é uma alteração em relação às versões anteriores que retornavam um objeto `PageDetail[]` . Consulte Detalhes da página para obter a descrição do objeto Detalhes da página e suas propriedades.