UiPath Marketplace
Mais recente
falso
Imagem de fundo do banner
Guia do usuário do Marketplace
Última atualização 16 de abr de 2024

Analyze Multipage Document

A atividade Analyze Multipage Document usa as APIs StartDocumentAnalysis e GetDocumentAnalysis do Amazon Textract para analisar um documento de várias páginas armazenado em um bucket S3 (Bucket,DocumentName e Version). Se seu documento incluir uma tabela, você tem a opção de indicar se a primeira linha contém cabeçalhos de coluna (DiscoverColumnHeaders) e/ou ignorar linhas vazias (IgnoreEmptyRows).

Após analisar o documento, a atividade retorna as propriedades do documento em um objeto PageDetailCollection (Páginas) que você pode usar como variáveis de entrada em outras atividades fora do pacote de atividades Amazon Textract.

A atividade Analisar Documento de Multipágina é essencialmente uma combinação das atividades Iniciar Análise de Documento, Obter Status de Análise de Documentoe Obter Análise de Documento em uma única atividade.

Importante: em versões anteriores desta atividade, o parâmetro de saída (Páginas) retornava um objeto PageDetail[] . Na versão 2.0, isso foi alterado para PageDetailCollection para nos permitir retornar a propriedade RawJson para a chamada do método, o que não era possível com uma matriz.

Como funciona

As etapas a seguir e o diagrama de sequência de mensagens são um exemplo de como a atividade funciona desde o tempo de design (ou seja, as dependências da atividade e as propriedades de entrada/saída) até o tempo de execução.

  1. Conclua as etapas de Configuração .
  2. Adicione a atividade Amazon Scope ao seu projeto.
  3. Adicione a Analisar Documento de Página Única dentro da atividade Amazon Scope .
  4. Insira valores para as propriedades de entrada do S3 Storage .
  5. Crie e insira uma variável PageDetailCollection para sua propriedade Saída .
  6. Execute a atividade.

    • Suas propriedades de entrada são enviadas para a API AnalyzeDocument .
    • A API retorna o valor PageDetail para sua variável de propriedade de saída.


Propriedades

Os valores para as seguintes propriedades são especificados ao adicionar esta atividade ao seu projeto no UiPath Studio.



Comum

NomeDeExibição

O nome de exibição da atividade.

Atributos

Detalhes

Tipo

String

Required

Sim

Valor padrão

Analyze Multipage Document

Valores permitidos

Insira uma variável String ou String .

Observações

N/A

Entrada

Ao contrário de Obter status de análise de documento, que requer um mecanismo de atraso externo para pesquisar o serviço quanto a alterações de status, Analisar documento de várias páginas inclui as seguintes propriedades de entrada opcionais para definir um atraso de verificação de status inicial (InitialDelay) e o intervalo de verificação de status (CheckStatusInterval).

InitialDelay

O tempo de espera antes que a atividade chame a API Amazon Textract GetDocumentAnalysis para recuperar o valor JobStatus.

Atributos

Detalhes

Tipo

Int32 (milissegundos)

Required

Não

Valor padrão

15000 (não mostrado)

Valores permitidos

Insira uma variável Int32 ou Int32 .

Observações

Insira seu valor em milissegundos (por exemplo, 30.000 por 30 segundos); seu valor deve ser maior ou igual a 15000 .

Ao analisar um documento grande, é recomendável inserir o tempo estimado que leva para o serviço Amazon Textract concluir sua análise. Por exemplo, se seu documento leva até 2 minutos para analisar, você deve inserir 120000 como seu valor e usar a propriedade StatusCheckInterval para indicar com que frequência deseja verificar o status atualizado se o trabalho não for concluído dentro dos 2 minutos estimativa.

StatusCheckInterval

O tempo de espera entre as chamadas para a API Amazon Textract GetDocumentAnalysis para recuperar o valor de JobStatus.

Atributos

Detalhes

Tipo

Int32 (milissegundos)

Required

Não

Valor padrão

10.000 (não mostrado)

Valores permitidos

Insira uma variável Int32 ou Int32 .

Observações

Insira seu valor em milissegundos (por exemplo, 15.000 para 30 segundos); seu valor deve ser maior ou igual a 10000.

O objetivo dessa propriedade é ajudar a gerenciar o número de chamadas que sua atividade faz para a API Amazon Textract.

Opções

TipoDeAnálise

Especifica os tipos de análise a serem realizados. Use Tabelas para retornar informações sobre as tabelas detectadas no documento de entrada e Formulários para retornar dados de formulários detectados.

Atributos

Detalhes

Tipo

ENUM

Required

Não.

Valor padrão

Todos

Valores permitidos

Todas, Tabelas, Formulários

Observações

N/A

DiscoverColumnHeaders

Indica se as tabelas no documento incluem cabeçalhos de coluna.

Atributos

Detalhes

Tipo

Caixa de seleção

Required

Não

Valor padrão

não selecionado

Valores permitidos

Selecionado ou Não Selecionado

Observações

N/A

IgnorarLinhasVazias

Indica se as linhas vazias nas tabelas do documento devem ser ignoradas ao analisar o documento.

Atributos

Detalhes

Tipo

Caixa de seleção

Required

Não

Valor padrão

não selecionado

Valores permitidos

Selecionado ou Não Selecionado

Observações

N/A

Armazenamento S3

Bucket

O nome do bucket S3 em que o documento é armazenado.

Atributos

Detalhes

Tipo

String

Required

Sim

Valor padrão

Vazio

Valores permitidos

Insira uma variável String ou String .

Observações

A região da AWS para o bucket S3 que contém o documento deve corresponder à região que você selecionou na atividade do Amazon Scope .

Para que o Amazon Textract processe um arquivo em um bucket S3, o usuário deve ter permissão para acessar o bucket S3; Para obter mais informações, consulte a etapa 6 na seção Criar usuário de IAM do Guia de configuração .

Nome do Documento

O nome do arquivo que diferencia maiúsculas de minúsculas no Bucket especificado que você deseja analisar.

Atributos

Detalhes

Tipo

String

Required

Sim

Valor padrão

Vazio

Valores permitidos

Insira uma variável String ou String .

Observações

Formatos de documento suportados: PNG, JPEG e PDF.

Versão

Se o bucket tiver o controle de versão habilitado, você poderá especificar a versão do objeto.

Atributos

Detalhes

Tipo

String

Required

Não

Valor padrão

Vazio

Valores permitidos

Insira uma variável String ou String .

Observações

N/A

Diversos

Particular

Se selecionado, os valores das variáveis e argumentos não são mais registrados no nível Verbose.

Atributos

Detalhes

Tipo

Caixa de seleção

Required

Não

Valor padrão

não selecionado

Valores permitidos

Selecionado ou Não Selecionado

Observações

N/A

Saída

Páginas

As propriedades extraídas do documento especificado são retornadas como uma matriz.

Atributos

Detalhes

Tipo

PageDetailCollection

Required

Não (recomendado se você planejar usar os dados de saída em atividades subsequentes)

Valor padrão

Vazio

Valores permitidos

Insira uma variável PageDetailCollection

Observações

Cada objeto da array representa os resultados de uma página individual. Essa é uma alteração em relação às versões anteriores que retornavam um objeto PageDetail[] .

Consulte Detalhes da página para obter a descrição do objeto Detalhes da página e suas propriedades.

Exemplo

A imagem a seguir mostra um exemplo do relacionamento de dependência de atividade e valores de propriedade de entrada/saída.

Para obter instruções passo a passo e exemplos, consulte os guias de início rápido .





  • Como funciona
  • Propriedades
  • Comum
  • Entrada
  • Opções
  • Armazenamento S3
  • Diversos
  • Saída
  • Exemplo

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.