UiPath Documentation
ixp
latest
false
  • Visão geral
    • Introdução
    • Extraindo Dados de documentos não estruturados
    • Criação e implantação de modelos
    • Cotas
  • Criação do modelo
  • Validação do modelo
  • Implantação do modelo
  • Consumo de modelos
    • Consumo de modelos por meio de um fluxo de trabalho
    • Consumo de modelos por meio da API do Document Understanding
  • API
  • Perguntas frequentes
Importante :
A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Guia do usuário de Documentos complexos e não estruturados

Consumo de modelos por meio de um fluxo de trabalho

Você pode consumir as previsões de uma versão publicada do modelo de Documentos complexos e não estruturados criando um fluxo de trabalho no UiPath Studio.

Visão geral

A criação de um fluxo de trabalho de Documentos complexos e não estruturados no IXP geralmente envolve as seguintes etapas:

  1. Instalação do pacote
  2. Definição da taxonomia
  3. Digitalização de documentos
  4. Classificação de Documento
  5. Extração de documentos
  6. Validação do Documento
Observação:

A etapa de definição da taxonomia aplica-se apenas a projetos do Windows, não a projetos multiplataforma. Para saber as diferenças entre os tipos de projeto, consulte as seções a seguir.

Pré-requisitos

Você deve ter um modelo publicado em um projeto de Documentos complexos e não estruturados.

Quando você começa a criar seu fluxo de trabalho do Studio, você deve decidir que tipo de projeto deseja executar: Windows ou Multiplataforma. Cada tipo de projeto requer pacotes diferentes.

Independentemente do tipo de projeto escolhido, você pode instalar os pacotes:

Windows

  • UiPath.IntelligentOCR.Activities 6.22.0
  • UiPath.System.Activities 24.10.6

Multiplataforma

  • UiPath.DocumentUnderstanding.Activities 2.12.0
  • UiPath.System.Activities 24.10.6
Observação:
  • O pacote IntelligentOCR é compatível com projetos do Windows, não com projetos multiplataforma.
  • Você pode criar fluxos de trabalho multiplataforma e usar outros modelos no Studio Web.

Criação de um fluxo de trabalho do IXP para projetos do Windows

As seções que se seguem contêm as etapas a serem aplicadas se você optar por não usar um dos modelos do Studio e começar do zero.

Para criar um fluxo de trabalho do IXP para projetos do Windows, proceda da seguinte forma:

Observação:

Os nomes de variáveis usados nas seções a seguir são apenas exemplos. Você pode dar nome às suas variáveis de acordo com suas próprias convenções.

1. Instalação dos pacotes

Certifique-se de instalar os pacotes mencionados na seção Pré-requisitos.

2. Definição da taxonomia

  1. No Studio Desktop, crie um processo básico.

  2. Ao configurar seu processo, no campo Compatibilidade selecione que tipo de fluxo de trabalho você deseja criar: Windows ou Multiplataforma. Para obter mais detalhes, consulte Sobre projetos de automação.

  3. Abra o Gerenciador de Taxonomia na guia Design e configure seus campos de tabela da seguinte forma:

    • Crie um campo de tabela para cada grupo de campos em sua taxonomia do projeto de Extração e Processamento Inteligente (IXP).
    • Adicione uma coluna no respectivo campo de tabela para cada campo definido no grupo de campos.
    Observação:

    Gerenciador de Taxonomia:

    • é compatível com a criação de tabelas e campos. Quando você cria fluxos de trabalho de Documentos complexos e não estruturados do IXP, recomenda-se criar campos de tabela em vez de apenas campos.
    • está disponível apenas quando o pacote IntelligentOCR está instalado. Isso significa que ela está disponível apenas em projetos do Windows, não em multiplataforma.
  4. Em seguida, você deve ter um local de onde possa ler documentos. Por exemplo, na pasta do projeto, crie uma nova pasta chamada documentos e adicione alguns arquivos.

  5. Na Sequência, adicione uma atividade Atribuir para especificar de onde você deseja ler documentos. Configure os seguintes campos:

    • Salvar em - Crie e adicione uma variável do tipo System.String[]. Neste exemplo, a variável é chamada docs.
    • Valor a salvar - Adicionar Directory.GetFiles("./documents").

  6. Adicione uma atividade Carregar taxonomia para armazenar a taxonomia configurada em uma variável para fazer referência a ela no restante da automação.Crie e adicione uma variável do tipo DocumentTaxonomy. Neste exemplo, a variável é chamada de taxo.

    Observação:

    Você precisa mapear a variável para a saída da atividade.

3. Digitalização de um documento

  1. Adicione uma atividade Para Cada para passar por cada Documento.Para a entrada, adicione a variável que você criou anteriormente.

  2. Arraste e solte a seguinte atividade dentro de Para cada:

    • Digitalizar documento - Permite ler os documentos que você forneceu e obter a saída do Modelo de objeto do documento (DOM). Configure os seguintes campos:
      • Caminho do documento - Adicione a variável doc. Você pode localizar a variável no Nome do item que você configurou na atividade Para cada. Neste exemplo, o nome do item é doc e representa o caminho do arquivo do documento que você deseja digitalizar.

      • Texto do Documento - Criar e adicionar a variável de texto.

      • Modelo de Object do Documento (DOM) - Criar e adicionar a variável dom.

4. Classificação de um documento

Na mesma atividade Para cada, após Digitalizar documento, arraste e solte a seguinte atividade:

  • Classificar escopo do documento - Permite classificar o documento que está sendo processado em um dos tipos de documentos definidos em sua taxonomia. Para as entradas, adicione o seguinte:
    • Caminho do documento - Adicione a variável doc.

    • Texto do documento - Adicione a variável Text.

    • Document Object Model (DOM) - Adicione a dom variable.

    • Taxonomia - Adicione a variável taxo. Para as saídas, adicione o seguinte:

    • ResultadosDaClassificação - Criar e adicionar uma nova variável ResultadosDaClassificação.

No Classify Document Scope, adicione a atividade Classificador generativo para classificar documentos usando modelos generativos. Configurar a atividade da seguinte forma: 1. selecione Gerenciar detalhes do campo. 2. Na coluna Tipo de documento, selecione um tipo de documento. 3. Na coluna Detalhes do campo, acrescente um valor opcional para definir detalhes adicionais sobre o tipo de documento.Isso pode ser uma breve descrição do tipo de documento. O número máximo de caracteres permitidos é 1000. 4. Selecione Salvar.

Observação:

Uma atividade de classificação é opcional se você tiver apenas um tipo de documento em sua taxonomia. Você pode copiar o ID do tipo de documento e usá-lo como entrada para a atividade Data Extraction Scope.

5. Extração de detalhes de um documento

  1. Arraste e solte a seguinte atividade dentro de Para cada:

    • Escopo da extração de dados - Permite que você configure atividades do extrator. Para as entradas, adicione o seguinte:
      • Caminho do documento – Adicione a variável doc.
      • Texto do documento – Adicione a variável Text.
      • Modelo de objeto do documento (DOM) – Adicione a variável dom.
      • Taxonomia – Adicione a variável da taxo.
      • Resultado da classificação – Adicione a variável ResultadosDaClassificação. Para a saída, adicione o seguinte:
      • Resultados da Extração – Crie e adicione uma nova variável ResultadosDaExtração.
  2. Dentro do Escopo da extração de dados, adicione a atividade Document Understanding Project Extractor para extrair os dados do documento.

Quando você adiciona a atividade do extrator do projeto dentro do escopo, a janela de configuração Obter recursos deve abrir automaticamente.

  1. Se o projeto publicado for hospedado em uma organização ou tenant diferente ou for usado em uma configuração híbrida, adicione os detalhes necessários em Obter recursos da seguinte forma:

    • Crie um aplicativo externo na página de Automation Cloud Admin. Para obter mais detalhes, consulte Adicionando um aplicativo externo.

    • Copie o ID do aplicativo e o Segredo do aplicativo, onde o segredo do aplicativo é a senha.

    • Na janela Obter recursos, adicione as credenciais, o ID do Aplicativo e o segredo.

    • Configure o restante dos campos conforme descrito no Document Understanding Project Extractor.

      Observação:

      Ao copiar o URL do tenant, certifique-se de que ele inclua os nomes da organização e do tenant.Por exemplo, https://staging.uipath.com/communicationsminingteam/IXPTesting, onde communicationsminingteam é a organização e IXPTesting é o tenant.

    • Na atividade Document Understanding Project Extractor, adicione o caminho do ativo como entrada na propriedade Ativo de credenciais do runtime da atividade Document Understanding Project Extractor. O caminho deve estar na forma de <OrchestratorFolderName>/<AssetName>.

  2. Se o fluxo de trabalho for executado na mesma organização e tenant em que o projeto foi publicado, selecione o projeto publicado na atividade Document Understanding Project Extractor.

    Observação:

    O modelo publicado aparece nas opções do menu suspenso se o Studio estiver conectado à mesma organização ou tenant em que o modelo foi publicado. Se o modelo não aparecer, pode ser porque ele foi publicado em uma organização ou tenant diferente. Nesse caso, aplique as instruções da seção que se segue, Consumo de previsões de projetos entre organizações, entre tenants ou híbridos.

  3. Selecione Configurar extratores e use o assistente para mapear seus campos da taxonomia para os campos definidos no projeto Documentos complexos e não estruturados. Figura 1. O assistente de Configuração de Extratores do Studio

6. Validação de um documento

Opcionalmente, você pode configurar critérios de decisão para determinar se a validação humana é necessária para a saída de classificação. Isso pode ser feito usando regras de negócios personalizadas ou lógica de pós-processamento. Você também pode usar critérios de decisão personalizados em um fluxo de trabalho para disparar a validação, ou pode configurar limites de confiança no nível de campo. Esses critérios de decisão dependem dos requisitos do processo de negócios e de como seu caso de uso permite falso positivos, ou seja, resultados que ignoram a validação humana, mas foram extraídos incorretamente. Com base nessas regras, você pode controlar se um documento é validado automaticamente ou é roteado para validação humana.Para obter mais detalhes, verifique a seção Configurações de validação em Estabelecer a estrutura.

  1. Adicione a atividade Present Validation Station para validar na Estação de validação. A saída ResultadosDaExtração da atividade Escopo da Extração de Dados será a entrada da atividade Estação de validação atual. Para a entrada, adicione a variável ResultadosDaExtração.Para a saída, crie e adicione uma nova variável ResultadosValidadosDaExtração.

  2. Para as entradas, adicione o seguinte:

    • Caminho do documento – Adicione a variável doc.
    • Texto do documento – Adicione a variável Text.
    • Modelo de objeto do documento (DOM) – Adicione a variável dom.
    • Taxonomia – Adicione a variável da taxo.
    • Resultados da Extração Automática – Adicione a variável ResultadosDaExtração.
  3. Para a saída, adicione o seguinte:

    • Resultados Validados da Extração – Crie e adicione uma nova variável ResultadosValidadosDaExtração.

Nesta etapa de validação, você também pode usar outras atividades além de Estação de validação presente. Por exemplo:

Para obter mais detalhes sobre validação, consulte os seguintes recursos:

Acionamento de validação humana

A validação humana da saída da classificação é disparada aplicando lógica de decisão após a etapa de classificação, antes que o fluxo de trabalho prossiga para a extração. A decisão não é automática por padrão, é controlada explicitamente por meio de limites de confiança e regras de negócios definidas no fluxo de trabalho.

A lista a seguir mostra como a validação humana pode ser disparada:

  1. Avaliação da confiança da classificação Cada resultado de classificação inclui pontuações de confiança que indicam o quão certo o modelo é acerca do tipo de documento previsto. Essas pontuações são avaliadas no fluxo de trabalho para determinar se a classificação é confiável.
  2. Limites de confiança Você pode definir um limite de confiança mínimo para classificação. Se a pontuação de confiança para o tipo de documento previsto ficar abaixo desse limite, a classificação é considerada incerta e o documento é sinalizado para validação humana.
  3. Regras de negócios e lógica condicional Além de limites de confiança, você pode aplicar regras de negócios personalizadas, como:
    • Tipos de documento específicos que sempre exigem revisão manual.
    • Incompatibilidades entre os tipos de documento esperados e previstos.
    • Regras com base em como o documento será processado mais tarde. Por exemplo, documentos que devem ser verificados antes da extração ou aprovação.
  4. Acionamento da etapa de validação Quando os critérios definidos são atendidos, o fluxo de trabalho direciona o documento para uma etapa de validação humana invocando um dos mecanismos de validação:
    • Present Validation Station para validação no robô.
    • Criar tarefa de validação para validação baseada no Action Center.
    • Criar Artefatos de validação de documentos para validação em Apps.
  5. Confirmação ou correção humana Durante a validação, o revisor humano confirma ou corrige o tipo de documento. O resultado da classificação validada é usado por etapas subsequentes, como extração de dados, garantindo que o processamento subsequente seja baseado em um tipo de documento aprovado. Para concluir, a validação humana para classificação é disparada por regras controladas por fluxo de trabalho, normalmente baseadas em pontuações de confiança e lógica de negócios, que determinam quando um resultado de classificação requer revisão manual antes que o processo continue.

Interpretação de resultados da Estação de validação a partir de modelos de IXP

Ao usar fluxos de trabalho que aproveitam modelos para Documentos complexos e não estruturados do IXP, a Estação de validação serve como uma interface crucial para revisar, confirmar e refinar os Dados extraídos. A Estação de validação mostra como o modelo interpretou o documento, permitindo que você entenda a precisão da extração, identifique áreas incertas e faça correções onde necessário.

Na Estação de validação, o tipo de documento e seus campos correspondentes são exibidos ao lado dos valores extraídos e indicadores de confiança. Para obter mais detalhes sobre o processo de validação, consulte os seguintes recursos:

Comparação dos fluxos de trabalho dos projetos do Windows e multiplataforma

A tabela a seguir mostra uma comparação entre os fluxos de trabalho do IXP para projetos do Windows e Multiplataforma:

WindowsMultiplataforma
Pacotes obrigatóriosIntelligentOCRDocument Understanding
Definindo a taxonomiaA opção Gerenciador de taxonomia permite que você defina a lista de campos que serão exibidos na Estação de validação ou incluídos no objeto de resultados da extração.
Observação: O Gerenciador de Taxonomia está disponível apenas quando o pacote Intelligent OCR está instalado.
O pacote Document Understanding lê e exibe automaticamente os campos definidos no esquema de modelo do IXP. Esses campos não são configurados por meio do fluxo de trabalho.

Esta página foi útil?

Conectar

Precisa de ajuda? Suporte

Quer aprender? Academia UiPath

Tem perguntas? Fórum do UiPath

Fique por dentro das novidades