UiPath Documentation
activities
latest
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Atividades do Document Understanding

Última atualização 5 de mai de 2026

Sobre o pacote de atividades IntelligentOCR

O UiPath.IntelligentOCR.Activities contém a infraestrutura para habilitar os fluxos de processamento de documentos usando uma abordagem completa, aberta e extensível.

Observação:

Ao instalar o pacote UiPath.IntelligentOCR.Activities , o pacote UiPath.DocumentUnderstanding.ML.Activities é instalado automaticamente para realizar a classificação e extração baseadas em ML.

Limitação conhecida

Se você estiver usando atividades do tipo "Wait for" que suspendem os fluxos de trabalho e você estiver trabalhando com variáveis DataTable , é crucial que as variáveis DataTable sejam serializáveis. Por exemplo, se uma variável DataTable for inicializada com new System.Data.DataTable, então ela se torna não serializável e isso pode fazer com que a execução do seu projeto falhe. Para evitar isso, você pode: deixar o valor padrão da variável DataTable vazio, ou atribuir um nome à variável DataTable , como: new System.Data.DataTable("MyTable").

Substituição de versões removidas

A tabela a seguir mostra as versões do pacote que foram removidas e, em vez disso, a versão recomendada para usar.

Tabela 1. As versões removidas e suas substituições recomendadas

Versão recomendada
4.3.0-preview4.4.0-preview
2.1.02.2.0
1.4.01.5.0
1.2.01.2.1

Importante

  • A partir da versão v6.19.0 , ao instalar o pacote UiPath.IntelligentOCR.Activities em um projeto, o pacote UiPath.DocumentUnderstanding.ML.Activities também é instalado automaticamente, e você não precisa instalá-lo separadamente.
  • Se você estiver usando o UiPath® Studio 2023.4.4 ou anterior, certifique-se de instalar a versão mais recente do Windows . NET 6.0 Desktop Runtime.

Compatibilidade da versão

A atualização do UiPath.IntelligentOCR.Activities também requer uma atualização para o pacote UiPath.UIAutomation.Activities e para o pacote UiPath.OCR.Activities , se incluído no projeto.

UiPath.IntelligentOCR.Activities e UiPath.DocumentUnderstanding.Activities não devem ser usados juntos no mesmo projeto. O pacote UiPath.IntelligentOCR.Activities deve ser usado para fluxos de trabalho do Windows (ou Legacy), enquanto o pacote UiPath.DocumentUnderstanding.Activities deve ser usado para fluxos de trabalho multiplataforma.

Observação:

Antes de usar a funcionalidade Monitorar, leve em consideração o seguinte:

  • Apenas UiPath.DocumentUnderstanding.Activities v 2.7.0 ou versões mais recentes são compatíveis com o Monitor;
  • Apenas o IntelligentOCR.Activities v6.20 ou versões mais recentes incluem a atividade Document Understanding Project Extractor que suporta Monitor

Formatos suportados

O pacote de atividades IntelligentOCR pode ser compatível com qualquer um dos seguintes tipos de arquivo: .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp e .pdf.

Suporte para a linguagem de projeto C#

A partir da versão 4.10.0, este pacote de atividades é validado para uso em projetos C#.

Funcionalidades

Esta seção mostra as várias funcionalidades do pacote Intelligent.OCR.

Digitalize documentos

Você pode conseguir isso usando a atividade Digitize Document . Isso recupera o texto de qualquer PDF ou imagem, usando, somente se necessário, o mecanismo de OCR de sua escolha.

Como os documentos são processados um a um, eles passam pelo processo de digitalização. A diferença para documentos não digitais (digitalizados) é que você precisa aplicar o mecanismo de OCR de sua escolha. As saídas desta etapa são o Document Object Model e uma variável de string contendo todo o texto do documento e são passadas para as próximas etapas.

Classifique documentos

Você pode conseguir isso usando a atividade Classify Document . Isso permite identificar o tipo de documento de um arquivo usando qualquer algoritmo de classificação.

Após a digitalização, o documento é classificado. Se você estiver trabalhando com vários tipos de documentos no mesmo projeto, para extrair os dados corretamente, você precisa saber com que tipo de documento está trabalhando. O importante é que você pode usar vários classificadores no mesmo escopo, pode configurar os classificadores e, posteriormente no framework, treiná-los. Os resultados da classificação ajudam na aplicação da estratégia correta na extração.

A lista a seguir mostra os classificadores disponíveis:

  • A atividade Keyword Based Classifier é o primeiro classificador desse tipo, direcionando a classificação para documentos com título.
  • A atividade Intelligent Keyword Classifier não pode apenas classificar, mas também "dividir" arquivos que contêm vários tipos de documentos dentro deles.
  • A atividade Machine Learning Classifier pode classificar seus arquivos usando um poderoso modelo de Machine Learning, que você pode treinar de acordo com suas necessidades.
  • A atividade Classificador generativo permite classificar documentos usando modelos generativos.

Validar classificação automática

Você pode conseguir isso usando a atividade attended Present Classification Station , que apresenta uma interface de usuário específica de processamento de documentos para validar e corrigir as saídas de classificação automática.

Especialmente para casos de uso em que a divisão de arquivos está envolvida, o uso da etapa de validação de classificação humana é altamente recomendável, para garantir que o processamento downstream para extração de dados funcione corretamente.

Uma alternativa para a atividade assistida está disponível por meio do uso de fluxos de trabalho de longa duração, que são projetados para habilitar de forma otimizada a colaboração humano-robô. As atividades Create Document Classification Action e Wait For Document Classification Action And Resume habilitam esse cenário.

Classificadores de trem

Você pode conseguir isso usando a atividade Train Classifiers Scope . Isso habilita o fechamento do loop de feedback para qualquer algoritmo de classificação capaz de aprender. Arraste e solte seus treinadores de classificadores dentro desta atividade Scope e habilite-os usando o assistente Configurar Classificadores para garantir que as informações validadas por humanos por meio da Estação de Classificação ou da Estação de Validação sejam usadas por seus classificadores para melhorar seu próprio desempenho.

A classificação é tão eficiente quanto os classificadores usados. Se um documento não foi classificado corretamente, significa que era desconhecido dos classificadores ativos. O Framework oferece a oportunidade de treinar os classificadores, para melhorar o reconhecimento das classes de documentos.

A seguir está uma lista dos treinadores de classificadores disponíveis:

Extrair dados de documentos

Você pode conseguir isso usando a atividade Escopo da Extração de Dados . Isso permite o uso de qualquer algoritmo de extração de dados para identificar diferentes campos em um documento classificado.

A extração está obtendo apenas os dados nos quais você está interessado de um determinado tipo de documento. Por exemplo, extrair dados específicos de um documento de 5 páginas é bastante problemático se você quiser fazer isso com manipulação de string. Nesta estrutura, você pode usar extratores diferentes, para as diferentes estruturas de documentos, no mesmo escopo de extração de dados. Os resultados da extração são passados para validação.

A seguir está uma lista de extratores disponíveis:

  • O RegEx Based Extractor é um extrator de dados básico que aplica a correspondência de expressão regular para identificar os melhores candidatos para um campo específico.
  • O Form Extractor usa modelos predefinidos para habilitar o processamento de documentos de formulário fixos e estruturados.
  • O Machine Learning Extractor aproveita o poder da IA e do Machine Learning para identificar informações em documentos estruturados ou semiestruturados usando um dos serviços de extração de dados públicos da UiPath® ou chamando modelos de Machine Learning treinados personalizados que você pode criar e hospedar em AI Center.
  • O Extrator generativo permite extrair documentos usando modelos generativos.

Valide os resultados da extração automática de dados

Você pode conseguir isso usando a atividade attended Estação de validação presente , que apresenta uma interface de usuário específica de processamento de documentos para validação e correção de dados.

  • The extracted data can be validated by a human user through the Validation Station. A best practice is to build logic around the decision of adding or not a human validation step, with rules depending on the specific use case to be implemented. Validation results can then be exported and used in further automation activities.
  • Você também pode habilitar a validação humana por meio de fluxos de trabalho de longa duração, otimizando a colaboração entre humanos e robôs, usando as atividades Criar ação de validação do documento e Aguardar a ação de validação de documento e retomar.

extratores de trem

Você pode conseguir isso usando a atividade Train Extractors Scope . Isso permite o fechamento do loop de feedback para qualquer algoritmo de extração de dados capaz de aprender. Arraste e solte seus treinadores de extratores dentro desta atividade Scope e habilite-os usando o assistente Configurar Extratores para garantir que as informações validadas por humanos através da Estação de Validação sejam usadas por seus extratores para melhorar seu próprio desempenho.

A extração é tão eficiente quanto os extratores utilizados. Se os valores dos campos não foram extraídos corretamente, significa que eles eram desconhecidos para os extratores ativos. O Framework oferece a oportunidade de treinar os extratores, para melhorar o reconhecimento dos valores de campo.

O Machine Learning Extractor Trainer fecha o loop de feedback para a extração de dados baseada em ML, coletando os dados necessários para treinar novamente um modelo de machine learning hospedado no AI Center. Esta atividade é a companheira da atividade Machine Learning Extractor .

Exportar informações extraídas

Você pode conseguir isso usando a atividade Export Extraction Results . Isso permite exportar a estrutura complexa de dados extraídos para um DataSet simples (coleção de TabelasDeDados).

Depois de ter suas informações validadas, você pode usá-las como estão ou salvá-las em um formato DataTable que pode ser convertido facilmente em um arquivo Excel.

O pacote UiPath.IntelligentOCR.Activities é compatível com qualquer classificação personalizada ou atividade de extração de dados que é criada com base no pacote público UiPath.DocumentProcessing.Contracts . Ele oferece total flexibilidade para construir seu próprio algoritmo específico para seu caso de uso, bem como integrá-lo a qualquer solução de terceiros para classificação de documentos e extração de dados.

As seguintes versões do pacote foram removidas do feed oficial. Se você tiver algum problema, entre em contato com nossas equipes de suporte.

Esta página foi útil?

Conectar

Precisa de ajuda? Suporte

Quer aprender? Academia UiPath

Tem perguntas? Fórum do UiPath

Fique por dentro das novidades