activities

latest

false

Importante :

A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Atividades de Document Understanding

Última atualização 3 de mar de 2025

Sobre o pacote de atividades IntelligentOCR

O UiPath.IntelligentOCR.Activities contém a infraestrutura para habilitar os fluxos de processamento de documentos usando uma abordagem completa, aberta e extensível.

Substituição de versões removidas

A tabela a seguir mostra as versões do pacote que foram removidas e, em vez disso, a versão recomendada para usar.

Tabela 1. As versões removidas e suas substituições recomendadas
	Versão recomendada
4.3.0-visualização \| 4.4.0-visualização	4.5.2
2.1.0 \| 2.2.0 \| 2.3.0	4.0.1
1.4.0 \| 1.5.0 \| 1.6.0 \| 1.6.1 \| 2.0.0 \| 2.0.1	2.0.2
1.2.0 \| 1.2.1 \| 1.3.0	1.3.2

Importante

A partir da versão v6.19.0 , ao instalar o pacote UiPath.IntelligentOCR.Activities em um projeto, o pacote UiPath.DocumentUnderstanding.ML.Activities também é instalado automaticamente, e você não precisa instalá-lo separadamente.
Se você estiver usando o UiPath® Studio 2023.4.4 ou anterior, certifique-se de instalar a versão mais recente do Windows . NET 6.0 Desktop Runtime.

Compatibilidade da versão

Atualizar o UiPath.IntelligentOCR.Activities também requer uma atualização para o pacote UiPath.UIAutomation.Activities e para o pacote UiPath.OCR.Activities , se incluídos no projeto.

UiPath.IntelligentOCR.Activities e UiPath.DocumentUnderstanding.Activities não devem ser usados juntos no mesmo projeto. O pacote UiPath.IntelligentOCR.Activities deve ser usado para fluxos de trabalho do Windows (ou Legacy), enquanto o pacote UiPath.DocumentUnderstanding.Activities deve ser usado para fluxos de trabalho multiplataforma.

Formatos suportados

O pacote de atividades IntelligentOCR pode ser compatível com qualquer um dos seguintes tipos de arquivo: .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp e .pdf.

Suporte para a linguagem de projeto C#

A partir da versão 4.10.0, este pacote de atividades é validado para uso em projetos C#.

Funcionalidades

Esta seção mostra as várias funcionalidades do pacote Intelligent.OCR.

Digitalize documentos

Você pode fazer isso usando a atividade Digitize Document . Isso recupera o texto de qualquer PDF ou imagem, usando, apenas se necessário, o mecanismo OCR de sua escolha.

Como os documentos são processados um a um, eles passam pelo processo de digitalização. A diferença para documentos não digitais (digitalizados) é que você precisa aplicar o mecanismo de OCR de sua escolha. As saídas desta etapa são o Document Object Model e uma variável de string contendo todo o texto do documento e são passadas para as próximas etapas.

Classifique documentos

Você pode fazer isso usando a atividade Classify Document . Isso permite identificar que tipo de documento é um arquivo usando qualquer algoritmo de classificação.

Após a digitalização, o documento é classificado. Se você estiver trabalhando com vários tipos de documentos no mesmo projeto, para extrair os dados corretamente, você precisa saber com que tipo de documento está trabalhando. O importante é que você pode usar vários classificadores no mesmo escopo, pode configurar os classificadores e, posteriormente no framework, treiná-los. Os resultados da classificação ajudam na aplicação da estratégia correta na extração.

A lista a seguir mostra os classificadores disponíveis:

A atividade Keyword Based Classifier é o primeiro classificador desse tipo, direcionando a classificação para documentos títulos.
A atividade Intelligent Keyword Classifier pode não apenas classificar, mas também "dividir" arquivos que contêm vários tipos de documentos dentro deles.
A atividade Machine Learning Classifier pode classificar seus arquivos usando um poderoso modelo de Machine Learning, que você pode treinar de acordo com suas necessidades.
A atividade Generative Classifier permite classificar documentos usando modelos generativos.

Validar classificação automática

Você pode fazer isso usando a atividade Present Classification Station Attended , que apresenta uma interface de usuário específica do processamento de documentos para validar e corrigir as saídas de classificação automática.

Especialmente para casos de uso em que a divisão de arquivos está envolvida, o uso da etapa de validação de classificação humana é altamente recomendável, para garantir que o processamento downstream para extração de dados funcione corretamente.

Uma alternativa para a atividade assistida está disponível com o uso de Fluxos de trabalho de longa duração, projetados para habilitar de maneira otimizada a colaboração humano-robô. As atividades Create Document Classification Action e Wait For Document Classification Action And Resume habilitam este cenário.

Classificadores de trem

Você pode fazer isso usando a atividade Train Classifiers Scope . Isso capacita o fechamento do ciclo de feedback para qualquer algoritmo de classificação capaz de aprender. Arraste e solte seus treinadores de classificadores dentro desta atividade do Escopo e habilite-os usando o assistente Configurar Classificadores para garantir que as informações validadas por humanos por meio da Estação de Classificação ou Estação de Validação sejam usadas por seus classificadores para melhorar seu próprio desempenho.

A classificação é tão eficiente quanto os classificadores usados. Se um documento não foi classificado corretamente, significa que era desconhecido dos classificadores ativos. O Framework oferece a oportunidade de treinar os classificadores, para melhorar o reconhecimento das classes de documentos.

A seguir está uma lista dos treinadores de classificadores disponíveis:

O Keyword Based Classifier Trainer é a atividade do treinador emparelhada com o Classificador baseado em palavras-chave.
O Intelligent Keyword Classifier Trainer habilita o loop de feedback para o Intelligent Keyword Classifier.
O Machine Learning Classifier Trainer é a atividade do treinador emparelhada com o Machine Learning Classifier.

Extrair dados de documentos

Você pode fazer isso usando a atividade Data Extraction Scope . Isso permite o uso de qualquer algoritmo de extração de dados para identificar diferentes campos em um documento classificado.

A extração está obtendo apenas os dados nos quais você está interessado de um determinado tipo de documento. Por exemplo, extrair dados específicos de um documento de 5 páginas é bastante problemático se você quiser fazer isso com manipulação de string. Nesta estrutura, você pode usar extratores diferentes, para as diferentes estruturas de documentos, no mesmo escopo de extração de dados. Os resultados da extração são passados para validação.

A seguir está uma lista de extratores disponíveis:

O RegEx Based Extractor é um extrator de dados básico que aplica a correspondência de expressões regulares para identificar os melhores candidatos para um campo específico.
O Form Extractor usa modelos predefinidos para habilitar o processamento de documentos de formulário fixo e estruturado.
O Machine Learning Extractor aproveita o poder da IA e do Machine Learning para identificar informações em documentos estruturados ou semiestruturados usando um dos serviços de extração de dados públicos da UiPath® ou chamando modelos de Machine Learning treinados personalizados que você pode criar e hospedar no AI Center.Essa atividade faz parte do pacote UiPath.DocumentUnderstanding.ML.Activities.
O Extrator generativo permite extrair documentos usando modelos generativos. Essa atividade faz parte do pacote UiPath.DocumentUnderstanding.ML.Activities .

Valide os resultados da extração automática de dados

Você pode fazer isso usando a atividade Present Validation Station Attended , que apresenta uma interface de usuário específica de processamento de documentos para validação e correção de dados.

Os dados extraídos podem ser validados por um usuário humano através da Estação de Validação. Uma boa prática é construir uma lógica em torno da decisão de adicionar ou não uma etapa de validação humana, com regras dependendo do caso de uso específico a ser implementado. Os resultados da validação podem ser exportados e usados em outras atividades de automação.
Você também pode habilitar a validação humana por meio de fluxos de trabalho de longa duração, otimizando a colaboração entre humanos e robôs, usando as atividades Criar ação de validação do documento e Aguardar a ação de validação de documento e retomar.

extratores de trem

Você pode fazer isso usando a atividade Train Extractors Scope . Isso capacita o fechamento do ciclo de feedback para qualquer algoritmo de extração de dados capaz de aprender. Arraste e solte seus treinadores de extratores dentro desta atividade do Escopo e habilite-os usando o assistente Configurar Extratores para garantir que as informações validadas por humanos por meio da Estação de Validação sejam usadas por seus extratores para melhorar seu próprio desempenho.

A extração é tão eficiente quanto os extratores utilizados. Se os valores dos campos não foram extraídos corretamente, significa que eles eram desconhecidos para os extratores ativos. O Framework oferece a oportunidade de treinar os extratores, para melhorar o reconhecimento dos valores de campo.

O Machine Learning Extractor Trainer fecha o loop de feedback para a extração de dados baseada em ML, coletando os dados necessários para um novo treinamento de um modelo de Machine Learning hospedado no AI Center. Essa atividade funciona em conjunto com o Machine Learning Extractor e faz parte do pacote UiPath.DocumentUnderstanding.ML.Activities .

Exportar informações extraídas

Você pode fazer isso usando a atividade Export Extraction Results . Isso permite exportar a estrutura complexa dos dados extraídos para um DataSet simples (conjunto de DataTables).

Depois de ter suas informações validadas, você pode usá-las como estão ou salvá-las em um formato DataTable que pode ser convertido facilmente em um arquivo Excel.

O pacote UiPath.IntelligentOCR.Activities é compatível com qualquer classificação personalizada ou atividade de extração de dados que seja criada com base no pacote público UiPath.DocumentProcessing.Contracts . Ele oferece total flexibilidade para construir seu próprio algoritmo específico para seu caso de uso, além de integrá-lo com qualquer solução de terceiros para classificação de documentos e extração de dados.

As seguintes versões do pacote foram removidas do feed oficial. Se você tiver algum problema, entre em contato com nossas equipes de suporte.

Nesta página