- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Sobre o pacote de atividades IntelligentOCR
O UiPath.IntelligentOCR.Activities contém a infraestrutura para habilitar os fluxos de processamento de documentos usando uma abordagem completa, aberta e extensível.
The following table shows the package versions that were removed, and the recommended version to use, instead.
Versão removida |
Versão recomendada |
---|---|
4.3.0-visualização | 4.4.0-visualização |
4.5.2 |
2.1.0 | 2.2.0 | 2.3.0 |
4.0.1 |
1.4.0 | 1.5.0 | 1.6.0 | 1.6.1 | 2.0.0 | 2.0.1 |
2.0.2 |
1.2.0 | 1.2.1 | 1.3.0 |
1.3.2 |
- A partir da versão v6.19.0 , ao instalar o pacote UiPath.IntelligentOCR.Activities em um projeto, o pacote UiPath.DocumentUnderstanding.ML.Activities também é instalado automaticamente, e você não precisa instalá-lo separadamente.
- Se você estiver usando o UiPath® Studio 2023.4.4 ou anterior, certifique-se de instalar a versão mais recente do Windows .NET 6.0 Desktop Runtime.
Atualizar o UiPath.IntelligentOCR.Activities também requer uma atualização para o pacote UiPath.UIAutomation.Activities e para o pacote UiPath.OCR.Activities , se incluídos no projeto.
UiPath.IntelligentOCR.Activities e UiPath.DocumentUnderstanding.Activities não devem ser usados juntos no mesmo projeto. O pacote UiPath.IntelligentOCR.Activities deve ser usado para fluxos de trabalho do Windows (ou Legacy), enquanto o pacote UiPath.DocumentUnderstanding.Activities deve ser usado para fluxos de trabalho multiplataforma.
.png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp
, and .pdf
.
Esta seção mostra as várias funcionalidades do pacote Intelligent.OCR.
Você pode fazer isso usando a atividade Digitize Document . Isso recupera o texto de qualquer PDF ou imagem, usando, apenas se necessário, o mecanismo OCR de sua escolha.
Como os documentos são processados um a um, eles passam pelo processo de digitalização. A diferença para documentos não digitais (digitalizados) é que você precisa aplicar o mecanismo de OCR de sua escolha. As saídas desta etapa são o Document Object Model e uma variável de string contendo todo o texto do documento e são passadas para as próximas etapas.
Você pode fazer isso usando a atividade Classify Document . Isso permite identificar que tipo de documento é um arquivo usando qualquer algoritmo de classificação.
Após a digitalização, o documento é classificado. Se você estiver trabalhando com vários tipos de documentos no mesmo projeto, para extrair os dados corretamente, você precisa saber com que tipo de documento está trabalhando. O importante é que você pode usar vários classificadores no mesmo escopo, pode configurar os classificadores e, posteriormente no framework, treiná-los. Os resultados da classificação ajudam na aplicação da estratégia correta na extração.
A lista a seguir mostra os classificadores disponíveis:
- A atividade Keyword Based Classifier é o primeiro classificador desse tipo, direcionando a classificação para documentos títulos.
- A atividade Intelligent Keyword Classifier pode não apenas classificar, mas também "dividir" arquivos que contêm vários tipos de documentos dentro deles.
- A atividade Machine Learning Classifier pode classificar seus arquivos usando um modelo de ML poderoso, que pode ser treinado de acordo com suas necessidades.
- A atividade Generative Classifier permite classificar documentos usando modelos generativos.
Você pode fazer isso usando a atividade Present Classification Station Attended , que apresenta uma interface de usuário específica do processamento de documentos para validar e corrigir as saídas de classificação automática.
Especialmente para casos de uso em que a divisão de arquivos está envolvida, o uso da etapa de validação de classificação humana é altamente recomendável, para garantir que o processamento downstream para extração de dados funcione corretamente.
Uma alternativa para a atividade assistida está disponível com o uso de Fluxos de trabalho de longa duração, projetados para habilitar de maneira otimizada a colaboração humano-robô. As atividades Create Document Classification Action e Wait For Document Classification Action And Resume habilitam este cenário.
Você pode fazer isso usando a atividade Train Classifiers Scope . Isso capacita o fechamento do ciclo de feedback para qualquer algoritmo de classificação capaz de aprender. Arraste e solte seus treinadores de classificadores dentro desta atividade do Escopo e habilite-os usando o assistente Configurar Classificadores para garantir que as informações validadas por humanos por meio da Estação de Classificação ou Estação de Validação sejam usadas por seus classificadores para melhorar seu próprio desempenho.
A classificação é tão eficiente quanto os classificadores usados. Se um documento não foi classificado corretamente, significa que era desconhecido dos classificadores ativos. O Framework oferece a oportunidade de treinar os classificadores, para melhorar o reconhecimento das classes de documentos.
A seguir está uma lista dos treinadores de classificadores disponíveis:
- O Keyword Based Classifier Trainer é a atividade do treinador emparelhada com o Classificador baseado em palavras-chave.
- O Intelligent Keyword Classifier Trainer habilita o loop de feedback para o Intelligent Keyword Classifier.
- O Machine Learning Classifier Trainer é a atividade do treinador emparelhada com o Machine Learning Classifier.
Você pode fazer isso usando a atividade Data Extraction Scope . Isso permite o uso de qualquer algoritmo de extração de dados para identificar diferentes campos em um documento classificado.
A extração está obtendo apenas os dados nos quais você está interessado de um determinado tipo de documento. Por exemplo, extrair dados específicos de um documento de 5 páginas é bastante problemático se você quiser fazer isso com manipulação de string. Nesta estrutura, você pode usar extratores diferentes, para as diferentes estruturas de documentos, no mesmo escopo de extração de dados. Os resultados da extração são passados para validação.
A seguir está uma lista de extratores disponíveis:
- O RegEx Based Extractor é um extrator de dados básico que aplica a correspondência de expressões regulares para identificar os melhores candidatos para um campo específico.
- O Form Extractor usa modelos predefinidos para habilitar o processamento de documentos de formulário fixo e estruturado.
- O Machine Learning Extractor aproveita o poder da IA e do Machine Learning para identificar informações em documentos estruturados ou semiestruturados, usando um dos serviços públicos de extração de dados da UiPath® ou chamando modelos de Machine Learning treinados personalizados que você pode construir e hospedar em AI Center. Essa atividade faz parte do pacote UiPath.DocumentUnderstanding.ML.Activities .
- O Extrator generativo permite extrair documentos usando modelos generativos. Essa atividade faz parte do pacote UiPath.DocumentUnderstanding.ML.Activities .
Você pode fazer isso usando a atividade Present Validation Station Attended , que apresenta uma interface de usuário específica de processamento de documentos para validação e correção de dados.
- Os dados extraídos podem ser validados por um usuário humano através da Estação de Validação. Uma boa prática é construir uma lógica em torno da decisão de adicionar ou não uma etapa de validação humana, com regras dependendo do caso de uso específico a ser implementado. Os resultados da validação podem ser exportados e usados em outras atividades de automação.
- You can also enable human validation through long-running workflows, optimizing human-robot collaboration, using the Create Document Validation Action and Wait for Document Validation Action and Resume activities.
Você pode fazer isso usando a atividade Train Extractors Scope . Isso capacita o fechamento do ciclo de feedback para qualquer algoritmo de extração de dados capaz de aprender. Arraste e solte seus treinadores de extratores dentro desta atividade do Escopo e habilite-os usando o assistente Configurar Extratores para garantir que as informações validadas por humanos por meio da Estação de Validação sejam usadas por seus extratores para melhorar seu próprio desempenho.
A extração é tão eficiente quanto os extratores utilizados. Se os valores dos campos não foram extraídos corretamente, significa que eles eram desconhecidos para os extratores ativos. O Framework oferece a oportunidade de treinar os extratores, para melhorar o reconhecimento dos valores de campo.
O Machine Learning Extractor Trainer fecha o loop de feedback para a extração de dados baseada em ML, coletando os dados necessários para um novo treinamento de um modelo de Machine Learning hospedado no AI Center. Essa atividade funciona em conjunto com o Machine Learning Extractor e faz parte do pacote UiPath.DocumentUnderstanding.ML.Activities .
Você pode fazer isso usando a atividade Export Extraction Results . Isso permite exportar a estrutura complexa dos dados extraídos para um DataSet simples (conjunto de DataTables).
Depois de ter suas informações validadas, você pode usá-las como estão ou salvá-las em um formato DataTable que pode ser convertido facilmente em um arquivo Excel.
O pacote UiPath.IntelligentOCR.Activities é compatível com qualquer classificação personalizada ou atividade de extração de dados que seja criada com base no pacote público UiPath.DocumentProcessing.Contracts . Ele oferece total flexibilidade para construir seu próprio algoritmo específico para seu caso de uso, além de integrá-lo com qualquer solução de terceiros para classificação de documentos e extração de dados.
As seguintes versões do pacote foram removidas do feed oficial. Se você tiver algum problema, entre em contato com nossas equipes de suporte.
- Replacing removed versions
- Importante
- Compatibilidade da versão
- Formatos suportados
- Suporte para a linguagem de projeto C#
- Funcionalidades
- Digitalize documentos
- Classifique documentos
- Validate automatic classification
- Classificadores de trem
- Extrair dados de documentos
- Valide os resultados da extração automática de dados
- extratores de trem
- Exportar informações extraídas