- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded

Atividades do Document Understanding
Validação manual para digitalizar documentos
O exemplo abaixo explica como extrair manualmente dados de uma imagem e apresentar a saída em um arquivo separado. Ele apresenta atividades como Digitize Document ou Present Validation Station. Você pode encontrar essas atividades no pacote UiPath.IntelligentOCR.Activities .
This workflow is using an older version of the UiPath.IntelligentOCR.Activities package.
Steps:
-
Abra o Studio e crie um novo Processo nomeado por padrão Principal.
Observação:Make sure to add all the needed files (
.jsonfiles and all the images) inside the project folder. -
Adicione um contêiner Sequência no Designer de fluxo de trabalho e crie as variáveis mostradas na tabela a seguir:
Tabela 1. Variáveis a serem criadas
Tipo de Variável Valor Padrão TextString DOMUiPath.DocumentProcessing.Contracts.Dom.Document DataUiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy DocumentTaxonomyUiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy TaxonomyJSONString HumanValidatedUiPath.DocumentProcessing.Contracts.Results.ExtractionResult -
Adicione uma atividade Read Text File dentro da sequência.
- In the Properties panel, add the name of the file, in this case
"taxonomy.json", in the FileName field. - Add the variable
TaxonomyJSONin the Content field.
- In the Properties panel, add the name of the file, in this case
-
Adicione uma atividade Atribuir após a atividade Read Text File.
- Add the variable
Datain the To field and the expressionDocumentTaxonomy.Deserialize(TaxonomyJSON)in the Value field. This activity builds the taxonomy for extraction.
- Add the variable
-
Adicione uma atividade Digitalizar documento após a atividade Atribuir.
- In the Properties panel, add the value
1in the DegreeOfParallelism field. - Add the expression
"Input\Invoice01.tif"in the DocumentPath field. - Add the variable
DOMin the DocumentObjectModel field. - Add the variable
Textin the DocumentText field.
- In the Properties panel, add the value
-
Adicione um mecanismo de Google OCR dentro da atividade Digitalizar Documento.
- No painel Propriedades, adicione a variável
Imageao campo Imagem. - Select the check box for the ExtractWords option. This option extracts the on-screen position of all detected words.
- Add the expression
"eng"in the Language field. - Select the option
Legacyfrom the Profile drop-down list. - Adicione o valor
2ao campo Escala.
- No painel Propriedades, adicione a variável
-
Adicione uma atividade Estação de validação presente após a atividade Digitalizar Documento.
- In the Properties panel, add the variable
DOMin the DocumentObjectModel field. - Add the expression
"Input\Invoice01.tif"in the DocumentPath field. - Add the variable
Textin the DocumentText field. - Add the variable
Datain the Taxonomy field. - Add the variable
HumanValidatedin the ValidatedExtractionResults field.
- In the Properties panel, add the variable
-
Adicione uma atividade For Each na atividade Estação de validação presente.
- In the Properties panel, select the option
UiPath.DocumentProcessing.Contracts.Results.ResultsDataPointfrom the TypeArgument drop-down list. - Add the expression
HumanValidated.ResultsDocument.Fieldsin the Values field.
- In the Properties panel, select the option
-
Add a Log Message activity inside the Body of the For Each activity.
- Select the option
Infofrom the Level drop-down list. - Adicione a expressão
item.FieldNameno campo Mensagem.
- Select the option
-
Adicione uma atividade Mensagem do log abaixo da primeira atividade Mensagem do log.
- Selecione a opção
Infona lista suspensa Nível . - Adicione a expressão
item.Values(0).Value.ToStringno campo Mensagem.
- Selecione a opção
-
Adicione uma atividade Write Line nas atividades Mensagem do Log.
- Adicione o valor
""no campo Texto.
- Adicione o valor
-
Execute o processo. O robô usa as atividades do IntelligentOCR para processar manualmente os dados e apresentar os resultados.
Acesse o link a seguir para baixar o exemplo como um arquivo ZIP : Exemplo.