- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Processo do Document Understanding - Modelo do Studio
- Document Understanding
- Notas de versão
- About the Document Understanding activity package
- Compatibilidade do projeto
- Dados do documento
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- About the IntelligentOCR activity package
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Intelligent Keyword Classifier
- Present Classification Station
- Create Document Classification Action
- Wait For Document Classification Action And Resume
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Validação manual para digitalizar documentos
- Extração de dados com base em âncoras usando a atividade Intelligent Form Extractor
- Validation Station
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Validação manual para digitalizar documentos
O exemplo abaixo explica como extrair manualmente dados de uma imagem e apresentar a saída em um arquivo separado. Ele apresenta atividades como Digitize Document ou Present Validation Station. Essas atividades podem ser encontradas no pacote UiPath.IntelligentOCR.Activities .
É assim que um processo de automação pode ser construído:
-
Abra o Studio e crie um novo Processo nomeado por padrão Principal.
Nota: Certifique-se de adicionar todos os arquivos necessários (.json
arquivos e todas as imagens) dentro da pasta do projeto. -
Arraste um contêiner Sequência para dentro do Designer de fluxo de trabalho e crie as seguintes variáveis:
Nome da variável
Tipo de Variável
Valor Padrão
Text
String
DOM
UiPath.DocumentProcessing.Contracts.Dom.Document
Data
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
DocumentTaxonomy
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
TaxonomyJSON
String
HumanValidated
UiPath.DocumentProcessing.Contracts.Results.ExtractionResult
-
Arraste uma atividade Ler arquivo de texto dentro da sequência.
- No painel Propriedades, adicione o nome do arquivo, neste caso
"taxonomy.json"
, no campo NomeDoArquivo. - Adicione a variável
TaxonomyJSON
no campo Conteúdo.
- No painel Propriedades, adicione o nome do arquivo, neste caso
-
Adicione uma atividade Atribuir abaixo da atividade Ler arquivo de texto .
- Adicione a variável
Data
no campo Para e a expressãoDocumentTaxonomy.Deserialize(TaxonomyJSON)
no campo Valor . Esta atividade constrói a taxonomia para extração.
- Adicione a variável
-
Arraste uma atividade Digitalizar documento abaixo da atividade Atribuir .
- No painel Propriedades, adicione o valor
1
no campo GrauDeParalelismo. - Adicione a expressão
"Input\Invoice01.tif"
no campo Caminho do documento. - Adicione a variável
DOM
no campo DocumentObjectModel . - Adicione a variável
Text
no campo TextoDoDocumento.
- No painel Propriedades, adicione o valor
-
Solte um mecanismo de OCR do Google na atividade Digitalizar documento .
- No painel Propriedades, adicione a variável
Image
ao campo Imagem. - Marque a caixa de seleção da opção ExtractWords . Esta opção extrai a posição na tela de todas as palavras detectadas.
- Adicione a expressão
"eng"
no campo Idioma. - Selecione a opção
Legacy
na lista suspensa Perfil. - Adicione o valor
2
ao campo Escala.
- No painel Propriedades, adicione a variável
-
Coloque uma atividade Estação de Validação Presente abaixo da atividade Digitalizar Documento .
- No painel Propriedades , adicione a variável
DOM
no campo DocumentObjectModel . - Adicione a expressão
"Input\Invoice01.tif"
no campo Caminho do documento. - Adicione a variável
Text
no campo TextoDoDocumento. - Adicione a variável
Data
no capo Taxonomia. - Adicione a variável
HumanValidated
no campo ValidatedExtractionResults .
- No painel Propriedades , adicione a variável
-
Arraste uma atividade Para Cada sob a atividade Estação de Validação Presente .
- No painel Propriedades, selecione a opção
UiPath.DocumentProcessing.Contracts.Results.ResultsDataPoint
da lista suspensa ArgumentoDeTipo. - Adicione a expressão
HumanValidated.ResultsDocument.Fields
no campo Valores.
- No painel Propriedades, selecione a opção
-
Arraste uma atividade Log Message para dentro do corpo da atividade For Each .
- Selecione a opção
Info
na lista suspensa Nível. - Adicione a expressão
item.FieldName
no campo Mensagem.
- Selecione a opção
-
Arraste uma atividade Log Message abaixo da primeira atividade Log Message.
- Selecione a opção
Info
na lista suspensa Nível. - Adicione a expressão
item.Values(0).Value.ToString
no campo Mensagem.
- Selecione a opção
-
Arraste uma atividade Write Line para as atividades Log Message .
- Adicione o valor
""
no campo Texto.
- Adicione o valor
- Execute o processo. O robô usa as atividades do IntelligentOCR para processar manualmente os dados e apresentar os resultados.
Baixe o exemplo aqui.