- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Processo do Document Understanding - Modelo do Studio
- Document Understanding
- Notas de versão
- About the Document Understanding activity package
- Compatibilidade do projeto
- Dados do documento
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- About the IntelligentOCR activity package
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Intelligent Keyword Classifier
- Present Classification Station
- Create Document Classification Action
- Wait For Document Classification Action And Resume
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Validation Station
A extração e validação de dados pode ser divertida e fácil ao usar o assistente da Estação de Validação. Abaixo, você encontra detalhes sobre a criação de um fluxo de trabalho que inclui atividades como Digitize Document, Data Extraction Scopee Present Validation Station.
Você pode usar essas atividades quando precisar automatizar a extração e validação de dados de documentos do mesmo tipo. Faturas ou ordens de compra são uma ótima opção para esse tipo de tarefa.
The below workflow focuses on using the Digitize Document activity on an Invoice, followed by validating the information with the use of the Present Validation Station activity. The OCR engine chosen for this workflow is UiPath® Document OCR but feel free to replace it with any other of our OCR engines.
A taxonomia também é simples, criada com base no documento de fatura usado. Aqui estão mais detalhes sobre como criar sua taxonomia.
Como criar o fluxo de trabalho
É assim que um processo de automação pode ser construído:
- Abra o Studio e crie um novo Processo nomeado por padrão Principal.
- Arraste um contêiner Sequência para o Designer de Fluxo de Trabalho.
-
Selecione o contêiner Sequence e crie a seguinte variável:
Nome da variável
Tipo de Variável
Valor Padrão
taxonomy
DocumentTaxonomy
-
Arraste uma atividade Carregar taxonomia para dentro do contêiner Sequência .
- Adicione a variável
taxonomy
no capo Taxonomia.
- Adicione a variável
-
Arraste uma atividade For Each abaixo da atividade Load Taxonomy.
- Adicione a expressão
doc
no campo ParaCada. - Adicione a expressão
directory.GetFiles("TestData\InputDocs\")
no campo Em. - No painel Propriedades, selecione a opção String da lista suspensa ArgumentoDeTipo.
- Adicione a expressão
-
Selecione o container Corpo da atividade For Each e crie as seguintes variáveis:
Nome da variável
Tipo de Variável
Valor Padrão
docName
GenericValue
dom
Documento
text
String
extractionResults
ExtractionResult
validatedResults
ExtractionResult
-
Adicione uma atividade Assign dentro do contêiner Corpo.
- Adicione a variável
docName
no campo Para. - Adicione a expressão
System.IO.Path.GetFileNameWithoutExtension(doc)
no campo Valor.
- Adicione a variável
-
Adicione uma atividade Write Line abaixo da atividade Assign.
- Adicione a expressão
"Digitizing "+docName
no campo Texto.
- Adicione a expressão
-
Adicione uma atividade Digitalizar documento abaixo da atividade Escrever linha .
- Defina o DocumentPath como
doc
. - Adicione a variável
text
no campo TextoDoDocumento. - Adicione a variável
dom
no campo DocumentObjectModel .
- Defina o DocumentPath como
- Arraste um mecanismo de OCR para a atividade Digitalizar documento . UiPath Document OCR é usado para este exemplo.
-
Adicione uma atividade Escrever linha abaixo da atividade Digitalizar documento .
- Adicione a expressão
docName+" was digitized."
no campo Texto.
- Adicione a expressão
-
Adicione uma atividade Write Line abaixo da atividade Write Line.
- Adicione a expressão
"Opening the Validation Station"
no campo Texto.
- Adicione a expressão
- Adicione uma atividade Try Catch abaixo da atividade Write Line.
- Adicione um contêiner Sequence na seção Try .
-
Adicione uma atividade Present Validation Station dentro do container Sequence .
- Adicione
doc
como valor no campo DocumentPath . - Adicione a variável
text
no campo TextoDoDocumento. - Adicione a variável
dom
no campo DocumentObjectMOdel . - Adicione a variável
taxonomy
no capo Taxonomia. - Adicione a variável
extractedResults
no campo AutomaticExtractionResults . - Adicione a variável
validatedResults
no campo ValidatedExtractionResults .
- Adicione
- Adicione uma atividade Gravar Arquivo de Texto abaixo da atividade Apresentar Estação de Validação .
- Execute o processo. O robô extrai dados automaticamente, classifica os documentos, extrai campos específicos, prepara os dados para validação e exibe os documentos extraídos.
Baixe o exemplo aqui.
Usando a Estação de Validação
A execução do fluxo de trabalho abre o assistente Estação de validação . Aqui você pode verificar as informações extraídas ou extraí-las você mesmo usando as opções Tokens ou Área Personalizada . Se você definir um campo na taxonomia como multivalor, vários valores poderão ser extraídos para esse campo. Isso pode ser útil para documentos com vários endereços, diferentes moedas, etc.
Vamos ver como você pode alternar entre as opções Tokens ou Custom Area .
Aqui está um exemplo de como adicionar um valor extra a um campo.
Mais informações sobre como usar e personalizar a Estação de Validação podem ser encontradas aqui.