- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades de Document Understanding
Validation Station
Esta página mostra como criar um fluxo de trabalho que inclua atividades como Digitalizar Documento, Escopo da extração de dados e Estação de validação presente.
Você pode usar essas atividades quando quiser automatizar a extração e validação de dados a partir de documentos do mesmo tipo. As faturas ou ordens de compra são um ótimo ajuste para esse tipo de tarefas.
O fluxo de trabalho a seguir concentra-se no uso da atividade Digitalizar documento em uma fatura, seguido da validação das informações com o uso da atividade Estação de validação presente. O mecanismo de OCR escolhido para esse fluxo de trabalho é o UiPath® Document OCR, mas você pode substituí-lo por qualquer outro dos nossos mecanismos de OCR. Uma taxonomia simples é usada, criada com base no documento de fatura escolhido. Acesse Visão geral da taxonomia para verificar como criar sua taxonomia.
- Abra o Studio e crie um novo Processo nomeado por padrão Principal.
- Arraste um contêiner Sequência para o Designer de Fluxo de Trabalho.
- Selecione o contêiner Sequence e crie a seguinte variável:
- Nome da variável:
taxonomy
; - Tipo de variável: DocumentTaxonomy;
- Valor padrão: nenhum.
- Nome da variável:
- Adicione uma atividade Carregar Taxonomia dentro do contêiner Sequência.
Adicione a variável
taxonomy
no capo Taxonomia. - Adicione uma atividade For Each após a atividade Carregar Taxonomia e dentro do contêiner Sequência.
- Adicione a expressão
doc
no campo ParaCada. - Adicione a expressão
directory.GetFiles("TestData\InputDocs\")
no campo Em. - No painel Propriedades, selecione a opção String da lista suspensa ArgumentoDeTipo.
- Adicione a expressão
- Selecione o contêiner Corpo da atividade For Each e crie as variáveis exibidas na tabela a seguir:
Tabela 1. As variáveis a serem criadas Tipo de Variável
Valor Padrão
docName
GenericValue
N/A dom
Documento
N/A text
String
N/A extractionResults
ExtractionResult
N/A validatedResults
ExtractionResult
N/A - Adicione uma atividade Assign dentro do contêiner Corpo.
- Adicione a variável
docName
no campo Para. - Adicione a expressão
System.IO.Path.GetFileNameWithoutExtension(doc)
no campo Valor.
- Adicione a variável
- Adicione uma atividade Write Line após a atividade Atribuir.
Adicione a expressão
"Digitizing "+docName
no campo Texto. - Adicione uma atividade Digitalizar Documento após a atividade Write Line.
- Defina o DocumentPath como
doc
. - Adicione a variável
text
no campo TextoDoDocumento. - Adicione a variável
dom
no campo DocumentObjectModel .
- Defina o DocumentPath como
- Arraste um mecanismo de OCR para a atividade Digitalizar documento . UiPath Document OCR é usado para este exemplo.
- Adicione uma atividade Write Line após a atividade Digitize Document .
Adicione a expressão
docName+" was digitized."
no campo Texto. - Adicione uma atividade Write Line após a atividade Write Line.
Adicione a expressão
"Opening the Validation Station"
no campo Texto. - Adicione uma atividade Try Catch após a atividade Write Line.
- Adicione um contêiner Sequence na seção Try .
- Adicione uma atividade Present Validation Station dentro do container Sequence .
- Adicione
doc
como valor no campo DocumentPath . - Adicione a variável
text
no campo TextoDoDocumento. - Adicione a variável
dom
no campo DocumentObjectMOdel . - Adicione a variável
taxonomy
no capo Taxonomia. - Adicione a variável
extractedResults
no campo AutomaticExtractionResults . - Adicione a variável
validatedResults
no campo ValidatedExtractionResults .
- Adicione
- Adicione uma atividade Gravar Arquivo de Texto após a atividade Estação de validação presente.
- Execute o processo. O robô extrai dados automaticamente, classifica os documentos, extrai campos específicos, prepara os dados para validação e exibe os documentos extraídos.
ZIP
do exemplo: Exemplo.
A execução do fluxo de trabalho abre o assistente Estação de validação . Aqui você pode verificar as informações extraídas ou extraí-las você mesmo usando as opções Tokens ou Área Personalizada . Se você definir um campo na taxonomia como multivalor, vários valores poderão ser extraídos para esse campo. Isso pode ser útil para documentos com vários endereços, diferentes moedas, etc.