- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded

Atividades do Document Understanding
Escopo de Extratores de Treinamento
UiPath.IntelligentOCR.Activities.Training.TrainExtractors
Description
Fornece um escopo para quaisquer atividades de extrator que você deseja treinar. Você deve adicionar as atividades do extrator dentro desse escopo.
Compatibilidade do projeto
Windows-Legacy | Windows
Propriedades
Painel de Propriedades
Comum
- DisplayName - O nome de exibição da atividade.
Entrada
- ModeloDeObjetoDeDocumento — o modelo de objeto do documento que você deseja usar para validar o documento. Este modelo é armazenado em uma variável
Documente pode ser recuperado da atividade Digitize Document . Acesse Digitize Document para saber como conseguir isso. Este campo é compatível apenas com variáveisDocument. - DocumentPath - The path to the document you want to validate. This field supports only strings and
Stringvariables.Observação:The supported file types for this property field are:
.png,.gif,.jpe,.jpg,.jpeg,.tiff,.tif,.bmp, and.pdf. - DocumentText - The text of the document itself, stored in a String variable. This value can be retrieved from the Digitize Document activity. Visit Digitize Document to learn how to achieve this. This field supports only strings and
Stringvariables. - HumanValidatedData - The output from the Validation Station, stored in an
ExtractionResultproprietary variable.Observação:If the DocumentObjectModel and HumanValidatedData files are from different sources, an error is thrown at runtime.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Usando o Assistente para configurar extratores
-
Add a Train Extractors Scope activity to your workflow.
-
In the Properties panel, add your custom configurations in the DocumentObjectModel, DocumentPath, DocumentText and HumanValidatedData fields.
-
Add an extractor trainer activity (for instance, Machine Learning Extractor Trainer), or create a custom activity for extractor training by implementing the classes and place it inside the Train Extractors Scope activity.
-
To configure your extractors, select Configure Extractors. You can now see the Configure Extractors wizard.
Figure 1. Overview of the Configure Extractors wizard

-
Para usar um extrator específico em um tipo de documento inteiro ou um campo específico dentro desse documento, selecione as caixas de seleção ao lado do tipo ou campos de documento. Ao selecionar um tipo de documento inteiro, todos os campos correspondentes também serão selecionados automaticamente.
Figure 2. Animated image showing the process of selecting document types or corresponding fields for extraction

-
-
Select Get of refresh extractor capabilities, for the extractors that support this functionality, to map your taxonomy fields with the available extractor fields, or refresh them in case the extractor fields have changed. After you configure the capabilities, select Get Capabilities, to reflect the changes in the Configure Extractors wizard.
Figure 3. Animated image showing the process of refreshing the extractor capabilities for a Machine Learning Extractor

-
To train the extractor based on its extraction result, start by entering any alphanumeric value in the Framework Alias field. After this, go on to set the exact value in the corresponding Framework Alias field of one or more trainers. This creates a link between the extractor and the respective trainer(s).
-
Select Save once all the extractors are selected.
Integração de Compreensão de Documentos
The Train Extractors Scope activity is part of the Document Understanding solutions. Visit the Document Understanding Guide for more information.