- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades do Document Understanding
UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer
Description
Habilita a coleção de dados que foram processados por meio da Estação de validação para que possam ser importados para o Document Manager. Esta atividade pode ser usada apenas dentro da atividade Train Extractors Scope .
Compatibilidade do projeto
Windows-Legacy | Windows
Configuração
Painel do Designer
Armazenamento local
- Output Folder - The directory where the collected data is stored. Once the data is stored, it can be imported into machine learning training tools.
Selecionar conjunto de dados privado para projeto
- Conjunto de dados - O conjunto de dados no qual os dados de treinamento podem ser carregados. Se o robô estiver conectado a um tenant que tenha o AI Center habilitado, você pode ver todos os conjuntos de dados do AI Center no menu suspenso e selecionar a pasta na qual carregar os documentos validados usando o menu suspenso.
- Project - The project where the training data can be uploaded.
Observação:
A seleção de projeto e conjunto de dados é habilitada apenas quando conectado ao Orchestrator. Acesse Gerenciamento de conjuntos de dados para obter mais informações sobre Conjuntos de dados públicos/privados.
Fornecer endpoint de conjunto de dados público
- Dataset ApiKey - The authentication key of the dataset.
- Ponto de extremidade do conjunto de dados - O ponto de extremidade do conjunto de dados no qual os dados de treinamento podem ser carregados. Depois que um conjunto de dados é público, ele pode ser acessado fora do ambiente da UiPath® por meio de um ponto de extremidade e usando a chave de API. Faça isso se você quiser carregar conjuntos de dados para uma instância do AI Center à qual você não esteja conectado (por exemplo, no caso de implantações híbridas em que o AI Center está na nuvem e o robô está conectado a um tenant local).
Painel de Propriedades
Comum
- DisplayName - O nome de exibição da atividade.
Armazenamento local
- Output Folder - The directory where the collected data is stored. Once the data is stored, it can be imported into machine learning training tools.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Fornecer endpoint de conjunto de dados público
- Dataset ApiKey - The authentication key of the dataset.
- Ponto de extremidade do conjunto de dados - O ponto de extremidade do conjunto de dados no qual os dados de treinamento podem ser carregados. Depois que um conjunto de dados é público, ele pode ser acessado fora do ambiente da UiPath® por meio de um ponto de extremidade e usando a chave de API. Faça isso se você quiser carregar conjuntos de dados para uma instância do AI Center à qual você não esteja conectado (por exemplo, no caso de implantações híbridas em que o AI Center está na nuvem e o robô está conectado a um tenant local).
Selecionar conjunto de dados privado para projeto
- Conjunto de dados - O conjunto de dados no qual os dados de treinamento podem ser carregados. Se o robô estiver conectado a um tenant que tenha o AI Center habilitado, você pode ver todos os conjuntos de dados do AI Center no menu suspenso e selecionar a pasta na qual carregar os documentos validados usando o menu suspenso.
- Project - The project where the training data can be uploaded.
Observação:
A seleção de projeto e conjunto de dados é habilitada apenas quando conectado ao Orchestrator. Acesse Gerenciamento de conjuntos de dados para obter mais informações sobre Conjuntos de dados públicos/privados.
Servidor
- RetryOnFailure - Retry on transient failure. This field only supports Boolean values (True, False). The default value is True.
- Timeout (milliseconds) - Specifies the amount of time (in milliseconds) to wait for a response from the server before an error is thrown. The default value is 100000 milliseconds (100 seconds).
Usando o assistente de treinamento do extrator de aprendizado de máquina
O Machine Learning Extractor Trainer coleta o feedback humano para você, em um diretório de sua escolha. Depois de coletar dados e quiser treinar novamente um Modelo de ML, você pode simplesmente compactar o conteúdo do diretório e carregá-lo no Document Manager para coletar e filtrar dados.
Como usar
Para usar a atividade Machine Learning Extractor Trainer, execute as seguintes etapas:
-
Use o assistente do Gerenciador de Taxonomia para definir seus tipos de documento e campos.
-
Adicione um Machine Learning Extractor Trainer a uma atividade Train Extractors Scope.
-
No assistente Machine Learning Extractor que é aberto automaticamente, insira informações para o campo Ponto de extemidade. Você pode escolher um dos pontos de extremidade públicos. Acesse Pontos de extremidade públicos para obter mais informações sobre pontos de extremidade públicos.
-
Marque a caixa de seleção para Atualizar argumentos de atividade se você também deseja usar os valores inseridos como argumentos de entrada para a atividade, mais precisamente para o Ponto de extremidade.
-
Selecione Obter recursos. O assistente fecha após essa operação
-
Enter a value for Output Folder.
-
Select the Configure Extractors option in the Train Extractors Scope. A wizard is displayed.
Figura 1. O assistente Configurar extratores

-
O Machine Learning Extractor Trainer agora está pronto para configuração. Expanda o tipo de documento para o qual você deseja aplicá-lo e comece a selecionar os campos que você deseja treinar, marcando as caixas de seleção ao lado dos campos apropriados.
-
Preencha as caixas de texto manualmente ou selecionando, na lista suspensa disponível, os dados corretos que você deseja mapear para cada campo. A lista suspensa contém todos os campos que o Machine Learning Extractor Trainer, usando o ponto de extremidade inserido no assistente do Machine Learning Extractor, declara como capacidade de extração.
Observação:Se você selecionar a caixa de seleção, mas deixar a caixa de texto vazia, a última será preenchida automaticamente com o ID do Tipo de Documento da taxonomia local. As alterações se aplicam após salvar. Se você quiser evitar o uso de uma string longa para o ID do campo, recomendamos que você insira manualmente um valor caso não tenha acesso à taxonomia interna do extrator.
-
Para verificar se você está usando os recursos mais recentes do extrator, você pode selecionar Obter ou atualizar recursos do extrator, que abre o assistente do Machine Learning Extractor.
-
A seleção de uma das opções de uma lista suspensa confirma automaticamente esse campo.
-
To train an extractor based on its extraction result, you can set the exact alphanumeric value in the Framework Alias field previously used for an extractor.
-
Selecione Salvar uma vez que todos os campos forem configurados corretamente.
Importante:You cannot choose the same option for two distinct fields.
Integração de Compreensão de Documentos
A atividade Machine Learning Extractor Trainer faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.