- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades de Document Understanding
Machine Learning Extractor Trainer
UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer
Permite a coleta de dados que foram processados por meio da Estação de validação para que possam ser importados para o Document Manager. Esta atividade pode ser usada apenas dentro da atividade Train Extractors Scope.
Painel do Designer
Armazenamento local
- Pasta de Saída - O diretório onde os dados coletados são armazenados. Depois que os dados são armazenados, eles podem ser importados para ferramentas de treinamento de aprendizado de máquina.
Selecionar conjunto de dados privado para projeto
- Conjunto de dados - O conjunto de dados onde os dados de treinamento podem ser carregados. Se o robô estiver conectado a um inquilino que tenha o AI Center ativado, você poderá ver todos os conjuntos de dados do AI Center no menu suspenso e selecionar a pasta onde carregar os documentos validados usando o menu suspenso.
- Projeto - O projeto onde os dados de treinamento podem ser carregados.
Observação: a seleção de projeto e conjunto de dados é habilitada apenas quando conectado ao Orchestrator. Acesse Gerenciamento de conjuntos de dados para obter mais informações sobre Conjuntos de dados públicos/privados.
Fornecer endpoint de conjunto de dados público
- Dataset ApiKey - A chave de autenticação do conjunto de dados.
- Ponto de extremidade do conjunto de dados - O ponto de extremidade do conjunto de dados no qual os dados de treinamento podem ser carregados. Depois que um conjunto de dados é público, ele pode ser acessado fora do ambiente da UiPath® por meio de um ponto de extremidade e usando a chave de API. Faça isso se você quiser carregar conjuntos de dados para uma instância do AI Center à qual você não esteja conectado (por exemplo, no caso de implantações híbridas nas quais o AI Center está na nuvem e o UiPath Robot está conectado a um tenant no local).
Painel de Propriedades
Comum
- NomeDeExibição - o nome de exibição da atividade.
Armazenamento local
- Pasta de Saída - O diretório onde os dados coletados são armazenados. Depois que os dados são armazenados, eles podem ser importados para ferramentas de treinamento de aprendizado de máquina.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Fornecer endpoint de conjunto de dados público
- Dataset ApiKey - A chave de autenticação do conjunto de dados.
- Ponto de extremidade do conjunto de dados - O ponto de extremidade do conjunto de dados no qual os dados de treinamento podem ser carregados. Depois que um conjunto de dados é público, ele pode ser acessado fora do ambiente da UiPath® por meio de um ponto de extremidade e usando a chave de API. Faça isso se você quiser carregar conjuntos de dados para uma instância do AI Center à qual você não esteja conectado (por exemplo, no caso de implantações híbridas nas quais o AI Center está na nuvem e o UiPath Robot está conectado a um tenant no local).
Selecionar conjunto de dados privado para projeto
- Conjunto de dados - O conjunto de dados onde os dados de treinamento podem ser carregados. Se o robô estiver conectado a um inquilino que tenha o AI Center ativado, você poderá ver todos os conjuntos de dados do AI Center no menu suspenso e selecionar a pasta onde carregar os documentos validados usando o menu suspenso.
-
Projeto - O projeto onde os dados de treinamento podem ser carregados.
Observação: a seleção de projeto e conjunto de dados é habilitada apenas quando conectado ao Orchestrator. Acesse Gerenciamento de conjuntos de dados para obter mais informações sobre Conjuntos de dados públicos/privados.
Servidor
- TentarNovamenteEmCasoDeFalha — tentar novamente na falha temporária. Este campo só aceita valores boolianos (Rue, False). O valor padrão é True.
- Tempo limite (milissegundos) — especifica o tempo (em milissegundos) a ser aguardado para que uma resposta do servidor seja executada antes de gerar um erro. O valor padrão é 100.000 milissegundos (100 segundos).
O Machine Learning Extractor Trainer coleta o feedback humano para você, em um diretório de sua escolha. Depois de coletar dados e quiser treinar novamente um Modelo de ML, você pode simplesmente compactar o conteúdo do diretório e carregá-lo no Document Manager para coletar e filtrar dados.
Para usar a atividade Machine Learning Extractor Trainer, execute as seguintes etapas:
- Use o assistente do Gerenciador de Taxonomia para definir seus tipos de documento e campos.
- Adicione um Machine Learning Extractor Trainer a uma atividade Train Extractors Scope.
- No assistente Machine Learning Extractor que é aberto automaticamente, insira informações para o campo Ponto de extemidade. Você pode escolher um dos pontos de extremidade públicos. Acesse Pontos de extremidade públicos para obter mais informações sobre pontos de extremidade públicos.
- Marque a caixa de seleção para Atualizar argumentos de atividade se você também deseja usar os valores inseridos como argumentos de entrada para a atividade, mais precisamente para o Ponto de extremidade.
- Selecione Obter recursos.
O assistente fecha após essa operação
- Insira um valor para Pasta de saída.
- Selecione a opção Configurar Extratores no Train Extractors Scope.
Um assistente é exibido.
Figura 1. O assistente Configurar extratores
- O Machine Learning Extractor Trainer agora está pronto para configuração. Expanda o tipo de documento para o qual você deseja aplicá-lo e comece a selecionar os campos que você deseja treinar, marcando as caixas de seleção ao lado dos campos apropriados.
- Preencha as caixas de texto manualmente ou selecionando, na lista suspensa disponível, os dados corretos que você deseja mapear para cada campo. A lista suspensa contém todos os campos que o Machine Learning Extractor Trainer, usando o ponto de extremidade inserido no assistente do Machine Learning Extractor, declara como capacidade de extração.
Observação: se você selecionar a caixa de seleção, mas deixar a caixa de texto vazia, a última será preenchida automaticamente com o ID do tipo de documento da taxonomia local. As alterações se aplicam após salvar. Se você quiser evitar o uso de uma string longa para o ID do campo, recomendamos que você insira manualmente um valor caso não tenha acesso à taxonomia interna do extrator.
- Para verificar se você está usando os recursos mais recentes do extrator, você pode selecionar Obter ou atualizar recursos do extrator, que abre o assistente do Machine Learning Extractor.
- A seleção de uma das opções de uma lista suspensa confirma automaticamente esse campo.
- Para treinar um extrator com base em seu resultado de extração, você pode definir o valor alfanumérico exato no campo Framework Alias usado anteriormente para um extrator.
- Selecione Salvar uma vez que todos os campos forem configurados corretamente.
Importante: não é possível escolher a mesma opção para dois campos distintos.
Integração de Compreensão de Documentos
A atividade Machine Learning Extractor Trainer faz parte das Document Understanding Solutions. Visite o Guia do Document Understanding para obter mais informações.