- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades do Document Understanding
UiPath.IntelligentOCR.Activities.DocumentClassification.KeywordBasedClassifier
Description
As capacidades desta atividade são as seguintes:
- Incorpora um algoritmo de classificação de documentos baseado em palavras-chave, direcionando a classificação para arquivos que possuem títulos repetíveis.
- Classifica um documento com base em um determinado conjunto de treinamento, localizado em um arquivo especificado, se usando dentro da atividade Classify Document Scope.
Esta atividade só pode ser usada em conjunto com as atividades Classify Document Scope e Train Classifies Scope.
Compatibilidade do projeto
Windows-Legacy | Windows
Configuração
Painel do Designer
-
LearningFilePath - The full path to the file containing the classifier data. This field supports only strings and
Stringvariables.Observação:Only one of the above parameters can be set at a time. You can use either the LearningData string or the LearningFilePath string.
The LearningFilePath specifies the locations from where to retrieve the classifier data.
The LearningData contains the actual information of that classifier.
Painel de Propriedades
Comum
- DisplayName - O nome de exibição da atividade.
Entrada
-
LearningData - The string containing the serialized classifier data. This field supports only strings and
Stringvariables. -
LearningFilePath - The full path to the file containing the classifier data. This field supports only strings and
Stringvariables.Observação:Only one of the above parameters can be set at a time. You can use either the LearningData string or the LearningFilePath string.
The LearningFilePath specifies the locations from where to retrieve the classifier data.
The LearningData contains the actual information of that classifier.
-
Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Observação:A prática recomendada é criar um arquivo
.jsonvazio nesse local e, em seguida, usar seu nome no campo CaminhoDoArquivoDeAprendizagem .
Usando o assistente de gerenciamento de aprendizado
You can configure the Keyword Based Classifier at design-time, by simply accessing the Manage Learning wizard of the activity. The same wizard can be used for reviewing data collected during the document classification training phase, by opening the same wizard with an updated learning file path.
This wizard allows you to configure and manage the keywords used by this activity for identifying the document type. It was created to suit the need for editing a file path. If a Learning Data parameter with a variable is used instead, then you are asked if you either want to edit a specific file path or to abort this operation.
Manage Keyword Based Classifier Learning wizard can be used only for editing and configuring a file path.
-
Adicione uma atividade Keyword Based Classifier ou Keyword Based Classifier Trainer ao seu fluxo de trabalho.
-
Configure sua atividade Keyword Based Classifier adicionando o caminho de um arquivo
.json. Leve em consideração as seguintes informações, ao configurar o classificador:- Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for selecionada, um pop-up será exibido, pedindo uma entrada Caminho do arquivo de aprendizado. Assim que o caminho for fornecido, o assistente será aberto.
- A variable can be added instead of a
.jsonfile, but, because the wizard cannot apply the learning pattern to a LearningData variable, it asks for a specific file path that can be edited.
-
Selecione Gerenciar aprendizado.
A janela Gerenciar o Aprendizado do Classificador Baseado em Palavra-chave é aberta.
Figura 1. Visão geral do assistente Gerenciar o Aprendizado do Classificador Baseado em Palavra-chave
-
Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for selecionada, um pop-up será exibido, pedindo um Caminho do arquivo de aprendizado. Assim que o caminho for fornecido, o assistente será aberto.
Figura 2. O pop-up Aviso exibido se nenhum caminho for fornecido e a opção Gerenciar aprendizado for selecionada
Observação:Even if no
.jsonfile is available, you can add the name of a new.jsonfile straight into the activity and the.jsonfile is automatically created inside the specified folder.
Adição de palavras-chave para o tipo de documento
O assistente tem o número de categorias de tipo de documento definidas em sua taxonomia. Você pode adicionar uma ou várias palavras-chave para cada tipo de documento. A atividade aprende as palavras-chave de um documento específico e posteriormente é capaz de identificar e classificar o documento em um tipo específico com base nessas regras.
Todas as entradas devem ser inseridas como strings, entre (aspas) "", e você pode adicionar valores únicos ou múltiplos. Para adicionar ou remover palavras-chave, execute as seguintes etapas no assistente:
- Selecione Adicionar novo conjunto de palavra-chave para adicionar um campo extra a essa categoria.
- Selecione o
remover ícone, para remover o campo e suas palavras-chave. - Selecione Salvar para salvar sua configuração do assistente. Você pode encontrar todos os valores adicionados no arquivo
.jsondo projeto.Observação:Double quotes entered as part of a keyword in the Manage Keywords wizard are always escaped according to the Visual Basic convention (double double quotes), even in a C# flavored project.
Integração do Document Understanding
A atividade Keyword Based Classifier faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.