- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Processo do Document Understanding - Modelo do Studio
- Document Understanding
- Notas de versão
- About the Document Understanding activity package
- Compatibilidade do projeto
- Dados do documento
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- About the IntelligentOCR activity package
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Intelligent Keyword Classifier
- Present Classification Station
- Create Document Classification Action
- Wait For Document Classification Action And Resume
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Classificador baseado em palavra-chave
UiPath.IntelligentOCR.Activities.DocumentClassification.KeywordBasedClassifier
As capacidades desta atividade são as seguintes:
- Incorpora um algoritmo de classificação de documentos baseado em palavras-chave, direcionando a classificação para arquivos que possuem títulos repetíveis.
- Classifica um documento com base em um determinado conjunto de treinamento, localizado em um arquivo especificado, se usando dentro da atividade Classify Document Scope.
Esta atividade só pode ser usada em conjunto com as atividades Classify Document Scope e Train Classifies Scope.
Comum
- NomeDeExibição - o nome de exibição da atividade.
Entrada
- DadosDeAprendizado — a string que contém os dados do classificador serializado. Esse campo é compatível apenas com strings e variáveis string.
-
CaminhoDoArquivoDeAprendizagem — o caminho completo para o arquivo que contém os dados do classificador. Esse campo é compatível apenas com strings e variáveis string.
Observação:Apenas um dos parâmetros acima pode ser definido por vez. Você pode usar a string DadosDeAprendizado ou a string CaminhoDoArquivoDeAprendizagem.
O CaminhoDoArquivoDeAprendizagem especifica os locais de onde recuperar os dados do classificador.
Os DadosDeAprendizado contêm as informações reais desse classificador.
Diversos
-
Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Observação: a prática recomendada é criar um arquivo.json
vazio nesse local e, em seguida, usar seu nome no campo CaminhoDoArquivoDeAprendizagem.
Você pode configurar o Classificador baseado em Palavra-chave no momento do projeto, simplesmente acessando o assistente Gerenciar aprendizado da atividade. O mesmo assistente pode ser usado para revisar os dados coletados durante a fase de treinamento de classificação de documentos, abrindo o mesmo assistente com um caminho de arquivo de aprendizagem atualizado.
Este assistente permite configurar e gerenciar as palavras-chave utilizadas por esta atividade para identificar o tipo de documento. Ele foi criado para atender a necessidade de editar um caminho de arquivo. Se um parâmetro Dados de Aprendizado com uma variável for usado, você será perguntado se deseja editar um caminho de arquivo específico ou anular esta operação.
- Adicione uma atividade Keyword Based Classifier/Keyword Based Classifier Trainer ao seu fluxo de trabalho.
-
Configure sua atividade Keyword Based Classifier adicionando o caminho de um arquivo
.json
.- Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for clicada, então um pop-up será exibido solicitando uma entrada de Aprendizado de caminho de arquivo. Assim que o caminho for fornecido, o assistente será aberto.
- Uma variável pode ser adicionada em vez de um arquivo
.json
, mas, como o assistente não pode aplicar o padrão de aprendizado a uma variável DadosDeAprendizado, ele solicita um caminho de arquivo específico que pode ser editado.
-
Clique na opção Gerenciar Aprendizagem.
-
A Janela do Assistente é exibida.
-
-
Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for clicada, então um pop-up será exibido solicitando um Aprendizado de caminho de arquivo. Assim que o caminho for fornecido, o assistente será aberto.
Observação: mesmo que nenhum arquivo.json
esteja disponível, você pode adicionar o nome de um novo arquivo.json
diretamente na atividade e o arquivo.json
é criado automaticamente dentro da pasta especificada.
O assistente tem o número de categorias de tipo de documento definidas em sua taxonomia. Você pode adicionar uma ou várias palavras-chave para cada tipo de documento. A atividade aprende as palavras-chave de um documento específico e posteriormente é capaz de identificar e classificar o documento em um tipo específico com base nessas regras.
""
(aspas), e você pode adicionar valores únicos ou múltiplos.
- Clicar no botão Adicionar novo conjunto de palavra-chave adiciona um campo extra a essa categoria.
- Clicar no botão remove o campo e suas palavras-chave.
-
Clique no botão Salvar para salvar a configuração do assistente. Você pode encontrar todos os valores adicionados no arquivo
.json
do projeto.Observação: as aspas duplas inseridas como parte de uma palavra-chave no assistente Gerenciar palavras-chave sempre têm caractere de escape de acordo com a convenção do Visual Basic (aspas duplas), mesmo em um projeto com sabor C#.
Integração de Compreensão de Documentos
A atividade Keyword Based Classifier faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.