- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Classificador baseado em palavra-chave
UiPath.IntelligentOCR.Activities.DocumentClassification.KeywordBasedClassifier
As capacidades desta atividade são as seguintes:
- Incorpora um algoritmo de classificação de documentos baseado em palavras-chave, direcionando a classificação para arquivos que possuem títulos repetíveis.
- Classifica um documento com base em um determinado conjunto de treinamento, localizado em um arquivo especificado, se usando dentro da atividade Classify Document Scope.
Esta atividade só pode ser usada em conjunto com as atividades Classify Document Scope e Train Classifies Scope.
Painel do Designer
- CaminhoDoArquivoDeAprendizagem — o caminho completo para o arquivo que contém os dados do classificador. Este campo é compatível apenas com strings e variáveis
String
.Observação:Apenas um dos parâmetros acima pode ser definido por vez. Você pode usar a string LearningData ou a string LearningFilePath .
O LearningFilePath especifica os locais de onde recuperar os dados do classificador.
O LearningData contém as informações reais desse classificador.
Painel de Propriedades
Comum
- NomeDeExibição - o nome de exibição da atividade.
Entrada
- DadosDeAprendizado — a string que contém os dados do classificador serializado. Este campo é compatível apenas com strings e variáveis
String
. - CaminhoDoArquivoDeAprendizagem — o caminho completo para o arquivo que contém os dados do classificador. Este campo é compatível apenas com strings e variáveis
String
.Observação:Apenas um dos parâmetros acima pode ser definido por vez. Você pode usar a string LearningData ou a string LearningFilePath .
O LearningFilePath especifica os locais de onde recuperar os dados do classificador.
O LearningData contém as informações reais desse classificador.
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Observação: a melhor prática é criar um arquivo
.json
vazio nesse local e, em seguida, usar seu nome no campo CaminhoDoArquivoDeAprendizagem.
Você pode configurar o Classificador baseado em Palavra-chave no momento do projeto, simplesmente acessando o assistente Gerenciar aprendizado da atividade. O mesmo assistente pode ser usado para revisar os dados coletados durante a fase de treinamento de classificação de documentos, abrindo o mesmo assistente com um caminho de arquivo de aprendizagem atualizado.
Este assistente permite configurar e gerenciar as palavras-chave utilizadas por esta atividade para identificar o tipo de documento. Ele foi criado para atender a necessidade de editar um caminho de arquivo. Se um parâmetro Dados de Aprendizado com uma variável for usado, você será perguntado se deseja editar um caminho de arquivo específico ou anular esta operação.
- Adicione uma atividade Keyword Based Classifier ou Keyword Based Classifier Trainer ao seu fluxo de trabalho.
- Configure sua atividade Keyword Based Classifier adicionando o caminho de um arquivo
.json
. Leve em consideração as seguintes informações, ao configurar o classificador:- Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for selecionada, um pop-up será exibido, pedindo uma entrada Caminho do arquivo de aprendizado. Assim que o caminho for fornecido, o assistente será aberto.
- Uma variável pode ser adicionada em vez de um arquivo
.json
, mas, como o assistente não pode aplicar o padrão de aprendizado a uma variável DadosDeAprendizado, ele solicita um caminho de arquivo específico que pode ser editado.
- Selecione Gerenciar aprendizado.
A janela Gerenciar o Aprendizado do Classificador Baseado em Palavra-chave é aberta.Figura 1. Visão geral do assistente Gerenciar o Aprendizado do Classificador Baseado em Palavra-chave
- Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for selecionada, um pop-up será exibido, pedindo um Caminho do arquivo de aprendizado. Assim que o caminho for fornecido, o assistente será aberto.
Figura 2. O pop-up Aviso exibido se nenhum caminho for fornecido e a opção Gerenciar aprendizado for selecionada
Observação: mesmo que nenhum arquivo.json
esteja disponível, você pode adicionar o nome de um novo arquivo.json
diretamente na atividade e o arquivo.json
é criado automaticamente dentro da pasta especificada.
O assistente tem o número de categorias de tipo de documento definidas em sua taxonomia. Você pode adicionar uma ou várias palavras-chave para cada tipo de documento. A atividade aprende as palavras-chave de um documento específico e posteriormente é capaz de identificar e classificar o documento em um tipo específico com base nessas regras.
""
, e você pode adicionar valores únicos ou múltiplos. Para adicionar ou remover palavras-chave, execute as seguintes etapas no assistente:
- Selecione Adicionar novo conjunto de palavra-chave para adicionar um campo extra a essa categoria.
- Selecione o ícone remover , para remover o campo e suas palavras-chave.
- Selecione Salvar para salvar sua configuração do assistente. Você pode encontrar todos os valores adicionados no arquivo
.json
do projeto.Observação: as aspas duplas inseridas como parte de uma palavra-chave no assistente Gerenciar palavras-chave sempre têm caractere de escape de acordo com a convenção do Visual Basic (aspas duplas), mesmo em um projeto com sabor C#.
A atividade Keyword Based Classifier faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.