- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Processo do Document Understanding - Modelo do Studio
- Document Understanding
- Notas de versão
- About the Document Understanding activity package
- Compatibilidade do projeto
- Dados do documento
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- About the IntelligentOCR activity package
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Intelligent Keyword Classifier
- Present Classification Station
- Create Document Classification Action
- Wait For Document Classification Action And Resume
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Intelligent Keyword Classifier
UiPath.IntelligentOCR.Activities.DocumentClassification.IntelligentKeywordClassifier
Esta atividade permite que qualquer usuário classifique e divida pacotes de documentos em tipos de documentos individuais.
Ela só pode ser usada em conjunto com a atividade Classify Document Scope .
Comum
- NomeDeExibição - o nome de exibição da atividade.
Entrada
- ApiKey - Especifica a chave de API da conta. O campo Chave de API é automaticamente pré-preenchido se isso for definido nas configurações de projeto locais ou na estrutura do Document Understanding.
- Endpoint - The URL to UiPath® server. By default, the endpoint is
https://du.uipath.com/svc/intelligentkeywords
. For more information, see Document Understanding Public Endpoints. - DadosDeAprendizado — a string que contém os dados do classificador serializado. Esse campo é compatível apenas com strings e variáveis string.
- CaminhoDoArquivoDeAprendizagem — o caminho completo para o arquivo que contém os dados do classificador. Este campo é compatível apenas com strings e variáveis
String
.Observação:Apenas um dos parâmetros acima pode ser definido por vez. Você pode usar a string LearningData ou a string LearningFilePath .
O LearningFilePath especifica os locais de onde recuperar os dados do classificador.
O LearningData contém as informações reais desse classificador.
- Enviar documentos - Envie documentos para melhor suporte, solução de problemas e melhorias de desempenho.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Observação: a prática recomendada é criar um arquivo
.json
vazio nesse local e, em seguida, usar seu nome no campo LearningFilePath .
Divisão
- PerformDocumentSplitting — Se não for selecionado, o modelo não realizará a divisão de documentos, apenas classificação.
- UsePageNumbers - Se marcado, o modo usará a funcionalidade de numeração de página para decidir onde dividir documentos. Use essa opção em casos nos quais a numeração de página possa melhorar os resultados de divisão.
Acesse o assistente Gerenciar Aprendizado para configurar a atividade Intelligent Keyword Classifier. O mesmo assistente pode ser usado para revisar os dados coletados durante a fase de treinamento de classificação de documentos, abrindo o mesmo assistente com um caminho de arquivo de aprendizagem atualizado.
Este assistente permite configurar e gerenciar os dados de treinamento usados pela atividade Intelligent Keyword Classifier para identificar o tipo de documento e classificar os documentos. Ele foi criado para atender a necessidade de editar um caminho de arquivo. Se uma opção de Dados de Aprendizagem com uma variável for usada, você será perguntado se deseja editar um caminho de arquivo específico ou anular esta operação.
- Adicione uma atividade Intelligent Keyword Classifier/Intelligent Keyword Classifier Trainer ao seu fluxo de trabalho.
- Configure sua atividade Intelligent Keyword Classifier incluindo o caminho de um arquivo
.json
.- Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for clicada, então um pop-up será exibido solicitando uma entrada de Aprendizado de caminho de arquivo. Assim que o caminho for fornecido, o assistente será aberto.
- Uma variável pode ser adicionada em vez de um arquivo
.json
, mas, como o assistente não pode aplicar o padrão de aprendizado a uma variável DadosDeAprendizado, ele solicita um caminho de arquivo específico que pode ser editado.
-
Clique na opção Gerenciar Aprendizagem.
- A Janela do Assistente é exibida.
- A Janela do Assistente é exibida.
- Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for clicada, então um pop-up será exibido solicitando um Aprendizado de caminho de arquivo. Assim que o caminho for fornecido, o assistente será aberto.
.json
esteja disponível, você pode adicionar o nome de um novo arquivo .json
diretamente na atividade e o arquivo .json
é criado automaticamente dentro da pasta especificada.
A captura de tela abaixo apresenta um tipo de documento que foi treinado, um que não foi e um que foi treinado e acessado para ser visualizado ou excluído.
Para tipos de documentos que ainda não foram treinados, o treinamento em tempo de design pode ser executado usando a opção Iniciar treinamento. Para os tipos de documentos que já possuem algum treinamento, você pode excluí-los para recomeçar, usando esta opção , ou realizar um treinamento extra (cumulativo ao já existente) usando a opção editar .
Once a new training has been initiated, a new screen is displayed asking for the training files and the OCR engine that should be used. The default OCR engine is UiPath® Document OCR.
Cada mecanismo de OCR vem com seu próprio conjunto de opções personalizadas.
Os seguintes mecanismos de OCR não suportam documentos rotacionados e não devem ser usados para processar tais documentos:
- Microsoft OCR
- Tesseract OCR
A opção Aplicar OCR em PDF estabelece se o processo de OCR deve ser aplicado ou não a documentos PDF. Três opções estão disponíveis na lista suspensa: True, Falsee Auto.
Se definido como True, o OCR é aplicado a todas as páginas PDF do documento. Se definido como False, apenas o texto inserido digitalmente é extraído. O valor padrão é Auto, determinando se o documento requer a aplicação do algoritmo OCR dependendo do documento de entrada.
Se o pacote UiPath.IntelligentOCR.Activities foi atualizado para v5.1.0, então o parâmetro ForceApplyOCR foi substituído pelo ApplyOcrOnPDF. Aqui está a compatibilidade entre os parâmetros antigos e novos:
• ForceApplyOCR = True está sendo substituído por ApplyOcrOnPDF = Sim
• ForceApplyOCR = False está sendo substituído por ApplyOcrOnPDF = Auto
• ForceApplyOCR = Vazio está sendo substituído por ApplyOcrOnPDF = Auto
ForçarAplicaçãoDeOCR = <user-defined variable> está sendo substituído por AplicarOcrEmPDF = Auto
Somente dados de treinamento de tipos de documento que foram treinados são elegíveis para exportação.Os tipos de documento que não foram treinados não podem ser selecionados.
Exportando dados de treinamento
Você pode exportar dados de treinamento seguindo estas etapas:
- Selecione os tipos de documento que foram treinados.
- Clique no botão Exportar.
- Se houver alterações não salvas, a seguinte mensagem será exibida.
- Clique em Sim.
- Salve o arquivo de dados de treinamento com o nome desejado.
- Uma mensagem é exibida informando quantos conjuntos de dados de treinamento de tipo de documento foram exportados. Por exemplo:
- Clique em OK para retornar à tela principal do assistente.
Importando dados de treinamento
Você pode importar dados de treinamento seguindo estas etapas:
- Clique no botão Importar.
- Selecione o arquivo de dados de treinamento e clique em Abrir.
- Selecione os tipos de documento que você deseja.
- Clique no botão Importar.
- Os dados de treinamento são importados.
A tabela abaixo explica cada mensagem exibida ao importar dados de treinamento:
Import Type |
Mensagem exibida |
---|---|
Novo tipo de documento e vetores do Word |
Este tipo de documento será adicionado à taxonomia |
Novo vetor do Word (nenhum foi definido anteriormente) |
N/A |
Mesmo tipo de documento e vetor do Word |
O vetor de palavra para este tipo de documento será substituído |
Integração de Compreensão de Documentos
A atividade Intelligent Keyword Classifier faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.