Atividades
Mais recente
falso
Imagem de fundo do banner
Atividades de Document Understanding
Última atualização 29 de abr de 2024

Intelligent Keyword Classifier

UiPath.IntelligentOCR.Activities.DocumentClassification.IntelligentKeywordClassifier

Esta atividade permite que qualquer usuário classifique e divida pacotes de documentos em tipos de documentos individuais.

Ela só pode ser usada em conjunto com a atividade Classify Document Scope .

Propriedades

Comum
  • NomeDeExibição - o nome de exibição da atividade.
Entrada
  • ApiKey - Especifica a chave de API da conta. O campo Chave de API é automaticamente pré-preenchido se isso for definido nas configurações de projeto locais ou na estrutura do Document Understanding.
  • Endpoint - The URL to UiPath® server. By default, the endpoint is https://du.uipath.com/svc/intelligentkeywords. For more information, see Document Understanding Public Endpoints.
  • DadosDeAprendizado — a string que contém os dados do classificador serializado. Esse campo é compatível apenas com strings e variáveis string.
  • CaminhoDoArquivoDeAprendizagem — o caminho completo para o arquivo que contém os dados do classificador. Este campo é compatível apenas com strings e variáveis String.
    Observação:

    Apenas um dos parâmetros acima pode ser definido por vez. Você pode usar a string LearningData ou a string LearningFilePath .

    O LearningFilePath especifica os locais de onde recuperar os dados do classificador.

    O LearningData contém as informações reais desse classificador.

  • Enviar documentos - Envie documentos para melhor suporte, solução de problemas e melhorias de desempenho.
Diversos
  • Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
    Observação: a prática recomendada é criar um arquivo .json vazio nesse local e, em seguida, usar seu nome no campo LearningFilePath .

Divisão

  • PerformDocumentSplitting — Se não for selecionado, o modelo não realizará a divisão de documentos, apenas classificação.
  • UsePageNumbers - Se marcado, o modo usará a funcionalidade de numeração de página para decidir onde dividir documentos. Use essa opção em casos nos quais a numeração de página possa melhorar os resultados de divisão.
Observação: a partir da versão 6.9.0, o desempenho de divisão para a atividade Intelligent Keyword Classifier foi melhorado. Para um desempenho de divisão otimizado, use a versão 6.9.0 ou superior.

Usando o assistente de gerenciamento de aprendizado

Acesse o assistente Gerenciar Aprendizado para configurar a atividade Intelligent Keyword Classifier. O mesmo assistente pode ser usado para revisar os dados coletados durante a fase de treinamento de classificação de documentos, abrindo o mesmo assistente com um caminho de arquivo de aprendizagem atualizado.

Este assistente permite configurar e gerenciar os dados de treinamento usados pela atividade Intelligent Keyword Classifier para identificar o tipo de documento e classificar os documentos. Ele foi criado para atender a necessidade de editar um caminho de arquivo. Se uma opção de Dados de Aprendizagem com uma variável for usada, você será perguntado se deseja editar um caminho de arquivo específico ou anular esta operação.

Observação: o assistente de Gerenciar aprendizado só funciona quando a atividade é configurada com um string de Caminho do arquivo de aprendizagem. Não funciona com o Caminho do arquivo de aprendizagem definido como variável ou com um string DadosDeAprendizado.
  1. Adicione uma atividade Intelligent Keyword Classifier/Intelligent Keyword Classifier Trainer ao seu fluxo de trabalho.
  2. Configure sua atividade Intelligent Keyword Classifier incluindo o caminho de um arquivo .json.
    • Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for clicada, então um pop-up será exibido solicitando uma entrada de Aprendizado de caminho de arquivo. Assim que o caminho for fornecido, o assistente será aberto.
    • Uma variável pode ser adicionada em vez de um arquivo .json, mas, como o assistente não pode aplicar o padrão de aprendizado a uma variável DadosDeAprendizado, ele solicita um caminho de arquivo específico que pode ser editado.
  3. Clique na opção Gerenciar Aprendizagem.

    • A Janela do Assistente é exibida.


  • Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for clicada, então um pop-up será exibido solicitando um Aprendizado de caminho de arquivo. Assim que o caminho for fornecido, o assistente será aberto.


Observação: mesmo que nenhum arquivo .json esteja disponível, você pode adicionar o nome de um novo arquivo .json diretamente na atividade e o arquivo .json é criado automaticamente dentro da pasta especificada.

A captura de tela abaixo apresenta um tipo de documento que foi treinado, um que não foi e um que foi treinado e acessado para ser visualizado ou excluído.



Para tipos de documentos que ainda não foram treinados, o treinamento em tempo de design pode ser executado usando a opção Iniciar treinamento. Para os tipos de documentos que já possuem algum treinamento, você pode excluí-los para recomeçar, usando esta opção , ou realizar um treinamento extra (cumulativo ao já existente) usando a opção editar .

Observação: arquivos de treinamento a serem usados devem conter uma única instância de tipo de documento por arquivo. Não execute treinamento em tempo de design em arquivos que contenham dois ou mais tipos de documento, pois seus dados de treinamento estarão incorretos.

Once a new training has been initiated, a new screen is displayed asking for the training files and the OCR engine that should be used. The default OCR engine is UiPath® Document OCR.



Cada mecanismo de OCR vem com seu próprio conjunto de opções personalizadas.

Observação:

Os seguintes mecanismos de OCR não suportam documentos rotacionados e não devem ser usados para processar tais documentos:

  • Microsoft OCR
  • Tesseract OCR

A opção Aplicar OCR em PDF estabelece se o processo de OCR deve ser aplicado ou não a documentos PDF. Três opções estão disponíveis na lista suspensa: True, Falsee Auto.

Se definido como True, o OCR é aplicado a todas as páginas PDF do documento. Se definido como False, apenas o texto inserido digitalmente é extraído. O valor padrão é Auto, determinando se o documento requer a aplicação do algoritmo OCR dependendo do documento de entrada.

Observação:

Se o pacote UiPath.IntelligentOCR.Activities foi atualizado para v5.1.0, então o parâmetro ForceApplyOCR foi substituído pelo ApplyOcrOnPDF. Aqui está a compatibilidade entre os parâmetros antigos e novos:

• ForceApplyOCR = True está sendo substituído por ApplyOcrOnPDF = Sim

• ForceApplyOCR = False está sendo substituído por ApplyOcrOnPDF = Auto

• ForceApplyOCR = Vazio está sendo substituído por ApplyOcrOnPDF = Auto

ForçarAplicaçãoDeOCR = <user-defined variable> está sendo substituído por AplicarOcrEmPDF = Auto

Somente dados de treinamento de tipos de documento que foram treinados são elegíveis para exportação.Os tipos de documento que não foram treinados não podem ser selecionados.



Exportando dados de treinamento

Você pode exportar dados de treinamento seguindo estas etapas:

  1. Selecione os tipos de documento que foram treinados.
  2. Clique no botão Exportar.
  3. Se houver alterações não salvas, a seguinte mensagem será exibida.


  4. Clique em Sim.
  5. Salve o arquivo de dados de treinamento com o nome desejado.
  6. Uma mensagem é exibida informando quantos conjuntos de dados de treinamento de tipo de documento foram exportados. Por exemplo:


  7. Clique em OK para retornar à tela principal do assistente.
Importando dados de treinamento

Você pode importar dados de treinamento seguindo estas etapas:

  1. Clique no botão Importar.
  2. Selecione o arquivo de dados de treinamento e clique em Abrir.
  3. Selecione os tipos de documento que você deseja.


  4. Clique no botão Importar.
  5. Os dados de treinamento são importados.


A tabela abaixo explica cada mensagem exibida ao importar dados de treinamento:

Import Type

Mensagem exibida

Novo tipo de documento e vetores do Word

Este tipo de documento será adicionado à taxonomia

Novo vetor do Word (nenhum foi definido anteriormente)

N/A

Mesmo tipo de documento e vetor do Word

O vetor de palavra para este tipo de documento será substituído

Integração de Compreensão de Documentos

A atividade Intelligent Keyword Classifier faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.

  • Propriedades
  • Usando o assistente de gerenciamento de aprendizado

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.