activities
latest
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo.
UiPath logo, featuring letters U and I in white
Atividades de Document Understanding
Last updated 21 de nov de 2024

Intelligent Keyword Classifier

UiPath.IntelligentOCR.Activities.DocumentClassification.IntelligentKeywordClassifier

Description

Essa atividade permite que qualquer usuário classifique e divida pacotes de documentos em tipos de documentos individuais. Você só pode usá-lo junto com a atividade Classify Document Scope.

Compatibilidade do projeto

Windows-Legacy | Windows

Configuração

Painel do Designer
  • CaminhoDoArquivoDeAprendizagem — o caminho completo para o arquivo que contém os dados do classificador. Este campo é compatível apenas com strings e variáveis String.
    Observação:

    Apenas um dos parâmetros acima pode ser definido por vez. Você pode usar a string LearningData ou a string LearningFilePath .

    O LearningFilePath especifica os locais de onde recuperar os dados do classificador.

    O LearningData contém as informações reais desse classificador.

  • Endpoint - O URL para o UiPath® Server. Por padrão, o ponto de extremidade é https://du.uipath.com/svc/intelligentkeywords. Para obter mais informações sobre os pontos de extremidade, acesse Pontos de extremidade públicos do Document Understanding.
  • ApiKey - Especifica a chave de API da conta. O campo Chave de API é automaticamente pré-preenchido se isso for definido nas configurações de projeto locais ou na estrutura do Document Understanding.
Painel de Propriedades

Comum

  • NomeDeExibição - o nome de exibição da atividade.

Entrada

  • ApiKey - Especifica a chave de API da conta. O campo Chave de API é automaticamente pré-preenchido se isso for definido nas configurações de projeto locais ou na estrutura do Document Understanding.
  • Endpoint - O URL para o UiPath® Server. Por padrão, o ponto de extremidade é https://du.uipath.com/svc/intelligentkeywords. Para obter mais informações sobre os pontos de extremidade, acesse Pontos de extremidade públicos do Document Understanding.
  • DadosDeAprendizado — a string que contém os dados do classificador serializado. Este campo é compatível apenas com strings e variáveis String.
  • CaminhoDoArquivoDeAprendizagem — o caminho completo para o arquivo que contém os dados do classificador. Este campo é compatível apenas com strings e variáveis String.
    Observação:

    Apenas um dos parâmetros acima pode ser definido por vez. Você pode usar a string LearningData ou a string LearningFilePath .

    O LearningFilePath especifica os locais de onde recuperar os dados do classificador.

    O LearningData contém as informações reais desse classificador.

  • Enviar documentos - Quando habilitado, permite que o UiPath® salve o documento referenciado para melhorar o desempenho do algoritmo. Desabilitar essa funcionalidade impede que o UiPath® armazene os documentos. Independentemente dessa configuração, a operação do algoritmo permanece não afetada.

Diversos

  • Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
    Observação: a prática recomendada é criar um arquivo .json vazio nesse local e, em seguida, usar seu nome no campo LearningFilePath .

Divisão

  • PerformDocumentSplitting — Se não for selecionado, o modelo não realizará a divisão de documentos, apenas classificação.
  • UsePageNumbers - Se marcado, o modo usará a funcionalidade de numeração de página para decidir onde dividir documentos. Use essa opção em casos nos quais a numeração de página possa melhorar os resultados de divisão.
Observação: para desempenho de divisão otimizado, use a versão 6.9.0 ou superior.

Usando o assistente de gerenciamento de aprendizado

Acesse o assistente Gerenciar Aprendizado para configurar a atividade Intelligent Keyword Classifier. O mesmo assistente pode ser usado para revisar os dados coletados durante a fase de treinamento de classificação de documentos, abrindo o mesmo assistente com um caminho de arquivo de aprendizagem atualizado.

Este assistente permite configurar e gerenciar os dados de treinamento usados pela atividade Intelligent Keyword Classifier para identificar o tipo de documento e classificar os documentos. Ele foi criado para atender a necessidade de editar um caminho de arquivo. Se uma opção de Dados de Aprendizagem com uma variável for usada, você será perguntado se deseja editar um caminho de arquivo específico ou anular esta operação.

Observação: o assistente de Gerenciar aprendizado só funciona quando a atividade é configurada com um string de Caminho do arquivo de aprendizagem. Não funciona com o Caminho do arquivo de aprendizagem definido como variável ou com um string DadosDeAprendizado.
  1. Adicione uma atividade Intelligent Keyword Classifier ou Intelligent Keyword Classifier Trainer ao seu fluxo de trabalho.
  2. Configure sua atividade Intelligent Keyword Classifier adicionando o caminho de um arquivo .json. Leve em consideração as seguintes informações, ao configurar o classificador:
    • Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for selecionada, um pop-up será exibido, pedindo uma entrada Caminho do arquivo de aprendizado. Assim que o caminho for fornecido, o assistente será aberto.
    • Uma variável pode ser adicionada em vez de um arquivo .json, mas, como o assistente não pode aplicar o padrão de aprendizado a uma variável DadosDeAprendizado, ele solicita um caminho de arquivo específico que pode ser editado.
  3. Selecione Gerenciar aprendizado.
    A janela do assistente Intelligent Keyword Classifier é aberta.
    Figura 1. Visão geral da seção Gerenciar aprendizado do assistente Intelligent Keyword Classifier

  4. Se nenhum caminho for fornecido e a opção Gerenciar aprendizado for selecionada, um pop-up será exibido, pedindo um CaminhoDoArquivoDeAprendizagem. Assim que o caminho for fornecido, o assistente será aberto.
    Figura 2. O pop-up Aviso exibido se nenhum caminho for fornecido e a opção Gerenciar aprendizado for selecionada

    Observação: mesmo que nenhum arquivo .json esteja disponível, você pode adicionar o nome de um novo arquivo .json diretamente na atividade e o arquivo .json é criado automaticamente dentro da pasta especificada.

No assistente Gerenciar aprendizado, você pode ver se um tipo de documento foi treinado ou não pelos seguintes rótulos exibidos ao lado deles: Treinado em arquivos X ou Iniciar treinamento. A captura de tela a seguir mostra um tipo de documento que foi treinado, um que não foi treinado e selecionado, para que possa ser visualizado ou excluído.

Figura 3. Tipos de documentos e seu status de treinamento dentro da seção Gerenciar aprendizado do Intelligent Keyword Classifier

Dados de treinamento

Para tipos de documentos que ainda não foram treinados, o treinamento em tempo de design pode ser executado usando a opção Iniciar treinamento. Para tipos de documentos que já têm algum treinamento, você pode excluí-lo para começar de novo, usando a opção remover remove ou realizar treinamento extra (cumulativo do já existente) usando a opção de edição edit.

Observação: arquivos de treinamento a serem usados devem conter uma única instância de tipo de documento por arquivo. Não execute treinamento em tempo de design em arquivos que contenham dois ou mais tipos de documento, pois seus dados de treinamento estarão incorretos.

Após iniciado um novo treinamento, uma nova tela é exibida solicitando os arquivos de treinamento e o mecanismo de OCR que deve ser usado. O mecanismo de OCR padrão é o UiPath® Document OCR. Cada mecanismo de OCR vem com seu próprio conjunto de opções personalizadas.

Figura 4. O assistente que aparece após a seleção da opção Iniciar treinamento

Observação:

Os seguintes mecanismos de OCR não suportam documentos rotacionados e não devem ser usados para processar tais documentos:

  • Microsoft OCR
  • Tesseract OCR
A opção Aplicar OCR em PDF estabelece se o processo de OCR deve ser aplicado ou não aos documentos de PDF. Três opções estão disponíveis na lista suspensa:
  • Verdadeiro: se definido como Verdadeiro, o OCR será aplicado a todas as páginas PDF do documento.
  • Falso: se definido como Falso, apenas o texto digitalmente digitado será extraído.
  • Auto: o valor padrão é Automático, determinando se o documento requer aplicar o algoritmo de OCR, dependendo do documento de entrada.
Observação:
Se o pacote UiPath.IntelligentOCR.Activities for atualizado para a v5.1.0, em seguida, o parâmetro ForçarAplicaçãoDeOCR foi substituído pelo ApplyOcrOnPDF. Aqui está a compatibilidade entre os parâmetros antigos e novos:
  • ForçarAplicaçãoDeOCR = True é substituído por ApplyOcrOnPDF = Yes
  • ForçarAplicaçãoDeOCR = False é substituído por ApplyOcrOnPDF = Auto
  • ForçarAplicaçãoDeOCR = vazio é substituído por ApplyOcrOnPDF = Auto
  • ForçarAplicaçãoDeOCR = Sua variável definida é substituída por ApplyOcrOnPDF = Auto

Exportando dados de treinamento

Somente dados de treinamento de tipos de documento que foram treinados são elegíveis para exportação.Os tipos de documento que não foram treinados não podem ser selecionados.

Figura 5. Tipos de documentos no Intelligent Keyword Classifier que não foram treinados, portanto, a opção Exportar não está disponível

Você pode exportar dados de treinamento seguindo estas etapas:

  1. Selecione os tipos de documento que foram treinados.
  2. Selecione Exportar.
    Se você tiver alterações não salvas, a seguinte mensagem será exibida: "Você não pode exportar enquanto tiver alterações não salvas. Você deseja salvar automaticamente antes de exportar?". Selecione Sim para continuar o processo de exportação.
    Figura 6. A mensagem Salvar alterações que mostra se você tiver alterações não salvas antes de exportar dados de treinamento

  3. Salve o arquivo de dados de treinamento com o nome desejado.
    Uma mensagem é exibida informando quantos conjuntos de dados de treinamento de tipo de documento foram exportados. Por exemplo: "Vetor(es) de 4 palavras exportado(s)".
    Figura 7. Exemplo da mensagem que exibe quantos conjuntos de dados de treinamento de tipos de documentos foram exportados

  4. Selecione OK para retornar à tela principal do assistente.

Importando dados de treinamento

Você pode importar dados de treinamento seguindo estas etapas:

  1. Selecione Importar.
  2. Selecione o arquivo de dados de treinamento e, em seguida, selecione Abrir.
  3. Selecione os tipos de documento que você deseja.
    Figura 8. Tipos de documentos selecionados na seção Importar vetores do Word

  4. Selecione Importar.
    Os dados de treinamento são importados.
    Figura 9. Os tipos de documentos selecionados anteriormente para importação são exibidos na seção Gerenciar aprendizado

A tabela a seguir mostra as mensagens que são exibidas ao importar dados de treinamento, com base no tipo de importação:

Tabela 1. As mensagens que são exibidas para vários tipos de importação
 

Mensagem exibida

Novo tipo de documento e vetores do Word

Esse tipo de documento será adicionado à taxonomia.

Novo vetor do Word (nenhum foi definido anteriormente)

Nenhuma mensagem é exibida.

Mesmo tipo de documento e vetor do Word

O vetor de palavra para esse tipo de documento será substituído.

Integração de Compreensão de Documentos

A atividade Intelligent Keyword Classifier faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.