activities
latest
false
UiPath logo, featuring letters U and I in white
Atividades de Document Understanding
Last updated 14 de nov de 2024

Classificar Documento

UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument

Description

Você pode usar essa atividade para classificar documentos, selecionando um classificador desejado e um documento que você gostaria de classificar.

Observação: a atividade Classify Document usa pontos de extremidade públicos.

Os idiomas suportados para os modelos generativos são os mesmos do mecanismo de OCR usado. Para obter mais informações, consulte a página Idiomas suportados pelo OCR .

A menos que essa atividade seja a primeira parte da atividade do Document Understanding de um fluxo de trabalho do Studio, a entrada deve ser Dados do Documento. O arquivo só deve ser usado como entrada se a atividade for a primeira parte do Document Understanding de um fluxo de trabalho do Studio.

Compatibilidade do projeto

Windows | Multiplataforma

Configuração

Painel do Designer
  • Projeto - Requer que você selecione seu projeto do Document Understanding no menu suspenso. As opções disponíveis são:
    • Predefinido - O tipo de projeto padrão
    • Você pode criar um novo projeto clicando no ícone +.
    Observação: se você tiver criado mais de 500 projetos em seu tenant e usar a atividade Classify Document, o UiPath Studio ou Studio Web não exibirá nenhum projeto além dos 500 iniciais.Portanto, esses projetos não podem ser usados.
  • Classificador - Requer que você selecione seu classificador do Document Understanding no menu suspenso.
    Observação: os dados enviados ao Classificador generativo serão enviados para uma instância de Modelo LLM que não está disponível publicamente, não a deixarão e, quando processados, não serão armazenados ou usados para treinamento.
    • Predefinido - O tipo de projeto padrão
    • Classificador generativo - O tipo de classificador generativo
      Importante:

      Essa funcionalidade faz parte atualmente de um processo de auditoria e não deve ser considerada parte da Autorização do FedRAMP até que a revisão seja finalizada. Veja aqui a lista completa das funcionalidades atualmente em revisão.

      • Solicitação - Solicitação para identificar tipos de documentos, fornecidos como pares de chave-valor, em que a chave representa o nome do tipo de documento e o valor, uma descrição para ele, ajudando o classificador a identificar tais documentos.
        • Tipo de documento - Forneça o nome do tipo de documento a ser usado como resultado da classificação (limite de 30 caracteres).
        • Solicitação generativa - Requer que você forneça a solicitação como entrada para o classificador generativo. O número máximo de caracteres permitidos é 1000.
  • Entrada - Fornece o arquivo de entrada ou o objeto de dados do documento.
    Importante: o número máximo de páginas que um arquivo pode ter é 500. Os arquivos que excedem esse limite não são classificados.
    Dica: quando seus arquivos não são armazenados como uma variável do tipo IResource, há uma opção para realizar uma conversão. Use LocalResource.FromPath(<reference_to_the_file>) no campo de propriedade Entrada para isso.
    Considere um cenário em que você está iterando por meio de uma lista de arquivos usando uma atividade For Each. Suponha que currentItem seja sua variável de iteração. Para converter currentItem em IResource, cole LocalResource.FromPath(currentItem) no campo Entrada.
Painel de Propriedades

Opções Avançadas

  • Confiança mínima - Especifique o limite mínimo de confiança com base no qual um tipo de documento é atribuído durante a classificação. Se a pontuação de confiança de um documento ficar abaixo desse limite, seu Tipo de documento será relatado como "desconhecido".
    Dica: a maioria dos tipos de documentos gera uma previsão com um nível de confiança. A configuração dessa propriedade evita falsos positivos considerando apenas as previsões com um nível de confiança acima do limite. Você pode identificar um nível de confiança ideal testando vários documentos dentro do seu fluxo de trabalho, gravando os resultados em uma planilha do Excel, por exemplo, e, em seguida, analisar qual valor de limite é o mais preciso.

Entrada

  • Tempo limite (segundos) - Tempo máximo de execução (em segundos) para a chamada para o modelo generativo. Se a operação exceder esse tempo limite, ela será encerrada automaticamente para evitar atrasos ou travamentos. Essa propriedade é exibida apenas se o Classificador generativo for selecionado como um classificador.

Saída

  • Dados do documento - Todos os dados de campo extraídos validados do arquivo.

Usando o classificador generativo

Para começar rapidamente com os recursos generativos da atividade Classify Document, execute as seguintes etapas:

  1. Adicione uma atividade Classify Document
  2. Na lista suspensa Projeto , selecione Predefinido.
  3. Para Classificador, selecione Classificador generativo.

    A propriedade Prompt aparece no corpo da atividade.

  4. No campo Solicitação , forneça suas instruções como Pares de valor de chave de dicionário, onde:
    • A Chave representa o Tipo de Documento (exemplo: CV).
    • O valor representa o Prompt generativo: a descrição usada pelo classificador generativo para identificar os tipos de documento.

      Por exemplo, verifique a tabela a seguir para obter uma amostra de pares de chave-valor:

      Tabela 1. Pares de chave-valor usados como um aviso para o classificador generativo
      Document typeSolicitação gerativa
      CV"Encontre palavras-chave comuns para CVs, como "Eduação", "Habilidades" e "Experiência"."
      Fatura"Encontrar nomes de campos comuns, como "Número da fatura", "Cobrança de" ou "Valor total"."
    Figura 1. Pares de chave-valor usados como um prompt para o classificador generativo

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.