document-understanding
2022.10
false
Guia do usuário do Document Understanding.
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 11 de nov de 2024

Sobre os pacotes de ML

O uso de um Pacote de ML do Document Understanding envolve estas etapas:

  • Coletar amostras de documentos e os requisitos dos pontos de dados que precisam ser extraídos.
  • Rotulagem de documentos usando o Document Manager. O próprio Document Manager se conecta a um Serviço de OCR.
  • Baixar ou exportar documentos rotulados como um conjunto de dados de treinamento e carregar a pasta exportada para o armazenamento do AI Center.
  • Baixar ou exportar documentos rotulados como um conjunto de dados de avaliação e carregar a pasta exportada para o armazenamento do AI Center.
  • Executar um pipeline de treinamento no AI Center.
  • Avaliar o desempenho do modelo com um pipeline de avaliação no AI Center.
  • Implantar o modelo treinado como uma Habilidade de ML no AI Center.
  • Consultar a Habilidade de ML de um fluxo de trabalho de RPA usando o pacote de atividades UiPath.DocumentUnderstanding.ML.
    Observação: lembre-se de que o uso dos Pacotes de ML do Document Understanding exige que a máquina na qual o AI Center está instalado possa acessar o https://du-metering.uipath.com.
    Importante: ao criar uma pacote UiPath.DocumentUnderstanding.ML.Activities no AI Center, o nome do pacote não deve ser nenhuma palavra-chave reservada do python, como class , break, from, finally, global, None, etc. Observe que esta lista não é exaustiva, pois o nome do pacote é usado para class <pkg-name> e import <pkg-name> .

Esses são modelos de Machine Learning prontos para uso para classificar e extrair quaisquer pontos de dados comuns de documentos semiestruturados ou não estruturados, incluindo campos regulares, colunas de tabela e campos de classificação, em uma abordagem sem modelo.



Observação:

Pacotes de Machine Learning prontos para uso fornecidos pela UiPath têm a versão 0 e já estão disponíveis em seu tenant, o que significa que não há necessidade de baixá-los.

O download está disponível apenas para as versões 1 ou superior, que já foram treinadas por você.

O Document Understanding contém vários Pacotes de ML divididos em cinco categorias principais:

  • UiPath Document OCR
  • Document Understanding
  • Classificador de documentos
  • Out-of-the-box Pre-trained ML Packages
  • Pacotes de ML DU pré-treinados e pré-configurados no AI Center
  • Outros pacotes de ML prontos para uso

UiPath Document OCR

Este é um modelo não retreinável que pode ser usado com a atividade do mecanismo UiPath Document OCR como parte da atividade Digitize Document. Para ser usada, a Habilidade de ML deve primeiro ser tornada pública para que um URL possa ser copiado e colado na atividade do mecanismo UiPath Document OCR.

Você pode executar o UiPathDocumentOCR na GPU ou na CPU, a precisão é a mesma em ambos os casos, mas o treinamento na GPU é mais rápido. Verifique os Requisitos de hardware para obter mais detalhes.

O UiPathDocumentOCR requer acesso ao servidor de medição do Document Understanding em https://du.uipath.com/metering se a Habilidade de ML estiver sendo executada em uma implantação regular no local do AI Center. Não é necessário acesso à Internet nas implantações no local e isoladas do AI Center.

UiPathDocumentOCR_CPU

Este pacote de ML pode ser implantado da mesma maneira que o pacote de ML UiPathDocumentOCR, com as seguintes diferenças:

  • isso é otimizado para ser executado na CPU, portanto, você deve ver uma aceleração de 3 a 4 vezes ao executar no fluxo de trabalho e de 5 a 10 vezes ao usá-lo para importar documentos para o Document Manager
  • a precisão é um pouco menor do que o Pacote de ML UiPathDocumentOCR e é semelhante ao pacote Studio UiPath.DocumentUnderstanding.OCR.LocalServer
  • por ser mais rápida, a CPU também é recomendada quando os documentos são grandes (mais de 20 páginas por documento) na ausência de GPU, o que é o ideal.

Document Understanding

Este é um modelo genérico e retreinável para extrair quaisquer pontos de dados comuns de qualquer tipo de documento estruturado ou semiestruturado, construindo um modelo do zero. Este Pacote de ML deve ser treinado. Se implantado sem treinamento prévio, a implantação falha com um erro informando que o modelo não foi treinado.

Classificador de documentos

Este é um modelo genérico e retreinável para classificar qualquer tipo de documento estruturado ou semiestruturado, construindo um modelo do zero. Este Pacote de ML deve ser treinado. Se implantado sem treinamento prévio, a implantação falha com um erro informando que o modelo não foi treinado.

Out-of-the-box Pre-trained ML Packages

Esses são Pacotes de ML retreináveis que contêm o conhecimento de diferentes modelos de Machine Learning.

Eles podem ser personalizados para extrair campos adicionais ou oferecer suporte a idiomas adicionais usando execuções de Pipeline. Usando recursos de aprendizado de transferência de última geração, esse modelo pode ser treinado novamente em documentos rotulados adicionais e adaptado a casos de uso específicos ou expandido para suporte adicional ao idioma latino, cirílico ou grego.

O conjunto de dados usado pode ter os mesmos campos, um subconjunto dos campos ou ter campos adicionais. Para se beneficiar da inteligência já contida no modelo pré-treinado, você precisa usar campos com os mesmos nomes do próprio modelo pronto para uso.

Esses Pacotes de ML são:

  • Faturas: os campos extraídos pré-configurados podem ser localizados aqui.
  • FaturasAustrália: os campos extraídos pré-configurados podem ser localizados aqui.
  • FaturasÍndia: os campos extraídos pré-configurados podem ser localizados aqui.
  • FaturasJapão Preview: os campos extraídos pré-configurados podem ser localizados aqui.

    A retenção usando dados da Estação de validação atualmente não é suportada.

  • FaturasChina Preview: os campos extraídos pré-configurados podem localizados aqui.

    A retenção usando dados da Estação de validação atualmente não é suportada.

  • Recibos: os campos extraídos pré-configurados podem ser encontrados aqui.
  • Ordens de compra: os campos extraídos pré-configurados podem ser localizados aqui.
  • Contas de serviço público: os campos extraídos pré-configurados podem ser localizados aqui.
  • Cartões de identificação: os campos extraídos pré-configurados podem ser localizados aqui.
  • Passaportes: os campos extraídos pré-configurados podem ser localizados aqui.
  • AvisosDePagamento: os campos extraídos pré-configurados podem ser localizados aqui.
  • ConhecimentoDeEmbarqueMarítimo: os campos extraídos pré-configurados podem ser localizados aqui.
  • W2: os campos extraídos pré-configurados podem ser localizados aqui.
  • W9: os campos extraídos pré-configurados podem ser localizados aqui.
  • ACORD125: os campos extraídos pré-configurados podem ser localizados aqui
  • I9: os campos extraídos pré-configurados podem ser localizados aqui
  • 990 Preview: os campos extraídos pré-configurados podem ser localizados aqui
  • 4506T: os campos extraídos pré-configurados podem ser localizados aqui
  • FM1003 Preview: os campos extraídos pré-configurados podem ser localizados aqui
  • ACORD25: os campos extraídos pré-configurados podem ser localizados aqui
  • 1040: os campos extraídos pré-configurados podem ser localizados aqui
  • Verificações: os campos extraídos pré-configurados podem ser localizados aqui
  • Extratos bancários: os campos extraídos pré-configurados podem ser localizados aqui
  • Demonstrações financeiras: os campos extraídos pré-configurados podem ser localizados aqui
  • Listas de embalagem: os campos extraídos pré-configurados podem ser localizados aqui
  • ACORD131: os campos extraídos pré-configurados podem ser localizados aqui
  • ACORD126: os campos extraídos pré-configurados podem ser localizados aqui
  • ACORD140: os campos extraídos pré-configurados podem ser localizados aqui
  • Licenças de veículo: os campos extraídos pré-configurados podem ser localizados aqui

Esses modelos são arquiteturas de deep learning criadas pela UiPath. Uma GPU pode ser usada tanto no tempo de serviço quanto no tempo de treinamento, mas não é obrigatória. Uma GPU oferece >10x de melhoria na velocidade para treinamento especificamente.

Os pacotes de ML pré-treinados e pré-configurados podem ser divididos em categorias de documentos com base no uso pretendido de cada modelo:

Categoria do documento

Modelo de ML

KYC

  • Passaportes
  • Cartões de ID
  • Contas de serviços
  • 4506T
  • 1040
  • Verificações
  • Títulos de veículos

Seguro

  • ACORD125
  • Acordo131
  • Acordo126
  • Acordo140

Empréstimo

  • FM1003
  • W2
  • 4506T

RH

  • Passaportes
  • Cartões de ID
  • W9
  • I9

Envio

  • Faturas
  • Conhecimentos de Embarque (inclui Conhecimentos Marítimos e Conhecimentos Aéreos)
  • Listas de embalagem

Contas a pagar

  • Faturas
  • Contas de serviços

Contas a receber

  • Avisos de remessas
  • Ordens de compra
  • Extratos bancários
  • Demonstrações financeiras

Despesas

  • Recebimentos

Outros pacotes de ML prontos para uso

Esses são pacotes não retreináveis que são necessários para componentes não ML do conjunto do Document Understanding.

Esses Pacotes de ML são:

  • FormExtractor: implante como Habilidade Pública e cole o URL na atividade Form Extractor.
  • IntelligentFormExtractor: implante como Habilidade Pública e cole o URL na atividade Intelligent Form Extractor. Certifique-se de primeiro implantar a Habilidade de ML HandwritingRecognition e configurá-la como OCR para este pacote.
  • IntelligentKeywordClassifier: implante como habilidade pública e cole o URL na atividade Intelligent Keyword Classifier.
  • HandwritingRecognitionOCR: implante como Habilidade Pública e use como OCR ao criar o pacote IntelligentFormExtractor.

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.