Automation Suite
2023.4
falso
Imagem de fundo do banner
Guia de instalação do Automation Suite no Linux
Última atualização 24 de abr de 2024

Arquivo de configuração do Document Understanding

documentunderstanding é uma propriedade no arquivo de configuração do Automation Suite, cluster_config.json. Ela contém valores configuráveis que controlam o comportamento do serviço do Document Understanding. O instalador gera os valores padrão. Alterações adicionais podem ser feitas para configurar ainda mais o serviço do Document Understanding. Se você precisar alterar qualquer configuração relacionada ao Document Understanding, a seção documentunderstanding em cluster_config.json pode ser editada e o instalador pode ser executado novamente.

Como alternativa, as mesmas alterações também podem ser feitas no aplicativo da UiPath no ArgoCD.

cluster_config.json

Configuração do Document Understanding

"documentunderstanding": {
    "enabled": Boolean,
    "datamanager": { 
      "sql_connection_str" : "String"
    }
    "handwriting": {
      "enabled": Boolean,
      "max_cpu_per_pod": "Number"
    }
  }"documentunderstanding": {
    "enabled": Boolean,
    "datamanager": { 
      "sql_connection_str" : "String"
    }
    "handwriting": {
      "enabled": Boolean,
      "max_cpu_per_pod": "Number"
    }
  }
Observação:

A string de conexão SQL do Data Manager é opcional apenas se você quiser substituir o banco de dados padrão por um próprio.

O manuscrito fica sempre habilitado para a instalação online.

O exemplo de configuração completo

"documentunderstanding": {
    "enabled": true,
    "datamanager": {
      "sql_connection_str": "mssql+pyodbc://testadmin:myPassword@mydev-sql.database.windows.net:1433/datamanager?driver=ODBC+Driver+17+for+SQL+Server",
    },
    "handwriting": {
      "enabled": true,
      "max_cpu_per_pod": "2"
    }
  }"documentunderstanding": {
    "enabled": true,
    "datamanager": {
      "sql_connection_str": "mssql+pyodbc://testadmin:myPassword@mydev-sql.database.windows.net:1433/datamanager?driver=ODBC+Driver+17+for+SQL+Server",
    },
    "handwriting": {
      "enabled": true,
      "max_cpu_per_pod": "2"
    }
  }
Observação: o valor para max_cpu_per_pod é, por padrão, 2,mas pode ser ajustado de acordo com suas necessidades. Para obter mais informações sobre como fazer isso, consulte a seção (opcional) Parâmetro máximo de CPU por pod .

Valores configuráveis

datamanager.sql_connection_str

  • String de conexão para o Data Manager
  • Obrigatório: False.
  • Essa propriedade é gerada e preenchida pelo instalador. Você não precisa defini-la, a não ser que queira substituir a string de conexão padrão. Para obter mais detalhes sobre a conexão ao SQL, consulte a página Uso do arquivo de configuração.

manuscrito

  • Configurações para a funcionalidade de reconhecimento de letra manuscrita (parte do IntelligentFormExtractor)
  • Obrigatório: False.

handwriting.enabled

  • Definir isso como True cria os recursos necessários para executar o reconhecimento de letra manuscrita. Isso precisa ser verdadeiro para usar o IntelligentFormExtractor.
  • Obrigatório: False
  • Essa propriedade está sempre habilitada para a instalação online e desabilitada para a instalação (isolada) offline. Para a instalação isolada, você precisa instalar o pacote offline do Document Understanding antes de habilitar o manuscrito.

handwriting.max_cpu_per_pod

  • A quantidade máxima de CPUs que cada contêiner tem permissão para usar. O valor recomendado é 2.
  • Obrigatório: False.
  • Padrão: 2.
Se você quiser usar o Extrator de formulários inteligente com a funcionalidade de detecção de manuscrito, pode ser necessário ajustar o parâmetro handwriting.max_cpu_per_pod para obter mais poder de processamento.

Os seguintes fatores são necessários para calcular o dimensionamento correto:

  • volume total de documentos por ano = V
  • número esperado de fragmentos de manuscrito por documento = S
  • dias em que o fluxo de trabalho processa os documentos (dias úteis, todos os dias, fins de semana, etc.) = d
  • horas em que o fluxo de trabalho processa os documentos = h
  • Número de CPUs = (V x T / (d x h)) / 1500

Como um exemplo, se você espera ter um milhão de documentos para processar durante um ano usando o Extrator de formulários inteligente para detectar manuscritos, com uma média de 50 fragmentos, funcionando em dias úteis da 00:00 às 08:00 (8 horas), o cálculo seria:

Number of CPUs = (1,000,000 x 50 / (250 x 8)) / 1500
               = 25,000 / 1500
               = 17 CPUsNumber of CPUs = (1,000,000 x 50 / (250 x 8)) / 1500
               = 25,000 / 1500
               = 17 CPUs
Para o modo de avaliação de nó único, é necessário ajustar o parâmetro max_cpu_per_pod para 17.
Para o modo de produção pronto para alta disponibilidade de vários nós (3 nós), ajuste o parâmetro max_cpu_per_pod para 5 ou 6.

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.