automation-suite
2022.4
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo.
Guia de instalação do Automation Suite
Last updated 4 de nov de 2024

Arquivo de configuração do Document Understanding

documentunderstanding é uma propriedade no arquivo de configuração do Automation Suite, cluster_config.json. Ela contém valores configuráveis que controlam o comportamento do serviço do Document Understanding. O instalador gera os valores padrão. Alterações adicionais podem ser feitas para configurar ainda mais o serviço do Document Understanding. Se você precisar alterar qualquer configuração relacionada ao Document Understanding, a seção documentunderstanding em cluster_config.json pode ser editada e o instalador pode ser executado novamente.

Como alternativa, as mesmas alterações também podem ser feitas no aplicativo da UiPath no ArgoCD.

cluster_config.json

Configuração do Document Understanding

"documentunderstanding": {
    "enabled": Boolean,
    "datamanager": { 
      "sql_connection_str" : "String"
    }
    "handwriting": {
      "enabled": Boolean,
      "max_cpu_per_pod": "Number"
    }
  }"documentunderstanding": {
    "enabled": Boolean,
    "datamanager": { 
      "sql_connection_str" : "String"
    }
    "handwriting": {
      "enabled": Boolean,
      "max_cpu_per_pod": "Number"
    }
  }
Observação:

A string de conexão SQL do Data Manager é opcional apenas se você quiser substituir o banco de dados padrão por um próprio.

O manuscrito fica sempre habilitado para a instalação online.

O exemplo de configuração completo

"documentunderstanding": {
    "enabled": true,
    "datamanager": {
      "sql_connection_str": "mssql+pyodbc://testadmin:myPassword@mydev-sql.database.windows.net:1433/datamanager?driver=ODBC+Driver+17+for+SQL+Server",
    },
    "handwriting": {
      "enabled": true,
      "max_cpu_per_pod": "2"
    }
  }"documentunderstanding": {
    "enabled": true,
    "datamanager": {
      "sql_connection_str": "mssql+pyodbc://testadmin:myPassword@mydev-sql.database.windows.net:1433/datamanager?driver=ODBC+Driver+17+for+SQL+Server",
    },
    "handwriting": {
      "enabled": true,
      "max_cpu_per_pod": "2"
    }
  }
Observação: o valor para max_cpu_per_pod é, por padrão, 2,mas pode ser ajustado de acordo com suas necessidades. Para obter mais informações sobre como fazer isso, consulte a seção (opcional) Parâmetro máximo de CPU por pod .

Valores configuráveis

datamanager.sql_connection_str

  • String de conexão para o Data Manager
  • Obrigatório: False.
  • Essa propriedade é gerada e preenchida pelo instalador. Você não precisa defini-la, a não ser que queira substituir a string de conexão padrão. Para obter mais detalhes sobre a conexão ao SQL, consulte a página Uso do arquivo de configuração.

manuscrito

  • Configurações para a funcionalidade de reconhecimento de letra manuscrita (parte do IntelligentFormExtractor)
  • Obrigatório: False.

handwriting.enabled

  • Definir isso como True cria os recursos necessários para executar o reconhecimento de letra manuscrita. Isso precisa ser verdadeiro para usar o IntelligentFormExtractor.
  • Obrigatório: False
  • Essa propriedade está sempre habilitada para a instalação online e desabilitada para a instalação (isolada) offline. Para a instalação isolada, você precisa instalar o pacote offline do Document Understanding antes de habilitar o manuscrito.

handwriting.max_cpu_per_pod

  • A quantidade máxima de CPUs que cada contêiner tem permissão para usar. O valor recomendado é 2.
  • Obrigatório: False.
  • Padrão: 2.
Se você quiser usar o Extrator de formulários inteligente com a funcionalidade de detecção de manuscrito, pode ser necessário ajustar o parâmetro handwriting.max_cpu_per_pod para obter mais poder de processamento.

Os seguintes fatores são necessários para calcular o dimensionamento correto:

  • volume total de documentos por ano = V
  • número esperado de fragmentos de manuscrito por documento = S
  • dias em que o fluxo de trabalho processa os documentos (dias úteis, todos os dias, fins de semana, etc.) = d
  • horas em que o fluxo de trabalho processa os documentos = h
  • Número de CPUs = (V x T / (d x h)) / 1500

Como um exemplo, se você espera ter um milhão de documentos para processar durante um ano usando o Extrator de formulários inteligente para detectar manuscritos, com uma média de 50 fragmentos, funcionando em dias úteis da 00:00 às 08:00 (8 horas), o cálculo seria:

Number of CPUs = (1,000,000 x 50 / (250 x 8)) / 1500
               = 25,000 / 1500
               = 17 CPUsNumber of CPUs = (1,000,000 x 50 / (250 x 8)) / 1500
               = 25,000 / 1500
               = 17 CPUs
Para o modo de avaliação de nó único, é necessário ajustar o parâmetro max_cpu_per_pod para 17.
Para o modo de produção pronto para alta disponibilidade de vários nós (3 nós), ajuste o parâmetro max_cpu_per_pod para 5 ou 6.

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.