Arquivo de configuração do Document Understanding

documentunderstanding é uma propriedade no arquivo de configuração do Automation Suite, cluster_config.json. Ela contém valores configuráveis que controlam o comportamento do serviço do Document Understanding. O instalador gera os valores padrão. Alterações adicionais podem ser feitas para configurar ainda mais o serviço do Document Understanding. Se você precisar alterar qualquer configuração relacionada ao Document Understanding, a seção documentunderstanding em cluster_config.json pode ser editada e o instalador pode ser executado novamente.

Como alternativa, as mesmas alterações também podem ser feitas no aplicativo da UiPath no ArgoCD.

cluster_config.json

Configuração do Document Understanding

"documentunderstanding": {
    "enabled": Boolean,
    "datamanager": { 
      "sql_connection_str" : "String"
    }
    "handwriting": {
      "enabled": Boolean,
      "max_cpu_per_pod": "Number"
    }
  }"documentunderstanding": {
    "enabled": Boolean,
    "datamanager": { 
      "sql_connection_str" : "String"
    }
    "handwriting": {
      "enabled": Boolean,
      "max_cpu_per_pod": "Number"
    }
  }

Observação:

A string de conexão SQL do Data Manager é opcional apenas se você quiser substituir o banco de dados padrão por um próprio.

O manuscrito fica sempre habilitado para a instalação online.

O exemplo de configuração completo

"documentunderstanding": {
    "enabled": true,
    "datamanager": {
      "sql_connection_str": "mssql+pyodbc://testadmin:myPassword@mydev-sql.database.windows.net:1433/datamanager?driver=ODBC+Driver+17+for+SQL+Server",
    },
    "handwriting": {
      "enabled": true,
      "max_cpu_per_pod": "2"
    }
  }"documentunderstanding": {
    "enabled": true,
    "datamanager": {
      "sql_connection_str": "mssql+pyodbc://testadmin:myPassword@mydev-sql.database.windows.net:1433/datamanager?driver=ODBC+Driver+17+for+SQL+Server",
    },
    "handwriting": {
      "enabled": true,
      "max_cpu_per_pod": "2"
    }
  }

Observação: o valor para max_cpu_per_pod é, por padrão, 2,mas pode ser ajustado de acordo com suas necessidades. Para obter mais informações sobre como fazer isso, consulte a seção (opcional) Parâmetro máximo de CPU por pod .

Valores configuráveis

datamanager.sql_connection_str

String de conexão para o Data Manager
Obrigatório: False.
Essa propriedade é gerada e preenchida pelo instalador. Você não precisa defini-la, a não ser que queira substituir a string de conexão padrão. Para obter mais detalhes sobre a conexão ao SQL, consulte a página Uso do arquivo de configuração.

manuscrito

Configurações para a funcionalidade de reconhecimento de letra manuscrita (parte do IntelligentFormExtractor)
Obrigatório: False.

handwriting.enabled

Definir isso como True cria os recursos necessários para executar o reconhecimento de letra manuscrita. Isso precisa ser verdadeiro para usar o IntelligentFormExtractor.
Obrigatório: False
Essa propriedade está sempre habilitada para a instalação online e desabilitada para a instalação (isolada) offline. Para a instalação isolada, você precisa instalar o pacote offline do Document Understanding antes de habilitar o manuscrito.

handwriting.max_cpu_per_pod

A quantidade máxima de CPUs que cada contêiner tem permissão para usar. O valor recomendado é 2.
Obrigatório: False.
Padrão: 2.

Se você quiser usar o Extrator de formulários inteligente com a funcionalidade de detecção de manuscrito, pode ser necessário ajustar o parâmetro handwriting.max_cpu_per_pod para obter mais poder de processamento.

Os seguintes fatores são necessários para calcular o dimensionamento correto:

volume total de documentos por ano = V
número esperado de fragmentos de manuscrito por documento = S
dias em que o fluxo de trabalho processa os documentos (dias úteis, todos os dias, fins de semana, etc.) = d
horas em que o fluxo de trabalho processa os documentos = h
Número de CPUs = (V x T / (d x h)) / 1500

Como um exemplo, se você espera ter um milhão de documentos para processar durante um ano usando o Extrator de formulários inteligente para detectar manuscritos, com uma média de 50 fragmentos, funcionando em dias úteis da 00:00 às 08:00 (8 horas), o cálculo seria:

Number of CPUs = (1,000,000 x 50 / (250 x 8)) / 1500
               = 25,000 / 1500
               = 17 CPUsNumber of CPUs = (1,000,000 x 50 / (250 x 8)) / 1500
               = 25,000 / 1500
               = 17 CPUs