automation-suite
2023.4
false
Important :
Veuillez noter que ce contenu a été localisé en partie à l’aide de la traduction automatique.
Guide d'installation d'Automation Suite sur Linux
Last updated 2 oct. 2024

Fichier de configuration de Document Understanding

documentunderstanding est une propriété du fichier de configuration d'Automation Suite, cluster_config.json. Il contient des valeurs configurables qui contrôlent le comportement du service Document Understanding. Le programme d'installation génère les valeurs par défaut. Des modifications supplémentaires peuvent être apportées pour configurer davantage le service Document Understanding. Si vous devez modifier des paramètres liés à Document Understanding, la section documentunderstanding dans cluster_config.json peut être modifiée et le programme d'installation peut être réexécuté.

Alternativement, les mêmes modifications peuvent être apportées dans l'application UiPath dans ArgoCD.

cluster_config.json

Configuration de Document Understanding

"documentunderstanding": {
    "enabled": Boolean,
    "datamanager": { 
      "sql_connection_str" : "String"
    }
    "handwriting": {
      "enabled": Boolean,
      "max_cpu_per_pod": "Number"
    }
  }"documentunderstanding": {
    "enabled": Boolean,
    "datamanager": { 
      "sql_connection_str" : "String"
    }
    "handwriting": {
      "enabled": Boolean,
      "max_cpu_per_pod": "Number"
    }
  }
Remarque :

La chaîne de connexion SQL du Data Manager est facultative uniquement si vous souhaitez remplacer la base de données par défaut par la vôtre.

L'écriture manuscrite est toujours activée pour l'installation en ligne.

L'exemple de configuration complète

"documentunderstanding": {
    "enabled": true,
    "datamanager": {
      "sql_connection_str": "mssql+pyodbc://testadmin:myPassword@mydev-sql.database.windows.net:1433/datamanager?driver=ODBC+Driver+17+for+SQL+Server",
    },
    "handwriting": {
      "enabled": true,
      "max_cpu_per_pod": "2"
    }
  }"documentunderstanding": {
    "enabled": true,
    "datamanager": {
      "sql_connection_str": "mssql+pyodbc://testadmin:myPassword@mydev-sql.database.windows.net:1433/datamanager?driver=ODBC+Driver+17+for+SQL+Server",
    },
    "handwriting": {
      "enabled": true,
      "max_cpu_per_pod": "2"
    }
  }
Remarque : La valeur de max_cpu_per_pod est par défaut 2, mais elle peut être ajustée selon vos besoins. Pour plus d'informations sur la procédure à suivre, consultez la section (facultative) Nombre max de CPU par paramètre de pod.

Valeurs configurables

datamanager.sql_connection_str

  • Chaîne de connexion pour le gestionnaire de données
  • Obligatoire : False
  • Cette propriété est générée et renseignée par le programme d'installation, vous n'avez pas besoin de la définir, sauf si vous souhaitez remplacer la chaîne de connexion par défaut. Pour plus de détails sur la connexion à SQL, veuillez consulter la page Utiliser le fichier de configuration.

Écriture manuscrite

  • Paramètres de la fonctionnalité de reconnaissance de l'écriture manuscrite (partie d'IntelligentFormExtractor)
  • Obligatoire : False

handwriting.enabled

  • Définir ce paramètre sur "true" crée les ressources nécessaires à la reconnaissance de l'écriture manuscrite. Il doit être défini sur true pour pouvoir utiliser IntelligentFormExtractor.
  • Obligatoire : False
  • Cette propriété est toujours activée pour l'installation en ligne et désactivée pour l'installation hors ligne (physiquement isolée). Pour une installation physiquement isolée, vous devez installer l'ensemble hors ligne Document Understanding avant d'activer l'écriture manuscrite.

handwriting.max_cpu_per_pod

  • Le nombre maximal de processeurs que chaque conteneur est autorisé à utiliser. La valeur recommandée est 2.
  • Obligatoire : False
  • Par défaut : 2.
Si vous prévoyez d'utiliser Intelligent Form Extractor avec la fonction de détection d'écriture manuscrite, vous devrez peut-être ajuster le paramètre handwriting.max_cpu_per_pod pour plus de puissance de traitement.

Les facteurs suivants sont nécessaires pour calculer le bon dimensionnement :

  • volume total de documents/an = V
  • nombre attendu de shreds d'écriture manuscrite/doc = S
  • jours pendant lesquels le workflow traite les documents (jours ouvrés, tous les jours, week-ends, etc.) = d
  • heures pendant lesquelles le workflow traite les documents = h
  • Nombre de CPU = (V x S / (d x h)) / 1500

Par exemple, si vous prévoyez d'avoir 1 million de documents à traiter pendant un an à l'aide d'Intelligent Form Extractor pour la détection de l'écriture manuscrite, avec 50 shreds en moyenne, exécutés en semaine de 00h00 à 08h00 (8 heures), le calcul serait :

Number of CPUs = (1,000,000 x 50 / (250 x 8)) / 1500
               = 25,000 / 1500
               = 17 CPUsNumber of CPUs = (1,000,000 x 50 / (250 x 8)) / 1500
               = 25,000 / 1500
               = 17 CPUs
Pour une installation en mode d'évaluation à nœud unique, vous devez régler le paramètre max_cpu_per_pod sur 17.
Pour le mode de production multi-nœuds compatible haute disponibilité (3 nœuds), réglez le paramètre max_cpu_per_pod sur 5-6.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.