订阅

UiPath Automation Suite

UiPath Automation Suite 指南

Document Understanding 配置文件

documentunderstanding 是 Automation Suite 配置文件 cluster_config.json 中的一个属性。它包含控制 Document Understanding 服务行为的可配置值。安装程序会生成默认值。可以进行其他更改以进一步配置 Document Understanding 服务。如果您需要更改与 Document Understanding 相关的任何设置,则可以编辑 cluster_config.json 中的 documentunderstanding 部分,并且可以重新运行安装程序。
或者,可以在 ArgoCD 中的 UiPath 应用程序中进行相同的更改。

cluster_config.json

Document Understanding 配置


"documentunderstanding": {
    "enabled": Boolean,
    "datamanager": { 
      "sql_connection_str" : "String"
    }
    "handwriting": {
      "enabled": Boolean,
      "max_cpu_per_pod": "Number"
    }
  }

📘

备注:

仅当您要用自己的数据库覆盖默认数据库时,数据管理器 SQL 连接字符串才可选。


在线安装时始终启用手写功能。

完整配置示例


"documentunderstanding": {
    "enabled": true,
    "datamanager": {
      "sql_connection_str": "mssql+pyodbc://testadmin:[email protected]:1433/datamanager?driver=ODBC+Driver+17+for+SQL+Server",
    },
    "handwriting": {
      "enabled": true,
      "max_cpu_per_pod": "2"
    }
  }

📘

备注:

max_cpu_per_pod 的默认值为 2,但可以根据您的需求进行调整。有关如何执行此操作的更多信息,请参阅(可选)每个 Pod 的最大 CPU 参数部分。

 

可配置的值

datamanager.sql_connection_str


Connection string for datamanager
Required: False.
This property is generated and populated by the installer, you do not need to set it unless you want to override the default connection string. For more details about connecting to SQL please refer to the Using the configuration file page.

handwriting


Settings for the handwriting recognition functionality (part of IntelligentFormExtractor)
Required: False.

handwriting.enabled


Setting this to true creates the resources necessary for performing handwriting recognition. This needs to be true to use IntelligentFormExtractor.
Required: False
This property is always enabled for online installation, and disabled for offline (air-gapped) installation. For air-gapped installation, you need to install the Document Understanding offline bundle before enabling handwriting.

handwriting.max_cpu_per_pod


The maximum amount of CPUs each container is allowed to use. The recommended value is 2.
Required: False.
Default: 2.

如果您计划使用具有手写检测功能的智能表单提取程序,则可能需要调整 handwriting.max_cpu_per_pod 参数以提高处理能力。

计算正确的尺寸需要考虑以下因素:

  • 文档总量/年 = V
  • 预期手写碎片数/文档 = S
  • 工作流处理文档的天数(工作日、所有天数、周末等)= d
  • 工作流处理文档的小时数 = h
  • CPU 数量 = (V x S / (d x h)) / 1500

例如,如果您预计在一年内使用智能表单提取程序检测 100 万个文档,并在工作日的 00:00 至 08:00(8 小时)运行平均 50 个碎片,则计算公式为:

Number of CPUs = (1,000,000 x 50 / (250 x 8)) / 1500
               = 25,000 / 1500
               = 17 CPUs

对于单节点评估模式,您需要将 max_cpu_per_pod 参数调整为 17。
对于多节点 HA 就绪生产模式(3 个节点),请将 max_cpu_per_pod 参数调整为 5-6。

10 个月前更新


Document Understanding 配置文件


建议的编辑仅限用于 API 参考页面

您只能建议对 Markdown 正文内容进行编辑,而不能建议对 API 规范进行编辑。