Automation Suite
2023.10
False
- 概述
- 要求
- 推荐:部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 High Availability Add-on
- 步骤 4:配置 Microsoft SQL Server
- 步骤 5:配置负载均衡器
- 步骤 6:配置 DNS
- 步骤 7:配置内核和操作系统级别设置
- Step 8: Configuring the disks
- 步骤 9:配置节点端口
- 步骤 10:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- Step 15: Configuring the temporary Docker registry for offline installations
- Step 16: Validating the prerequisites for the installation
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
Document Understanding 特定配置
Linux 版 Automation Suite 安装指南
上次更新日期 2024年4月19日
Document Understanding 特定配置
documentunderstanding
是 Automation Suite 配置文件 cluster_config.json
中的一个属性。它包含控制 Document Understanding 服务行为的可配置值。安装程序会生成默认值。可以进行其他更改以进一步配置 Document Understanding 服务。如果您需要更改与 Document Understanding 相关的任何设置,则可以编辑 cluster_config.json
中的 documentunderstanding
部分,并且可以重新运行安装程序。
Alternatively, the same changes can be made in the UiPath® app in ArgoCD.
"documentunderstanding": {
"enabled": Boolean,
"datamanager": {
"sql_connection_str" : "String"
}
"handwriting": {
"enabled": Boolean,
"max_cpu_per_pod": "Number"
}
}
"documentunderstanding": {
"enabled": Boolean,
"datamanager": {
"sql_connection_str" : "String"
}
"handwriting": {
"enabled": Boolean,
"max_cpu_per_pod": "Number"
}
}
备注:
仅当您要用自己的数据库覆盖默认数据库时,数据管理器 SQL 连接字符串才可选。
在线安装时始终启用手写功能。
"documentunderstanding": {
"enabled": true,
"datamanager": {
"sql_connection_str": "mssql+pyodbc://testadmin:myPassword@mydev-sql.database.windows.net:1433/datamanager?driver=ODBC+Driver+17+for+SQL+Server",
},
"handwriting": {
"enabled": true,
"max_cpu_per_pod": "2"
}
}
"documentunderstanding": {
"enabled": true,
"datamanager": {
"sql_connection_str": "mssql+pyodbc://testadmin:myPassword@mydev-sql.database.windows.net:1433/datamanager?driver=ODBC+Driver+17+for+SQL+Server",
},
"handwriting": {
"enabled": true,
"max_cpu_per_pod": "2"
}
}
- Data Manager 的连接字符串
- 必填项:False。
- 此属性由安装程序生成并填充,除非要覆盖默认连接字符串,否则不需要设置它。有关连接到 SQL 的更多详细信息,请参阅使用配置文件页面。
- 将此设置为 True 可创建执行手写识别所需的资源。要使用智能表单提取程序,此项必须为 True。
- 必填项:False
- 对于在线安装,始终启用此属性,而对于离线(脱机)安装则始终禁用。对于离线安装,您需要在启用手写之前安装 Document Understanding 离线捆绑包。
- 每个容器允许使用的最大 CPU 数量。建议值为 2。
- 必填项:False。
- 默认值: 2。
如果您计划使用具有手写检测功能的智能表单提取程序,则可能需要调整
handwriting.max_cpu_per_pod
参数以提高处理能力。
计算正确的尺寸需要考虑以下因素:
- 文档总量/年 = V
- 预期手写碎片数/文档 = S
- 工作流处理文档的天数(工作日、所有天数、周末等)= d
- 工作流处理文档的小时数 = h
- CPU 数量 = (V x S / (d x h)) / 1500
例如,如果您预计在一年内使用智能表单提取程序检测 100 万个文档,并在工作日的 00:00 至 08:00(8 小时)运行平均 50 个碎片,则计算公式为:
Number of CPUs = (1,000,000 x 50 / (250 x 8)) / 1500
= 25,000 / 1500
= 17 CPUs
Number of CPUs = (1,000,000 x 50 / (250 x 8)) / 1500
= 25,000 / 1500
= 17 CPUs
对于单节点评估模式,您需要将
max_cpu_per_pod
参数调整为 17。
对于多节点 HA 就绪生产模式(3 个节点),请将
max_cpu_per_pod
参数调整为 5-6。