document-understanding
2020.10
false
- 入门指南
- 框架组件
- AI Center 中的 Document Understanding
- 管道
- ML 包
- Data Manager
- OCR 服务
- 许可
- 参考
配置 Data Manager
已弃用
Document Understanding 用户指南
配置 Data Manager
您必须先创建一个用于保存 ML 数据的工作文件夹。下面记录的所有命令将引用该文件夹。
注意:启动 Data Manager 之前,请执行下面的配置步骤。如果稍后需要更改配置(例如 OCR 引擎或用户密码),则需要使用 docker stop 命令停止 Data Manager,运行配置命令,然后再次启动 Data Manager。请参阅此处的 Docker 速查表。
默认情况下,系统会用 admin 用户名和 admin 密码创建管理员用户。
要创建新用户,请停止正在运行的 Data Manager 容器,并使用以下命令,然后再次启动 Data Manager 容器:
docker run --rm -it -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --user <username> --passw <password>
docker run --rm -it -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --user <username> --passw <password>
每个用户还可以在“设置” ->“密码”视图中修改其密码,通过屏幕右上角的按钮即可访问此视图。
在您自己的计算机或安全的办公网络中运行 Data Manager 时,您不需要这样做。
但是,如果您计划在开放互联网的远程服务器上运行 Data Manager,则强烈建议您启用 SSL 加密。
为此,您需要获取远程服务器的 DNS 名称,并以 PEM 格式为该域名生成一个 https 证书(.crt 文件)和密钥(.key 文件),然后将其放置在远程服务器上名为 certs 的文件夹中。
然后,您需要使用以下命令启动 Data Manager:
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certs_folder>:/certs" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --https-certificate /certs/<cert_filename.crt> --https-private-key /certs/<key_filename.key>
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certs_folder>:/certs" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --https-certificate /certs/<cert_filename.crt> --https-private-key /certs/<key_filename.key>
在此命令中,<cert_filename.crt> 指 .crt 文件的名称,key_filename.key> 指 .key 文件(您已放置在 certs 文件夹中)的名称。
要在 AI Center 中使用重新训练功能,您需要基于 UiPath 提供的开箱即用式预训练 ML 包已提取的字段来使用一组字段。此字段列表称为架构。
为了更容易入门,我们在下方提供了开箱即用的 ML 包架构。这些是
.zip
文件,您可以将其导入 Data Manager,就像导入数据集一样。
UiPath 提供的预训练 ML 包的架构可通过下表中的链接获得:
重要提示:日本发票 ML 包仅支持 Google Cloud Vision OCR。
从上表下载
.zip
文件后,您可以单击屏幕顶部的“导入”按钮,从而导入架构到 Data Manager,然后从对话框中选择 .zip
文件。Data Manager 会检测到这是一个新架构,然后将其直接导入。