- 概述
- 入门指南
- Activities (活动)
- Insights 仪表板
- Document Understanding 流程
- 快速入门教程
- 框架组件
- 模型详细信息
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 流量限制
- OCR 配置
- 管道
- OCR 服务
- 支持的语言
- 深度学习
- 数据与安全性
- 许可和计费逻辑

Document Understanding classic user guide
概述
There are several ways in which you can consume Document UnderstandingTM capabilities:
- The DocumentUnderstanding.Activities package is available in Studio Web, Studio X, and Studio Desktop and is pre-configured for you either when you create a new automation starting from a file, or if you continue your journey after publishing a project version.
- Using the IntelligentOCR package, which is designed for Windows and Windows Legacy projects, and pre-configured in the Document Understanding process template.
- Using cloud API calls, consuming Document Understanding as a service via the programming language of your choice.
Document Understanding 活动
If you're an RPA developer, you can use DocumentUnderstanding.Activities in your cloud projects. Using Document Understanding allows you to handle all data about a document within a single input/output object, named Document Data. Also, Document Understanding activities don't require setting the taxonomy of Document Types, so you can easily leverage out-of-the-box-models.
您可以通过 Document Understanding、UiPath Marketplace 和 Studio Web 中提供的提取自动化生成器,使用以下某些活动轻松设置自动化:
请记住,Document Understanding 活动尚不支持以下功能:拆分、训练(模型微调)、生产/开发者租户支持、内部部署支持以及每种文档类型的多种提取方法。
If you start new automation projects that leverage modern projects (created using the Active Learning experience), you can use DocumentUnderstanding.Activities.
智能 OCR
作为想要试用 IntelligentOCR 包的 RPA 开发者,您可以根据需要使用不同的提取和分类模型。如果一个模型不能满足您的需求,您可以使用其他提取程序或分类器作为备用选项。您还可以在运行时使用 RPA 代码修改分类、文档对象模型 (DOM) 和提取结果。
但是,使用智能 OCR 需要更长的学习曲线,因为其灵活性涉及多种活动和数据类型,同时也涉及复杂性。
With IntelligentOCR, you can integrate your own classifier, extractor, or OCR engine. Visit Document Processing Code Samples to check implementation examples.
API 调用
您可以使用 API 调用替代机器人流程自动化 (RPA) 方法。API 调用可让您检索有关项目的详细信息,包括所使用的提取程序和分类器,方便使用数字化 API,使用专用模型和生成式模型对文档中的数据进行分类和提取,并验证先前数字化、分类和提取的信息。
要使用 API,您可以使用任何编程/脚本语言(因为调用是使用 HTTP 进行的),包括 RPA。
You can access the APIs via Swagger: In the toolbar of the Document Understanding service, search the REST API dropdown list, and select Framework.
For more information on how to get started with the Document Understanding APIs, check the Document Understanding API Guide.