document-understanding
2024.10
false
- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- 990 - ML 包 - 预览
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 护照 - ML 包
- 工资单 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 硬件要求
- 管道
- Document Manager
- OCR 服务
- 深度学习
- Insights 仪表板
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- 活动
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
Last updated 2024年11月11日
“智能 OCR”活动
With Intelligent OCR activities you can process documents in a comprehensive manner, allowing you to not only digitize, extract, classify, and validate documents, but also train your extractor and classifiers on your specific data, so they can be faster and more accurate. The steps involved in creating Document UnderstandingTM processes using Intelligent OCR activities are:
- 创建分类:定义文档类型,并使用“加载分类”活动将其转换为文档对象模型变量。
- 将文档数字化:准备文档,以便机器人可以使用 OCR 引擎处理这些文档,方法是将其文本存储在字符串变量中,并将有关它们的基本信息存储在文档对象模型文件中。
- 对文档进行分类:使用特定的分类器准备文档,以便机器人识别要处理的文件类型。
- 验证文档的分类:核实并验证文档是否已正确分类。
- 训练分类器:验证分类时根据收到的输入配置分类器
- 从文档中提取数据:使用各种提取程序从文档中识别并提取特定信息,然后将其发送以进行验证。
- 验证提取文档:使用 Action Center 中团队成员的输入核实和验证您处理、分类和提取的文档。
- 训练提取程序:验证提取时根据收到的输入配置提取程序。
- 消耗导出数据:验证提取的数据后,您可以按原样使用数据,也可以使用“导出提取结果”活动将其导出为数据集变量。