document-understanding
2022.4
false
- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 管道
- Data Manager
- OCR 服务
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- 参考
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
智能关键词分类器
智能关键字分类器是一种分类器,它使用从某些文档类型的文件中学习的字词向量执行文档分类。
该算法围绕对相同文档类型重复内容的概念构建而成,其前提是文档类型包含一系列通常会在这些文档类型中出现的词,从而可以计算向量相似度。
将文件归入某一文档类型时,“智能关键字分类器”:
- 会查找与文件更相似的最接近的字词向量,
- 会报告得分最高的文档类型,以及基本的匹配主字词。
“智能关键字分类器”还具有文件拆分功能,这意味着它可以针对给定文件、单独的页面范围报告多个类。
将“智能关键字分类器训练器”活动放在“训练分类器作用域”中,并进行相应配置。
在活动级别,我们无法在并行训练之间强制保持训练文件一致性。Document Understanding 流程提供了可用于解决此问题的两种方法。两者都包含流量控制:
- 锁文件(在流程中默认实现):使用
.lock
扩展名重命名文件,修改并保存文件,然后再次重命名文件以删除.lock
扩展名 - 手动设置特殊队列:在 Orchestrator 中创建一个空队列,并集成项目中的两个活动
有关如何训练分类器的更多信息,请查看此页面,其中描述了“管理学习”向导的使用过程。
点击此链接,了解有关智能关键字分类器的更多信息。