活动

分类文档作用域

UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope

为分类器活动提供作用域，进而提供执行文档分类所需的所有必要文件。至少接受一个分类器或接受分类器之间的多个代理，确保将所有参数转发到子分类活动。

属性

文档对象模型 - 要用于验证文档的文档对象模型。此模型存储在 Document 变量中，可以从数字化文档活动中检索。有关如何执行此操作的更多信息，请参阅活动的文档。此字段仅支持 Document 变量。
“文档路径”- 要验证的文档的路径。此字段仅支持字符串和字符串变量。

注意：该属性字段支持的文件类型包括“.png”、“.gif”、“.jpe”、“.jpg”、“.jpeg”、“.tiff”、“.tif”、“.bmp”和“.pdf”。
“文档 文本”- 文档本身的文本，存储在字符串变量中。可以从“ 数字化文档” 活动中检索此值。有关如何执行此操作的更多信息，请参阅活动的文档。此字段仅支持字符串和字符串变量。
“分类”- 要处理的文档的分类，存储在 DocumentTaxonomy 变量中。此字段仅支持 DocumentTaxonomy 变量。

“分类结果”- 对指定文件运行分类器文件的结果，存储在 IReadOnlyList<ClassificationResult> 对象中。此字段仅支持 IReadOnlyList<ClassificationResult> 变量。

“分类结果”对象包含：

“文档类型 ID”- 与“分类”匹配的文档类型所对应的 ID。
“文档 ID”- 已处理文档的文件名。
“内容类型”- 已处理文档中包含的内容类型。
“可信度”- 分类可信度，以 0 到 1 之间的数值显示。
“OCR 可信度”- 报告的引用中所含字符的 OCR 可信度，以 0 到 1 之间的数值显示。
“引用”- 分类的证明，可用于文档的文本版（通过“TextStartIndex”和“TextLength”）和“文档对象模型”（通过“Tokens”以及用于从中选取证明的每个页面的高亮显示框）。
“文档边界”- 用于描述分类所属的文档部分，包括“StartPage”（“Int32”，从 0 开始）、“PageCount”（“Int32”）、“TextStartIndex”（“Int32”，从 0 开始）、“TextLength”（“Int32”）。
“分类器名称”- 由“分类文档作用域”活动自动填充，将填充为用于报告当前“分类结果”的分类器的显示名称。

注意：ClassificationResults 将所有内容按可信度分数降序排列，这表示最顶部的内容具有最高可信度。

“ 配置分类器向导 ”允许您配置将分类器应用于每种文档类型的方式，以及可接受的结果。

请按照以下步骤配置向导：

将“对文档范围进行分类”活动添加到工作流中。
将一个或多个分类器活动放置在“对文档范围进行分类”活动中。
- 为您的分类器提供暗示性名称。
- 按接受优先级的顺序，从左到右对范围内的分类器排序。
- 单击“配置分类器”按钮，以配置分类器。
- 您现在可以看到向导。
选中要激活的分类器和文档类型对的复选框。取消选中某个分类器的文档类型意味着：(1) 未训练或配置该分类器以识别该特定的文档类型；或 (2) 分类器对特定文档类型的执行不如预期，如果分类器返回此类结果，应将其忽略。
如果分类器具有自己的分类，则使用每个复选框旁边的文本框设置两个分类之间正确的分类映射。例如，如果已将 Classifier1 配置为返回“发票”的类 INV，但您的项目分类包含一个名为“传入发票”的文档类型，则与“传入发票”相对应的方框和特定的 Classifier1 应包含字符串 INV。
为每个分类器选择一个最低可信度阈值。可接受的值介于 0（无最低可信度）和 100 之间。如果分类器返回可信度低于设定阈值的分类结果，则“对文档范围进行分类”将忽略该分类结果，并且不会报告该结果。
配置所有分类器后，单击“保存”按钮。