communications-mining
latest
false
重要 :
Communications Mining 现在是 UiPath IXP 的一部分。有关更多详细信息,请查看用户指南中的简介。 请注意,此内容已使用机器翻译进行了本地化。 新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Communications Mining 用户指南

上次更新日期 2025年5月12日

验证并标注生成的提取

概述

本节说明如何验证提取的字段预测。

提取可以是以下类型:

  • 生成的提取内容 - 模型根据您提供的输入(即标签、注释),方法是选择“预测提取”选项。
  • 手动创建的提取 - 如果模型尚未进行预测,则可以为特定标签创建提取字段。

请确保您提供了足够的示例,以便模型可以返回验证统计信息。验证统计信息可帮助您了解提取的性能。此外,它还允许您微调提取。

通过微调,您可以使用收集的注释来提高提取模型的性能。​它还允许您使用开箱即用的模型,并增强用例的性能。

备注:
  • 您可以决定何时停止训练标签
  • 不同的用例对于提取有不同的性能要求。​
重要提示:如果您使用Preview LLM ,作为最佳实践,请在每个字段达到 25 个示例后停止注释更多示例。 这对于上下文学习和验证来说已经足够了,更多的示例不会提高性能。

查看提取结果,并且根据具体情况,您可以从以下操作中进行选择:

  • 如果提取内容全部正确,则接受​。
  • 如果有任何不正确的预测,请更正提取。
  • 如果消息中不存在提取内容,则将其标记为缺失。
  • 如果缺少任何其他字段,请配置启用端到端自动化所需的字段。

什么时候可以停止批注?

在提供至少25 个标签提取示例以供模型在其验证流程中使用后停止。 检查验证,并查看性能是否足够,或者是否需要更多示例。

验证来自“探索”选项卡的提取

概述

# 说明
1如果所有字段预测都正确,请选择“全部确认”以批量验证注释是否正确。
2要添加新的提取字段,请选择通用字段旁边或任何提取字段旁边的加号按钮。 要编辑任何现有字段,请选择“通用字段”旁边或任何提取字段旁边的垂直省略号。
3在侧面板中,如果您选中预测提取旁边的复选框,则表示您确认字段注释在提取级别正确。
4在每个字段下,您可以找到模型预测的数据点。

如果预测不正确,请选择x按钮以使用正确的字段调整字段。

5在原始消息中标记预测的数据点。
  • Adocs image图标表示消息中存在常规字段
  • Andocs image图标表示消息中存在提取字段
6要添加或修改任何字段,请将鼠标悬停在相应的通用字段或提取字段部分上的+按钮旁边。
7要展开通用字段或特定提取字段的显示字段,请选择下拉按钮。

验证提取

要验证您的提取,请应用以下步骤:
  1. 选择数据集旁边的“探索”以访问该特定数据集。
  2. “探索”选项卡下,选择“注释字段”
  3. 在侧面板中,选择“预测提取”按钮。
  4. 在同一侧面板中,模型预测旁边会显示用红色或绿色圆圈标记的匹配指示器。
    探索标签页匹配指示器
    注意:匹配指示器显示模型预测是否与您为提取字段所做的注释匹配。 这些指标在用户界面中以红色或绿色圆圈标记在提取字段和提取级别中。 如果值不匹配,则说明值不匹配或缺失。 您可以重新运行最新的模型预测,以确认它们是否与提供的注释匹配。

    匹配指标可返回的状态包括:
    • 绿色 - 预测与注释相符。 仅当所有提取字段的指示符均为绿色时,才在提取级别可见。
    • 红色 - 预测与注释不匹配,或者预测缺少注释。 如果提取中的任何字段具有红色指示器,则在提取级别可见。

未确认的状态提取

下图显示了提取处于未确认状态的情况。 在右侧窗格中,提取被标记为未确认,并且文本本身的高亮显示颜色较浅。

注意:​相同的概念也适用于“常规”字段


已确认的状态提取

下图显示了字段处于已确认状态的情况。 在右侧窗格中,提取标记为“已确认” ,并且文本本身的高亮显示颜色较深。

注意:相同的概念也适用于“常规”字段。


验证“训练”选项卡中的提取内容

备注: “训练” 选项卡下的“提取” 处于公开预览阶段。

您可以在与“探索”选项卡类似的方式下验证“训练” 选项卡体验下的提取。

要验证您的提取,请应用以下步骤:

  1. 选择数据集旁边的“训练”以访问该特定数据集。
  2. “训练”选项卡下,选择“提取”
  3. 选择要验证的标签提取。


  4. 确认显示的消息是否是标签的适用示例。
  5. 应用所有适用标签后,选择“下一步:注释字段”


  6. 在接下来的页面上,模型预测旁边会显示标有红色或绿色圆圈的匹配指示器。
    注意:匹配指示器显示模型预测是否与您为提取字段所做的注释匹配。 这些指标在用户界面中以红色或绿色圆圈标记在提取字段和提取级别中。 如果值不匹配,您会注意到值不匹配或丢失。 您可以重新运行最新的模型预测,以确认它们是否与提供的注释匹配。

    匹配指标可返回的状态包括:
    • 绿色 - 预测与注释相符。 仅当所有提取字段的指示符均为绿色时,才在提取级别可见。
    • 红色 - 预测与注释不匹配,或者预测缺少注释。 如果提取中的任何字段具有红色指示器,则在提取级别可见。
  7. 选择“全部确认”,然后选择“下一步”查看下一条要自动标注的消息。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
© 2005-2025 UiPath。保留所有权利。