activities
latest
false
UiPath logo, featuring letters U and I in white

Document Understanding 活动

上次更新日期 2024年12月5日

生成式分类器 - 良好做法

生成式分类器允许您使用生成模型对文档进行分类。 您可以在此页面中找到有关如何使用生成式分类器充分利用工作流的提示和技巧。

对大量文档进行分类

假设您有大量合同,需要将其归入不同类别。 要使用生成式分类器优化此流程,请遵循本页中列出的良好做法。

优化输入提示

要优化输入提示,请提供尽可能多的上下文。 提供每种文档类型的详细说明。 例如,在对发票进行分类时可以考虑以下文本: “发票是卖方向买方签发的文件,其中详细说明了所提供的产品或服务、数量和价格。其中包含卖方和买方的详细信息、发票编号、日期、到期总金额和付款条件。发票用于在业务事务中请求付款和保存记录”

为了使生成式模型有效运行,有必要提供广泛的上下文,而不是提供简短而模糊的文档式描述,这可能会导致明显的错误。

优化工作流

要优化工作流,请首先创建一个文件夹来移动已分类的文件,以避免冗余分类。

在自动化更大的数据集之前,创建一个示例文档集。 此示例集应包含已损坏且受密码保护的 PDF,以测试工作流。 建议您在工作流中加入“ Try Catch异常处理”活动,以防止由于 PDF 文件损坏或受密码保护而可能发生的故障。 完成“Try Catch 异常处理”活动后,即可在样本集上测试工作流,以确保其有效性。

在工作流中,缓存数字化结果(文档文本和文档对象模型)可在对同一个文件进行多次测试时节省时间。

  • 对大量文档进行分类
  • 优化输入提示
  • 优化工作流

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。