UiPath Documentation
activities
latest
false

用户界面自动化活动

上次更新日期 2026年5月6日

计算机视觉屏幕作用域

UiPath.CV.Activities.CVScope

描述

初始化 UiPath 计算机视觉神经网络,分析指定窗口,并为所有后续计算机视觉活动提供作用域。该活动用于选择要用于抓取目标应用程序中文本的 OCR 引擎。此活动使用的默认 OCR 引擎为UiPath 屏幕 OCR 。可以通过将默认引擎手动替换为您选择的引擎来更改引擎。

备注:

如果您使用的是本地部署的 Linux Computer Vision 服务器部署,您也可以在此活动中使用UiPath 屏幕 OCR引擎。

文档图像

项目兼容性

Windows - Legacy | Windows

配置

常见
  • “出错时继续”- 指定在活动引发错误时是否应继续自动化操作。该字段仅支持“布尔值”(True 和 False)。默认值为 False。因此,如果该字段为空且活动引发错误,系统将停止执行项目。如果该值设为“True”,则无论出现何种错误,系统都将继续执行项目。

    备注:

    如果“Try Catch 异常处理”中包含该活动且“出错时继续”属性的值为“True”,则系统在执行项目时不会捕获任何错误。

  • “在此之前延迟”- 活动开始执行任何操作之前的延迟时间(以毫秒为单位)。此字段的默认值为 300 毫秒。

  • “显示名称”- 活动的显示名称。

输入
  • “计算机视觉方法”- 此为下拉列表,用于指定要与该活动一起使用的检测方法。默认情况下,“元素检测”和“OCR”选项均处于选中状态。可选择以下选项:
    • 无 - 仅使用图像自动化。
    • 元素检测 - 使用计算机视觉。
    • OCR - 使用 OCR。
  • “Target.ClippingRegion”- 按照左、上、右、下四个方向定义相对于用户界面元素的剪切矩形(以像素为单位)。支持正数和负数。
  • “Target.Element”- 使用另一个活动返回的“用户界面元素”变量。该属性不能与“选取器”属性一起使用。该字段仅支持用户界面元素变量。
  • “Target.Selector”- 用于在执行活动时查找特定用户界面元素的“文本”属性。它实际上是一个 XML 片段,用于指定要查找的图形用户界面元素及其一些父元素的属性。
  • “Target.Timeout(毫秒)”- 指定最长等待时间(以毫秒为单位),如果超出该时间后活动并未运行,系统便会抛出“SelectorNotFoundException”错误。默认值为 30000 毫秒(30 秒)。
  • Target.WaitForReady - 在执行操作之前,等待目标准备就绪。默认情况下,此字段设置为 INTERACTIVE。可选择以下选项:
    • “无”- 在执行操作之前,系统不会等待显示除目标用户界面元素之外的任何内容。例如,如果希望只从网页检索文本或单击特定按钮,则可以使用此选项,而不必等待用户界面元素全部加载。请注意,如果按钮依赖尚未加载的元素(如脚本),这可能会产生不良后果。
    • INTERACTIVE - 在执行操作之前,等待目标应用程序中使用的用户界面元素显示。
    • 完成 - 在执行操作之前,等待目标应用程序中的所有用户界面元素全部显示。 为了评估应用程序处于“交互”状态还是“完成”状态,系统将验证以下标签:
      • “桌面应用程序”- 系统会发出一条“wm_null”消息,以检查是否存在“<wnd>”、“<ctrl>”、“<java>”或“<uia>”标签。如存在,则执行活动。
      • 网页应用程序:
        • Internet Explorer - <webctrl>标签用于检查 HTML 文档的“就绪”状态是否设置为“完成(变量)” 。此外,必须将“忙碌”状态设置为False
        • Others - The <webctrl> tag is used to check if the Ready state of the HTML document is Complete.
      • “SAP 应用程序”- 首先验证是否存在“<wnd>”标签,然后使用 SAP 特定 API 来检测会话是否繁忙。
其他
  • “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
滚动
  • 滚动偏移- 滚动中使用的滚动偏移,在此作用域中查找每个“计算机视觉”活动的目标。
服务器(同步)
  • “API 密钥”- 用于对计算机视觉服务器进行身份验证的 API 密钥。该字段仅支持字符串或字符串变量。这是一个全局属性,适用于工作流中的所有“计算机视觉屏幕作用域”活动。

    备注:

    请注意,仅在连接到 UiPath Automation Cloud 服务器时才需要 API 密钥。有关获取秘钥的更多信息,请单击此处

    备注:

    编辑一个作用域活动的“API 密钥”属性会更改当前工作流中所有其他作用域的值,因此您不必手动执行此操作。

  • URL - 运行计算机视觉服务的服务器的 URL。默认情况下,此属性设置为 https://cv.uipath.com/。这是一个全局属性,在工作流中的所有“计算机视觉屏幕作用域”活动之间共享。

  • “使用本地服务器” - 如果选中,则本地服务器将用于分析。要使用本地服务器,需要安装UiPath.ComputerVision.LocalServer包。

    备注:

    使用神经网络模型的内部服务器部署时,要通过“计算机视觉”活动连接到该模型,必须将计算机视觉屏幕作用域活动的URL属性值更改为您服务器的 URL。有关连接到服务器的更多详细信息,请单击此处

在活动正文中

可以使用活动主体中的“在屏幕上指定”按钮,将要自动化的应用程序指定给“计算机视觉屏幕作用域”活动。完成此操作后,您指定的屏幕截图将显示在活动主体中。

文档图像

If you indicate multiple screens when automating an application, you can cycle between the screens by using the directional buttons (<, >) to easily check what screens the activity is using.

也可以通过从屏幕名称下拉列表中选择屏幕并单击 docs image 按钮来重命名屏幕。

  • 描述
  • 项目兼容性
  • 配置
  • 在活动正文中

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新