订阅

UiPath Studio

UiPath Studio 指南

输出或屏幕抓取方法

输出或屏幕抓取方法是指那些用于从指定的用户界面元素或文档(如 .pdf 文件)中提取数据的活动。

为了了解哪一个更适合自动化您的业务流程,我们来看看它们之间的区别。

Capability MethodSpeedAccuracyBackground ExecutionExtract Text PositionExtract Hidden TextSupport for Citrix
FullText10/10100%yesnoyesno
Native8/10100%noyesnono
OCR3/1098%noyesnoyes

默认方法是“全文”,它快速而准确,但与“原生”方法不同的是,它不能提取文本的屏幕坐标。

这两种方法都只适用于桌面应用程序,但“原生”方法只适用于为了使用图形设备接口 (GDI) 呈现文本而构建的应用程序。

OCR 不是 100% 准确,但可用于提取其他两种方法无法提取的文本,因为它适用于包括 Citrix 在内的所有应用程序Studio 默认情况下使用两个 OCR 引擎:Google Tesseract 和 Microsoft Modi。

Languages can be changed for OCR engines and you can find out how to Install OCR Languages here.

Capability MethodMultiple Languages SupportPreferred Area SizeSupport for Color InversionSet Expected Text FormatFilter Allowed CharactersBest with Microsoft Fonts
Google TesseractCan be addedSmallyesyesyesno
Microsoft MODISupported by defaultLargenononoyes

要开始从各种来源提取文本,请单击“设计”功能区选项卡上“向导”组中的“屏幕抓取”按钮。

利用上述三种输出方法之一,屏幕抓取向导可以让您指向用户界面元素并从中提取文本。Studio 自动为您选择屏幕抓取方法,并将其显示在“屏幕抓取器向导”窗口的顶部。

11021102

要更改屏幕抓取方法,请从“选项”面板中选择另一种方法,然后单击“刷新”。

When you are satisfied with the scraping results, click Copy to Clipboard and then Finish. The latter option copies the extracted text to the Clipboard, and it can be added to a Generate Data Table activity in the Designer panel. Just like desktop recording, screen scraping generates a container (with the selector of the top-level window) which contains activities, and partial selectors for each activity.

11021102

在“选项”面板中的“屏幕抓取器向导”中,每种类型的屏幕抓取都具有不同的功能:

  1. 全文
11081108
  • 忽略隐藏项 – 当选中此复选框时,将不会复制所选用户界面元素中的隐藏文本。
  1. 原生
11011101
  • 不限定格式 - 选中此复选框时,复制的文本不会从文本中提取格式信息。否则,保留提取文本的相对位置。
  • 获取词信息 - 当选中此复选框时,Studio 还会提取每个词的屏幕坐标。此外,还将显示“自定义分隔符”字段,使您能够指定用作分隔符的字符。如果该字段为空,则使用所有已知文本分隔符。
  1. Google OCR
11031103
  • “语言”– 默认情况下只有英语可用。
  • “字符”– 用于选择要提取的字符类型。可用的选项如下:任何字符、仅数字、字母、大写、小写、电话号码、货币、日期和自定义。如果选择“自定义”,则会显示另外两个字段(“允许”和“拒绝”),用于创建有关要抓取的字符类型和要避免的字符类型的自定义规则。
  • 反相 – 如果选中该复选框,则在抓取之前反转用户界面元素的颜色。这在背景颜色比文本颜色更深的情况下有用。
  • “缩放比例”– 选定用户界面元素或图像的比例因子。数字越大,将图像放大得越大。这样可以更好地读取 OCR,建议小图像使用较大比例因子。
  • “获取词信息”– 获取每个抓取的词在屏幕上的位置。

📘

备注:

在 UiPath Studio 的某些实例中,Google Tesseract 引擎可能有训练文件(关于训练文件,请参阅:WikipediaGitHub),这些训练文件可能不适用于某些非英语语言。运行包含这些已损坏训练文件的项目可能会导致抛出异常。要解决此问题,请从此处下载您希望使用的语言的训练文件,并将其从 UiPath 安装目录复制到 tessdata 文件夹中。要检查您下载的训练文件是否有效,可以下载此测试项目

  1. UiPath 屏幕 OCR
878878
  • Endpoint – the endpoint where the OCR model is hosted, either publicly or through an ML Skill in AI Center.
  • “API 密钥”– 端点 API 密钥。
  • “获取词信息”– 获取每个抓取的词在屏幕上的位置。
  1. Microsoft OCR
11001100
  • “语言”- 用于更改抓取文本的语言。默认选择英语。
  • “缩放比例”– 选定用户界面元素或图像的比例因子。数字越大,将图像放大得越大。这样可以更好地读取 OCR,建议小图像使用较大比例因子。
  • “获取词信息”- 获取每个抓取的词在屏幕上的位置。

除了从指示的用户界面元素中提取文本外,还可以提取多种类型属性的值、其确切的屏幕位置及其上级。

这种类型的信息可以通过在“活动”面板中的“用户界面自动化”>“元素”>“查找”和“用户界面自动化”>“元素”>“属性”下找到的专用活动来提取。

这些活动是:

  • Get Ancestor – enables you to retrieve an ancestor from a specified UI element. You can indicate at which level of the UI hierarchy to find the ancestor, and store the results in a UiElement variable.
393393
  • Get Attribute – retrieves the value of a specified UI element attribute. Once you indicate the UI element on screen, a drop-down list with all available attributes is displayed.
393393
  • Get Position – retrieves the bounding rectangle of the specified UiElement, and supports only Rectangle variables.
393393

UiPath Studio also features Relative Scraping, a scraping method that identifies the location of the text to be retrieved relative to an anchor. You can find more about it here.

You can also generate tables from unstructured data and store the information in DataTable variables, by using the Screen Scraping Wizard. For more information, see Generating Tables from Unstructured Data.

大约一年前更新


输出或屏幕抓取方法


建议的编辑仅限用于 API 参考页面

您只能建议对 Markdown 正文内容进行编辑,而不能建议对 API 规范进行编辑。