为举例说明如何使用文本识别活动实现流程的自动化,我们创建了一个自动化项目,用以打开 Internet Explorer 并导航到述及美元历史汇率表的 Wikipedia 文章。此项目从近年的汇率表中提取数据,将其显示在“输出”面板中,并检查是否在此表中找到了欧元货币。
备注:
建议您在 Internet Explorer 11 及更高版本、Mozilla Firefox 50 或更高版本或最新版本的 Google Chrome 上运行网页自动化。
- 打开 Internet Explorer 并导航到 https://en.wikipedia.org/wiki/Tables_of_historical_exchange_rates_to_the_United_States_dollar#Table_for_recent_years。
- 在 Studio 中“新建空白流程”。
- 在“活动”面板中,向“设计器”面板添加“打开浏览器”活动,并在“Url”字段中键入以下类型:
"https://en.wikipedia.org/wiki/Tables_of_historical_exchange_rates_to_the_United_States_dollar#Table_for_recent_years"
。

- 在“设计”功能区选项卡的“向导”组中,单击“数据抓取”。系统随即会显示“提取向导”。
- 单击“下一步”,在网页上“近年的汇率表”中选择一个单元格,然后在系统提示提取整张表的数据时单击“是”。系统随即会在“预览数据”向导步骤中显示预览的数据。
- 在“最大结果数”字段中键入 200,然后单击“完成”。由于表中包含大量条目,同时还要确保提取整张表的数据,因此我们需要执行此操作。
- 在“指示下一个链接”窗口中单击“否”,因为我们的数据并未跨越多个页面。系统将更新流程,并在“设计器”面板中显示一个“数据抓取”序列。在此序列中,系统已生成“附加浏览器”活动,其中包含用于检索表格内容的“提取数据”活动。提取的数据将存储在自动生成的“数据表”变量
ExtractDataTable
中。

- 创建新的“字符串”变量
GetText
,并将作用域设置为“序列”。 - 在“附加浏览器”活动的“执行”容器中,先添加“提取数据”活动,然后添加“输出数据表”活动。此活动会将表格数据转换为可在“输出”面板中显示的字符串。
- 选择“输出数据表”活动,然后在“数据表”和“文本”字段中分别添加
ExtractDataTable
变量和GetText
变量。 - 在添加“输出数据表”活动后,再添加“写入行”活动,并在“文本”字段中添加
GetText
变量。如此一来,所提取的表格数据便可写入“输出”面板。

- 在“数据抓取”序列之后添加一个“延迟”活动,并将“持续时间”属性设置为
00:00:03
(3 秒)。这种延迟的目的是让网页完全加载后再执行下一活动。

- 在“变量”面板中,创建一个名为“
GetExists
”的新变量,将类型设置为“布尔值”,并将作用域设置为“序列”。 - 在“延迟”活动之后添加一个“存在文本”活动,并在“文本”字段中键入类型
"Euro"
。单击“在屏幕上指示”按钮,然后在先前打开的浏览器页中单击包含“欧元”的表格单元格。系统将生成该用户界面元素的选取器。本示例中,此活动会检查是否在表格中找到了“Euro
”一词。

- 选择“存在文本”活动,然后在“属性”面板中的“存在”字段中插入
GetExists
变量。 - 在“存在文本”活动之后添加“IF 条件”活动,并在“条件”字段中插入
GetExists
变量。 - 添加两个“消息框”活动,将其中一个添加到“Then”部分,并将另一个添加到“IF 条件”活动的“Else”部分。
- 在“Then”部分选择“消息框”活动,然后在“文本”字段中键入
"Euro appears in the table."
。如果在此表中找到“Euro
”一词,则会显示此消息。 - 在“Else”部分选择“消息框”活动,然后在“文本”字段中键入
"Euro does not appear in the table."
。如果在此表中找不到“Euro
”一词,则会显示此消息。
相应工作流应如下所示:

- 按 F5 执行项目。注意,系统将提取近期汇率表中的数据,并将其显示在“输出”面板中;此外还将显示一个消息框,说明是否找到了“
Euro
”一词。
2 年前更新