订阅

UiPath Studio

UiPath Studio 指南

关于数据抓取

数据抓取用于将浏览器、应用程序或文档中的结构化数据提取到数据库、.csv 文件或 Excel 电子表格中。

📘

备注:

建议您在 Internet Explorer 11 及更高版本、Mozilla Firefox 50 或更高版本或最新版本的 Google Chrome 上运行网页自动化。

结构化数据是一种特殊类型的信息,具有高度的组织性,并以可预测的模式呈现。例如,所有 Google 搜索结果都有相同的结构:顶部的链接、URL 字符串以及网页描述。这种结构使 Studio 能够轻松地提取信息,因为 Studio 始终知道可以在哪里找到信息。

可以从“设计”选项卡中单击“数据抓取”按钮来打开抓取向导。

742742

数据抓取向导的主要步骤是:

  1. 选择要从中提取数据的网页、文档或应用程序中的第一个和最后一个字段,以便 Studio 可以推断信息的模式。
10351035

📘

备注:

Studio 自动检测您是否指示了表单元格,并询问是否要提取整个表。如果您单击“是”,则“提取向导”将显示选定表数据的预览。

815815
  1. 自定义列标题并选择是否提取 URL。
542542
  1. 预览数据,编辑要提取的最大结果数,并更改列的顺序。
12211221
  1. 可选择单击“提取相关数据”。这可用于再次浏览“提取向导”,从而提取其他信息并将其作为新列添加到同一表中。
  2. 指示网页、应用程序或文档中的“下一步”按钮(如果要提取的信息跨越多个页面)。
484484

完成向导后,将在 Studio 中生成一个序列。

546546

Data scraping always generates a container (Attach Browser or Attach Window) with a selector for the top-level window and an Extract Structured Data activity with a partial selector, thus ensuring a correct identification of the app to be scraped.

此外,“提取结构化数据”活动还附带一个自动生成的 XML 字符串(在“提取元数据”属性中),该字符串指示要提取的数据。

最后,所有已抓取的信息都存储在“数据表”变量中,以后可以用来填充数据库、.csv 文件或 Excel 电子表格。

Updated 3 years ago


关于数据抓取


建议的编辑仅限用于 API 参考页面

您只能建议对 Markdown 正文内容进行编辑,而不能建议对 API 规范进行编辑。