studio
2022.10
false
- 发行说明
- 入门指南
- 设置和配置
- 自动化项目
- 依赖项
- 工作流类型
- 文件比较
- 自动化最佳实践
- 源代码控件集成
- 调试
- 诊断工具
- 工作流分析器
- 变量
- 参数
- 导入的命名空间
- 录制
- 用户界面元素
- 控制流程
- 选取器
- 对象存储库
- 数据抓取
- 关于数据抓取
- 使用数据抓取的示例
- 图像与文本自动化
- Citrix 技术自动化
- RDP 自动化
- Salesforce 自动化
- SAP 自动化
- VMware Horizon 自动化
- 日志记录
- ScreenScrapeJavaSupport 工具
- Webdriver 协议
- 测试套件 - Studio
- 扩展程序
- 故障排除
Studio 用户指南
Last updated 2024年11月4日
关于数据抓取
数据抓取用于将浏览器、应用程序或文档中的结构化数据提取到数据库、.csv 文件或 Excel 电子表格中。
注意:建议您在 Internet Explorer 11 及更高版本、Mozilla Firefox 50 或更高版本或最新版本的 Google Chrome 上运行网页自动化。
结构化数据是一种特殊类型的信息,具有高度的组织性,并以可预测的模式呈现。例如,所有 Google 搜索结果都有相同的结构:顶部的链接、URL 字符串以及网页描述。这种结构使 Studio 能够轻松地提取信息,因为 Studio 始终知道可以在哪里找到信息。
可以从“设计”选项卡中单击“数据抓取”按钮来打开抓取向导。
数据抓取向导的主要步骤是:
-
选择要从中提取数据的网页、文档或应用程序中的第一个和最后一个字段,以便 Studio 可以推断信息的模式。
注意:Studio 会自动检测您是否指定了表格单元格,并询问您是否要提取整个表格。如果单击“是”,则提取向导将显示所选表格数据的预览。 -
自定义列标题并选择是否提取 URL。
-
预览数据,编辑要提取的最大结果数,并更改列的顺序。
- (可选)单击“提取相关数据”。这可用于再次浏览提取向导,从而提取其他信息并将其作为新列添加到同一表中。
-
指示网页、应用程序或文档中的“下一步”按钮(如果要提取的信息跨越多个页面)。
完成向导后,将在 Studio 中生成一个序列。
此外,提取结构化数据活动还附带一个自动生成的 XML 字符串(在提取元数据属性中),该字符串指示要提取的数据。
最后,所有已抓取的信息都存储在“数据表”变量中,以后可以用来填充数据库、.csv 文件或 Excel 电子表格。