活动
最新
False
HTML Pages: Extract and Manipulate Information - Other latest
横幅背景图像
徽标
用户界面自动化活动
上次更新日期 2023年12月21日

HTML 页面: 提取和操作信息

示例说明了如何自动化浏览网页、提取信息以及使用这些信息新建本地 HTML 页面的操作。它提供了诸如输入单击获取文本打开浏览器之类的活动。您可以在 UiPath.UIAutomation.Activities 包中找到这些活动。

此自动化流程的构建方法如下:

  1. 打开 Studio ,创建一个新“流程”
  2. 打开 Internet Explorer 并导航到 www.goodreads.com
  3. 在“工作流设计器”中拖动“流程图”

    • 创建以下变量:

      变量名称

      变量类型

      默认值

      bookFound

      字符串

       

      bookName

      泛型值

       
  4. 输入对话框活动拖动到流程图容器中,并将其连接到开始节点。

    • 双击活动以将其打开。
    • 在“标题”字段中添加表达式“"Book Name:"”。
    • 在“标签”字段中添加表达式“"Enter the name of a book you read:"”。
    • 在“ 属性 ” 面板的“ 结果 ” 字段中添加变量 bookName
    • 您的工作流应如以下屏幕截图所示:



  5. 返回到流程图屏幕。
  6. 拖动序列容器并将其连接到输入对话框活动。这用于创建新的 .html 文件。
    • 创建以下变量:

      变量名称

      变量类型

      默认值

      fileExists

      布尔值

       
  7. 双击序列容器将其打开,然后将存在路径活动拖动至其中。

    • 路径类型下拉列表中选择文件选项。
    • 在“路径”字段中添加表达式“"books.html"”。
    • 属性面板中,向存在字段添加 fileExists 变量。
  8. IF 条件活动拖动至存在路径活动下方。

    • 在“条件”字段中添加变量 fileExists
  9. Else字段中放置写入文本文件活动。

    • 在“文件名”字段中添加表达式“"books.html"”。
    • 文本字段中添加以下代码。

      <html> <head> <title>Books</title> </head> <body> </body> </html>

    • 您的工作流应如以下屏幕截图所示:



  10. 返回到流程图屏幕。
  11. 拖动打开浏览器活动并将其连接到序列容器。

    • 双击活动以将其打开。
    • 在“属性”面板中,从“浏览器类型”下拉列表中选择“IE”选项。
    • URL字段中添加表达式 "https://www.goodreads.com/search"。这将打开指定的网站。
    • 选中新会话选项的复选框。这会打开所选浏览器的新会话。
  12. 选择打开浏览器活动的执行容器并创建以下变量:

    变量名称

    变量类型

    默认值

    noResults

    泛型值

     
  13. 输入活动拖动到执行序列中。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择想要的应用程序。下面的动图表示您需要遵循的所有步骤:


    • 在“文本”字段中添加“bookName”变量。
  14. 输入活动下方放置单击活动。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择想要的应用程序。下面的动图表示您需要遵循的所有步骤:


    • 属性面板中,向在此之前延迟字段添加1000值。在执行任何操作之前都会有 1 秒的延迟。
  15. 获取文本活动拖动至单击输入活动下方。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择想要的应用程序。下面的动图表示您需要遵循的所有步骤:


    • 属性面板中,向字段添加 noResults 变量。
  16. IF 条件活动拖动至获取文本 H3活动下方。

    • 在“条件”字段中添加表达式“noResults.toLower.Trim.Contains("no results")”。
  17. Then字段中放置一个序列容器。
  18. 将“ 消息框” 活动拖动到“ 序列 ”容器内。

    • 文本字段中添加"Book not found. Please search another one."消息。如果没有可用的结果,则会显示此消息。
  19. 关闭选项卡活动拖动至消息框活动下方。这将关闭在网页浏览器中打开的选项卡。
  20. Else字段中放置一个序列容器。
  21. 获取文本活动拖动至序列容器中。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择想要的应用程序。下面的动图表示您需要遵循的所有步骤:


    • 属性面板中,向字段添加 bookFound 变量。
  22. IF 条件活动拖动至获取文本间隔活动下方。

    • 在“条件”字段中添加表达式“bookFound.ToLower.Trim.Contains(bookName.ToLower.Trim)”。
  23. 序列容器拖动至Then字段,并创建以下变量:

    变量名称

    变量类型

    默认值

    realName

    字符串

     
  24. 单击活动拖到序列容器中。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择书名。下面的动图表示您需要遵循的所有步骤:


  25. 将另一个序列容器拖动到单击间隔活动下方,将其命名为 Get book Details 并创建以下变量:

    变量名称

    变量类型

    默认值

    description

    泛型值

     

    author

    泛型值

     

    booksContent

    字符串

     

    alreadyExists

    布尔值

     
  26. 获取文本活动拖动至序列容器中。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择书名。下面的动图表示您需要遵循的所有步骤:


    • 属性面板中,向字段添加 realName 变量。
  27. 分配活动置于获取文本 H1 书名活动下方。

    • 在“收件人”字段中添加“realName”变量。
    • 在“值”字段中添加表达式“realName.Replace(":","").Replace("'","").Trim”。
  28. 分配活动下方添加存在路径活动。

    • 路径类型下拉列表中选择文件选项。
    • 在“路径”字段中添加表达式“Environment.CurrentDirectory+"\"+realName+".jpg"”。
    • 属性面板中,向存在字段添加 alreadyExists 变量。
  29. 将另一个IF 条件活动拖动至存在路径活动下方。

    • 在“条件”字段中添加变量 alreadyExists
  30. Then字段中放置一个序列容器。
  31. 将“ 消息框” 活动拖动到“ 序列 ”容器内。

    • 文本字段中添加"Book already added."消息。
    • 属性面板中,从“按钮下拉菜单中选择确定选项。
  32. 关闭选项卡活动拖动至消息框活动下方。这将关闭在网页浏览器中打开的选项卡。
  33. Else字段中放置一个序列容器。
  34. 在上一个“序列”容器中放置另一个序列容器。
  35. 获取文本活动拖动至序列容器中。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择书名。下面的动图表示您需要遵循的所有步骤:


    • 属性面板中,向字段添加 description 变量。
  36. 获取文本活动拖动至获取描述活动下方。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择书名。下面的动图表示您需要遵循的所有步骤:


    • 属性面板中,向字段添加 author 变量。
  37. 单击活动拖动至获取作者活动下方。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择书名。下面的动图表示您需要遵循的所有步骤:


    • 属性面板中,从鼠标按键下拉列表中选择BTN_RIGHT选项。此操作将右键单击图像并显示一个菜单。
    • 偏移 X字段中添加89值。
    • 偏移 Y字段中添加22值。
    • 位置下拉列表中选择左上选项。
  38. 延迟活动拖动至单击 IMG 封面图像活动下方。

    • 属性面板中,向持续时间字段添加 00:00:02 值。这提供了两秒的延迟。
  39. 延迟活动下方放置新的单击活动。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择书名。下面的动图表示您需要遵循的所有步骤:


  40. 输入活动拖动至单击菜单项活动下方。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择书名。下面的动图表示您需要遵循的所有步骤:


    • 属性面板中,向字段添加表达式 Environment.CurrentDirectory+"\"+realName+".jpg"
  41. 单击活动置于输入编辑活动下方。

    • 在活动中,单击在浏览器中指定元素选项。现在,您可以选择书名。下面的动图表示您需要遵循的所有步骤:


  42. 写入文本文件活动拖动至单击按钮活动下方。

    • 在“文件名”字段中添加表达式“realName+".html"”。
    • 文本字段中添加以下代码。

      "<html>
        <head>
          <title>"+realName+"</title>
        </head>
        <body>
          <a href='books.html'>BACK</a>
          <h1>"+realName+"</h1>
          <h2>by "+author+"</h2>
            <img href='"+realName+".jpg'>
          <h3>"+description+"</h3>
         </body>
       </html>""<html>
        <head>
          <title>"+realName+"</title>
        </head>
        <body>
          <a href='books.html'>BACK</a>
          <h1>"+realName+"</h1>
          <h2>by "+author+"</h2>
            <img href='"+realName+".jpg'>
          <h3>"+description+"</h3>
         </body>
       </html>"
  43. 读取文本文件活动置于写入文本文件活动下方。

    • 在“文件名”字段中添加表达式“"books.html"”。
    • 在“内容”字段中添加“booksContent”变量。
  44. 将另一个写入文本文件活动拖动至读取文本文件活动下方。

    • 在“文件名”字段中添加表达式“"books.html"”。
    • 文本字段中添加字符串 booksContent.Replace("</body></html>","<h1><a href='"+realName+".html'>"+realName+"</h1></body></html>")
  45. 在“ 写入文本文件 ”活动下方添加“关闭选项卡”活动。
  46. 打开浏览器活动拖动至关闭选项卡活动下方。这将打开新创建的 .html 文件。
    • 浏览器类型下拉列表中选择IE选项。
    • URL字段中添加表达式 "file:\\\"+Environment.CurrentDirectory+"\books.html"
  47. 返回到初始的IF 条件活动并在Else字段中添加一个序列容器。
  48. 将“ 消息框” 活动拖动到“ 序列 ”容器内。

    • 在“文本”字段中添加表达式 "Book not found. Please check the name and try again"
  49. 在“ 写入文本文件 ”活动下方添加“关闭选项卡”活动。
  50. 运行工作流。自动化流程将请求书名,在 www.goodreads.com 上搜索,检索有关图书的信息,创建一个基本的 .html 页面,并用检索到的信息填充该页面。
支持和服务图标
获取您需要的帮助
UiPath Academy 图标
了解 RPA - 自动化课程
UiPath 论坛图标
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.