studio
2023.4
false
UiPath logo, featuring letters U and I in white
Guía de usuario de Studio
Last updated 4 de dic. de 2024

Sobre el raspado de datos

El raspado de datos le permite extraer datos estructurados de su navegador, aplicación o documento a una base de datos, .csv o incluso una hoja de cálculo de Excel.

Nota: Se recomienda ejecutar tus automatizaciones web en Internet Explorer 11 y superiores, Mozilla Firefox 50 o superior o la versión más reciente de Google Chrome.

Los datos estructurados son un tipo específico de información que está muy organizada y se presenta siguiendo un patrón predecible. Por ejemplo, todos los resultados de búsqueda de Google tienen la misma estructura: un enlace en la parte superior, una cadena de la URL y una descripción de la página web. Esta estructura permite a Studio extraer fácilmente la información, ya que siempre sabe dónde encontrarla.

El asistente de extracción puede abrirse desde la pestaña Diseño, haciendo clic en el botón Extracción de datos.



Los principales pasos del asistente de extracción de datos son:

  1. Selecciona el primer y el último campo de la página web, el documento o la aplicación de la que desea extraer datos, para que Studio pueda deducir el patrón de la información.



    Nota: Studio detecta automáticamente si ha indicado una celda de la tabla y le pregunta si desea extraer toda la tabla. Si presionas , el Asistente de Extracción muestra una vista previa de los datos de la tabla seleccionada.


  2. Personaliza los encabezados de las columnas y elija si desea extraer o no las URL.



  3. Previsualizar los datos, editar el número de resultados máximos a extraer y cambiar el orden de las columnas.



  4. De manera opcional , haz clic en Extraer datos correlacionados. Esto te permitirá volver a pasar por el Asistente de Extracción, para extraer información adicional y agregarla como una nueva columna en la misma tabla.
  5. Indica con el botón Siguiente en la página web, aplicación o documento (si la información que se quiere extraer abarca varias páginas).



Una vez que haya finalizado el asistente, se generará una secuencia en Studio.



La Extracción de datos siempre genera un contenedor (Asociar Navegador o Asociar Ventana) con un selector para la ventana de nivel superior y una actividad de Extracción de Datos Estructurados con un selector parcial, asegurando así una correcta identificación de la app a extraer.

Asimismo, la actividad Extraer Datos Estructurados también incluye una cadena XML generada automáticamente (en la propiedad ExtractMetadata) que indica los datos que se van a extraer.

Por último, toda la información obtenida se almacena en una variable DataTable, que posteriormente se puede utilizar para rellenar una base de datos, un archivo .csv o una hoja de cálculo de Excel.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.