- Notas relacionadas
- Primeros pasos
- Instalación y configuración
- Proyectos de automatización
- Acerca de la publicación de proyectos de automatización
- Diseñar automatizaciones
- Gestionar paquetes de actividades
- Configuración de los Ajustes del Proyecto de Actividades
- Firma de paquetes
- Control
- Importar entidades
- Experiencia de diseño moderna
- Vincular un proyecto a una idea en Automation Hub
- Usar Data Manager
- Dependencias
- Tipos de flujos de trabajo
- Comparación de archivos
- Mejores prácticas de automatización
- Integración del control de código fuente
- Depuración
- La herramienta de diagnóstico
- Analizador de flujo de trabajo
- Acerca del analizador de flujo de trabajo
- ST-NMG-001: convención sobre nombres de variables
- ST-NMG-002: convención de nombres de argumentos
- ST-NMG-004: duplicación de nombres de visualización
- ST-NMG-005: anulación de variables
- ST-NMG-006: argumentos de anulación de variables
- ST-NMG-008: longitud variable excedida
- ST-NMG-009: variables de datos prefijados
- ST-NMG-011: argumentos de prefijo Datatable
- ST-NMG-012: valores predeterminados de los argumentos
- ST-NMG-016: longitud del argumento excedida
- ST-DBP-002: recuento de Argumentos elevado
- ST-DBP-003: bloque de Catch vacío
- ST-DBP-007: múltiples capas de diagramas de flujo
- ST-DBP-020: propiedades de salida no definidas
- ST-DBP-023: flujo de trabajo vacío
- ST-DBP-024: comprobación de actividad de persistencia
- ST-DBP-025: requisito previo para la serialización de variables
- ST-DBP-026: retraso en el uso de la actividad
- ST-DBP-027: mejor práctica de persistencia
- ST-DBP-028: requisito de serialización de argumentos
- ST-USG-005: argumentos de actividad codificados
- ST-USG-009: variables no utilizadas
- ST-USG-010: dependencias sin utilizar
- ST-USG-014: restricciones de los paquetes
- ST-USG-020: mensajes de registro mínimos
- ST-USG-024: guardado sin usar para más adelante
- ST-USG-025: uso incorrecto de los valores guardados
- ST-USG-026: restricciones de actividad
- ST-USG-027: paquetes necesarios
- ST-USG-028: Restringir la invocación de plantillas de archivo
- ST-USG-032 - Etiquetas obligatorias
- ST-USG-034 - URL Automation Hub
- Variables
- Argumentos
- Espacios de nombres importados
- Grabación
- Elementos de la IU
- Flujo de control
- Selectores
- Repo. de objetos
- Extracción de datos
- Sobre el raspado de datos
- Ejemplo de uso de la extracción de datos
- Automatización de imágenes y texto
- Acerca de la automatización de imágenes y texto
- Actividades con el ratón y el teclado
- Ejemplo de uso de la automatización de ratón y teclado
- Actividades de texto
- Ejemplo de uso de la automatización de texto
- Actividades de OCR
- Actividades de imagen
- Ejemplo de uso de la automatización de OCR y la automatización de imágenes
- Automatizar las tecnologías de Citrix
- Automatización RDP
- Automatización de Salesforce
- Automatización SAP
- Automatización de VMware Horizon
- Registro
- La herramienta ScreenScrapeJavaSupport
- El protocolo WebDriver
- Conjunto de pruebas - Estudio
- Extensiones
- Solución de problemas
- Acerca de la resolución de problemas
- Compatibilidad y limitaciones de Microsoft App-V
- Solución de problemas de Internet Explorer x64
- Problemas de Microsoft Office
- Identificación de elementos de la interfaz de usuario en PDF con opciones de accesibilidad
- Reparar Soporte Active Accessibility
- Automatizar aplicaciones que se ejecutan en un usuario de Windows diferente
- Validation of large Windows-legacy projects takes longer than expected
Sobre el raspado de datos
El raspado de datos le permite extraer datos estructurados de su navegador, aplicación o documento a una base de datos, .csv o incluso una hoja de cálculo de Excel.
Los datos estructurados son un tipo específico de información que está muy organizada y se presenta siguiendo un patrón predecible. Por ejemplo, todos los resultados de búsqueda de Google tienen la misma estructura: un enlace en la parte superior, una cadena de la URL y una descripción de la página web. Esta estructura permite a Studio extraer fácilmente la información, ya que siempre sabe dónde encontrarla.
El asistente de extracción puede abrirse desde la pestaña Diseño, haciendo clic en el botón Extracción de datos.
Los principales pasos del asistente de extracción de datos son:
-
Selecciona el primer y el último campo de la página web, el documento o la aplicación de la que desea extraer datos, para que Studio pueda deducir el patrón de la información.
Nota: Studio detecta automáticamente si ha indicado una celda de la tabla y le pregunta si desea extraer toda la tabla. Si presionas Sí, el Asistente de Extracción muestra una vista previa de los datos de la tabla seleccionada. -
Personaliza los encabezados de las columnas y elija si desea extraer o no las URL.
-
Previsualizar los datos, editar el número de resultados máximos a extraer y cambiar el orden de las columnas.
- De manera opcional , haz clic en Extraer datos correlacionados. Esto te permitirá volver a pasar por el Asistente de Extracción, para extraer información adicional y agregarla como una nueva columna en la misma tabla.
-
Indica con el botón Siguiente en la página web, aplicación o documento (si la información que se quiere extraer abarca varias páginas).
Una vez que haya finalizado el asistente, se generará una secuencia en Studio.
La Extracción de datos siempre genera un contenedor (Asociar Navegador o Asociar Ventana) con un selector para la ventana de nivel superior y una actividad de Extracción de Datos Estructurados con un selector parcial, asegurando así una correcta identificación de la app a extraer.
Asimismo, la actividad Extraer Datos Estructurados también incluye una cadena XML generada automáticamente (en la propiedad ExtractMetadata) que indica los datos que se van a extraer.
Por último, toda la información obtenida se almacena en una variable DataTable, que posteriormente se puede utilizar para rellenar una base de datos, un archivo .csv o una hoja de cálculo de Excel.