Studio
2023.4
False
Bannerhintergrundbild
Studio-Benutzerhandbuch
Letzte Aktualisierung 3. Apr. 2024

Über Data-Scraping

Mit Data-Scraping können Sie strukturierte Daten aus Ihrem Browser, Ihrer Anwendung oder Ihrem Dokument extrahieren und in eine Datenbank, CSV-Datei oder sogar in ein Excel-Arbeitsblatt einfügen.

Hinweis: Es wird empfohlen, die Web-Automatisierung im Internet Explorer 11 oder höher, Mozilla Firefox 50 oder höher oder der neuesten Version von Google Chrome auszuführen.

Strukturierte Daten sind eine spezifische Art von Informationen, die in hohem Maße organisiert sind und in einem vorhersehbaren Muster dargestellt werden. Zum Beispiel haben alle Google-Suchergebnisse die gleiche Struktur: einen Link oben, einen String der URL und eine Beschreibung der Webseite. Diese Struktur ermöglicht es Studio, die Informationen einfach zu extrahieren, da es immer weiß, wo sie zu finden sind.

Der Scraping-Assistent kann über die Registerkarte Design geöffnet werden, indem Sie auf die Schaltfläche Data Scraping klicken.



Die Hauptschritte des Data-Scraping-Assistenten sind:

  1. Wählen Sie das erste und das letzte Feld der Webseite, des Dokuments oder der Anwendung aus, aus welcher/welchem Sie Daten extrahieren möchten, damit Studio das Informationsmuster ableiten kann.



    Hinweis: Studio erkennt automatisch, ob Sie eine Tabellenzelle angegeben haben und fragt Sie, ob Sie die gesamte Tabelle extrahieren möchten. Wenn Sie auf Ja(Yes) klicken, zeigt der Extrahierungsassistent (Extract Wizard) eine Vorschau der ausgewählten Tabellendaten an.


  2. Passen Sie Spaltenüberschriften an und wählen Sie aus, ob URLs extrahiert werden sollen oder nicht.



  3. Zeigen Sie eine Vorschau der Daten an, bearbeiten Sie die Anzahl der maximal zu extrahierenden Ergebnisse und ändern Sie die Reihenfolge der Spalten.



  4. Optional (Optionally) klicken Sie auf Extract Correlated Data. Dadurch können Sie den Extrahierungsassistent (Extract Wizard) noch einmal duchlaufen, um zusätzliche Informationen zu extrahieren und diese als neue Spalte in derselben Tabelle hinzuzufügen.
  5. Geben Sie die Schaltfläche Next auf der Webseite in der Anwendung oder im Dokument an (wenn sich die Information, die Sie extrahieren möchten, über mehrere Seiten erstreckt).



Nachdem Sie den Assistenten beendet haben, wird eine Sequence in Studio generiert.



Beim Daten-Scraping wird immer ein Container (Browser hinzufügen (Attach Browser) oder Fenster anhängen (Attach Window)) mit einem Selektor für das Fenster der obersten Ebene und eine Strukturierte Daten extrahieren (Extract Structured Data)-Aktivität mit einem partiellen Selektor generiert, sodass eine korrekte Identifizierung der zu extrahierenden App gewährleistet ist.

Darüber hinaus enthält die Aktivität Strukturierte Daten extrahieren (Extract Structured Data) einen automatisch generierten XML-String (in der Eigenschaft MetadatenExtrahieren (ExtractMetadata)), die die zu extrahierenden Daten angibt.

Zuletzt werden alle extrahierten Informationen in einer DatenTabelle (DataTable)-Variable gespeichert, die Sie später verwenden können, um eine Datenbank, eine CSV-Datei oder ein Excel-Arbeitsblatt auszufüllen.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
UiPath Logo weiß
Vertrauen und Sicherheit
© 2005-2024 UiPath. All rights reserved.