Abonnieren

UiPath Studio

UiPath Studio-Anleitung

Über Data-Scraping

Mit Data-Scraping können Sie strukturierte Daten aus Ihrem Browser, Ihrer Anwendung oder Ihrem Dokument extrahieren und in eine Datenbank, CSV-Datei oder sogar in ein Excel-Arbeitsblatt einfügen.

📘

Hinweis:

Es wird empfohlen, die Web-Automatisierung im Internet Explorer 11 oder höher, Mozilla Firefox 50 oder höher oder der neuesten Version von Google Chrome auszuführen.

Strukturierte Daten sind eine spezifische Art von Informationen, die in hohem Maße organisiert sind und in einem vorhersehbaren Muster dargestellt werden. Zum Beispiel haben alle Google-Suchergebnisse die gleiche Struktur: einen Link oben, einen String der URL und eine Beschreibung der Webseite. Diese Struktur ermöglicht es Studio, die Informationen einfach zu extrahieren, da es immer weiß, wo sie zu finden sind.

Der Scraping-Assistent kann über die Registerkarte Design geöffnet werden, indem Sie auf die Schaltfläche Data Scraping klicken.

Die Hauptschritte des Data-Scraping-Assistenten sind:

  1. Wählen Sie das erste und das letzte Feld der Webseite, des Dokuments oder der Anwendung aus, aus welcher/welchem Sie Daten extrahieren möchten, damit Studio das Informationsmuster ableiten kann.

📘

Hinweis:

Studio erkennt automatisch, ob Sie eine Tabellenzelle angegeben haben und fragt Sie, ob Sie die gesamte Tabelle extrahieren möchten. Wenn Sie auf Ja(Yes) klicken, zeigt der Extrahierungsassistent (Extract Wizard) eine Vorschau der ausgewählten Tabellendaten an.

  1. Passen Sie Spaltenüberschriften an und wählen Sie aus, ob URLs extrahiert werden sollen oder nicht.
  1. Zeigen Sie eine Vorschau der Daten an, bearbeiten Sie die Anzahl der maximal zu extrahierenden Ergebnisse und ändern Sie die Reihenfolge der Spalten.
  1. Optional (Optionally) klicken Sie auf Extract Correlated Data. Dadurch können Sie den Extrahierungsassistent (Extract Wizard) noch einmal duchlaufen, um zusätzliche Informationen zu extrahieren und diese als neue Spalte in derselben Tabelle hinzuzufügen.
  2. Geben Sie die Schaltfläche Next auf der Webseite in der Anwendung oder im Dokument an (wenn sich die Information, die Sie extrahieren möchten, über mehrere Seiten erstreckt).

Nachdem Sie den Assistenten beendet haben, wird eine Sequence in Studio generiert.

Data scraping always generates a container (Attach Browser or Attach Window) with a selector for the top-level window and an Extract Structured Data activity with a partial selector, thus ensuring a correct identification of the app to be scraped.

Darüber hinaus enthält die Aktivität Strukturierte Daten extrahieren (Extract Structured Data) einen automatisch generierten XML-String (in der Eigenschaft MetadatenExtrahieren (ExtractMetadata)), die die zu extrahierenden Daten angibt.

Zuletzt werden alle extrahierten Informationen in einer DatenTabelle (DataTable)-Variable gespeichert, die Sie später verwenden können, um eine Datenbank, eine CSV-Datei oder ein Excel-Arbeitsblatt auszufüllen.

Aktualisiert vor 2 Jahren


Über Data-Scraping


Auf API-Referenzseiten sind Änderungsvorschläge beschränkt

You can only suggest edits to Markdown body content, but not to the API spec.