Process Mining – Transformationen

process-mining

2024.10

false

Process Mining-Benutzerhandbuch

Wichtig :

Bitte beachten Sie, dass dieser Inhalt teilweise mithilfe von maschineller Übersetzung lokalisiert wurde. Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Transformationen

Konfigurieren Sie dbt-Projekttransformationen in Process Mining in der Automation Suite, einschließlich Ereignisprotokoll, Konfigurationsdateien für Fälligkeitsdaten und die Seed-Ordnerstruktur.

Ordnerstruktur

Wichtig:

Die Informationen auf dieser Seite gelten nur für App-Vorlagen, die über Fälligkeitsdaten-Konfigurationsdateien und einen seeds\ -Ordner verfügen.

Die Transformationen einer Prozess-App bestehen aus einem dbt -Projekt. In der folgenden Tabelle wird der Inhalt eines dbt -Projektordners beschrieben.

Ordner/Datei	Enthält
`dbt_packages\`	das `pm_utils` -Paket und seine Makros.
`macros\`	optionaler Ordner für benutzerdefinierte Makros
`models\`	`.sql` die Transformationen definieren.
`models\schema\`	`.yml` die Tests für die Daten definieren.
`seeds`	`.csv` Dateien mit Konfigurationseinstellungen.
`dbt_project.yml`	Die Einstellungen des dbt-Projekts.

Hinweis:

Die App-Vorlagen Ereignisprotokoll und Benutzerdefinierter Prozess haben eine vereinfachte Datentransformationsstruktur. Prozess-Apps, die mit diesen App-Vorlagen erstellt wurden, haben diese Ordnerstruktur nicht.

dbt_project.yml

Die Datei dbt_project.yml enthält Einstellungen des dbt- Projekts, die Ihre Transformationen definieren. Der vars-Abschnitt enthält Variablen, die in den Transformationen verwendet werden.

Datums-/Uhrzeitformat

Jede App-Vorlage enthält Variablen, die das Format für die Analyse von Datums-/Uhrzeitdaten bestimmen. Diese Variablen müssen angepasst werden, wenn die Eingabedaten ein anderes Datums-/Uhrzeitformat als erwartet haben.

Datentransformationen

Die Datentransformationen werden in .sql -Dateien im Verzeichnis models\ definiert. Die Datentransformationen sind in einem Standardsatz von Unterverzeichnissen organisiert.

Weitere Informationen finden Sie unter Struktur von Transformationen .

The .sql files are written in Jinja SQL, which allows you to insert Jinja statements inside plain SQL queries. When dbt runs all .sql files, each .sql file results in a new view or table in the database.

In der Regel haben die .sql -Dateien die folgende Struktur: Select * from {{ ref('Table_A') }} Table_A.

Der folgende Code zeigt eine SQL-Beispielabfrage.

select
    tableA."Field_1" as "Alias_1",
    tableA."Field_2",
    tableA."Field_3"
from {{ ref('tableA') }} as tableA
select
    tableA."Field_1" as "Alias_1",
    tableA."Field_2",
    tableA."Field_3"
from {{ ref('tableA') }} as tableA

Hinweis:

In einigen Fällen haben die .sql -Dateien bei Prozess-Apps, die mit früheren Versionen der App-Vorlagen erstellt wurden, die folgende Struktur:

Mit Anweisungen: Eine oder mehrere mit Anweisungen, die die erforderlichen Untertabellen enthalten sollen.

{{ ref(‘My_table) }} verweist auf eine Tabelle, die durch eine andere SQL-Datei definiert ist Datei.
{{ source(var("schema_sources"), 'My_table') }} verweist auf eine Eingabetabelle.

Hauptabfrage: Die Abfrage, die die neue Tabelle definiert.
Letzte Abfrage: In der Regel wird am Ende eine Abfrage wie Select * from table verwendet. Dies erleichtert das Treffen von Unterauswahlen beim Debuggen.

Weitere Tipps zum effektiven Schreiben von Transformationen finden Sie unter Tipps zum Schreiben von SQL.

Hinzufügen von Quelltabellen

Um dem dbt -Projekt eine neue Quelltabelle hinzuzufügen, muss sie in models\schema\sources.yml aufgeführt sein. Auf diese Weise können andere Modelle mit {{ source(var("schema_sources"), 'My_table') }} darauf verweisen. Die folgende Abbildung zeigt ein Beispiel.

Wichtig:

Each new source table must be listed in sources.yml.

Ausführliche Informationen finden Sie in der offiziellen dbt-Dokumentation unter Quellen.

Datenausgabe

Die Datenumwandlungen müssen das Datenmodell ausgeben, das von der entsprechenden App benötigt wird. jede erwartete Tabelle und jedes Feld muss vorhanden sein.

Wenn Sie Ihrer Prozess-App neue Felder hinzufügen möchten, können Sie diese Felder in den Transformationen hinzufügen.

Makros

Makros machen die Wiederverwendung gängiger SQL-Konstruktionen einfach. Ausführliche Informationen finden Sie in der offiziellen dbt-Dokumentation zu Chinja-Makros.

pm_utils

Das pm-utils -Paket enthält eine Reihe von Makros, die typischerweise in Process Mining-Transformationen verwendet werden. Weitere Informationen zu den pm_utils -Makros finden Sie unter ProcessMining-pm-utils.

Die folgende Abbildung zeigt ein Beispiel für Minja-Code, der das Makro pm_utils.optional() aufruft.

Samen

Startdaten sind csv -Dateien, die verwendet werden, um Datentabellen zu Ihren Transformationen hinzuzufügen. Ausführliche Informationen finden Sie in der offiziellen dbt-Dokumentation zu jinja- Seeds.

In Process Mining wird dies normalerweise verwendet, um die Konfiguration von Zuordnungen in Ihren Transformationen zu vereinfachen.

Führen Sie nach der Bearbeitung von Startdateien die Datei aus, indem Sie Datei ausführen oder Alle ausführen auswählen, um die entsprechende Datentabelle zu aktualisieren.

Beispiele für die Verwendung von Seed-Dateien finden Sie unter Aktivitätskonfiguration: Definieren der Aktivitätsreihenfolge und Simulation des Automatisierungspotenzials .

Aktivitätskonfiguration: Definieren der Aktivitätsreihenfolge

Das Feld Activity_order wird als Bindestrichpunkt verwendet, wenn zwei Ereignisse im selben Zeitstempel auftreten.

Option 1: SQL-Konfiguration

Der folgende Code zeigt ein Beispiel für die Konfiguration von Activity_order mit einer SQL CASE -Anweisung:

    case
            when tableA."Activity" = 'ActivityA'
                then 1
            when tableA."Activity" = 'ActivityB'
                then 2
            when tableA."Activity" = 'ActivityC'
                then 3
            when tableA."Activity" = 'ActivityD'
                then 4
    end as "Activity_order"
    case
            when tableA."Activity" = 'ActivityA'
                then 1
            when tableA."Activity" = 'ActivityB'
                then 2
            when tableA."Activity" = 'ActivityC'
                then 3
            when tableA."Activity" = 'ActivityD'
                then 4
    end as "Activity_order"

Option 2: CSV-Samendatei

Anstatt eine SQL CASE -Anweisung zu verwenden, können Sie Activity_order mithilfe der activity_configuration.csv -Datei definieren.

Die folgende Abbildung zeigt eine activity_configuration.csv -Datei als Beispiel:

Empfehlungen

Die meisten UiPath-App-Vorlagen enthalten vordefinierte Felder für die Aktivitätskonfiguration, die Sie an Ihre spezifischen Geschäftsanforderungen anpassen können. Wenn vordefinierte Felder nicht verfügbar oder unzureichend sind, können Sie jederzeit benutzerdefinierte Felder mithilfe von SQL oder der Seed-Datei activity_configuration.csv erstellen, wie beschrieben.

Tests

Der models\schema\ -Ordner enthält einen Satz von .yml -Dateien, die Tests definieren. Diese validieren die Struktur und den Inhalt der erwarteten Daten. Ausführliche Informationen finden Sie in der offiziellen dbt-Dokumentation zu Tests.

Hinweis:

When you edit transformations, make sure to update the tests accordingly. The tests can be removed if desired.

Dbt-Projekte

Datentransformationen werden verwendet, um Eingabedaten in Daten umzuwandeln, die für Process Mining geeignet sind . Die Transformationen in Process Mining werden als dbt -Projekte geschrieben.

Auf dieser Seite wird eine Einführung in dbt angezeigt. Ausführliche Informationen finden Sie in der offiziellen dbt-Dokumentation.

pm-utils package

Process Mining- App-Vorlagen enthalten ein dbt- Paket mit dem Namen pm_utils. Dieses pm-utils -Paket enthält Dienstprogrammfunktionen und Makros für Process Mining- dbt- Projekte. Weitere Informationen zu pm_utils finden Sie unter ProcessMining-pm-utils.

Aktualisieren der PM-utils-Version, die für Ihre App-Vorlage verwendet wird

UiPath® verbessert das pm-utils -Paket ständig, indem neue Funktionen hinzugefügt werden.

Wenn eine neue Version des pm-utils -Pakets veröffentlicht wird, wird Ihnen empfohlen, die in Ihren Transformationen verwendete Version zu aktualisieren, um sicherzustellen, dass Sie die neuesten Funktionen und Makros des pm-utils -Pakets nutzen.

Sie finden die Versionsnummer der neuesten Version des pm-utils -Pakets im Bereich Versionen von ProcessMining-pm-utils.

Führen Sie die folgenden Schritte aus, um die pm-utils -Version in Ihren Transformationen zu aktualisieren.

Laden Sie den Quellcode (ZIP) aus der Version von pm-utils herunter.
Extrahieren Sie die Datei zip und benennen Sie den Ordner in pm_utils um.
Exportieren Sie Transformationen aus dem Inline- Datentransformations -Editor und extrahieren Sie die Dateien.
Ersetzen Sie den Ordner pm_utils aus den exportierten Transformationen durch den neuen Ordner pm_utils .
Zippen Sie die Inhalte der Transformationen erneut und importieren Sie sie in den Datentransformations- Editor.

War diese Seite hilfreich?

Vorherige (previous)Vorgefertigte Tags und Fälligkeitsdaten

WeiterBenutzerdefinierte Metriken zur Durchsatzzeit

Ordnerstruktur​

dbt_project.yml​

Datums-/Uhrzeitformat​

Datentransformationen​

Hinzufügen von Quelltabellen​

Datenausgabe​

Makros​

pm_utils​

Samen​

Aktivitätskonfiguration: Definieren der Aktivitätsreihenfolge​

Option 1: SQL-Konfiguration​

Option 2: CSV-Samendatei​

Empfehlungen​

Tests​

Dbt-Projekte​

pm-utils package​

Aktualisieren der PM-utils-Version, die für Ihre App-Vorlage verwendet wird​

War diese Seite hilfreich?

Ordnerstruktur

dbt_project.yml

Datums-/Uhrzeitformat

Datentransformationen

Hinzufügen von Quelltabellen

Datenausgabe

Makros

pm_utils

Samen

Aktivitätskonfiguration: Definieren der Aktivitätsreihenfolge

Option 1: SQL-Konfiguration

Option 2: CSV-Samendatei

Empfehlungen

Tests

Dbt-Projekte

pm-utils package

Aktualisieren der PM-utils-Version, die für Ihre App-Vorlage verwendet wird