Process Mining
2021.10
False
Bannerhintergrundbild
Process Mining
Letzte Aktualisierung 2. Apr. 2024

Bereinigen von Eingabedaten

Bereinigen von Eingabedaten

Wenn Daten in den Basic Connectorgeladen werden, ist es möglich, dass das Dataset falsche oder irrelevante Fälle und Ereignisse enthält. Der Basis-Connector enthält zwei Filter, die zum Entfernen dieser Fälle und Ereignisse verwendet werden können, den Cases filter und den Events filter .

Siehe Abbildung unten.



Fälle-Filter

Der Filter Fälle gilt für alle Fälle in der Tabelle Cases_input und wird häufig verwendet, um doppelte Fälle zu entfernen oder bestimmte Falltypen auszulassen. Im folgenden Beispiel werden Fälle mit einem negativen Betrag gefiltert. Der Ergebnisbereich zeigt, dass 15 Fälle basierend auf dieser Definition herausgefiltert werden.


Filter „Ereignisse“.

Der Filter Ereignisse gilt für alle Ereignisse in der Tabelle Events_input und wird häufig verwendet, um bestimmte Aktivitäten auszulassen oder Ereignisse vor einem bestimmten Datum herauszufiltern. Der Filter Ereignisse verweist immer auf den Filter Fälle , um Ereignisse zu entfernen, bei denen der Fall im Filter Fälle herausgefiltertwurde. Im folgenden Beispiel werden Ereignisse, die vor dem 01.01.2016 stattfinden, entfernt. Der Ergebnisbereich zeigt, dass dies dazu führt, dass 72 191 Ereignisse entfernt werden.


Anwenden des Filters

Standardmäßig werden Cases filter und Events filter in der Verknüpfung der Tabellen Cases_preprocessing und Events_preprocessing angewendet. Aus diesem Grund reicht es aus, nur die Filter selbst zu ändern. Die Einstellung garantiert, dass die Vorverarbeitungstabellen nur Daten gemäß der Filterdefinition enthalten.
Doppelklicken Sie auf die Tabelle Cases_preprocessing oder Events_preprocessing , um zu überprüfen, wie der Filter angewendet wird.

Cases_preprocessing

Der Join der Tabelle Cases_preprocessing wendet den Filter Fälle in seiner WHERE-Bedingung an. Daher enthält die Tabelle alle Daten, die in der Tabelle Cases_input enthalten sind, mit Ausnahme der Datensätze, die vom Filter Fälle herausgefiltertwurden. Das folgende Beispiel zeigt, dass 15 Datensätze ausgeschlossen werden, was den 15 falschen Werten im Filter Fälle selbst entspricht.


Events_preprocessing

Der Filter „Ereignisse“ gilt für alle Ereignisse in der Tabelle Events_input und wird häufig verwendet, um bestimmte Aktivitäten auszulassen oder Ereignisse vor einem bestimmten Datum herauszufiltern. Der Filter „Ereignisse“ verweist immer auf den Filter „Fälle“, um Ereignisse zu entfernen, bei denen der Fall im Filter „Fälle“ herausgefiltert wurde. Im folgenden Beispiel werden Ereignisse entfernt, die vor dem 01.01.2016 geschehen sind. Der Ergebnisbereich zeigt, dass dadurch 72 191 Ereignisse entfernt werden.


Ersetzen von Attributen

Anstelle von Attributen in Ihrem Dataset, die nicht im Basic Connectorvorhanden sind, ist es auch möglich, dass in AppOneFelder definiert sind, die nicht direkt einem der Felder in Ihrer Eingabedatendatei entsprechen. In diesem Fall sollten Sie einen Ausdruck für dieses Feld im Basic Connectorerstellen.

In einigen Fällen möchten Sie möglicherweise nicht den gesamten Datensatz entfernen, sondern einfach die Werte des falschen Attributs korrigieren.

Um ein solches Attribut in UiPath Process Miningzu korrigieren, müssen Sie zuerst einen Ausdruck erstellen, der die richtigen Werte berechnet, und dann das falsche Attribut durch den neuen Ausdruck ersetzen.

Korrigieren des Attributwerts

Um das Attribut zu korrigieren, erstellen Sie einen neuen Ausdruck, der die richtigen Werte berechnet. Erstellen Sie diesen Ausdruck in derselben Tabelle, aus der das falsche Attribut stammt.

Das Attribut Case ID ist beispielsweise in den Tabellen Cases_preprocessing und Cases_base verfügbar, stammt jedoch aus Cases_input . Daher sollte der neue Ausdruck zur Korrektur auch in Cases_input berechnet werden.
Hinweis: Es wird empfohlen, dem neuen Ausdruck denselben Namen wie dem ursprünglichen Attribut zu geben.
In der Abbildung unten finden Sie ein Beispiel zum Entfernen des Präfixes CORE_ aus Case ID in der Tabelle Cases_input .


Ersetzen des Attributs

Die Attribute der Tabellen im Basisconnector werden im gesamten Connector in verschiedenen Ausdrücken verwendet. Daher ist es nicht möglich, das falsche Attribut einfach zu löschen, sondern es muss durch den neuen Ausdruck ersetzt werden. In den folgenden Schritten wird erläutert, wie ein Attribut ersetzt wird.

Hinweis: Es ist wichtig, diese Schritte in der Tabelle auszuführen, aus der das falsche Attribut und der neue Ausdruck stammen.

Schritt 1: Festlegen der Verfügbarkeit des neuen Ausdrucks

Um ein Attribut zu ersetzen, muss die Verfügbarkeit beider Attribute gleich sein. Die beiden Fall-ID-Attribute in der folgenden Abbildung haben unterschiedliche Verfügbarkeiten.

Klicken Sie mit der rechten Maustaste auf den zweiten Fall-ID-Ausdruck, und wählen Sie im Kontextmenü Verfügbarkeit – Öffentlich aus, um die Verfügbarkeit in Öffentlichzu ändern.



Schritt 2: UIDs austauschen

Um das falsche Attribut an allen Stellen, an denen es im Connector verwendet wird, durch den neuen Ausdruck zu ersetzen, müssen die UIDs beider Attribute ausgetauscht werden. Durch das Vertauschen der UIDs ersetzt die Software alle Verweise auf das ursprüngliche Attribut durch Verweise auf den neuen Ausdruck und umgekehrt. Um UIDs auszutauschen, wählen Sie beide Attribute aus, klicken Sie mit der rechten Maustaste und wählen Sie Erweitert – UIDs tauschen aus dem Kontextmenü aus. Siehe Abbildung unten.



Hinweis:
  • Die UID ist eine interne Software-ID und nicht die im Ausdruckseditor angezeigte ID. Nach dem Austauschen der UIDs haben sich der Name und die ID des Attributs oder Ausdrucks nicht geändert.
  • Wenn die UIDs nicht in der Tabelle ausgetauscht werden, aus der das ursprüngliche Attribut und der neue Ausdruck stammen, wird eine Warnung angezeigt und der Tausch wird nicht in der ursprünglichen Tabelle ausgeführt. Sie können die Änderungen mit STRG + Z rückgängig machen und das Attribut in der richtigen Tabelle ersetzen.

Schritt 3: Referenzen überprüfen

Um zu überprüfen, ob der Austausch erfolgreich war, überprüfen Sie die Referenzen der einzelnen Attribute. Alle Verweise, die früher auf das ursprüngliche Attribut verwiesen haben, sollten jetzt auf den neuen Ausdruck verweisen (siehe Beispiel unten). Das falsche Attribut sollte nur von unserem neuen Ausdruck selbst referenziert werden. Um die Referenzen zu überprüfen, wählen Sie ein Attribut aus, klicken Sie mit der rechten Maustaste und wählen Sie Erweitert – Referenzen anzeigen aus dem Kontextmenü aus.



Geister
Ein Ghost ist ein Attribut, das nicht mehr verfügbar ist, obwohl es noch im Connector verwendet wird. Wenn ein Ghost erstellt wird, wird eine Warnung angezeigt. Ein Geist wird durch das Symbol angezeigt. Löschen Sie niemals einen Geist, auf den noch Verweise verweisen. Machen Sie die Änderungen rückgängig, indem Sie CTRL+Z verwenden, bis das Geisterbild durch das tatsächliche Attribut ersetzt wird. Bewerten Sie, welche Schritte beim Ersetzen des Attributs schief gelaufen sind, und wiederholen Sie sie bei Bedarf.

Schritt 4: Festlegen der Verfügbarkeit des ursprünglichen Attributs

Wenn der Austausch erfolgreich war und die Verweise auf die richtigen Attribute verweisen, wird empfohlen, die Verfügbarkeit des ursprünglichen Attributs auf Private festzulegen. Auf diese Weise kann sie nicht in anderen Tabellen wie den Tabellen Preprocessing und Base verwendet werden. Siehe Abbildung unten für die beiden Fall-ID-Attribute nach dem Tausch und das ursprüngliche Attribut, das auf privat festgelegt ist.


War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
UiPath Logo weiß
Vertrauen und Sicherheit
© 2005-2024 UiPath. All rights reserved.