- はじめる前に
- 基本情報
- Integrations
- プロセス アプリを使用する
- アプリを作成する
- データを読み込む
- プロセス アプリをカスタマイズする
- ダッシュボードをパブリッシュする
- アプリ テンプレート
- その他のリソース
- すぐに使えるタグと期限日
- ローカル環境でデータ変換を編集する
- ローカルのテスト環境を設定する
- イベント ログをデザインする
- SAP Ariba の抽出ツールを拡張する
- パフォーマンス特性
Process Mining ユーザー ガイド
フォルダー構造
プロセス アプリの変換は、1 つの dbt プロジェクトで成り立ちます。以下の表は、dbt プロジェクト フォルダーの内容の説明です。
| フォルダー/ファイル | 次の値を含む |
|---|---|
dbt_packages\ | pm_utils パッケージとそのマクロです。 |
logs\ | dbt の実行時に作成されるログです。 |
macros\ | カスタム マクロです。 |
models\ | .sql 変換を定義するファイル |
models\schema\ | .yml データに対するテストを定義するファイル |
seed | .csv 構成設定を含むファイル |
dbt_project.yml | dbt プロジェクトの設定です。 |
以下の画像でご確認ください。
データ変換
データ変換は、models\ ディレクトリ内の .sql ファイルで定義されます。データ変換は、サブディレクトリの標準セット内で整理されています。
1_input2_objects3_events4_event_logs5_business_logicです。
「変換の構造」をご覧ください。
.sql ファイルは Jinja SQL で記述されており、プレーンな SQL クエリに Jinja ステートメントを挿入できます。dbt ですべての .sql ファイルが実行されると、各 .sql ファイルによってデータベース内に新しいビューまたはテーブルが生成されます。
.sql ファイルは通常、次の構造を持ちます。
-
With ステートメント: 必要なサブ テーブルを含む With ステートメントが 1 つ以上必要です。
{{ ref(‘My_table) }}は、別の .sql ファイルで定義されたテーブルを参照します。{{ source(var("schema_sources"), 'My_table') }}は入力テーブルを参照します。
-
メイン クエリ: 新しいテーブルを定義するクエリです。
-
最後のクエリ: 通常、
Select * from tableのようなクエリが最後に使用されます。これにより、デバッグ中に副選択を簡単に行うことができます。
変換の効果的な記述方法について詳しくは、「SQL を記述するためのヒント」をご覧ください。
ソース テーブルを追加する
dbt プロジェクトに新しいソース テーブルを追加するには、そのテーブルが models\schema\sources.yml のリストに含められている必要があります。こうすることで、他のモデルが {{ source(var("schema_sources"), 'My_table') }} を使用してテーブルを参照できます。次の図に例を示します。
新しいソース テーブルは、それぞれ sources.yml のリストに加えられている必要があります。
詳しくは、 ソース に関する dbt の公式ドキュメント をご覧ください。
データ出力
データ変換は、対応するアプリで必要となるデータ モデルを出力する必要があります。つまり、期待されるそれぞれのテーブルとフィールドが存在する必要があります。
プロセス アプリに新しいフィールドを追加する場合は、これらのフィールドを変換に追加できます。
マクロ
マクロを使用すると、一般的な SQL の構造を簡単に再利用できます。詳しくは、Jinja マクロに関する dbt 公式ドキュメント をご覧ください。
pm_utils
pm-utils パッケージには、Process Mining の変換で通常使用されるマクロが一式含まれています。pm_utils マクロについて詳しくは、「ProcessMining-pm-utils」をご覧ください。
次の図に pm_utils.optional() マクロを呼び出す Jinja のコードの例を示します。
シード
シードとは、変換にデータ テーブルを追加するために使用される csv ファイルです。詳しくは、Jinja のシードに関する dbt の公式ドキュメント をご覧ください。
Process Mining では、変換内のマッピングを簡単に設定できるよう、一般的にシードが使用されます。
シード ファイルを編集した後、[ファイルを実行] または [すべてを実行] を選択してファイルを実行し、対応するデータ テーブルを更新します。
シード ファイルの使用例については、「 アクティビティの設定 」および「 自動化の見込みをシミュレーションする 」をご覧ください。
アクティビティの設定
activity_configuration.csv ファイルは、アクティビティに関連する追加フィールドを設定するために使用されます。activity_order は、同じタイムスタンプで 2 つのイベントが発生する際のタイ ブレーカーとして使用されます。次の図に activity_configuration.csv ファイルの例を示します。
テスト
models\schema\ フォルダーには、テストを定義する .yml ファイル一式が含まれます。これらのファイルは、期待されるデータの構造と内容を検証します。詳しくは、テストに関する dbt の公式ドキュメント をご覧ください。
変換を Process Mining で実行すると、各データ取り込みでは sources.yml 内のテストのみが実行されます。これは、入力データの書式が正しいかどうかを確認するために行われます。
変換を編集する際は、テストを適宜更新してください。テストは必要に応じて削除できます。
dbt プロジェクト
データ変換は、入力データを Process Mining に適したデータに変換するために使用されます。Process Mining の変換は dbt プロジェクトとして書き込まれます。
このページでは、 dbt について説明します。詳しくは、 dbt の公式ドキュメントをご覧ください。
pm-utils パッケージ
Process Mining のアプリ テンプレートには、pm_utilsという dbt パッケージが付属しています。この pm-utils パッケージには、Process Mining の dbt プロジェクト用のユーティリティ関数とマクロが含まれています。pm_utilsについて詳しくは、「ProcessMining-pm-utils」をご覧ください。
アプリ テンプレートに使用する pm-utils のバージョンを更新する
UiPath® では、新しい関数を追加することで、 pm-utils パッケージに対して継続的な改善を行っています。
新しいバージョンの pm-utils パッケージがリリースされたら、変換で使用されているバージョンを更新して、必ず pm-utils パッケージの最新の関数とマクロを利用できるようにすることをお勧めします。
最新バージョンの パッケージのバージョン番号は、pm-utils ProcessMining-pm-utils の[リリース] パネルで確認できます。
変換で使用されている pm-utils のバージョンを更新するには、以下の手順に従います。
pm-utilsのリリースからソース コード (zip) をダウンロードします。zipファイルを抽出し、フォルダーの名前を pm_utils に変更します。- インラインのデータ変換エディターから変換をエクスポートし、ファイルを抽出します。
- エクスポートした変換の pm_utils フォルダーを、新しい pm_utils フォルダーに置き換えます。
- 変換の内容を再度 zip で圧縮し、データ変換エディターにインポートします。