通知を受け取る

UiPath Document Understanding

UiPath Document Understanding

Document Manager を使用する

このページでは、Document Manager を使用して新しいデータセットをラベル付けし、ML モデルを再トレーニングする方法を説明します。

Document Manager にアクセスして設定を行う


Launch the created data labeling session in First Run Experience and go to the settings to configure the OCR.

Choose the OCR you intend to use in the OCR method dropdown menu. For UiPathDocumentOCR, paste the Document Understanding license key (retrieve the Document Understanding API key from the Admin > License page) and then paste the OCR URL you generated when you deployed UiPathDocumentOCR.

14991499

Configure the prelabelling with the models that you have deployed following the instructions here. Paste the model public ML Skill endpoint and the Document Understanding license key, and then click Save.

14881488

For more details, please check the documentation here: Configure Document Manager.

ドキュメントをインポートする


Click the Import button importimport from a Document Manager Session.

16741674

データセットに名前を付け、[アップロードするファイルを参照] をクリックします。

15151515

アップロードするドキュメントを選択します。

12781278

[はい] をクリックします。

12801280

For more details, please check the documentation here: Import Documents.

抽出フィールドを作成する


Click create_fieldcreate_field to create fields to be extracted.

最大 40 個のフィールドを作成できます。

この検証の演習では、一般的な請求書フィールドをいくつか作成できます。たとえば、日付名前請求書番号合計金額などです。[コンテンツの種類] は、日付 (date)、名前 (string)、請求書番号 (string)、合計金額 (number) のように適切に選択します。

15031503

For more details, please check the documentation here: Create & Configure Fields.

ドキュメントにラベル付けする


ドキュメントのラベル付けを開始します。

Click the predict button predictpredict on top to use the base invoice model to predict the labels for the defined fields, and correct it if the prediction is wrong.

To change the label, drag the mouse over the field and hit the keyboard shortcut to label it (e.g., d for labeling date in the below example).

画面上部にある矢印を使用して次のドキュメントに切り替え、アップロードしたすべての請求書のラベルを検証します。

📘

注:

Invoices (請求書) のベース モデルのパフォーマンスは既に十分高く、サンプルとして使用されている請求書はシンプルでバリエーションも少ないため、この場合の予測精度は 100% に近くなります。したがって、ラベルを修正する必要はない可能性があります。

18701870

For more details about labeling documents, please check the documentation here: Label Documents.

ドキュメントをエクスポートする


Make sure to select the correct dataset in the dataset filtering and click the Export button exportexport.

16501650

[エクスポート] をクリックします。

14031403

同じ AI Center プロジェクトの下の [データセット] に移動すると、エクスポートしたトレーニング データセットが表示されています。

16531653

For more details, please check the documentation: Export Documents.

AI Center でカスタム モデルをトレーニングする

[パイプライン] > [新規作成] に移動します。評価の実行の種類を選択し、モデル パッケージと入力データセットを選択します。

16531653

入力データセットとして使用する、export 下のサブフォルダーを選択します。

14311431

[作成] をクリックしてパイプラインを開始します。CPU マシン上でのパイプラインの実行には 1 時間から 2 時間かかる場合があります。

再トレーニングした ML モデルを ML スキルとしてデプロイする


[ML スキル] に移動し、新しい ML スキルを作成します。

前に作成したのと同じ請求書モデルのパッケージを選択します。モデルは再トレーニング済みなので、新しいマイナー パッケージ バージョンが表示されます (1 と 0)。最新のバージョンを選択します。

13951395

ML スキルを作成した後は、[現在のデプロイを変更] に移動して ML スキルを公開します。トグルを切り替え、[確認] をクリックします。

12171217

後で使用するために、パブリック ML スキルの URL をコピーします。

12781278

これで、独自のデータセットで Invoices (請求書) モデルを再トレーニングし、モデルにアクセスするためのエンドポイントを作成できました。

2 か月前に更新


Document Manager を使用する


改善の提案は、API リファレンスのページでは制限されています

改善を提案できるのは Markdown の本文コンテンツのみであり、API 仕様に行うことはできません。