Document Understanding
2021.10
バナーの背景画像
Document Understanding ガイド
最終更新日 2024年2月28日

Data Manager を使用する

このページでは、Data Manager を使用して新しいデータセットをラベル付けし、ML モデルを再トレーニングする方法を説明します。

Data Manager にアクセスして設定を行う

初回の操作」で作成したデータのラベル付けセッションを起動し、設定に移動して OCR を設定します。

[OCR メソッド] ドロップダウン メニューから、使用する OCR を選択します。[UiPathDocumentOCR] を使用する場合は、Document Understanding ライセンス キー ([管理] > [ライセンス] ページから Document Understanding の API キーを取得) を貼り付け、次に、UiPathDocumentOCR のデプロイ時に生成した OCR URL を貼り付けます。



こちらの指示に従ってデプロイしたモデルで、事前ラベル付けを設定します。モデルのパブリック ML スキル エンドポイントと Document Understanding ライセンス キーを貼り付け、[保存] をクリックします。



詳しくは、こちらのドキュメントをご覧ください。

ドキュメントをインポートする

Data Manager セッションの [インポート] ボタン をクリックします。



データセットに名前を付け、[アップロードするファイルを参照] をクリックします。



アップロードするドキュメントを選択します。



[はい] をクリックします。



詳しくは、「ドキュメントをインポートする」をご覧ください。

抽出フィールドを作成する

をクリックして、抽出するフィールドを作成します。

最大 40 個のフィールドを作成できます。

この検証の演習では、一般的な請求書フィールドをいくつか作成できます。たとえば、日付名前請求書番号合計金額などです。[コンテンツの種類] は、日付 (date)、名前 (string)、請求書番号 (string)、合計金額 (number) のように適切に選択します。



詳しくは、「フィールドを作成および設定する」をご覧ください。

ドキュメントにラベル付けする

ドキュメントのラベル付けを開始します。

画面上部にある予測ボタン をクリックし、請求書のベース モデルを使用して定義済みフィールドのラベルを予測します。予測が誤っている場合はラベルを修正します。

ラベルを変更するには、フィールド上にマウスをドラッグし、キーボード ショートカット キーを押してラベル付けします (下の例では、d を押して日付をラベル付けする)。

画面上部にある矢印を使用して次のドキュメントに切り替え、アップロードしたすべての請求書のラベルを検証します。

注: Invoices (請求書) のベース モデルのパフォーマンスは既に十分高く、サンプルとして使用されている請求書はシンプルでバリエーションも少ないため、この場合の予測精度は 100% に近くなります。したがって、ラベルを修正する必要はない可能性があります。


ドキュメントのラベル付けについて詳しくは、「ドキュメントにラベル付けする」をご覧ください。

ドキュメントをエクスポートする

データセットのフィルターで正しいデータセットを選択していることを確認し、[エクスポート] ボタン をクリックします。



[エクスポート] をクリックします。



同じ AI Center プロジェクトの下の [データセット] に移動すると、エクスポートしたトレーニング データセットが表示されています。



詳しくは、「ドキュメントをエクスポートする」をご覧ください。

AI Center でカスタム モデルをトレーニングする

[パイプライン] > [新規作成] に移動します。評価の実行の種類を選択し、モデル パッケージと入力データセットを選択します。



入力データセットとして使用する、export 下のサブフォルダーを選択します。



[作成] をクリックしてパイプラインを開始します。CPU マシン上でのパイプラインの実行には 1 時間から 2 時間かかる場合があります。

再トレーニングした ML モデルを ML スキルとしてデプロイする

[ML スキル] に移動し、新しい ML スキルを作成します。

前に作成したのと同じ請求書モデルのパッケージを選択します。モデルは再トレーニング済みなので、新しいマイナー パッケージ バージョンが表示されます (1 と 0)。最新のバージョンを選択します。



ML スキルを作成した後は、[現在のデプロイを変更] に移動して ML スキルを公開します。トグルを切り替え、[確認] をクリックします。



後で使用するために、パブリック ML スキルの URL をコピーします。



これで、独自のデータセットで Invoices (請求書) モデルを再トレーニングし、モデルにアクセスするためのエンドポイントを作成できました。

Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.