document-understanding

2021.10

false

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

サポート対象外

Document Understanding ガイド

Data Manager を使用する

このページでは、Data Manager を使用して新しいデータセットをラベル付けし、ML モデルを再トレーニングする方法を説明します。

Data Manager にアクセスして設定を行う

「初回の操作」で作成したデータのラベル付けセッションを起動し、設定に移動して OCR を設定します。

[OCR メソッド] ドロップダウンメニューから、使用する OCR を選択します。[UiPathDocumentOCR] を使用する場合は、Document Understanding ライセンスキー ([管理] > [ライセンス] ページから Document Understanding の API キーを取得) を貼り付け、次に、UiPathDocumentOCR のデプロイ時に生成した OCR URL を貼り付けます。

こちらの指示に従ってデプロイしたモデルで、事前ラベル付けを設定します。モデルのパブリック ML スキルエンドポイントと Document Understanding ライセンスキーを貼り付け、[保存] をクリックします。

詳しくは、こちらのドキュメントをご覧ください。

ドキュメントをインポートする

Data Manager セッションの [インポート] ボタンをクリックします。

データセットに名前を付け、[アップロードするファイルを参照] をクリックします。

アップロードするドキュメントを選択します。

[はい] をクリックします。

詳しくは、「ドキュメントをインポートする」をご覧ください。

抽出フィールドを作成する

をクリックして、抽出するフィールドを作成します。

最大 40 個のフィールドを作成できます。

この検証の演習では、一般的な請求書フィールドをいくつか作成できます。たとえば、日付、名前、請求書番号、合計金額などです。[コンテンツの種類] は、日付 (date)、名前 (string)、請求書番号 (string)、合計金額 (number) のように適切に選択します。

詳しくは、「フィールドを作成および設定する」をご覧ください。

ドキュメントにラベル付けする

ドキュメントのラベル付けを開始します。

画面上部にある予測ボタンをクリックし、請求書のベースモデルを使用して定義済みフィールドのラベルを予測します。予測が誤っている場合はラベルを修正します。

ラベルを変更するには、フィールド上にマウスをドラッグし、キーボードショートカットキーを押してラベル付けします (下の例では、d を押して日付をラベル付けする)。

画面上部にある矢印を使用して次のドキュメントに切り替え、アップロードしたすべての請求書のラベルを検証します。

注: Invoices (請求書) のベースモデルのパフォーマンスは既に十分高く、サンプルとして使用されている請求書はシンプルでバリエーションも少ないため、この場合の予測精度は 100% に近くなります。したがって、ラベルを修正する必要はない可能性があります。

ドキュメントのラベル付けについて詳しくは、「ドキュメントにラベル付けする」をご覧ください。

ドキュメントをエクスポートする

データセットのフィルターで正しいデータセットを選択していることを確認し、[エクスポート] ボタンをクリックします。

[エクスポート] をクリックします。

同じ AI Center プロジェクトの下の [データセット] に移動すると、エクスポートしたトレーニングデータセットが表示されています。

詳しくは、「ドキュメントをエクスポートする」をご覧ください。

AI Center でカスタムモデルをトレーニングする

[パイプライン] > [新規作成] に移動します。評価の実行の種類を選択し、モデルパッケージと入力データセットを選択します。

入力データセットとして使用する、export 下のサブフォルダーを選択します。

[作成] をクリックしてパイプラインを開始します。CPU マシン上でのパイプラインの実行には 1 時間から 2 時間かかる場合があります。

再トレーニングした ML モデルを ML スキルとしてデプロイする

[ML スキル] に移動し、新しい ML スキルを作成します。

前に作成したのと同じ請求書モデルのパッケージを選択します。モデルは再トレーニング済みなので、新しいマイナーパッケージバージョンが表示されます (1 と 0)。最新のバージョンを選択します。

ML スキルを作成した後は、[現在のデプロイを変更] に移動して ML スキルを公開します。トグルを切り替え、[確認] をクリックします。

後で使用するために、パブリック ML スキルの URL をコピーします。

これで、独自のデータセットで Invoices (請求書) モデルを再トレーニングし、モデルにアクセスするためのエンドポイントを作成できました。

目次

Data Manager にアクセスして設定を行う
ドキュメントをインポートする
抽出フィールドを作成する
ドキュメントにラベル付けする
ドキュメントをエクスポートする
再トレーニングした ML モデルを ML スキルとしてデプロイする

このページは役に立ちましたか?

前へML パッケージのオフラインインストール

次へフレームワークを使用する