- 基本情報
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- データ マネージャー (Data Manager)
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Data Manager を使用する
このページでは、Data Manager を使用して新しいデータセットをラベル付けし、ML モデルを再トレーニングする方法を説明します。
「初回の操作」で作成したデータのラベル付けセッションを起動し、設定に移動して OCR を設定します。
[OCR メソッド] ドロップダウン メニューから、使用する OCR を選択します。[UiPathDocumentOCR] を使用する場合は、Document Understanding ライセンス キー ([管理] > [ライセンス] ページから Document Understanding の API キーを取得) を貼り付け、次に、UiPathDocumentOCR のデプロイ時に生成した OCR URL を貼り付けます。
こちらの指示に従ってデプロイしたモデルで、事前ラベル付けを設定します。モデルのパブリック ML スキル エンドポイントと Document Understanding ライセンス キーを貼り付け、[保存] をクリックします。
詳しくは、こちらのドキュメントをご覧ください。
Data Manager セッションの [インポート] ボタン をクリックします。
データセットに名前を付け、[アップロードするファイルを参照] をクリックします。
アップロードするドキュメントを選択します。
[はい] をクリックします。
詳しくは、「ドキュメントをインポートする」をご覧ください。
をクリックして、抽出するフィールドを作成します。
最大 40 個のフィールドを作成できます。
この検証の演習では、一般的な請求書フィールドをいくつか作成できます。たとえば、日付、名前、請求書番号、合計金額などです。[コンテンツの種類] は、日付 (date)、名前 (string)、請求書番号 (string)、合計金額 (number) のように適切に選択します。
詳しくは、「フィールドを作成および設定する」をご覧ください。
ドキュメントのラベル付けを開始します。
画面上部にある予測ボタン をクリックし、請求書のベース モデルを使用して定義済みフィールドのラベルを予測します。予測が誤っている場合はラベルを修正します。
d
を押して日付をラベル付けする)。
画面上部にある矢印を使用して次のドキュメントに切り替え、アップロードしたすべての請求書のラベルを検証します。
ドキュメントのラベル付けについて詳しくは、「ドキュメントにラベル付けする」をご覧ください。
データセットのフィルターで正しいデータセットを選択していることを確認し、[エクスポート] ボタン をクリックします。
[エクスポート] をクリックします。
同じ AI Center プロジェクトの下の [データセット] に移動すると、エクスポートしたトレーニング データセットが表示されています。
詳しくは、「ドキュメントをエクスポートする」をご覧ください。
AI Center でカスタム モデルをトレーニングする
[パイプライン] > [新規作成] に移動します。評価の実行の種類を選択し、モデル パッケージと入力データセットを選択します。
入力データセットとして使用する、export 下のサブフォルダーを選択します。
[作成] をクリックしてパイプラインを開始します。CPU マシン上でのパイプラインの実行には 1 時間から 2 時間かかる場合があります。
[ML スキル] に移動し、新しい ML スキルを作成します。
前に作成したのと同じ請求書モデルのパッケージを選択します。モデルは再トレーニング済みなので、新しいマイナー パッケージ バージョンが表示されます (1 と 0)。最新のバージョンを選択します。
ML スキルを作成した後は、[現在のデプロイを変更] に移動して ML スキルを公開します。トグルを切り替え、[確認] をクリックします。
後で使用するために、パブリック ML スキルの URL をコピーします。
これで、独自のデータセットで Invoices (請求書) モデルを再トレーニングし、モデルにアクセスするためのエンドポイントを作成できました。