- 概要
- Document Understanding Process
- クイックスタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- Document Manager
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- インストールして使用する
- 初回の操作
- UiPathDocumentOCR をデプロイする
- すぐに使える ML パッケージをデプロイする
- Document Manager を使用する
- フレームワークを使用する
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Manager を使用する
このページでは、Document Manager を使用して新しいデータセットをラベル付けし、ML モデルを再トレーニングする方法を説明します。
「初回の操作」で作成したデータのラベル付けセッションを起動し、設定に移動して OCR を設定します。
[OCR メソッド] ドロップダウン メニューから、使用する OCR を選択します。[UiPathDocumentOCR] を使用する場合は、Document UnderstandingTM ライセンス キー ([管理] > [ライセンス] ページから Document Understanding の API キーを取得) を貼り付け、次に、UiPathDocumentOCR のデプロイ時に生成した OCR URL を貼り付けます。
こちらの指示に従ってデプロイしたモデルで、事前ラベル付けを設定します。モデルのパブリック ML スキル エンドポイントと Document Understanding ライセンス キーを貼り付け、[保存] をクリックします。
詳しくは、「事前定義されたスキーマを使用する」をご覧ください。
- Document Manager セッションの [インポート] ボタン を選択します。
- データセットに名前を付け、[アップロードするファイルを参照] を選択します。
- アップロードするドキュメントを選択します。
- [はい] をクリックします。
をクリックして、抽出するフィールドを作成します。
最大 40 個のフィールドを作成できます。
この検証の演習では、一般的な請求書フィールドをいくつか作成できます。たとえば、日付、名前、請求書番号、合計金額などです。[コンテンツの種類] は、日付 (date)、名前 (string)、請求書番号 (string)、合計金額 (number) のように適切に選択します。
ドキュメントのラベル付けを開始します。
画面上部にある予測ボタン をクリックし、請求書のベース モデルを使用して定義済みフィールドのラベルを予測します。予測が誤っている場合はラベルを修正します。
d
を押して日付をラベル付けする)。
画面上部にある矢印を使用して次のドキュメントに切り替え、アップロードしたすべての請求書のラベルを検証します。
- データセットのフィルターで正しいデータセットを選択していることを確認し、[エクスポート] ボタン をクリックします。
- [エクスポート] を選択します。
- 同じ AI Center プロジェクトの下の [データセット] に移動すると、エクスポートしたトレーニング データセットが表示されています。
AI Center でカスタム モデルをトレーニングする
- [パイプライン] > [新規作成] に移動します。評価の実行の種類を選択し、モデル パッケージと入力データセットを選択します。
- 入力データセットとして使用する、export 下のサブフォルダーを選択します。
- [作成] を選択してパイプラインを開始します。CPU マシン上でのパイプラインの実行には 1 時間から 2 時間かかる場合があります。
[ML スキル] に移動し、新しい ML スキルを作成します。
前に作成したのと同じ請求書モデルのパッケージを選択します。モデルは再トレーニング済みなので、新しいマイナー パッケージ バージョンが表示されます (1 と 0)。最新のバージョンを選択します。
ML スキルを作成した後は、[現在のデプロイを変更] に移動して ML スキルを公開します。トグルを切り替え、[確認] をクリックします。
後で使用するために、パブリック ML スキルの URL をコピーします。
これで、独自のデータセットで Invoices (請求書) モデルを再トレーニングし、モデルにアクセスするためのエンドポイントを作成できました。