Document Understanding
2022.4
バナーの背景画像
Document Understanding ガイド
最終更新日 2024年3月13日

Document Manager について

UiPath Document Manager は、Document Understanding マシン ラーニング モデルのトレーニングと評価に必要なデータセットを準備、レビュー、修正できる軽量の Web アプリケーションです。Document Manager を使用すると、複数のユーザーが以下のようなさまざまな操作を実行できます。

  • ML モデルで抽出するフィールドを定義・設定します。
  • ラベル付けのためにドキュメントをインポートします。
  • UiPath が提供する、すぐに使える既存の ML モデル (請求書抽出や領収書抽出など) や、AI Center でトレーニングしたモデルを使用して、ドキュメントの事前ラベル付けを行います。
  • ドキュメントのラベル付けを行います。
  • AI Center のトレーニング パイプラインで使用できる形式で、ドキュメントをエクスポートします。

ユーザー インターフェイス

Document Manager のインターフェイスには、以下のパネルがあります。

管理バー

Document Manager のページの上部に表示されます。

複数の操作を実行できます (ドキュメント間の移動、ドキュメントの削除/復元、ドキュメントの検索/フィルター処理、AI モデルの予測の実行、ドキュメントのインポートとエクスポート)。

以下に、管理バーで利用可能な項目を示します。

アイテム

Icon

説明

ナビゲーション

アクティブなフィルターに一致するドキュメント間を移動します。

2 つの矢印の間にカウンターが表示されます。アクティブな検索/フィルターに一致するドキュメントの総数のうち、現在のドキュメントの数を示します。

検索

ドキュメントを検索またはフィルター処理します。フィルターはドキュメントのエクスポート時にも適用されます。ドキュメント内の単語またはドキュメント名でフィルター処理することもできます。

削除/復元

/

ドキュメントを削除または復元します。削除したドキュメントは、deleted フィルターで検索できます。

インポート

[データをインポート] ダイアログ ボックスを開きます。

エクスポート

[ファイルをエクスポート] ダイアログ ボックスを開きます。

ドキュメントの名前と種類

なし

現在アクティブなドキュメントの名前と種類です。

ドキュメントには以下の 3 種類があります。

  • トレーニング ドキュメント

    -検証ドキュメント

    -評価ドキュメント

トレーニング ドキュメントと検証ドキュメントは、トレーニング パイプラインで使用されるトレーニング データセットの一部です。

評価ドキュメントはトレーニング パイプラインでは無視され、AI Center の評価パイプラインでのみ使用されるようになっています。評価ドキュメントは、[データをインポート] ダイアログ ボックスの [これを評価セットにする] チェックボックスをオンにして、評価用としてマークしたドキュメントです。

ダウンロードする

このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。

アイコンをクリックすると、元のドキュメントを含む Zip ファイルをダウンロードできます。元のドキュメントに加えて、Document Manager によって内部で .jpeg 画像に変換されたすべてのページもダウンロードされます。

完全に削除



このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。

個々のファイルを完全に削除します。.pdf とそのファイルのすべての .jpeg イメージが AI Center のデータセットから削除され、すべてのメタデータがデータベースから削除されます。

ボタンをクリックすると、ドキュメントを完全に削除するかどうかを確認するポップアップ メッセージが表示されます。[OK] クリックして続行するか、[キャンセル] をクリックして前の画面に戻ります。

セッション名

なし

現在のセッションの名前です。

予測

AI モデルの予測を実行し、結果を表示します。

事前ラベル付けを設定すると、管理バーでこのボタンが有効化されます。このボタンをクリックすると、現在のドキュメントの事前ラベル付けが行われます。

  • 現時点では、パブリック エンドポイントを使用して [予測] オプションを使用すると、ドキュメントの最初の 10 ページにしか事前ラベル付けが行われません。これは既知の問題であり、現在修正が行われています。なお、AI Center で ML スキルを使用して [予測] オプションを使用した場合には、そのような制限はありません。

設定

OCR と事前ラベル付けの設定を行ったり、[使い方] パネルにアクセスしたりできます。詳しくは、以下をご覧ください。

設定ボタンには、2 つの利用可能なオプションがあります。

OCR

Document Manager にドキュメントをインポートするには、OCR サービスの設定が必須です。



次のオプションを使用できます。

OCR メソッド

クラウドベースのオプションは以下のとおりです。

  • UiPath Document OCR - https://du.uipath.com/ocr;
  • Google Cloud Vision OCR - 対応している言語の種類は最多です。
  • Google Cloud Vision OCR for Japanese - 日本語ドキュメントの読み取りに最適です。
  • Microsoft Read OCR

OCR の URL

OCR を設定するには、OCR サービスに URL が必要です。使用できる URL は以下のとおりです。

  • パブリック URL (例: https://du.uipath.com/ocr) または Google Vision OCR や Microsoft Read OCR のサードパーティの URL

OCR キー

選択した OCR エンジンに対応する API キーです。たとえば、UiPath ドキュメント OCR の場合、Document Understanding の API キーを使用する必要があります。クラウドの Document Manager およびオンプレミスのオンラインの Document Manager の場合は必須です。オンプレミスのエアギャップ環境の Document Manager では不要です。

事前ラベル付け

ラベル付けが必要なフィールドの一部を抽出できるモデルを既に所持しており、追加で手動のラベル付けが必要なフィールドがほとんどない場合は、Document Manager の事前ラベル付け機能を使用すると、時間を大幅に節約できます。



次のオプションを使用できます。

事前ラベル付け URL

事前ラベル付けを行うには、ML モデルに URL が必要です。使用できる URL は以下のとおりです。

  • パブリック URL (例: https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders)
  • エンドポイントの完全なリストについてはこちらをご覧ください。
  • オンプレミスの AI Center または AI Center Cloud で公開されている ML スキルの URL

事前ラベル付けキー

Document Understanding の API キーです。クラウドの Document Manager およびオンプレミスのオンラインの Document Manager の場合は必須です。オンプレミスのエアギャップ環境の Document Manager では不要です。

使い方

[使い方] オプションから、Document Manager のヘルプ メニューにアクセスできます。



以下の項目が含まれます。

  • Document Manager のバージョン
  • 製品ガイドのページへのリンク です。
  • [ラベル付けのコントロール] セクション: データを処理するときに使用されるコントロールが表示されます。
  • [ドキュメントのショートカット] セクション: ナビゲーションや UI のスケーリングなどのさまざまな操作の実行に使用されるショートカットが表示されます。
  • [構成] セクション: インストール時に実行されたインスタンス構成に関する詳細が表示されます。

列フィールド

列フィールドでは、以下のオプションを利用できます。

  • 新しい列フィールドを作成 docs image
  • フィールドを編集 docs image
  • 列フィールドの値を展開/折りたたみ docs image
  • 列フィールドについて詳しくは、こちらのセクションをご覧ください。

標準フィールド

標準フィールドでは、以下のオプションを利用できます。

  • 新しい標準フィールドを作成 docs image
  • フィールドを編集 docs image
  • 標準フィールドについて詳しくは、こちらのセクションをご覧ください。

分類フィールド

分類フィールドでは、以下のオプションを利用できます。

  • 新しい分類フィールドを作成 docs image
  • フィールドを編集 docs image
  • 分類フィールドについて詳しくは、こちらのセクションをご覧ください。

ドキュメント ビュー

複数のページが含まれるドキュメントの場合、PDF ビューアーと同様に、ページからページへと自然にスクロールできます。拡大または縮小するには、Ctrl キーを押しながらマウスをスクロールします。

ドキュメント ビューでは、ドキュメントのラベル付けを行えます。単語ボックスを選択し、キーを押してそれらのボックスをフィールドに割り当てます。また、単語ボックスを右クリックして、抽出された情報を検証することもできます。

  • ドキュメントのラベル付けの方法について詳しくは、こちらのページをご覧ください。

新しい Document Manager セッションを開いた場合、またはフィルターが空の場合は、ドキュメント ビューに特定のガイドラインが表示されます。



また、読み込みの失敗もドキュメント ビューに表示されます。



Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.