document-understanding
2024.10
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
Document Understanding ガイド
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年11月11日

ユーザー インターフェイス

Document Manager のインターフェイスには、以下のパネルがあります。

  • 管理バー
  • 列フィールド
  • 標準フィールド
  • 分類フィールド
  • ドキュメント ビュー

管理バー

Document Manager のページの上部に表示されます。

複数の操作を実行できます (ドキュメント間の移動、ドキュメントの削除/復元、ドキュメントの検索/フィルター処理、AI モデルの予測の実行、ドキュメントのインポートとエクスポート)。

以下に、管理バーで利用可能な項目を示します。

アイテム

Icon

説明

ナビゲーション

アクティブなフィルターに一致するドキュメント間を移動します。

2 つの矢印の間にカウンターが表示されます。アクティブな検索/フィルターに一致するドキュメントの総数のうち、現在のドキュメントの数を示します。

検索


docs image

次の 2 つの検索機能があります。

  • 組み込みフィルター: ドロップダウン メニューで選択できるバッチ/カテゴリ オプションに基づいて、ドキュメントをフィルター処理します。

  • キーワードを使用する: テキスト入力に基づいてドキュメントをフィルター処理します。

削除/復元


docs image

docs image

ドキュメントを削除または復元します。削除したドキュメントは、deleted フィルターで検索できます。

インポート


docs image

[データをインポート] ダイアログ ボックスを開きます。

エクスポート


docs image

[ファイルをエクスポート] ダイアログ ボックスを開きます。

ドキュメントの名前と種類

なし

現在アクティブなドキュメントの名前と種類です。

ドキュメントには以下の 3 種類があります。

  • トレーニング ドキュメント

  • 検証ドキュメント

  • 評価ドキュメント

トレーニング ドキュメントと検証ドキュメントは、トレーニング パイプラインで使用されるトレーニング データセットの一部です。

評価ドキュメントはトレーニング パイプラインでは無視され、AI Center の評価パイプラインでのみ使用されるようになっています。評価ドキュメントは、[データをインポート] ダイアログ ボックスの [これを評価セットにする] チェックボックスをオンにして、評価用としてマークしたドキュメントです。

ダウンロードする


docs image

このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。

アイコンをクリックすると、元のドキュメントを含む Zip ファイルをダウンロードできます。元のドキュメントに加えて、Document Manager によって内部で .jpeg 画像に変換されたすべてのページもダウンロードされます。

完全に削除

docs image

このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。

個々のファイルを完全に削除します。.pdf とそのファイルのすべての .jpeg イメージが AI Center のデータセットから削除され、すべてのメタデータがデータベースから削除されます。

ボタンをクリックすると、ドキュメントを完全に削除するかどうかを確認するポップアップ メッセージが表示されます。[OK] クリックして続行するか、[キャンセル] をクリックして前の画面に戻ります。

バッチ名

なし

現在のバッチの名前です。

セッション名

なし

現在のセッションの名前です。

予測


docs image

AI モデルの予測を実行し、結果を表示します。

事前ラベル付けを設定すると、管理バーでこのボタンが有効化されます。このボタンをクリックすると、現在のドキュメントの事前ラベル付けが行われます。

設定


docs image

OCR と事前ラベル付けの設定を行ったり、[使い方] パネルにアクセスしたりできます。詳しくは、以下をご覧ください。

[削除] オプションと [完全に削除] オプション

[削除] オプションと [完全に削除] オプションの違いを理解できるよう、もう少し詳しく説明します。

  • [削除] オプションを使用するとファイルが削除されますが、プロジェクトから完全に削除されるわけではありません。削除したファイルは [検索] バーから [削除済み] フィルターで検索し、[復元] オプションを使用して復元できます。
  • [完全に削除] オプションを使用すると、選択したファイルが削除され、一切復元できません。

検索オプション

合計で 3 つの検索オプションを利用できます。2 つはページ上部の管理バーにあり、1 つはページ左下にあるアイコン docs image を使用します。
注: フォーム AI で使用できる組み込みフィルターは、[削除済み]、[ラベルあり]、[ラベルなし] のみであることに注意してください。

公開されている検索機能には、次の 2 つの部分があります。

  • 組み込みフィルターを使用して検索する: ドロップダウン メニューで選択できるバッチ/カテゴリ オプションに基づいて、ドキュメントをフィルター処理します。

注意:

他のオプションも選択すると、検索をさらに制限できます。たとえば、[Batch import1][削除済み] を選択すると、[Batch import1] でインポートされた、削除済みのドキュメントのみが検索されます。

常に空のリストが返される組み合わせに注意してください。[Batch import1][Batch import2] を選択すると、ドキュメントは返されません。この選択は制限が厳しく、一度に 2 つのバッチに存在できるドキュメントはないからです。

  • キーワードを使用してドキュメントを検索する: この検索バーでは、テキスト入力に基づいて情報をフィルター処理します。[検索] バーにキーワードをフリー テキストとして入力する必要があります。ドキュメントの内容またはドキュメント名でキーワードが検索されます。複数語検索では、単語が隣接している場合に結果が返されます (単語間の句読点はすべて除外されます)。

注: 2 つのバー検索のほかに、docs image のアイコンが付いたドキュメント内検索機能もあります。
  • ドキュメント内を検索します。現在のドキュメント内にのみ存在するテキスト インスタンスを検索できます。検索バー は、画面の左下にあります。

設定メニュー

[設定] ボタンには、2 つの利用可能なオプションがあります。

  • 設定: OCR サービスまたは事前ラベル付けの設定を行えます。
  • 使い方: ヘルプ メニューです。
OCR

Document Manager にドキュメントをインポートするには、OCR サービスの設定が必須です。



次のオプションを使用できます。

OCR メソッド

This setting is available only for Document Types (Data Manager sessions) created in AI Center. When created in Document UnderstandingTM, this setting is inherited from the Project Settings. If you want to modify these settings in Document UnderstandingTM, go back to the Project view and open Project Settings from the bottom left.

クラウドベースのオプションは以下のとおりです。

  • UiPath® Document OCR - https://du.uipath.com/ocr;
  • OCR for Chinese, Japanese and Korean
  • Google Cloud Vision OCR - 対応している言語の種類は最多です。
  • Google Cloud Vision OCR for Japanese - 日本語ドキュメントの読み取りに最適です。
  • Microsoft Read OCR

OCR の URL

OCR を設定するには、OCR サービスに URL が必要です。使用できる URL は以下のとおりです。

  • パブリック URL (例: https://du.uipath.com/ocr) または Google Vision OCR や Microsoft Read OCR のサードパーティの URL

OCR キー

選択した OCR エンジンに対応する API キーです。たとえば、UiPath Document OCR の場合、Document Understanding の API キーを使用する必要があります。クラウドの Document Manager およびオンプレミスのオンラインの Document Manager の場合は必須です。オンプレミスのエアギャップ環境の Document Manager では不要です。

詳しくは、「クラウドおよびオンプレミスでの使用」をご覧ください。

PDF に OCR を適用

OCR プロセスを PDF ドキュメントに適用するかどうかを指定します。[True] に設定すると、ドキュメントのすべての PDF ページに OCR が適用されます。[False] にすると、デジタル入力されたテキストのみが抽出されます。[Auto] に設定すると、入力ドキュメントに応じてドキュメントに OCR アルゴリズムを適用する必要があるかを判断します。既定値は [Auto] です。

予測/事前ラベル付け

ラベル付けが必要なフィールドの一部を抽出できるモデルをすでに所持しており、追加で手動のラベル付けが必要なフィールドがほとんどない場合は、Document Manager の事前ラベル付け機能を使用すると、時間を節約できます。

事前ラベル付けでは、[事前ラベル付け] 設定で設定した事前ラベル付けエンドポイントの結果がマージされます。



次のオプションを使用できます。

事前ラベル付け URL

事前ラベル付けを行うには、ML モデルに URL が必要です。使用できる次の URL を確認してください。

  • パブリック URL (例: https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders)

    エンドポイントの完全なリストについては、「パブリック エンドポイント」をご覧ください。

  • オンプレミス版の AI Center または Cloud AI Center で公開されている ML スキルの URL

事前ラベル付けキー

AI ユニット/Document Understanding の API キーです。事前ラベル付け API キーは、スキルが存在する組織の Document Understanding API のキーです。

このキーは、Cloud Document Manager およびオンプレミスのオンラインの Document Manager では必須です。オンプレミスのエアギャップ環境の Document Manager では任意です。

使い方

[使い方] オプションから、Document Manager のヘルプ メニューを開きます。

ヘルプ メニューでは以下の情報を確認できます。

  • Document Manager のバージョンです。
  • 製品ガイドのページへのリンク です。
  • [ラベル付けのコントロール] セクション: データを処理するときに使用されるコントロールが表示されます。
  • [ドキュメントのショートカット] セクション: ナビゲーションや UI のスケーリングなどのさまざまな操作の実行に使用されるショートカットが表示されます。
  • [構成] セクション: インストール時に実行されたインスタンス構成に関する詳細が表示されます。
ラベル付けのコントロール

コマンド

説明

左クリック

ボックスを選択します。フィールドのホットキーと一緒に使用した場合、選択した情報がフィールドに割り当てられます。

Backspace/Delete

フィールドのタグ付けされた値を削除します。

右クリック

OCR テキストと現在のラベルを表示します。

Enter キーまたはバックスラッシュ

複数行のテキストにまたがる表の行をグループ化またはグループ化解除します。
ドキュメントのショートカット

ショートカット

説明

Alt + 左矢印/右矢印

ドキュメント間を移動します。

Alt + Delete

ドキュメントを削除または回復します。

Ctrl + スクロール

拡大/縮小してドキュメントのスケーリングを変更します。

列フィールド

列フィールドでは、以下のオプションを利用できます。
  • 新しい列フィールドを作成 docs image
  • フィールドを編集 docs image
  • 列フィールドの値を展開/折りたたみ docs image

列フィールドについて詳しくは、こちらのセクションをご覧ください。

標準フィールド

標準フィールドでは、以下のオプションを利用できます。
  • 新しい標準フィールドを作成 docs image
  • フィールドを編集 docs image

標準フィールドについて詳しくは、こちらのセクションをご覧ください。

分類フィールド

分類フィールドでは、以下のオプションを利用できます。
  • 新しい分類フィールドを作成 docs image
  • フィールドを編集 docs image

分類フィールドについて詳しくは、こちらのセクションをご覧ください。

ドキュメント ビュー

複数のページが含まれるドキュメントの場合、PDF ビューアーと同様に、ページからページへと自然にスクロールできます。拡大または縮小するには、Ctrl キーを押しながらマウスをスクロールします。

ドキュメント ビューでは、ドキュメントのラベル付けを行えます。単語ボックスを選択し、キーを押してそれらのボックスをフィールドに割り当てます。また、単語ボックスを右クリックして、抽出された情報を検証することもできます。

ドキュメントのラベル付けの方法について詳しくは、こちらのページをご覧ください。

新しい Document Manager セッションを開いた場合、またはフィルターが空の場合は、ドキュメント ビューに特定のガイドラインが表示されます。



また、読み込みの失敗もドキュメント ビューに表示されます。



このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.