document-understanding
2024.10
true
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
最終更新日時 2024年12月18日

ユーザー インターフェイス

Document Manager のインターフェイスには、以下のパネルがあります。

  • 管理バー
  • 列フィールド
  • 標準フィールド
  • 分類フィールド
  • ドキュメント ビュー

管理バー

Document Manager のページの上部に表示されます。

複数の操作を実行できます (ドキュメント間の移動、ドキュメントの削除/復元、ドキュメントの検索/フィルター処理、AI モデルの予測の実行、ドキュメントのインポートとエクスポート)。

以下に、管理バーで利用可能な項目を示します。

アイテム

Icon

説明

ナビゲーション

アクティブなフィルターに一致するドキュメント間を移動します。

2 つの矢印の間にカウンターが表示されます。アクティブな検索/フィルターに一致するドキュメントの総数のうち、現在のドキュメントの数を示します。

検索


docs image

次の 2 つの検索機能があります。

  • 組み込みフィルター: ドロップダウン メニューで選択できるバッチ/カテゴリ オプションに基づいて、ドキュメントをフィルター処理します。

  • キーワードを使用する: テキスト入力に基づいてドキュメントをフィルター処理します。

削除/復元


docs image

docs image

ドキュメントを削除または復元します。削除したドキュメントは、deleted フィルターで検索できます。

インポート


docs image

[データをインポート] ダイアログ ボックスを開きます。

エクスポート


docs image

[ファイルをエクスポート] ダイアログ ボックスを開きます。

ドキュメントの名前と種類

なし

現在アクティブなドキュメントの名前と種類です。

ドキュメントには以下の 3 種類があります。

  • トレーニング ドキュメント

  • 検証ドキュメント

  • 評価ドキュメント

トレーニング ドキュメントと検証ドキュメントは、トレーニング パイプラインで使用されるトレーニング データセットの一部です。

評価ドキュメントはトレーニング パイプラインでは無視され、AI Center の評価パイプラインでのみ使用されるようになっています。評価ドキュメントは、[データをインポート] ダイアログ ボックスの [これを評価セットにする] チェックボックスをオンにして、評価用としてマークしたドキュメントです。

ダウンロードする


docs image

このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。

アイコンをクリックすると、元のドキュメントを含む Zip ファイルをダウンロードできます。元のドキュメントに加えて、Document Manager によって内部で .jpeg 画像に変換されたすべてのページもダウンロードされます。

完全に削除

docs image

このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。

個々のファイルを完全に削除します。.pdf とそのファイルのすべての .jpeg イメージが AI Center のデータセットから削除され、すべてのメタデータがデータベースから削除されます。

ボタンをクリックすると、ドキュメントを完全に削除するかどうかを確認するポップアップ メッセージが表示されます。[OK] クリックして続行するか、[キャンセル] をクリックして前の画面に戻ります。

バッチ名

なし

現在のバッチの名前です。

セッション名

なし

現在のセッションの名前です。

予測


docs image

AI モデルの予測を実行し、結果を表示します。

事前ラベル付けを設定すると、管理バーでこのボタンが有効化されます。このボタンをクリックすると、現在のドキュメントの事前ラベル付けが行われます。

設定


docs image

OCR と事前ラベル付けの設定を行ったり、[使い方] パネルにアクセスしたりできます。詳しくは、以下をご覧ください。

[削除] オプションと [完全に削除] オプション

[削除] オプションと [完全に削除] オプションの違いを理解できるよう、もう少し詳しく説明します。

  • [削除] オプションを使用するとファイルが削除されますが、プロジェクトから完全に削除されるわけではありません。削除したファイルは [検索] バーから [削除済み] フィルターで検索し、[復元] オプションを使用して復元できます。
  • [完全に削除] オプションを使用すると、選択したファイルが削除され、一切復元できません。

検索オプション

合計で 3 つの検索オプションを利用できます。2 つはページ上部の管理バーにあり、1 つはページ左下にあるアイコン docs image を使用します。
注: フォーム AI で使用できる組み込みフィルターは、[削除済み]、[ラベルあり]、[ラベルなし] のみであることに注意してください。

公開されている検索機能には、次の 2 つの部分があります。

  • 組み込みフィルターを使用して検索する: ドロップダウン メニューで選択できるバッチ/カテゴリ オプションに基づいて、ドキュメントをフィルター処理します。

注意:

他のオプションも選択すると、検索をさらに制限できます。たとえば、[Batch import1][削除済み] を選択すると、[Batch import1] でインポートされた、削除済みのドキュメントのみが検索されます。

常に空のリストが返される組み合わせに注意してください。[Batch import1][Batch import2] を選択すると、ドキュメントは返されません。この選択は制限が厳しく、一度に 2 つのバッチに存在できるドキュメントはないからです。

  • キーワードを使用してドキュメントを検索する: この検索バーでは、テキスト入力に基づいて情報をフィルター処理します。[検索] バーにキーワードをフリー テキストとして入力する必要があります。ドキュメントの内容またはドキュメント名でキーワードが検索されます。複数語検索では、単語が隣接している場合に結果が返されます (単語間の句読点はすべて除外されます)。

注: 2 つのバー検索のほかに、docs image のアイコンが付いたドキュメント内検索機能もあります。
  • ドキュメント内を検索します。現在のドキュメント内にのみ存在するテキスト インスタンスを検索できます。検索バー は、画面の左下にあります。

設定メニュー

[設定] ボタンには、2 つの利用可能なオプションがあります。

  • 設定: OCR サービスまたは事前ラベル付けの設定を行えます。
  • 使い方: ヘルプ メニューです。
OCR

Document Manager にドキュメントをインポートするには、OCR サービスの設定が必須です。



次のオプションを使用できます。

OCR メソッド

この設定は、AI Center で作成されたドキュメントの種類 (Data Manager セッション) でのみ使用できます。Document UnderstandingTM で作成すると、この設定は [プロジェクト設定] から継承されます。Document UnderstandingTM のこれらの設定を変更する場合は、プロジェクト ビューに戻り、左下の [プロジェクト設定] を開きます。

クラウドベースのオプションは以下のとおりです。

  • UiPath® Document OCR - https://du.uipath.com/ocr
  • OCR for Chinese, Japanese and Korean
  • Google Cloud Vision OCR - 対応している言語の種類は最多です。
  • Google Cloud Vision OCR for Japanese - 日本語ドキュメントの読み取りに最適です。
  • Microsoft Read OCR

OCR の URL

OCR を設定するには、OCR サービスに URL が必要です。使用できる URL は以下のとおりです。

  • パブリック URL (例: https://du.uipath.com/ocr) または Google Vision OCR や Microsoft Read OCR のサードパーティの URL

OCR キー

選択した OCR エンジンに対応する API キーです。たとえば、UiPath Document OCR の場合、Document Understanding の API キーを使用する必要があります。クラウドの Document Manager およびオンプレミスのオンラインの Document Manager の場合は必須です。オンプレミスのエアギャップ環境の Document Manager では不要です。

詳しくは、「クラウドおよびオンプレミスでの使用」をご覧ください。

PDF に OCR を適用

OCR プロセスを PDF ドキュメントに適用するかどうかを指定します。[True] に設定すると、ドキュメントのすべての PDF ページに OCR が適用されます。[False] にすると、デジタル入力されたテキストのみが抽出されます。[Auto] に設定すると、入力ドキュメントに応じてドキュメントに OCR アルゴリズムを適用する必要があるかを判断します。既定値は [Auto] です。

予測/事前ラベル付け

ラベル付けが必要なフィールドの一部を抽出できるモデルをすでに所持しており、追加で手動のラベル付けが必要なフィールドがほとんどない場合は、Document Manager の事前ラベル付け機能を使用すると、時間を節約できます。

事前ラベル付けでは、[事前ラベル付け] 設定で設定した事前ラベル付けエンドポイントの結果がマージされます。



次のオプションを使用できます。

事前ラベル付け URL

事前ラベル付けを行うには、ML モデルに URL が必要です。使用できる次の URL を確認してください。

  • パブリック URL (例: https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders)

    エンドポイントの完全なリストについては、「パブリック エンドポイント」をご覧ください。

  • オンプレミス版の AI Center または Cloud AI Center で公開されている ML スキルの URL

事前ラベル付けキー

AI ユニット/Document Understanding の API キーです。事前ラベル付け API キーは、スキルが存在する組織の Document Understanding API のキーです。

このキーは、Cloud Document Manager およびオンプレミスのオンラインの Document Manager では必須です。オンプレミスのエアギャップ環境の Document Manager では任意です。

使い方

[使い方] オプションから、Document Manager のヘルプ メニューを開きます。

ヘルプ メニューでは以下の情報を確認できます。

  • Document Manager のバージョンです。
  • 製品ガイドのページへのリンク です。
  • [ラベル付けのコントロール] セクション: データを処理するときに使用されるコントロールが表示されます。
  • [ドキュメントのショートカット] セクション: ナビゲーションや UI のスケーリングなどのさまざまな操作の実行に使用されるショートカットが表示されます。
  • [構成] セクション: インストール時に実行されたインスタンス構成に関する詳細が表示されます。
ラベル付けのコントロール

コマンド

説明

左クリック

ボックスを選択します。フィールドのホットキーと一緒に使用した場合、選択した情報がフィールドに割り当てられます。

Backspace/Delete

フィールドのタグ付けされた値を削除します。

右クリック

OCR テキストと現在のラベルを表示します。

Enter キーまたはバックスラッシュ

複数行のテキストにまたがる表の行をグループ化またはグループ化解除します。
ドキュメントのショートカット

ショートカット

説明

Alt + 左矢印/右矢印

ドキュメント間を移動します。

Alt + Delete

ドキュメントを削除または回復します。

Ctrl + スクロール

拡大/縮小してドキュメントのスケーリングを変更します。

列フィールド

列フィールドでは、以下のオプションを利用できます。
  • 新しい列フィールドを作成 docs image
  • フィールドを編集 docs image
  • 列フィールドの値を展開/折りたたみ docs image

列フィールドについて詳しくは、こちらのセクションをご覧ください。

標準フィールド

標準フィールドでは、以下のオプションを利用できます。
  • 新しい標準フィールドを作成 docs image
  • フィールドを編集 docs image

標準フィールドについて詳しくは、こちらのセクションをご覧ください。

分類フィールド

分類フィールドでは、以下のオプションを利用できます。
  • 新しい分類フィールドを作成 docs image
  • フィールドを編集 docs image

分類フィールドについて詳しくは、こちらのセクションをご覧ください。

ドキュメント ビュー

複数のページが含まれるドキュメントの場合、PDF ビューアーと同様に、ページからページへと自然にスクロールできます。拡大または縮小するには、Ctrl キーを押しながらマウスをスクロールします。

ドキュメント ビューでは、ドキュメントのラベル付けを行えます。単語ボックスを選択し、キーを押してそれらのボックスをフィールドに割り当てます。また、単語ボックスを右クリックして、抽出された情報を検証することもできます。

ドキュメントのラベル付けの方法について詳しくは、こちらのページをご覧ください。

新しい Document Manager セッションを開いた場合、またはフィルターが空の場合は、ドキュメント ビューに特定のガイドラインが表示されます。



また、読み込みの失敗もドキュメント ビューに表示されます。



このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.