Document Understanding
最新
バナーの背景画像
Document Understanding ガイド
最終更新日 2024年4月30日

ドキュメントの種類 (Document Manager)

ドキュメントの種類では、Document Understanding マシン ラーニング モデルのトレーニングと評価に必要なデータセットを準備、レビュー、修正できます。複数のユーザーが以下のようなさまざまな操作を実行できます。
  • ML モデルで抽出するフィールドを定義・設定します。
  • ラベル付けのためにドキュメントをインポートします。
  • UiPath が提供する、すぐに使える既存の ML モデル (請求書抽出や領収書抽出など) や、AI Center でトレーニングしたモデルを使用して、ドキュメントの事前ラベル付けを行います。
  • ドキュメントのラベル付けを行います。
  • AI Center のトレーニング パイプラインで使用できる形式で、ドキュメントをエクスポートします。

ドキュメントの種類を作成する

プロジェクトを作成して開いたら、新しいドキュメントの種類を作成できます。[新規] ボタンをクリックして [半構造化 AI を使用] オプションを選択します。新しいウィンドウが開き、追加情報の入力が求められます。

docs image

新しいドキュメントの種類のセッションを作成する際に使用できるオプションは次のとおりです。これらの値を入力することによって、開始点として使用するデータセットの推奨サイズの推定値が得られます。

また、すぐに使えるドキュメントの種類を選択すると、スキーマが自動的に入力されて設定されるので、AI Center で利用可能な事前トレーニング済みのモデルを活用できます。これにより、事前定義済みのスキーマを手動でインポートする必要がなくなるため、作業スピードを上げ、コストのかかる間違いを減らすことができます。

さらに、[事前ラベル付けエンドポイント] に適切なエンドポイントが自動的に入力されるため、新しいドキュメントの種類を開いたらすぐに事前ラベル付けを使用でき便利です。



オプション

説明

名前 (必須)

新しいドキュメントの種類の名前を入力します。

すぐに使えるドキュメントの種類 (必須)

ドロップダウン リストに表示される、事前トレーニング済みのすぐに使えるドキュメントの種類の 1 つを選択します。

すぐに使える標準フィールド (任意)

スキーマに対して作成する事前定義済みの標準フィールドを選択します。

すぐに使える列フィールド (任意)

対象のドキュメントから抽出する事前定義済みの列フィールドを選択します。

すぐに使える分類フィールド (任意)

対象のドキュメントから抽出する事前定義済みの分類フィールドを選択します。

カスタムの標準フィールド (任意)

対象のドキュメントから抽出する追加の標準フィールドの数を入力します。

カスタムの列フィールド (任意)

対象のドキュメントから抽出する追加の列フィールドの数を入力します。

言語の数 (任意)

抽出するドキュメントの言語の数を入力します。

レイアウトの数 (任意)

抽出するドキュメントのレイアウトの数を入力します。

注: ドキュメントの種類を選択すると、データセットに必要な推奨ページ数が生成されます。

ユーザー インターフェイス

Document Manager のインターフェイスには、以下のパネルがあります。

  • 管理バー
  • 列フィールド
  • 標準フィールド
  • 分類フィールド
  • ドキュメント ビュー

管理バー

Document Manager のページの上部に表示されます。

複数の操作を実行できます (ドキュメント間の移動、ドキュメントの削除/復元、ドキュメントの検索/フィルター処理、AI モデルの予測の実行、ドキュメントのインポートとエクスポート)。

以下に、管理バーで利用可能な項目を示します。

アイテム

Icon

説明

ナビゲーション

アクティブなフィルターに一致するドキュメント間を移動します。

2 つの矢印の間にカウンターが表示されます。アクティブな検索/フィルターに一致するドキュメントの総数のうち、現在のドキュメントの数を示します。

検索


docs image

次の 2 つの検索機能があります。

  • 組み込みフィルター: ドロップダウン メニューで選択できるバッチ/カテゴリ オプションに基づいて、ドキュメントをフィルター処理します。

  • キーワードを使用する: テキスト入力に基づいてドキュメントをフィルター処理します。

削除/復元


docs image

docs image

ドキュメントを削除または復元します。削除したドキュメントは、deleted フィルターで検索できます。

インポート


docs image

[データをインポート] ダイアログ ボックスを開きます。

エクスポート


docs image

[ファイルをエクスポート] ダイアログ ボックスを開きます。

ドキュメントの名前と種類

なし

現在アクティブなドキュメントの名前と種類です。

ドキュメントには以下の 3 種類があります。

  • トレーニング ドキュメント

  • 検証ドキュメント

  • 評価ドキュメント

トレーニング ドキュメントと検証ドキュメントは、トレーニング パイプラインで使用されるトレーニング データセットの一部です。

評価ドキュメントはトレーニング パイプラインでは無視され、AI Center の評価パイプラインでのみ使用されるようになっています。評価ドキュメントは、[データをインポート] ダイアログ ボックスの [これを評価セットにする] チェックボックスをオンにして、評価用としてマークしたドキュメントです。

ダウンロードする


docs image

このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。

アイコンをクリックすると、元のドキュメントを含む Zip ファイルをダウンロードできます。元のドキュメントに加えて、Document Manager によって内部で .jpeg 画像に変換されたすべてのページもダウンロードされます。

完全に削除

docs image

このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。

個々のファイルを完全に削除します。.pdf とそのファイルのすべての .jpeg イメージが AI Center のデータセットから削除され、すべてのメタデータがデータベースから削除されます。

ボタンをクリックすると、ドキュメントを完全に削除するかどうかを確認するポップアップ メッセージが表示されます。[OK] クリックして続行するか、[キャンセル] をクリックして前の画面に戻ります。

バッチ名

なし

現在のバッチの名前です。

セッション名

なし

現在のセッションの名前です。

予測


docs image

AI モデルの予測を実行し、結果を表示します。

事前ラベル付けを設定すると、管理バーでこのボタンが有効化されます。このボタンをクリックすると、現在のドキュメントの事前ラベル付けが行われます。

このボタンには、次の 3 つのオプションがあります。
  • 予測: 事前ラベル付けエンドポイント (事前ラベル付けの設定で指定) の結果と生成 AI モデルの予測を結合します。事前ラベル付けエンドポイントが設定されていない場合は、生成 AI モデルの予測のみを使用してすべてのフィールドが予測されます。
  • 生成 AI モデルの予測: 生成 AI モデルの予測機能を使用して、すべてのフィールドを予測します。
  • モデルの予測: 事前ラベル付けの設定で指定した事前ラベル付けエンドポイント モデルを使用して、フィールドを予測します。

生成 AI によるアノテーション (事前ラベル付け)機能は、すべてのフィールドの種類の手動で編集したフィールド値をすべて破棄し、ドキュメントのすべてのタグを削除します。

現時点では、パブリック エンドポイントを使用して [予測] オプションを使用すると、ドキュメントの最初の 10 ページにしか事前ラベル付けが行われません。これは既知の問題であり、現在修正が行われています。なお、AI Center で ML スキルを使用して [予測] オプションを使用した場合には、そのような制限はありません。

Automation Cloud™ にデプロイされたパブリック エンドポイントまたはスキルを Automation Cloud でホストされた Document Manager セッションから使用する場合、生成 AI による事前ラベル付けで AI ユニットは消費されません。生成 AI による事前ラベル付けで AI ユニットが消費されるのは、Automation Suite でホストされたセッションからパブリック エンドポイントを呼び出す場合や、Automation Suite にデプロイされたスキルを Automation Cloud でホストされた Document Manager セッションから呼び出す場合などです。

設定


docs image

OCR と事前ラベル付けの設定を行ったり、[使い方] パネルにアクセスしたりできます。詳しくは、以下をご覧ください。

[削除] オプションと [完全に削除] オプション

[削除] オプションと [完全に削除] オプションの違いを理解できるよう、もう少し詳しく説明します。

  • [削除] オプションを使用するとファイルが削除されますが、プロジェクトから完全に削除されるわけではありません。削除したファイルは [検索] バーから [削除済み] フィルターで検索し、[復元] オプションを使用して復元できます。
  • [完全に削除] オプションを使用すると、選択したファイルが削除され、一切復元できません。

    これらのオプションの使い方は、以下の GIF で確認できます。

    docs image

検索オプション

合計で 3 つの検索オプションを利用できます。2 つはページ上部の管理バーにあり、1 つはページ左下にあるアイコン docs image を使用します。
注: フォーム AI で使用できる組み込みフィルターは、[削除済み]、[ラベルあり]、[ラベルなし] のみであることに注意してください。

公開されている検索機能には、次の 2 つの部分があります。

  • 組み込みフィルターを使用して検索する: ドロップダウン メニューで選択できるバッチ/カテゴリ オプションに基づいて、ドキュメントをフィルター処理します。

注意:

他のオプションも選択すると、検索をさらに制限できます。たとえば、[Batch import1][削除済み] を選択すると、[Batch import1] でインポートされた、削除済みのドキュメントのみが検索されます。

常に空のリストが返される組み合わせに注意してください。[Batch import1][Batch import2] を選択すると、ドキュメントは返されません。この選択は制限が厳しく、一度に 2 つのバッチに存在できるドキュメントはないからです。

  • キーワードを使用してドキュメントを検索する: この検索バーでは、テキスト入力に基づいて情報をフィルター処理します。[検索] バーにキーワードをフリー テキストとして入力する必要があります。ドキュメントの内容またはドキュメント名でキーワードが検索されます。複数語検索では、単語が隣接している場合に結果が返されます (単語間の句読点はすべて除外されます)。

注: 2 つのバー検索のほかに、docs image のアイコンが付いたドキュメント内検索機能もあります。
  • ドキュメント内を検索します。現在のドキュメント内にのみ存在するテキスト インスタンスを検索できます。検索バー は、画面の左下にあります。

設定メニュー

[設定] ボタンには、2 つの利用可能なオプションがあります。

  • 設定: OCR サービスまたは事前ラベル付けの設定を行えます。
  • 使い方: ヘルプ メニューです。
OCR

Document Manager にドキュメントをインポートするには、OCR サービスの設定が必須です。



次のオプションを使用できます。

OCR メソッド

この設定は、AI Center で作成されたドキュメントの種類 (Data Manager セッション) でのみ使用できます。Document Understanding で作成すると、この設定は [プロジェクト設定] から継承されます。Document Understanding のこれらの設定を変更する場合は、プロジェクト ビューに戻り、左下の [プロジェクト設定] を開きます。

クラウドベースのオプションは以下のとおりです。

  • UiPath Document OCR - https://du.uipath.com/ocr;
  • OCR - 中国語、日本語、韓国語
  • Google Cloud Vision OCR - 対応している言語の種類は最多です。
  • Google Cloud Vision OCR for Japanese - 日本語ドキュメントの読み取りに最適です。
  • Microsoft Read OCR

OCR の URL

OCR を設定するには、OCR サービスに URL が必要です。使用できる URL は以下のとおりです。

  • パブリック URL (例: https://du.uipath.com/ocr) または Google Vision OCR や Microsoft Read OCR のサードパーティの URL

OCR キー

選択した OCR エンジンに対応する API キーです。たとえば、UiPath ドキュメント OCR の場合、Document Understanding の API キーを使用する必要があります。クラウドの Document Manager およびオンプレミスのオンラインの Document Manager の場合は必須です。オンプレミスのエアギャップ環境の Document Manager では不要です。

PDF に OCR を適用

OCR プロセスを PDF ドキュメントに適用するかどうかを指定します。[True] に設定すると、ドキュメントのすべての PDF ページに OCR が適用されます。[False] にすると、デジタル入力されたテキストのみが抽出されます。[Auto] に設定すると、入力ドキュメントに応じてドキュメントに OCR アルゴリズムを適用する必要があるかを判断します。既定値は [Auto] です。

予測/事前ラベル付け

ラベル付けが必要なフィールドの一部を抽出できるモデルをすでに所持しており、追加で手動のラベル付けが必要なフィールドがほとんどない場合は、Document Manager の事前ラベル付け機能を使用すると、時間を節約できます。

事前ラベル付けでは、[事前ラベル付け] 設定で設定した事前ラベル付けエンドポイントの結果と生成予測の結果がマージされます。

事前ラベル付けエンドポイントが設定されていない場合は、生成 AI モデルの予測のみを使用してすべてのフィールドが予測されます。



次のオプションを使用できます。

事前ラベル付け URL

事前ラベル付けを行うには、ML モデルに URL が必要です。使用できる次の URL を確認してください。

  • パブリック URL (例: https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders)

    エンドポイントの完全なリストについては、「パブリック エンドポイント」をご覧ください。

  • オンプレミス版の AI Center または Cloud AI Center で公開されている ML スキルの URL

事前ラベル付けキー

AI ユニット/Document Understanding の API キーです。事前ラベル付け API キーは、スキルが存在する組織の Document Understanding API のキーです。

このキーは、Cloud Document Manager およびオンプレミスのオンラインの Document Manager では必須です。オンプレミスのエアギャップ環境の Document Manager では任意です。

使い方

[使い方] オプションから、Document Manager のヘルプ メニューを開きます。



ヘルプ メニューでは以下の情報を確認できます。

  • Document Manager のバージョンです。
  • 製品ガイドのページへのリンク です。
  • [ラベル付けのコントロール] セクション: データを処理するときに使用されるコントロールが表示されます。
  • [ドキュメントのショートカット] セクション: ナビゲーションや UI のスケーリングなどのさまざまな操作の実行に使用されるショートカットが表示されます。
  • [構成] セクション: インストール時に実行されたインスタンス構成に関する詳細が表示されます。
ラベル付けのコントロール

コマンド

説明

左クリック

ボックスを選択します。フィールドのホットキーと一緒に使用した場合、選択した情報がフィールドに割り当てられます。

Backspace/Delete

フィールドのタグ付けされた値を削除します。

右クリック

OCR テキストと現在のラベルを表示します。

Enter キーまたはバックスラッシュ

複数行のテキストにまたがる表の行をグループ化またはグループ化解除します。
ドキュメントのショートカット

ショートカット

説明

Alt + 左矢印/右矢印

ドキュメント間を移動します。

Alt + Delete

ドキュメントを削除または回復します。

Ctrl + スクロール

拡大/縮小してドキュメントのスケーリングを変更します。

列フィールド

列フィールドでは、以下のオプションを利用できます。
  • 新しい列フィールドを作成 docs image
  • フィールドを編集 docs image
  • 列フィールドの値を展開/折りたたみ docs image

列フィールドについて詳しくは、こちらのセクションをご覧ください。

標準フィールド

標準フィールドでは、以下のオプションを利用できます。
  • 新しい標準フィールドを作成 docs image
  • フィールドを編集 docs image

標準フィールドについて詳しくは、こちらのセクションをご覧ください。

分類フィールド

分類フィールドでは、以下のオプションを利用できます。
  • 新しい分類フィールドを作成 docs image
  • フィールドを編集 docs image

分類フィールドについて詳しくは、こちらのセクションをご覧ください。

ドキュメント ビュー

複数のページが含まれるドキュメントの場合、PDF ビューアーと同様に、ページからページへと自然にスクロールできます。拡大または縮小するには、Ctrl キーを押しながらマウスをスクロールします。

ドキュメント ビューでは、ドキュメントのラベル付けを行えます。単語ボックスを選択し、キーを押してそれらのボックスをフィールドに割り当てます。また、単語ボックスを右クリックして、抽出された情報を検証することもできます。

ドキュメントのラベル付けの方法について詳しくは、こちらのページをご覧ください。

新しい Document Manager セッションを開いた場合、またはフィルターが空の場合は、ドキュメント ビューに特定のガイドラインが表示されます。



また、読み込みの失敗もドキュメント ビューに表示されます。



Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.