document-understanding

latest

false

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

Document Understanding ガイド

デリバリー:

最終更新日時 2025年10月15日

ドキュメントの種類 (Document Manager)

ドキュメントの種類では、Document Understanding^TM マシンラーニングモデルのトレーニングと評価に必要なデータセットを準備、レビュー、修正できます。複数のユーザーが以下のようなさまざまな操作を実行できます。

ML モデルで抽出するフィールドを定義・設定します。
ラベル付けのためにドキュメントをインポートします。
UiPath が提供する、すぐに使える既存の ML モデル (請求書抽出や領収書抽出など) や、AI Center でトレーニングしたモデルを使用して、ドキュメントの事前ラベル付けを行います。
ドキュメントのラベル付けを行います。
AI Center のトレーニングパイプラインで使用できる形式で、ドキュメントをエクスポートします。

ドキュメントの種類を作成する

プロジェクトを作成して開いたら、新しいドキュメントの種類を作成できます。[新規] ボタンを選択し、[半構造化 AI を使用] オプションを選択します。新しいウィンドウが開き、追加情報の入力が求められます。

新しいドキュメントの種類のセッションを作成する際に使用できるオプションは次のとおりです。これらの値を入力することによって、開始点として使用するデータセットの推奨サイズの推定値が得られます。

また、すぐに使えるドキュメントの種類を選択すると、スキーマが自動的に入力されて設定されるので、AI Center で利用可能な事前トレーニング済みのモデルを活用できます。これにより、事前定義済みのスキーマを手動でインポートする必要がなくなるため、作業スピードを上げ、コストのかかる間違いを減らすことができます。

さらに、[事前ラベル付けエンドポイント] に適切なエンドポイントが自動的に入力されるため、新しいドキュメントの種類を開いたらすぐに事前ラベル付けを使用でき便利です。

オプション	説明
名前 (必須)	新しいドキュメントの種類の名前を入力します。
すぐに使えるドキュメントの種類 (必須)	ドロップダウンリストに表示される、事前トレーニング済みのすぐに使えるドキュメントの種類の 1 つを選択します。
すぐに使える標準フィールド (任意)	スキーマに対して作成する事前定義済みの標準フィールドを選択します。
すぐに使える列フィールド (任意)	対象のドキュメントから抽出する事前定義済みの列フィールドを選択します。
すぐに使える分類フィールド (任意)	対象のドキュメントから抽出する事前定義済みの分類フィールドを選択します。
カスタムの標準フィールド (任意)	対象のドキュメントから抽出する追加の標準フィールドの数を入力します。
カスタムの列フィールド (任意)	対象のドキュメントから抽出する追加の列フィールドの数を入力します。
言語の数 (任意)	抽出するドキュメントの言語の数を入力します。
レイアウトの数 (任意)	抽出するドキュメントのレイアウトの数を入力します。

注: ドキュメントの種類を選択すると、データセットに必要な推奨ページ数が生成されます。

ユーザーインターフェイス

Document Manager のインターフェイスには、以下のパネルがあります。

管理バー
列フィールド
標準フィールド
分類フィールド
ドキュメントビュー

管理バー

Document Manager のページの上部に表示されます。

複数の操作を実行できます (ドキュメント間の移動、ドキュメントの削除/復元、ドキュメントの検索/フィルター処理、AI モデルの予測の実行、ドキュメントのインポートとエクスポート)。

以下に、管理バーで利用可能な項目を示します。

アイテム	Icon	説明
ナビゲーション		アクティブなフィルターに一致するドキュメント間を移動します。 2 つの矢印の間にカウンターが表示されます。アクティブな検索/フィルターに一致するドキュメントの総数のうち、現在のドキュメントの数を示します。
検索		次の 2 つの検索機能があります。組み込みフィルター: ドロップダウンメニューで選択できるバッチ/カテゴリオプションに基づいて、ドキュメントをフィルター処理します。キーワードを使用する: テキスト入力に基づいてドキュメントをフィルター処理します。
削除/復元		ドキュメントを削除または復元します。削除したドキュメントは、deleted フィルターで検索できます。
インポート		[データをインポート] ダイアログボックスを開きます。
エクスポート		[ファイルをエクスポート] ダイアログボックスを開きます。
ドキュメントの名前と種類	なし	現在アクティブなドキュメントの名前と種類です。ドキュメントには以下の 3 種類があります。トレーニングドキュメント検証ドキュメント評価ドキュメントトレーニングドキュメントと検証ドキュメントは、トレーニングパイプラインで使用されるトレーニングデータセットの一部です。評価ドキュメントはトレーニングパイプラインでは無視され、AI Center の評価パイプラインでのみ使用されるようになっています。評価ドキュメントは、[データをインポート] ダイアログボックスの [これを評価セットにする] チェックボックスをオンにして、評価用としてマークしたドキュメントです。
ダウンロードする		このオプションは、ドキュメント名の横にあるドロップダウンリストから利用できます。アイコンを選択すると、元のドキュメントを含む Zip ファイルをダウンロードできます。元のドキュメントに加えて、Document Manager によって内部で `.jpeg` 画像に変換されたすべてのページもダウンロードされます。
完全に削除		このオプションは、ドキュメント名の横にあるドロップダウンリストから利用できます。個々のファイルを完全に削除します。`.pdf` とそのファイルのすべての `.jpeg` イメージが AI Center のデータセットから削除され、すべてのメタデータがデータベースから削除されます。ボタンを選択すると、ドキュメントを完全に削除するかどうかを確認するポップアップメッセージが表示されます。[OK] を選択して続行するか、[キャンセル] を選択して前の画面に戻ります。
バッチ名	なし	現在のバッチの名前です。
セッション名	なし	現在のセッションの名前です。
予測注: 予測機能は UiPath DocPath を利用して実行されますが、これは欧州リージョンに拠点を置くテナントのみが対象です。テナントが欧州以外のリージョンにある場合は、前世代のモデルアーキテクチャが使用されます。		AI モデルの予測を実行し、結果を表示します。事前ラベル付けを設定すると、管理バーでこのボタンが有効化されます。このボタンを選択すると、現在のドキュメントの事前ラベル付けが行われます。このボタンには、次の 3 つのオプションがあります。予測: 事前ラベル付けエンドポイント (事前ラベル付けの設定で指定) の結果と生成 AI モデルの予測を結合します。事前ラベル付けエンドポイントが設定されていない場合は、生成 AI モデルの予測のみを使用してすべてのフィールドが予測されます。生成 AI モデルの予測: 生成 AI モデルの予測機能を使用して、すべてのフィールドを予測します。モデルの予測: 事前ラベル付けの設定で指定した事前ラベル付けエンドポイントモデルを使用して、フィールドを予測します。生成 AI によるアノテーション (事前ラベル付け)機能は、すべてのフィールドの種類の手動で編集したフィールド値をすべて破棄し、ドキュメントのすべてのタグを削除します。現時点では、パブリックエンドポイントを使用して [予測] オプションを使用すると、ドキュメントの最初の 10 ページにしか事前ラベル付けが行われません。これは既知の問題であり、現在修正が行われています。なお、AI Center で ML スキルを使用して [予測] オプションを使用した場合には、そのような制限はありません。 Automation Cloud™ にデプロイされたパブリックエンドポイントまたはスキルを Automation Cloud でホストされた Document Manager セッションから使用する場合、生成 AI による事前ラベル付けで AI ユニットは消費されません。生成 AI による事前ラベル付けで AI ユニットが消費されるのは、Automation Suite でホストされたセッションからパブリックエンドポイントを呼び出す場合や、Automation Suite にデプロイされたスキルを Automation Cloud でホストされた Document Manager セッションから呼び出す場合などです。
設定		OCR と事前ラベル付けの設定を行ったり、[使い方] パネルにアクセスしたりできます。

[削除] オプションと [完全に削除] オプション

[削除] オプションと [完全に削除] オプションの違いを理解できるよう、もう少し詳しく説明します。

[削除] オプションを使用するとファイルが削除されますが、プロジェクトから完全に削除されるわけではありません。削除したファイルは [検索] バーから [削除済み] フィルターで検索し、[復元] オプションを使用して復元できます。
[完全に削除] オプションを使用すると、選択したファイルが削除され、一切復元できません。

検索オプション

合計で 3 つの検索オプションを利用できます。2 つはページ上部の管理バーにあり、1 つはページ左下にあるアイコン検索のアイコン

を使用します。

注: フォーム AI で使用できる組み込みフィルターは、[削除済み]、[ラベルあり]、[ラベルなし] のみであることに注意してください。

公開されている検索機能には、次の 2 つの部分があります。

組み込みフィルターを使用して検索する: ドロップダウン メニューで選択できるバッチ/カテゴリオプションに基づいて、ドキュメントをフィルター処理します。

注意:

他のオプションも選択すると、検索をさらに制限できます。たとえば、[Batch import1] と [削除済み] を選択すると、[Batch import1] でインポートされた、削除済みのドキュメントのみが検索されます。

常に空のリストが返される組み合わせに注意してください。[Batch import1] と [Batch import2] を選択すると、ドキュメントは返されません。この選択は制限が厳しく、一度に 2 つのバッチに存在できるドキュメントはないからです。

キーワードを使用してドキュメントを検索する: この検索バーでは、テキスト入力に基づいて情報をフィルター処理します。[検索] バーにキーワードをフリーテキストとして入力する必要があります。ドキュメントの内容またはドキュメント名でキーワードが検索されます。複数語検索では、単語が隣接している場合に結果が返されます (単語間の句読点はすべて除外されます)。

注: 2 つのバー検索のほかに、 docs image

のアイコンが付いたドキュメント内検索機能もあります。

ドキュメント内を検索します。現在のドキュメント内にのみ存在するテキストインスタンスを検索できます。検索バーは、画面の左下にあります。

設定メニュー

[設定] ボタンには、2 つの利用可能なオプションがあります。

設定: OCR サービスまたは事前ラベル付けの設定を行えます。
使い方: ヘルプメニューです。

OCR

Document Manager にドキュメントをインポートするには、OCR サービスの設定が必須です。

OCR メソッド

この設定は、AI Center で作成されたドキュメントの種類 (Data Manager セッション) でのみ使用できます。Document Understanding^TM で作成すると、この設定は [プロジェクト設定] から継承されます。Document Understanding^TM のこれらの設定を変更する場合は、プロジェクトビューに戻り、左下の [プロジェクト設定] を開きます。

クラウドベースのオプションは以下のとおりです。

UiPath® Document OCR - https://du.uipath.com/ocr
OCR for Chinese, Japanese and Korean
Google Cloud Vision OCR - 対応している言語の種類は最多です。
Google Cloud Vision OCR for Japanese - 日本語ドキュメントの読み取りに最適です。
Microsoft Read OCR

OCR の URL

OCR を設定するには、OCR サービスに URL が必要です。使用できる URL は以下のとおりです。

パブリック URL (例: https://du.uipath.com/ocr) または Google Vision OCR や Microsoft Read OCR のサードパーティの URL

OCR キー

選択した OCR エンジンに対応する API キーです。たとえば、UiPath Document OCR の場合、Document Understanding の API キーを使用する必要があります。クラウドの Document Manager およびオンプレミスのオンラインの Document Manager の場合は必須です。オンプレミスのエアギャップ環境の Document Manager では不要です。

詳しくは、「クラウドおよびオンプレミスでの使用」をご覧ください。

PDF に OCR を適用

OCR プロセスを PDF ドキュメントに適用するかどうかを指定します。[True] に設定すると、ドキュメントのすべての PDF ページに OCR が適用されます。[False] にすると、デジタル入力されたテキストのみが抽出されます。[Auto] に設定すると、入力ドキュメントに応じてドキュメントに OCR アルゴリズムを適用する必要があるかを判断します。既定値は [Auto] です。

予測/事前ラベル付け

注: 予測機能は UiPath DocPath を利用して実行されますが、これは欧州リージョンに拠点を置くテナントのみが対象です。テナントが欧州以外のリージョンにある場合は、前世代のモデルアーキテクチャが使用されます。

ラベル付けが必要なフィールドの一部を抽出できるモデルをすでに所持しており、追加で手動のラベル付けが必要なフィールドがほとんどない場合は、Document Manager の事前ラベル付け機能を使用すると、時間を節約できます。

事前ラベル付けでは、[事前ラベル付け] 設定で設定した事前ラベル付けエンドポイントの結果と生成予測の結果がマージされます。

事前ラベル付けエンドポイントが設定されていない場合は、生成 AI モデルの予測のみを使用してすべてのフィールドが予測されます。

次のオプションを使用できます。

事前ラベル付け URL

事前ラベル付けを行うには、ML モデルに URL が必要です。使用できる次の URL を確認してください。

パブリック URL (例: https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders)
エンドポイントの完全なリストを確認するには、「パブリックエンドポイント」をご覧ください。
オンプレミス版の AI Center または Cloud AI Center で公開されている ML スキルの URL

事前ラベル付けキー

AI ユニット/Document Understanding の API キーです。事前ラベル付け API キーは、スキルが存在する組織の Document Understanding API のキーです。

このキーは、Cloud Document Manager およびオンプレミスのオンラインの Document Manager では必須です。オンプレミスのエアギャップ環境の Document Manager では任意です。

使い方

[使い方] オプションから、Document Manager のヘルプメニューを開きます。

ヘルプメニューでは以下の情報を確認できます。

Document Manager のバージョンです。
製品ガイドのページへのリンク です。
[ラベル付けのコントロール] セクション: データを処理するときに使用されるコントロールが表示されます。
[ドキュメントのショートカット] セクション: ナビゲーションや UI のスケーリングなどのさまざまな操作の実行に使用されるショートカットが表示されます。
[構成] セクション: インストール時に実行されたインスタンス構成に関する詳細が表示されます。

ラベル付けのコントロール

コマンド	説明
左クリック	ボックスを選択します。フィールドのホットキーと一緒に使用した場合、選択した情報がフィールドに割り当てられます。
Backspace/Delete	フィールドのタグ付けされた値を削除します。
右クリック	OCR テキストと現在のラベルを表示します。
Enter キーまたはバックスラッシュ	複数行のテキストにまたがる表の行をグループ化またはグループ化解除します。

ドキュメントのショートカット

ショートカット	説明
Alt + 左矢印/右矢印	ドキュメント間を移動します。
Alt + Delete	ドキュメントを削除または回復します。
Ctrl + スクロール	拡大/縮小してドキュメントのスケーリングを変更します。