document-understanding
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding モダン プロジェクト ユーザー ガイド

最終更新日時 2025年11月20日

トレーニング可能な分割器 (プレビュー)

新しいプロジェクトを作成する

新しいプロジェクトを作成する際に、欧州と米国にあるテナントでは、新しい分割器および分類器モデルを有効化できます。このトレーニング可能なモデルは、複雑なドキュメントを分割および分類するようにトレーニングできるため、ドキュメント パケットを処理できます。

このページの手順に従って Document UnderstandingTM プロジェクトを作成し、新しい分割器と分類器モデルを有効化します。

  1. Document Understanding を開きます。
  2. [ プロジェクトを作成] を選択します。
  3. 希望のプロジェクト名を入力します。
  4. モダン エクスペリエンスを表す [モダン] を選択します。
  5. [新しい分割器および分類器モデルを有効化] トグルをオンにします。
  6. 必要に応じて [詳細オプション] を設定します。
    1. [分割を有効化] トグルをオンにして、分類前にモデルがドキュメントを個別のファイルに分割できるようにします。この機能は、[プロジェクト設定] 画面からも有効化できます。
      重要: [分割を有効化] オプションをオフにすると、全ドキュメントが丸ごと 1 つとして分類されます。
    2. [OCR メソッド] ドロップダウン リストから、新しいプロジェクトで使用する OCR を選択します。
    3. [OCR API キー] にキーを入力します。
      注: UiPath® の OCR を選択した場合、このフィールドには自動的に入力されます。
    4. [OCR の URL] に OCR の URL を入力します。UiPath の OCR の URL の完全なリストについては、「パブリック エンドポイント」をご覧ください。
    5. [PDF に OCR を適用] で、PDF に OCR を適用するかどうかを選択します。既定では [自動] に設定されています。
  7. [作成] を選択します。

プロジェクトが正常に作成されたら、[ビルド] セクションからドキュメントをアップロードできます。

利用可能な次の 2 つのオプションのいずれかを選択します。

  • ドキュメントからデータを抽出: 請求書番号、日付、合計数などの特定のフィールドをドキュメントから取得します。
    注: ドキュメントからフィールドを抽出する必要がある場合は、このオプションを選択することをお勧めします。
  • ドキュメントを分類および分割: ドキュメントを種類別に並べ替え、1 つのファイル内で複数のドキュメントを区分します。
    注: ドキュメントを分割および分類する必要がある場合は、このオプションを選択することをお勧めします。

ドキュメントからデータを抽出する

  1. ドキュメントの種類を選択します。
  2. [アップロード] を選択するか、新しいドキュメントの種類内にファイルをドラッグ アンド ドロップします。アップロードが完了するまで待ちます。

ドキュメントを分類および分割

特定の複合ファイルには、複数のドキュメントの種類が含まれます。新しいモデルは、各サブドキュメントの開始位置と終了位置を検出し、それに応じて各セクションを分類できます。

  1. [ドキュメントを分類および分割] をクリックし、ドキュメント パケットをアップロードします。ドキュメントのアップロードと処理が完了するまで待ちます。

  2. アップロード セクションから任意のドキュメントを選択し、[分割] をクリックします。これにより、分割アノテーション インターフェイスが開きます。

    注: プロジェクトにトレーニング済みのモデルがすでにある場合は、そのモデルを使用して、アップロードされたドキュメントに事前にアノテーションが行われます。これにより、アノテーションが高速化され、新しいドキュメントの予測結果を確認できるようになります。
  3. [新しいドキュメントの種類] をクリックして、目的のタクソノミー内の各項目に対してドキュメントの種類を作成します。定義済みのドキュメントの種類を選択するか、カスタムのドキュメントの種類を作成できます。

    注: カスタムのドキュメントの種類の場合は、名前、目的の簡単な説明、および識別に役立つコンマ区切りの主要インジケーター (一意のフィールドや用語など) を入力します。
  4. ドキュメントを区切る場所を指定します。ドロップダウン メニューを使用して、各ページ範囲をドキュメントの種類に割り当てます。ドキュメントのアノテーションが完了したら、[確定] をクリックします。

    注: [確定] をクリックすると、ドキュメントの処理がトリガーされます。処理後、各サブドキュメントは [構築] セクション内の対応するドキュメントの種類の下に表示されます。
    注: ドキュメントの種類に移動された各サブドキュメントには、そのドキュメントの種類のスキーマで事前アノテーションが行われます。

モデルのトレーニング

モデルのトレーニングがトリガーされるのは、次の後のみです。

  • 少なくとも 5 つのサブドキュメントが作成され、アノテーションが行われた。
    注: たとえば、1 つの PDF を使用している場合、トレーニングを開始するには、少なくとも 5 つのサブドキュメントが含まれていることを確認してください。PDF を 2 つ使用している場合は、一方に少なくとも 2 つのサブドキュメント、もう一方に少なくとも 3 つのサブドキュメントを含める必要があります。
  • ドキュメントが確定された。

トレーニングのステータスは [分類] パネルの右上隅に表示されます。

重要:
  • 最大ドキュメント サイズは 160 MB または 500 ページです。
  • ページを並べ替えたり削除したりすることはできません。

分割と分類の予測

新しいモデルをトレーニングすると、必ずプロジェクト内のすべてのドキュメントがトレーニング済みのモデルから予測を受け取ります。これにより、分類モデルのパフォーマンスを確認できます。

[種類] 列には、アノテーションが行われたドキュメントの種類であるグラウンド トゥルースが表示されます。[予測された種類] 列には、モデルによって予測された種類が表示されます。

既定では、ドキュメント パケットのみが UI に表示されます。各パケット内のサブドキュメントを表示するには、[表示] をクリックし、[サブドキュメントを含む] チェックボックスをオンにします。

[予測を表示] トグルを有効化すると、アノテーション インターフェイスで予測を表示することもできます。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo
信頼とセキュリティ
© 2005-2025 UiPath. All rights reserved.