document-understanding
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding モダン プロジェクト ユーザー ガイド

最終更新日時 2025年11月12日

トレーニング可能な分割器 (プレビュー)

新しいプロジェクトを作成する

When creating a new project, tenants located in Europe and the US may enable our new splitter and classifier model. This trainable model can be trained to split and classify complex documents, enabling you to process document packets.

このページの手順に従って Document UnderstandingTM プロジェクトを作成し、新しい分割器と分類器モデルを有効化します。

  1. Document Understanding を開きます。
  2. [ プロジェクトを作成] を選択します。
  3. 希望のプロジェクト名を入力します。
  4. モダン エクスペリエンスを表す [モダン] を選択します。
  5. [新しい分割器および分類器モデルを有効化] トグルをオンにします。
  6. 必要に応じて [詳細オプション] を設定します。
    1. Switch on the Enable splitting toggle to enable the model to split documents into individual files before classification. You can also enable this feature from the Project settings screen.
      重要: [分割を有効化] オプションをオフにすると、全ドキュメントが丸ごと 1 つとして分類されます。
    2. [OCR メソッド] ドロップダウン リストから、新しいプロジェクトで使用する OCR を選択します。
    3. [OCR API キー] にキーを入力します。
      注: UiPath® の OCR を選択した場合、このフィールドには自動的に入力されます。
    4. [OCR の URL] に OCR の URL を入力します。UiPath の OCR の URL の完全なリストについては、「パブリック エンドポイント」をご覧ください。
    5. [PDF に OCR を適用] で、PDF に OCR を適用するかどうかを選択します。既定では [自動] に設定されています。
  7. [作成] を選択します。
    図 1. 最初のプロジェクトを作成する docs image

プロジェクトが正常に作成されたら、[ビルド] セクションからドキュメントをアップロードできます。

利用可能な次の 2 つのオプションのいずれかを選択します。

  • ドキュメントからデータを抽出: 請求書番号、日付、合計数などの特定のフィールドをドキュメントから取得します。
    Note: We recommend choosing this option when you need to extract fields from documents.
  • ドキュメントを分類および分割: ドキュメントを種類別に並べ替え、1 つのファイル内で複数のドキュメントを区分します。
    Note: We recommend choosing this option when you need to split and classify documents.

ドキュメントからデータを抽出する

  1. ドキュメントの種類を選択します。
  2. Select Upload or drag and drop your files inside the new document type. Wait for the upload to finish.

ドキュメントを分類および分割

特定の複合ファイルには、複数のドキュメントの種類が含まれます。新しいモデルは、各サブドキュメントの開始位置と終了位置を検出し、それに応じて各セクションを分類できます。

  1. [ドキュメントを分類および分割] をクリックし、ドキュメント パケットをアップロードします。ドキュメントのアップロードと処理が完了するまで待ちます。

  2. アップロード セクションから任意のドキュメントを選択し、[分割] をクリックします。これにより、分割アノテーション インターフェイスが開きます。

    注: プロジェクトにトレーニング済みのモデルがすでにある場合は、そのモデルを使用して、アップロードされたドキュメントに事前にアノテーションが行われます。これにより、アノテーションが高速化され、新しいドキュメントの予測結果を確認できるようになります。
  3. [新しいドキュメントの種類] をクリックして、目的のタクソノミー内の各項目に対してドキュメントの種類を作成します。定義済みのドキュメントの種類を選択するか、カスタムのドキュメントの種類を作成できます。

    注: カスタムのドキュメントの種類の場合は、名前、目的の簡単な説明、および識別に役立つコンマ区切りの主要インジケーター (一意のフィールドや用語など) を入力します。
  4. ドキュメントを区切る場所を指定します。ドロップダウン メニューを使用して、各ページ範囲をドキュメントの種類に割り当てます。ドキュメントのアノテーションが完了したら、[確定] をクリックします。

    注: [確定] をクリックすると、ドキュメントの処理がトリガーされます。処理後、各サブドキュメントは [構築] セクション内の対応するドキュメントの種類の下に表示されます。
    注: ドキュメントの種類に移動された各サブドキュメントには、そのドキュメントの種類のスキーマで事前アノテーションが行われます。

モデルのトレーニング

モデルのトレーニングがトリガーされるのは、次の後のみです。

  • At least five sub-documents have been created and annotated
    Note: For instance, if you are using a single PDF, make sure it includes at least five sub-documents to initiate training. If you are using two PDFs, one should contain at least two sub-documents and the other at least three.
  • ドキュメントが確定された。

トレーニングのステータスは [分類] パネルの右上隅に表示されます。

重要:
  • 最大ドキュメント サイズは 160 MB または 500 ページ です。
  • ページを並べ替えたり削除したりすることはできません。

分割と分類の予測

新しいモデルをトレーニングすると、必ずプロジェクト内のすべてのドキュメントがトレーニング済みのモデルから予測を受け取ります。これにより、分類モデルのパフォーマンスを確認できます。

[種類] 列には、アノテーションが行われたドキュメントの種類であるグラウンドトゥルースが表示されます。[予測された種類] 列には、モデルによって予測された種類が表示されます。

既定では、ドキュメント パケットのみが UI に表示されます。各パケット内のサブドキュメントを表示するには、[表示] をクリックし、[サブドキュメントを含む] チェックボックスをオンにします。

[予測を表示] トグルを有効化すると、アノテーション インターフェイスで予測を表示することもできます。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo
信頼とセキュリティ
© 2005-2025 UiPath. All rights reserved.