document-understanding
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding モダン プロジェクト ユーザー ガイド

最終更新日時 2025年11月7日

トレーニング可能な分割線 (プレビュー)

新しいプロジェクトを作成する

新しいプロジェクトを作成する際に、ヨーロッパ、米国、日本にあるテナントでは、新しい分割および分類器モデルを有効化できます。このトレーニング可能なモデルでは、複雑なドキュメントを自動的に分割して分類できるため、乱雑なパケットをクリーンな型指定されたドキュメントに変えることができます。

このページの手順に従って Document UnderstandingTM プロジェクトを作成し、新しい分割器と分類器モデルを有効化します。

  1. Document Understanding を開きます。
  2. [ プロジェクトを作成] を選択します。
  3. 希望のプロジェクト名を入力します。
  4. モダン エクスペリエンスを表す [モダン] を選択します。
    注: これは、ガイド付きのモデル構築エクスペリエンスであり、最適なモデル パフォーマンスを得るための推奨事項とアクティブ ラーニングも含まれています。
  5. [ 新しい分割ツールと分類器モデルを有効化 ] トグルをオンにします。
  6. 必要に応じて [詳細オプション] を設定します。
    1. [ 分割を有効化 ] トグルをオンにして、分類前にモデルが自動的にドキュメントを個別のファイルに分割できるようにします。この機能は、[プロジェクト設定] 画面から有効化することもできます。
      大事な: [ 分割を有効化 ] オプションをオフにすると、すべてのドキュメントが全体として分類されます。
    2. [OCR メソッド] ドロップダウン リストから、新しいプロジェクトで使用する OCR を選択します。
    3. [OCR API キー] にキーを入力します。
      注: UiPath® の OCR を選択した場合、このフィールドには自動的に入力されます。
    4. [OCR の URL] に OCR の URL を入力します。UiPath の OCR の URL の完全なリストについては、「パブリック エンドポイント」をご覧ください。
    5. [PDF に OCR を適用] で、PDF に OCR を適用するかどうかを選択します。既定では [自動] に設定されています。
  7. [作成] を選択します。
    図 1. 図 1.最初のプロジェクトを作成する docs image

プロジェクトが正常に作成されたら、[ビルド] セクションからドキュメントをアップロードできます。

次の 2 つの利用可能なオプションのいずれかを選択します。

  • ドキュメントからデータを抽出: 請求書番号、日付、合計などの特定のフィールドをドキュメントから取得します。
    注: 自動化やレポート作成のために構造化データが必要な場合に、このオプションを選択することをお勧めします。
  • ドキュメントを分類して分割: ドキュメントの種類別に並べ替え、複数のドキュメントを 1 つのファイル内で分離します。
    注: 抽出用のドキュメントを整理して準備する必要がある場合に、このオプションを選択することをお勧めします。

ドキュメントからデータを抽出する

  1. ドキュメントの種類を選択します。
  2. [ アップロード ] を選択するか、新しいドキュメントの種類内にファイルをドラッグ アンド ドロップします。アップロードが完了するまで待ちます。docs image

ドキュメントを分類および分割

特定の複合ファイルには、複数のドキュメントの種類が含まれます。新しいモデルは、各サブドキュメントの開始位置と終了位置を検出し、それに応じて各セクションを分類できます。

  1. [ ドキュメントを分類して分割] をクリックし、ドキュメント パケットをアップロードします。ドキュメントのアップロードと処理が完了するまで待ちます。

  2. アップロード セクションから任意のドキュメントを選択し、[ 分割] をクリックします。これにより、分割アノテーションインターフェースが開きます。

    docs image
    注: プロジェクトにトレーニング済みのモデルがすでにある場合は、アップロードされたドキュメントにそのモデルを使用して事前アノテーションが行われます。これにより、アノテーションが高速化され、新しいドキュメントの予測結果を表示できるようになります。
  3. [ 新しいドキュメントの種類 ] をクリックして、目的のタクソノミー内の各項目のドキュメントの種類を作成します。定義済みのドキュメントの種類を選択するか、カスタムのドキュメントの種類を作成できます。

    docs image
    注: カスタムのドキュメントの種類の場合は、名前、目的を説明する簡単な説明、および識別に役立つコンマ区切りの主要インジケーター (一意のフィールドや用語など) を入力します。
  4. ドキュメントを区切る場所を指定します。ドロップダウン メニューを使用して、各ページ範囲をドキュメントの種類に割り当てます。ドキュメントのアノテーションが完了したら、[ 確定] をクリックします。

    docs image
    注:[確認] をクリックすると、ドキュメントの処理がトリガーされます。処理後、各サブドキュメントは [ 構築 ] セクション内の対応するドキュメントの種類の下に表示されます。
    注: ドキュメントの種類に移動された各サブドキュメントには、そのドキュメントの種類のスキーマで事前アノテーションが行われます。

モデルのトレーニング

モデルのトレーニングは、次の後にのみトリガーされます。

  • 少なくとも 5 つのサブドキュメントが作成され、アノテーションが行われました。
  • ドキュメントが確認されました。

トレーニングのステータスは [ 分類 ] ウィンドウの右上隅に表示されます。

重要:
  • 最大ドキュメント サイズは 160 MB (500 ページ) です。
  • ページを並べ替えたり削除したりすることはできません。

分割と分類の予測

新しいモデルをトレーニングすると、必ずプロジェクト内のすべてのドキュメントがトレーニング済みのモデルから予測を受け取ります。これにより、分類モデルのパフォーマンスを確認できます。

「タイプ」列には、アノテーションが行われたドキュメントタイプであるグラウンドトゥルースが表示されます。[予測された型] 列には、モデルによって予測された型が表示されます。

docs image

デフォルトでは、ドキュメント パケットのみが UI に表示されます。各パケット内のサブドキュメントを表示するには、[ 表示 ] をクリックし、[ サブドキュメントを含める ] チェックボックスをオンにします。

[ 予測を表示] トグルを有効化すると、アノテーション インターフェイスで予測を表示することもできます。

docs image

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo
信頼とセキュリティ
© 2005-2025 UiPath. All rights reserved.