Document Understanding
最新
バナーの背景画像
プレビュー
モダン エクスペリエンスの Document Understanding ユーザー ガイド
最終更新日 2024年4月26日

開発

このセクションでは、次の操作を行うことができます。
  • ドキュメントをアップロードし、自動的に分類します。
  • ドキュメントをドキュメントの種類に直接アップロードします。
  • プロジェクトからファイルを管理します (ファイルの追加・削除、タグの追加・変更)。
  • ドキュメントに注釈を付けます。
  • フィールドを追加または削除します。
  • ビジネス ルールを追加または削除します。
  • 推奨事項を実行しながら分類モデルと抽出モデルをトレーニングする、ガイド付きエクスペリエンスを利用します。

ドキュメントをアップロードする

プロジェクトが正常に作成されたら、[ビルド] セクションからドキュメントをアップロードできます。
  1. プロジェクトを開きます。
  2. サンプル ドキュメントの最初のバッチを [サンプル ドキュメントをアップロード] セクションにドラッグ アンド ドロップします。
    ヒント: [推奨事項] セクションの提案を使用できます。これらの提案を参考にしてプロセスを実行できます。
    アップロードされたファイルは自動的に処理されます (アップロード、デジタル化、分類、注釈)。
  3. [アップロード] をクリックして、サンプル ドキュメントの次のバッチをアップロードします。
    ヒント: [推奨事項] セクションで、アップロードするとさらに便利な項目に関する提案を確認できます。たとえば、utility_bills のドキュメントが少なすぎる場合は、以下のような提案が表示されます。

    utility_bills のサンプル数が少なすぎます。最適なデータ セットのサイズにするには、少なくとも 150 個のドキュメントを追加してください。

    推奨事項には分類モデル用と抽出モデル用の 2 種類があります。


  4. アップロードされたドキュメントを確認します。
    1. 必要なセクションを展開します (請求書領収書など)。
    2. ドキュメント名をクリックします。
    3. 自動的に入力されたドキュメントの種類が正しいかどうかを確認します。ドキュメントの種類は、ドロップダウン リストを使用して変更できます。

ドキュメントに注釈を付ける

プロジェクトが正常に作成され、ドキュメントがアップロードされたら、[ビルド] セクションからそれらのドキュメントに注釈を付けることができます。

ドキュメントの種類のセクションの [注釈] をクリックすると、ドキュメントに注釈を付けることができます。

ドキュメント名の横にある 3 点リーダー メニューのアイコン をクリックして [注釈] を選択することで、特定のドキュメントに注釈を付けることもできます。
ヒント: アップロードされたドキュメントは自動的に処理されます (アップロード、デジタル化、分類、注釈付きを含む)。高性能なモデルの場合は、[推奨事項]セクションの提案に従います。これらの推奨事項は、モデルの全体的なパフォーマンスを向上させるのに役立ちます。
注: カスタムのドキュメントの種類には、自動的には注釈が付けられません。カスタムのドキュメントの種類のドキュメント部分に手動で事前ラベル付けする必要があります。


事前にラベル付けされたドキュメントを検証する

既知のドキュメントの種類の一部であるアップロードされたドキュメントは、自動的に事前ラベル付けされます。これは、[注釈] ビューから検証できます。

検証中に、次の状況が発生する可能性があります。
  • 事前ラベル付けは正しく行われており、検証を完了できる
  • 事前ラベル付けが行われていないため、そのようにマークする必要がある
  • 事前ラベル付けが正しくないため、編集する必要がある。

ドキュメントのすべてのフィールドが正しくラベル付けされている場合は、[確認] をクリックしてすべてのフィールドの検証を一度に完了します。

ドキュメントの検証が完了すると、ドキュメント リストで緑色の盾のマークが付きます。



事前ラベル付けが正確な場合

フィールドが正しい場合は、フィールドの横にあるチェックボックスをオンにします。この例では、最初のフィールドは [ベンダー名] であり、正しくマークされています。検証を完了するには、フィールドの横にあるチェックボックスをオンにします。


事前ラベル付けに欠落がある場合

そのフィールドに関連する事前ラベルがない場合は、フィールド名の横にある 3 点リーダー メニューのアイコン をクリックし、[存在しないとしてマーク] を選択します。
重要: 間違ったラベルが付けられたフィールドは、存在しないとしてマークすることもできます。たとえば、ドキュメント内に [ベンダー住所] は存在しないが、処理中に別のフィールドが [ベンダー住所] として事前にラベル付けされていた場合、検証中にそのフィールドを存在しないとしてマークできます。


不正確な事前ラベル付け

事前ラベル付けが正しくない場合は、フィールドを手動で修正できます。

新しいフィールドを作成することで、フィールドに手動でラベル付けできます。これを行うには、選択ボックスをドキュメントに直接ドラッグ アンド ドロップし、ドロップダウン リストから目的のフィールド名を選択して、必要な情報を選択できます。

注: 手動で注釈が付けられたフィールドはすべて、自動的に検証されます。

ドキュメントの種類の設定

ドキュメントの種類の設定は、[注釈] ビューから変更できます。

そのためには、ドキュメントの種類名の右側にある 3 点リーダー メニューのアイコン をクリックして、[設定] を選択します。



次の設定を変更できます。
  • ベース モデル: [推奨されるアクション] に表示されるデータセットのサイズの推定値は、トレーニングに使用されるベース モデルによって異なります。対象のドキュメントの種類に最も類似したベース モデルを使用すると、必要とされる注釈作業量が減ります。
  • レイアウトの数: [推奨されるアクション] で使用されるデータセットのサイズの推定値は、データセットに含まれるレイアウトの数によって異なります。一般には、レイアウトの数が多いほど、より多くのデータに注釈を付ける必要があります。
  • 言語の数: [推奨されるアクション] に表示されるデータセットのサイズの推定値は、データセットに含まれる言語の数によって異なります。一般には、言語の数が多いほど、より多くのデータに注釈を付ける必要があります。

ドキュメントを検索する

You can search uploaded documents by document name. To do so, use the search bar from the left corner of the Build section. For a more efficient search, use the Filter feature to filter by:
  • ドキュメントの種類: ドロップダウン リストから目的のドキュメントの種類を選択します。
  • アップロード日: ドキュメントがアップロードされた日付の期間を選択します。
  • ステータス: ドキュメントのステータスを選択します。


プロジェクトとモデルのスコア

プロジェクトの総合スコアは右上隅から確認できます。このスコアは、すべてのドキュメントの種類の分類器と抽出器のスコアを考慮して算出されています。[プロジェクト スコア] をクリックすると [評価] セクションが表示され、より詳細なパフォーマンスの評価を確認できます。

ドキュメントの種類ごとのスコアは、[ドキュメントの種類] セクションで個別に確認できます。このスコアでは、モデルの全体的なパフォーマンスに加えてデータセットのサイズと品質も考慮されます。

注: プロジェクトのスコアを取得するには、少なくとも 10 個のドキュメントをアップロードする必要があります。ドキュメントの種類のスコアの場合、同じドキュメントの種類で少なくとも 10 個のドキュメントが必要です。


スコア タグを選択すると、使用しているモデルに関するモデルの評価を確認できます。モデルの評価は、分類モデルのパフォーマンスを視覚化するのに役立つ機能です。評価は、次のように 0 から 100 までのモデルのスコアとして表されます。
  • 不良 (0-49)
  • 平均的 (50-69)
  • 良好 (70-89)
  • 優秀 (90-100)

[モデルの詳細なスコア] を選択して [評価] セクションに移動し、詳細情報を確認します。



Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.