document-understanding
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
モダン エクスペリエンスの Document Understanding ユーザー ガイド
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年9月17日

ドキュメントのアノテーションを行う

Note: The prelabeling feature relies on UiPath DocPath, but only for tenants based in the Europe region. If your tenant is located in a region outside of Europe, this functionality uses the previous-generation model architecture.

After successfully creating your project and uploading your documents to a specific document type, they are automatically pre-annotated. This is done using a combination of generative and specialized models, based on the document type's schema. The schema clearly defines the fields you want to extract from a particular document type. To find the document type's schema, go to the Annotation page and check the Fields section.



事前アノテーションはドキュメント内のテキストに下線付きで示され、削除できません。事前アノテーションが間違っていて、特定のフィールドに一致させることができない場合は、無視してかまいません。トレーニング プロセスでは、確認済みのフィールドのみがトレーニングに使用され、下線は考慮されません。

As you continue to add more annotations, the pre-annotated underlines should progressively align with your input. There may be a few inconsistencies between underlines and user-annotated fields at the beginning. However, as you make more annotations and the model improves, the underlines should line up more precisely with the user-supplied data.

次の画像では、配送先住所の事前アノテーションに誤りがあり、人名まで含まれています。



これを修正するには、配送先住所を確認するだけです。名前に関連する下線付きのテキストを削除する必要はありません。アノテーションを続行してこのようなエラーを修正していくと、下線付きのテキストが確認済みのフィールドと一致しないケースが減っていきます。

注:
  • カスタムのドキュメント タイプでは、アノテーションが自動的に行われません。カスタムのドキュメント タイプのドキュメント部分に手動で事前ラベル付けする必要があります。
  • モデルのトレーニングをトリガーするには、40 以上の操作が必要です。たとえば、ドキュメントが 20 個ある場合、ドキュメント 1 個につき 2 つ以上のフィールドに注釈を付ける必要があるため、合計で 40 の操作が必要になります。
ヒント: モデルのパフォーマンスを最適化するには、[推奨事項] セクションの提案に従います。これらの提案は、モデルの全体的なパフォーマンスを向上させることを目的としています。


事前アノテーション済みのドキュメントを検証する

ドキュメントをすべてアップロードして事前アノテーションが完了したら、事前アノテーション済みのフィールドを検証または変更することが目標になります。すべてのフィールドのアノテーションが正確に行われたドキュメントの場合は、[確認] を選択して、すべてのフィールドを一度に承認します。ドキュメントの確認が完了すると、ドキュメント リストで緑色の盾のマークが付きます。



ドキュメントが部分的にしか確認されていない場合は、ドキュメント リストで空の盾の記号が付きます。この記号は、この特定のドキュメントのアノテーション プロセスが進行中であることを示します。最終的な目標は、すべてのドキュメントを確認済みにすることです。

検証中に、次のシナリオが発生する可能性があります。
  • 事前アノテーションは正確であり、検証する必要がある
  • 事前アノテーションが間違っていて、フィールドがドキュメントに存在している。
  • 事前アノテーションに誤りがあり、フィールドがドキュメントに存在しない
  • 事前アノテーションが行われていない。

事前アノテーションは正確であり、検証する必要がある

事前アノテーションが正しく行われている場合は、事前アノテーションを確定します。そのためには、下線付きのテキストを選択して [確認] を選択するか、フィールドの確認用のチェック ボックスをオンにします。ただし、最適な方法は、フィールドに割り当てられているホットキー (このシナリオでは「N」) を押すことです。


事前アノテーションに誤りがあり、フィールドがドキュメントに存在する

事前アノテーションが間違っている場合は、正しいテキストとフィールドを選択し、[確認] を選択します。

事前アノテーションに誤りがあり、フィールドがドキュメントに存在しない

事前アノテーションが間違っていて、フィールドがドキュメントに存在しない場合は、フィールド名の横にある 3 点リーダー メニューのアイコン を選択し、[存在しないとしてマーク] を選択します。
重要: 間違ったラベルが付けられたフィールドは、存在しないとしてマークすることもできます。たとえば、ドキュメント内に [ベンダー住所] は存在しないが、処理中に別のフィールドが [ベンダー住所] として事前にラベル付けされていた場合、検証中にそのフィールドを存在しないとしてマークできます。


事前アノテーションがないフィールド

事前アノテーションがないフィールドは、空のセルとして表示されます。このようなセルは、存在しないものとして 1 つずつマークを付けることも、[確認] ボタンを選択して一括でマークを付けることもできます。

ドキュメントの種類の設定

ドキュメントの種類の設定は、[アノテーションを行う] ビューから変更できます。

そのためには、ドキュメントの種類名の右側にある 3 点リーダー メニューのアイコン をクリックして、[設定] を選択します。



次の設定を変更できます。
  • ベース モデル: [推奨されるアクション] に表示されるデータセットのサイズの推定値は、トレーニングに使用されるベース モデルによって異なります。対象のドキュメントの種類に最も類似したベース モデルを使用すると、必要とされるアノテーション作業量が減ります。
  • 言語の数: [推奨されるアクション] に表示されるデータセットのサイズの推定値は、データセットに含まれる言語の数によって異なります。一般には、言語の数が多いほど、より多くのデータのアノテーションを行う必要があります。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.