document-understanding
2024.10
true
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
最終更新日時 2024年12月18日

チェックボックスと署名

チェックボックス

チェックボックスを使用する複数選択フィールドには、いくつか種類があります。

  • 相互に排他的なチェックボックス
  • 相互に排他的ではないチェックボックス (複数のオプションを選択可能)

もう 1 つの重要な点は、特定の複数選択フィールドで利用可能な選択肢の数です。オプションが 1 個だけで、チェックボックスがオンかオフのいずれかしかない場合や、健康診断書のように、オプションが 10 個から 20 個以上もあり、グリッドや表として配置されていることもあります。

このような種類の複数選択フィールドをラベル付けする方法は、主に 2 つあります。

オプションにラベル付けする

例を見ながら、オプションにラベル付けする方法を理解していきましょう。フォームに Project または Policy のオプションが含まれるとします。この場合、フィールドは 1 つだけであり、選択した単語にのみラベル付けします。つまり、Project という単語の横にあるチェックボックスにチェックマークが付いている場合は Project という単語にラベル付けし、Policy という単語の横にあるチェックボックスにチェックマークが付いている場合は Policy という単語にラベル付けします。どちらにもチェックマークが付いていなければ、どちらにもラベル付けしません。両方にチェックマークが付くことはあり得ないので、そのようなドキュメントがあった場合はトレーニング セットから削除されます。



このアプローチのメリットは、フィールドが 1 つあれば良く、必要なデータが少ないところです。チェックボックスの検出の成否に依存しないというメリットもあります。チェックボックスが X という文字として検出されても、モデルはその X の意味が、その横にあるオプションがオンになっていることだと学習して認識できます。

デメリットとしては、両方のオプションがだいたい等しく表されていることを確認する必要があります。常にそうなっているとは限りません。場合によっては、トレーニング セットのドキュメントの 90% で Project にチェックマークが付いていることがあります。この場合、モデルのパフォーマンスは十分とは言えず、このアプローチは失敗します。オプションが多いほど問題は悪化します。一部のオプションはほとんどの場合、まれであるためです。このような場合には、まれなオプションにチェックマークを付けた偽のドキュメントを作成して、バランスを取る必要があるかもしれません。

単一の複数値フィールドを持つオプションにラベル付けする

この方法でも、ラベル付けが容易になり、チェックボックス検出エラーの影響も受けにくくなりますが、最初のオプションと同じように、バランスの悪いオプションの影響を受けやすくなる可能性があります。



署名の検出

LTS Enterprise バージョンの 2022.4 リリースより UiPath Document OCR を使用して署名を検出できるようになったため、マシン ラーニング モデルが署名を直接検出できます。

ドキュメント内で他のフィールドをラベル付けするのと同じように署名をラベル付けします。UiPath Document OCR によって署名が検出されると、マシン ラーニング モデルはこのフィールドを署名として認識するよう学習します。

注: より詳しく署名を分析するには、UiPath Image Analysis (UiPath 画像分析) ML パッケージに存在する Signature Comparison (署名の比較) モデルも使用できます。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.