document-understanding
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
最終更新日時 2024年11月7日

UiPath® DocPath

DocPath 大規模言語モデル (LLM) は UiPath の最新のデータ抽出モデル テクノロジであり、UiPath® Document UnderstandingTM 内で使用されている現行世代のモデルを置き換えることを目的として設計されています。DocPath は以前のモデルと同様に動作しますが、多種多様なドキュメントを使用してトレーニングされています。このため、一般的なドキュメントの種類を、ほとんどまたはまったくトレーニングなしに処理できます。DocPath LLM の際立った特徴はその生成アーキテクチャです。これにより、精度が大幅に向上し、抽出が簡素化されます。さらに、独自のデータセットを使用してモデルを微調整することもできます。

DocPath のアーキテクチャとトレーニングに使用される手法について詳しくは、UiPath の AI に関するブログの「DocPath」をご覧ください。

利用可能状況

現在、UiPath DocPath は米国を拠点とするテナントでのみ利用可能です。他のリージョンのサポートは 2025 年初頭にロールアウトされる予定です。

前世代からの改良点

DocPath LLM では、以前のモデルに比べてさまざまな機能が強化されています。特に表の精度が向上するほか、さまざまなドキュメント レイアウトに適合するのでアノテーションの手間が減り、自動化率が向上します。

主な改良点は次のとおりです。
  • 精度の向上: DocPath LLM では、請求書、領収書、発注書などの半構造化ドキュメントで精度が向上しており、F1 スコアも高くなっています。これにより、正確で一貫性のあるデータ抽出が保証されます。
  • 簡単なアノテーション: 1 つのドキュメントにつき 1 つのアノテーションで済むので、すべてのページでフィールドの各インスタンスにアノテーションを行う必要がなくなり、手動での作業が減ります。
  • 自動化の強化: 信頼度レベルと適合率の相関性が向上するため、自動化率が向上すると同時に、同じ適合率レベルで Action Center に送信されるドキュメントの数が減ります。

社内テストの結果、DocPath は前モデルよりも優れたパフォーマンスを示しました。偽陽性率は約 15% 減少し、偽陰性率は約 17% 低下しました。

DocPath の使用方法

DocPath LLM は、Document Understanding モダン プロジェクトでのみ使用できます。DocPath の導入後も、既存のプロジェクトのバージョンはすべて現在のモデル バージョンを使用します。これにより、進行中の運用ワークフローに中断を生じることなくシームレスに移行できます。

DocPath で既存のドキュメントの種類のトレーニングを開始するには、数個のドキュメントのすべてのフィールドの確認を解除して確認します。

  1. DocPath でトレーニングするドキュメントの種類を選択します。
  2. ドキュメントを選択します。
  3. ドキュメントのすべてのフィールドを選択し、[削除] を選択します。


  4. ドキュメントのすべてのフィールドにアノテーションを行い、[確認] を選択します。
    注: 選択したドキュメントの種類でトレーニングが開始されるまで、手順 34 を繰り返します。


DocPath が有効化されているかどうかの確認方法

モデルを DocPath でトレーニングした後、モデルのバージョンをチェックして、DocPath が有効化されていることを確認します。
  1. [パブリッシュ] ページに移動し、新しいプロジェクトのバージョンを作成します。
  2. プロジェクトのバージョンの横にある 3 点リーダー メニューのアイコン を選択し、[バージョンを編集] を選択してモデルのバージョンを確認します。
    注: バージョン 24.7 以降のモデルはすべて UiPath DocPath モデルです。


結果を最適化する

選択するフィールド名は、モデルのパフォーマンスに大きく影響する可能性があります。最適な結果が得られるようにするには、フィールド名に対して自然言語と適切な文法を使用します。Number (No)、Account (Acct)、Address (Addr)、Apartment (Apt) など、広く認識されている頭字語のみを使用してください。現在サポートされているのは西ヨーロッパの言語のみであるため、選択したフィールド名がこれらの言語と一致するようにしてください。内容を表していない名前 (「Column 3」など) は、ドキュメントで明確にその用語が使用されている場合を除き、使用しないでください。

UiPath® DocPath の既知の制限事項

現在、UiPath DocPath には以下の制限が適用されます。
  • 抽出されるフィールドが、ドキュメント内のテキストと完全に一致する必要があります。このプロセスには、要約やその他の種類のテキスト分析は含まれません。
  • カスタム トレーニングは、次のドキュメントの種類には適用されません。これらに DocPath を使用しようとすると、エラーが発生します。
    • Invoices China (請求書 - 中国)
    • Invoices (請求書) (ヘブライ語)
    • Invoices Japan (請求書 - 日本)

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.