document-understanding
2024.10
true
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
UiPath logo, featuring letters U and I in white
Document Understanding モダン プロジェクト ユーザー ガイド
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年11月11日

UiPath® DocPath (英語)

DocPath 大規模言語モデル (LLM) は、UiPath の最新のデータ抽出モデル テクノロジです。 UiPath® Document UnderstandingTM で使用されている現行世代のモデルを置き換えるように設計されています。 DocPath の動作は以前のモデルと似ていますが、さまざまなドキュメントを使用してトレーニングされています。 これにより、一般的なドキュメントの種類をほとんどまたはまったくトレーニングせずに処理できます。 DocPath LLM を際立たせているのは、その生成アーキテクチャです。これにより、精度が大幅に向上し、抽出が簡素化されます。 さらに、独自のデータセットでモデルを微調整することもできます。

DocPath のアーキテクチャとトレーニングに使用される手法の詳細については、AI ブログの「 DocPath 」をご覧ください。

利用可能状況

現在、UiPath DocPath は米国を拠点とするテナントでのみ利用可能です。 他のリージョンのサポートは、2025 年初頭にロールアウトされる予定です。

前世代に対する改良点

DocPath LLM では、以前のモデルに比べてさまざまな機能が強化されています。 これにより、特に表の精度が向上し、さまざまなドキュメント レイアウトに適応して注釈の労力が軽減され、自動化率が向上します。

主な改善点は次のとおりです。
  • 精度の向上: DocPath LLM は、請求書、領収書、発注書などの半構造化ドキュメントの精度が高く、F1 スコアも高くなります。 これにより、正確で一貫性のあるデータ抽出が保証されます。
  • 簡単なアノテーション: このモデルでは、1 つのドキュメントにつき 1 つのアノテーションで済み、すべてのページのフィールド インスタンスにアノテーションを行う必要がなくなるため、手作業が軽減されます。
  • 自動化の強化: 信頼度レベルと精度の相関性が高いため、DocPath LLM は自動化率を向上させると同時に、同じ精度レベルで Action Center に送信されるドキュメントの数を減らします。

社内テストの結果、DocPath は前モデルよりも優れたパフォーマンスを発揮していました。 偽陽性率は約15%減少し、偽陰性率は約17%低下しました。

DocPath の使い方

DocPath LLM は、Document Understanding モダン プロジェクトでのみ使用できます。 DocPath の導入後も、既存のすべてのプロジェクト バージョンは、現在のモデル バージョンを使用します。 これにより、進行中の運用ワークフローを中断することなく、シームレスに移行できます。

DocPath で既存のドキュメントの種類のトレーニングを開始するには、いくつかのドキュメントのすべてのフィールドの確認を解除してから確認します。

  1. DocPath でトレーニングするドキュメントの種類を選択します。
  2. ドキュメントを選択します。
  3. 伝票からすべての項目を選択し、[ 削除]を選択します。


  4. ドキュメントのすべてのフィールドにアノテーションを行い、[ 確認] を選択します。
    手記: 手順 34 を繰り返して、選択したドキュメントの種類でトレーニングを開始します。


DocPath が有効になっているかどうかを確認する方法

DocPath でモデルをトレーニングした後、モデルのバージョンをチェックして、DocPath が有効化されていることを確認します。
  1. [ パブリッシュ] ページに移動し、新しいプロジェクトのバージョンを作成します。
  2. プロジェクト バージョンの横にある 3 点リーダー メニューのアイコン を選択し、[ バージョンを編集 ] を選択してモデルのバージョンを確認します。
    手記: バージョン 24.7 以降のすべてのモデルは UiPath DocPath モデルです。


結果の最適化

選択するフィールド名は、モデルのパフォーマンスに大きく影響します。 最適な結果が得られるように、フィールド名には自然言語と適切な文法を使用してください。 Number (No)、Account (Acct)、Address (Addr)、Apartment (Apt) など、広く認識されている頭字語のみを使用してください。 現在、西ヨーロッパの言語のみがサポートされているため、選択したフィールド名がこれらの言語と一致していることを確認してください。 "列 3" などの説明的でない名前は、ドキュメントでその用語が特に使用されている場合を除き、使用しないでください。

UiPath® DocPath の既知の制限事項

現在、UiPath DocPath には以下の制限が適用されます。
  • 抽出されるフィールドは、ドキュメント内のテキストと完全に一致する必要があります。 このプロセスには、要約やその他の種類のテキスト分析は含まれません。
  • カスタム トレーニングは、次のドキュメントの種類には適用されません。 これらに DocPath を使用しようとすると、エラーが発生します。
    • Invoices China (請求書 - 中国)
    • Invoices (請求書) (ヘブライ語)
    • Invoices Japan (請求書 - 日本)

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.