document-understanding
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
Document Understanding Modern Projects User Guide
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年10月31日

UiPath® DocPath (英語)

The DocPath large language model (LLM) is our latest data extraction model technology, designed to replace current generation models used within UiPath® Document UnderstandingTM. While DocPath operates similarly to previous models, it was trained using a wide variety of documents. This enables it to process common document types with little to no training needed. What sets DocPath LLM apart is its generative architecture, which significantly improves accuracy and simplifies extraction. Additionally, you can also fine-tune the model with your unique datasets.

DocPath のアーキテクチャとトレーニングに使用される手法の詳細については、AI ブログの「 DocPath 」をご覧ください。

利用可能状況

Currently, UiPath DocPath is only available for US-based tenants. Support for other regions is planned to roll out in early 2025.

前世代に対する改良点

DocPath LLM では、以前のモデルに比べてさまざまな機能が強化されています。 これにより、特に表の精度が向上し、さまざまなドキュメント レイアウトに適応して注釈の労力が軽減され、自動化率が向上します。

主な改善点は次のとおりです。
  • 精度の向上: DocPath LLM は、請求書、領収書、発注書などの半構造化ドキュメントの精度が高く、F1 スコアも高くなります。 これにより、正確で一貫性のあるデータ抽出が保証されます。
  • 簡単なアノテーション: このモデルでは、1 つのドキュメントにつき 1 つのアノテーションで済み、すべてのページのフィールド インスタンスにアノテーションを行う必要がなくなるため、手作業が軽減されます。
  • 自動化の強化: 信頼度レベルと精度の相関性が高いため、DocPath LLM は自動化率を向上させると同時に、同じ精度レベルで Action Center に送信されるドキュメントの数を減らします。

社内テストの結果、DocPath は前モデルよりも優れたパフォーマンスを発揮していました。 偽陽性率は約15%減少し、偽陰性率は約17%低下しました。

How to use DocPath

DocPath LLM は、Document Understanding モダン プロジェクトでのみ使用できます。 DocPath の導入後も、既存のすべてのプロジェクト バージョンは、現在のモデル バージョンを使用します。 これにより、進行中の運用ワークフローを中断することなく、シームレスに移行できます。

DocPath で既存のドキュメントの種類のトレーニングを開始するには、いくつかのドキュメントのすべてのフィールドの確認を解除してから確認します。

  1. DocPath でトレーニングするドキュメントの種類を選択します。
  2. ドキュメントを選択します。
  3. 伝票からすべての項目を選択し、[ 削除]を選択します。


  4. ドキュメントのすべてのフィールドにアノテーションを行い、[ 確認] を選択します。
    手記: 手順 34 を繰り返して、選択したドキュメントの種類でトレーニングを開始します。


How to check if DocPath is enabled

After training your models on DocPath, check the model version to make sure that DocPath is enabled.
  1. [ パブリッシュ] ページに移動し、新しいプロジェクトのバージョンを作成します。
  2. プロジェクト バージョンの横にある 3 点リーダー メニューのアイコン を選択し、[ バージョンを編集 ] を選択してモデルのバージョンを確認します。
    手記: バージョン 24.7 以降のすべてのモデルは UiPath DocPath モデルです。


結果の最適化

選択するフィールド名は、モデルのパフォーマンスに大きく影響します。 最適な結果が得られるように、フィールド名には自然言語と適切な文法を使用してください。 Number (No)、Account (Acct)、Address (Addr)、Apartment (Apt) など、広く認識されている頭字語のみを使用してください。 現在、西ヨーロッパの言語のみがサポートされているため、選択したフィールド名がこれらの言語と一致していることを確認してください。 "列 3" などの説明的でない名前は、ドキュメントでその用語が特に使用されている場合を除き、使用しないでください。

UiPath® DocPath の既知の制限事項

現在、UiPath DocPath には以下の制限が適用されます。
  • 抽出されるフィールドは、ドキュメント内のテキストと完全に一致する必要があります。 このプロセスには、要約やその他の種類のテキスト分析は含まれません。
  • カスタム トレーニングは、次のドキュメントの種類には適用されません。 これらに DocPath を使用しようとすると、エラーが発生します。
    • Invoices China (請求書 - 中国)
    • Invoices (請求書) (ヘブライ語)
    • Invoices Japan (請求書 - 日本)

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.