- 基本情報
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- データ マネージャー (Data Manager)
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
ドキュメント分類の概要
ドキュメント分類は、ロボットが処理しているファイルの種類を識別するのに役立つ Document Understanding フレームワークのコンポーネントです。
ファイルは、内容や使用される分類方法に応じて、1 つ以上のドキュメントの種類に分類できます。
- ファイルに 1 つの種類の論理ドキュメントが含まれる場合 (たとえば、それ全体が 1 つの請求書または医療記録の場合)、それに応じて分類コンポーネントが設定され、1 つの分類結果が返されます。
- ファイルに複数の種類の論理ドキュメントが含まれる場合 (たとえば、1 ~ 5 ページには請求書、次の 10 ページには医療記録、16 ページから最後までは保険契約書が含まれる場合)、分類コンポーネントは、それぞれが入力ファイルの正しいページ範囲に対応する複数の分類結果を返します。
分類が試行されるドキュメントの種類は、プロジェクトのタクソノミーで定義された種類です。
プロジェクトで、すべてが同じドキュメントの種類で、常にファイルごとに 1 つのインスタンスとして存在するファイル (たとえば、1 つのファイルに 1 つの請求書) を処理する必要がある場合、分類は不要で、分類自体をスキップできます。
一方、プロジェクトで、2 つ以上の種類のドキュメントを処理している場合 (たとえば、処理前には区別できない請求書と医療記録をワークフローで処理する必要がある場合)、またはファイル内に 2 つ以上の異なる種類のドキュメントが含まれることがある場合 (たとえば、1 つのファイルに 3 つの請求書)、分類を行うことを強くお勧めします。
分類は、[ドキュメント分類スコープ] アクティビティを使用して行われます。このスコープ アクティビティには、ドキュメント分類のための 1 つ以上のアルゴリズムを設定して実行する役割と、ユーザーのニーズに合わせた 1 つのシンプルな設定オプションを提供する役割があるため、1 つ以上の分類器を使用してドキュメントを分類することができます。
[ドキュメント分類スコープ] で行われることを、以下に簡潔にまとめます。
- すべての分類器 (分類アルゴリズム) の実行に必要な設定を指定します。
- 1 つ以上の分類器を受け入れます。
- 分類器レベルでのドキュメントの種類のフィルター処理、タクソノミーのマッピング、および最小信頼度閾値の設定を可能にします。
- 分類のソースに関係なく、分類情報を統一された方法で報告します。
[ドキュメント分類スコープ] は、分類器を設定ウィザードを使用して設定できます。以下をカスタマイズできます。
- どの分類器からどのドキュメントの種類が受け入れられるか
- 分類器ごとに許容される、特定の結果の最小信頼度閾値
- ドキュメントの種類のレベルでの、プロジェクトのタクソノミーと分類器の内部タクソノミー間のマッピング (ある場合)
[ドキュメント分類スコープ] での分類器の順序は重要です。
- 分類器は、左から優先的に実行されます。
- 分類器から返された分類結果は、それが許容できるドキュメントの種類のいずれかについての報告であり、かつその分類器に設定された信頼度閾値が最小信頼度閾値以上である場合に受け入れられます。
- 分類器は、前の分類器だけでは分類されずに残ったページ範囲で実行されます (このため、1 つの実行で複数回呼び出されることがあります)。
ユース ケースの要件に基づいて、分類器と呼ばれる複数の分類方法から選択できます。
分類器は UiPath.IntelligentOCR.Activities パッケージ、およびその他の UiPath (UiPath.DocumentUnderstanding.ML.Activities)、またはサードパーティ パッケージ (UiPath.Abbyy.Activities) にあります。
使用可能な分類器は次のとおりです。
公開されている Document Processing Contracts を使用していつでも独自の分類器を構築し、ユース ケースに適したアルゴリズムを実装できます。