アクティビティ - IntelligentOCR アクティビティパッケージについて

activities

latest

false

Document Understanding アクティビティ

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

IntelligentOCR アクティビティパッケージについて

オープンで拡張可能なドキュメント処理フローを構築するための UiPath.IntelligentOCR.Activities パッケージリファレンス。

UiPath.IntelligentOCR.Activities には、完全でオープンかつ拡張可能なアプローチを使用したドキュメント処理フローを実現するためのインフラストラクチャが含まれています。

注:

UiPath.IntelligentOCR.Activities パッケージをインストールすると、ML ベースの分類と抽出を実行するために UiPath.DocumentUnderstanding.ML.Activities パッケージが自動的にインストールされます。

既知の制限事項

ワークフローを一時停止する「待機」系のアクティビティを使用していて、DataTable 変数を扱う場合は、DataTable 変数がシリアル化可能であることが重要です。たとえば、DataTable 変数を new System.Data.DataTable で初期化すると、その変数はシリアル化不可能になるのでプロジェクトの実行が失敗する可能性があります。この状況を防止するには、DataTable 変数の既定値を空のままにするか、DataTable 変数に new System.Data.DataTable("MyTable") などの名前を割り当てます。

削除されたバージョンを置き換える

次の表に、削除されたパッケージバージョンと、代わりに使用する推奨バージョンを示します。

表 1.削除されたバージョンと推奨される置き換えバージョン

	推奨バージョン
4.3.0-preview	4.4.0-preview
2.1.0	2.2.0
1.4.0	1.5.0
1.2.0	1.2.1

重要

v6.19.0 のリリースより、プロジェクトに UiPath.IntelligentOCR.Activities パッケージをインストールすると UiPath.DocumentUnderstanding.ML.Activities パッケージも自動的にインストールされるため、個別にインストールする必要はありません。
v2023.4.4 以前の UiPath® Studio を使用している場合は、Windows .NET 6.0 Desktop Runtime の最新バージョンをインストールしてください。

対応しているバージョン

UiPath.IntelligentOCR.Activities を更新するには、UiPath.UIAutomation.Activities パッケージと UiPath.OCR.Activities パッケージ (プロジェクトに含まれている場合) の更新も必要です。

UiPath.IntelligentOCR.Activities と UiPath.DocumentUnderstanding.Activities を同じプロジェクト内で一緒に使用することはできません。UiPath.IntelligentOCR.Activities パッケージを Windows (またはレガシ) ワークフローに使用してください。また、クロスプラットフォームのワークフローには UiPath.DocumentUnderstanding.Activities パッケージを使用する必要があります。

注:

モニター機能を使用する前に、以下の点を考慮してください。

UiPath.DocumentUnderstanding.Activities v 2.7.0 以降のバージョンのみが、監視をサポートしています。
IntelligentOCR.Activities v6.20 以降のバージョンにのみ、監視をサポートする [Document Understanding プロジェクト抽出器] アクティビティが含まれています。

サポートされる形式

IntelligentOCR アクティビティパッケージでサポートされているファイルの種類は、.png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp および .pdf です。

C# のプロジェクト言語のサポート

バージョン 4.10.0 から、このアクティビティパッケージが C# プロジェクトで使用できるように検証が行われます。

機能

このセクションでは、Intelligent.OCR パッケージの複数の機能について説明します。

ドキュメントのデジタル化

このためには、[ ドキュメントをデジタル化] アクティビティを使用できます。このウィザードは、 必要な場合にのみ、任意の OCR エンジンを使用して PDF または画像からテキストを取得します。

ドキュメントを 1 つずつ処理しながら、デジタル化プロセスが実行されます。非デジタル (スキャンされた)ドキュメントの特異な点は、選択した OCR エンジンを適用する必要があることです。このステップの出力は、ドキュメントオブジェクトモデルとすべてのドキュメントテキストを含む String 型変数であり、次のステップに渡されます。

ドキュメントの分類

このためには、[ ドキュメントを分類] アクティビティを使用できます。これにより、分類アルゴリズムを使用して、ファイルがどの種類のドキュメントであるかを識別できます。

デジタル化後、ドキュメントは分類されます。同じプロジェクトで複数の種類のドキュメントを使用している場合、データを適切に抽出するには、使用しているドキュメントの種類を知る必要があります。重要なことは、同じスコープで複数の分類器を使用でき、分類器を設定し、後でフレームワークでそれらをトレーニングできることです。分類結果は、適切な抽出方法を適用するのに役立ちます。

利用可能な分類器は以下のとおりです。

[キーワードベースの分類器] アクティビティはタイトル付きドキュメントの分類をターゲットにする、最初のこのような分類器です。
[インテリジェントキーワード分類器] アクティビティは、複数のドキュメントの種類を含むファイルを分類できるだけでなく「分割」することもできます。
[マシンラーニング分類器] アクティビティは、ニーズに応じてトレーニングできる強力な ML モデルを使用してファイルを分類することができます。
[生成 AI 分類器] アクティビティでは、生成 AI モデルを使用してドキュメントを分類できます。

自動分類の検証

[分類ステーションを提示] の Attended アクティビティを使用して実現できます。このアクティビティは、自動分類の出力を検証および修正するための、ドキュメント処理固有のユーザーインターフェイスを表示します。

特にファイル分割に関係するユースケースでは、データ抽出のダウンストリーム処理が適切に機能することを保証するために、人間の分類検証ステップを使用することを強くお勧めします。

Attended アクティビティの代わりに、人間とロボットのコラボレーションを最適に実現するように設計された長期実行のワークフローを使用することもできます。[ドキュメント分類アクションを作成] および [ドキュメント分類アクション完了まで待機し再開] アクティビティは、このシナリオを可能にします。

分類器のトレーニング

このためには、[ 分類器トレーニングスコープ ] アクティビティを使用できます。これにより、学習可能な分類アルゴリズムへのフィードバックループを閉じることができます。分類器トレーナーをこのスコープアクティビティ内にドラッグアンドドロップし、 分類器を設定 ウィザードを使用してトレーナーを有効化します。 これにより、分類ステーション または 検証ステーション で人間が検証した情報を分類器が使用し、分類器のパフォーマンスを向上できます。

分類は、使用される分類器と同程度に効率的です。ドキュメントが適切に分類されなかった場合は、そのドキュメントがアクティブな分類器にとって不明であったことを意味します。このフレームワークは、ドキュメントクラスの認識を向上させるために、分類器をトレーニングする機会を提供します。

利用可能な分類器トレーナーは以下のとおりです。

[キーワードベースの分類器トレーナー] は、[キーワードベースの分類器] とペアとなるトレーナーアクティビティです。
[インテリジェントキーワード分類器トレーナー] は、[インテリジェントキーワード分類器] のためのフィードバックループを可能にします。
[マシンラーニング分類器トレーナー] は、[マシンラーニング分類器] と組み合わせて使用するトレーナーアクティビティです。

ドキュメントからのデータ抽出

このためには、[ データ抽出スコープ] アクティビティを使用できます。これにより、任意のデータ抽出アルゴリズムを使用して、機密ドキュメントのさまざまなフィールドを識別することができます。

抽出とは、特定のドキュメントの種類から関心のあるデータだけを取得することです。たとえば、5 ページのドキュメントから特定のデータを抽出することは、文字列操作で行う場合は非常に面倒です。このフレームワークでは、同じデータ抽出スコープで、さまざまなドキュメント構造に対してさまざまな抽出器を使用できます。抽出結果は、さらに検証するために渡されます。

利用可能な抽出器は以下のとおりです。

正規表現ベースの抽出器は、特定のフィールドに最適な候補を識別するために、正規表現による一致を適用する基本的なデータ抽出器です。
フォーム抽出器は、事前定義されたテンプレートを使用して、構造化された固定フォームのドキュメントの処理を可能にします。
マシンラーニング抽出器は、AI とマシンラーニングのパワーを活用して、UiPath® の公開データ抽出サービスの 1 つを使用するか、または AI Center で構築およびホストできるトレーニング済みのマシンラーニングのカスタムモデルを呼び出すことにより、構造化または半構造化されたドキュメントの情報を識別します。
生成 AI 抽出器を使用すると、生成 AI モデルを使用してドキュメントを抽出できます。

自動データ抽出結果の検証

[検証ステーションを提示] の Attended アクティビティを使用して実現できます。このアクティビティは、データを検証および修正するための、ドキュメント処理固有のユーザーインターフェイスを表示します。

抽出されたデータは、検証ステーションを介して人間のユーザーが検証できます。ベストプラクティスは、実装する特定のユースケースに応じたルールを使用して、人間による検証ステップを追加するかどうかの決定に基づいてロジックを構築することです。その後、検証結果をエクスポートして、以降のオートメーションアクティビティで使用できます。
また、[ドキュメント検証アクションを作成] および [ドキュメント検証アクション完了まで待機し再開] アクティビティを使用して、長期実行のワークフローを通じて人間による検証を有効化し、人間とロボットのコラボレーションを最適化することもできます。

抽出器のトレーニング

このためには、[ 抽出器トレーニングスコープ ] アクティビティを使用できます。これにより、学習可能なデータ抽出アルゴリズムへのフィードバックループを閉じることができます。抽出器トレーナーをこのスコープアクティビティ内にドラッグアンドドロップし、 抽出器を設定 ウィザードを使用してトレーナーを有効化します。 これにより、検証ステーション で人間が検証した情報が抽出器によって使用されるようになり、抽出器のパフォーマンスが向上します。

抽出は、使用される抽出器と同程度に効率的です。フィールド値が適切に抽出されなかった場合は、それらのフィールド値がアクティブな抽出器にとって不明であったことを意味します。このフレームワークは、フィールド値の認識を向上させるために、抽出器をトレーニングする機会を提供します。

マシンラーニング抽出器トレーナーは、AI Center でホストされているマシンラーニングモデルの再トレーニングに必要なデータを収集することにより、ML ベースのデータ抽出のフィードバックループを閉じます。このアクティビティは、[ マシンラーニング抽出器 ] アクティビティのコンパニオンです。

抽出した情報のエクスポート

このためには、[ 抽出結果をエクスポート ] アクティビティを使用します。これにより、抽出したデータの複雑な構造を単純なデータセット (データテーブルの集合) にエクスポートできます。

検証済みの情報を取得したら、それをそのまま使用することも、Excel ファイルに非常に簡単に変換できるデータテーブル形式で保存することもできます。

UiPath.IntelligentOCR.Activities パッケージは、パブリックの UiPath.DocumentProcessing.Contracts パッケージに基づいて構築されている任意のカスタム分類やデータ抽出アクティビティとともに利用できます。ユースケースに固有の独自のアルゴリズムを構築するための完全な柔軟性を提供し、ドキュメント分類およびデータ抽出のためのサードパーティソリューションと連携します。

以下のバージョンのパッケージが公式フィードから削除されました。問題が発生した場合は、サポートチームにお問い合わせください。

このページは役に立ちましたか?

前へリリースノート

次へプロジェクトの対応 OS

既知の制限事項​

削除されたバージョンを置き換える​

重要​

対応しているバージョン​

サポートされる形式​

C# のプロジェクト言語のサポート​

機能​

ドキュメントのデジタル化​

ドキュメントの分類​

自動分類の検証​

分類器のトレーニング​

ドキュメントからのデータ抽出​

自動データ抽出結果の検証​

抽出器のトレーニング​

抽出した情報のエクスポート​