Document Understanding - マシンラーニング抽出器

document-understanding

2021.10

false

Document Understanding ガイド

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

マシンラーニング抽出器

マシンラーニング抽出器とは

マシンラーニング抽出器は、データ抽出の対象データを識別および報告するためにマシンラーニングモデルを使用するデータ抽出ツールです。

このアクティビティは UiPath Document Understanding モデルのコンパニオンであり、ワークフロー内でそのようなモデルを使用する手段です。

マシンラーニングを使用するアプローチは、さまざまなドキュメントプロバイダーによってレイアウトが大きく異なる構造化または半構造化ドキュメントからデータを抽出する場合に強く推奨されます。このアプローチでは、抽出器はトレーニングされたマシンラーニングモデルを使用します。このモデルは学習することができ、今まで処理したことのないドキュメントやレイアウトでも対象フィールドの値を推測できます。つまり、ドキュメントがテキストパターンやレイアウトパターンに従っていないユースケースにおいて、マシンラーニング抽出器はよい選択肢です。

マシンラーニングモデルは、複数の方法で使用できます。

特定のドキュメントの種類を対象にした一般的なモデルを使用する場合、UiPath Document Understanding のいずれかのパブリックエンドポイントで使用できます。
UiPath Document Understanding の利用可能モデルから始まる、カスタムでトレーニングされたマシンラーニングモデルで使用できます。

この抽出器はトレーニング/再トレーニングできます。詳細については、「トレーニング方法」セクションをご覧ください。

重要: 50 x 50 ピクセルよりも解像度が低い画像は処理できず、エラーを生成します。

特別な要件

以下を使用する必要があります。

データ抽出用の UiPath Document Understanding のいずれかのパブリックエンドポイント
Automation Cloud の AI Center でホストされるマシンラーニングモデル
オンプレミスの AI Center でホストされているが、Automation Cloud でライセンスされており、Automation Cloud Document Understanding の API キーを使用する必要のあるマシンラーニングモデル

オンプレミスのライセンスでマシンラーニング抽出器を使用するには、オンプレミスの AI Center (エアギャップインストール) インスタンスで Document Understanding モデルをホストする必要があります。

設定方法

アクティビティの設定

使用しているエンドポイントが Automation Cloud でライセンスされている場合は、Automation Cloud Document Understanding の API キーを指定する必要があります。

UiPath Document Understanding のパブリックエンドポイントまたは AI Center のパブリック ML スキルでマシンラーニング抽出器を使用している場合は、対応する URL でアクティビティの [エンドポイント] 引数を設定する必要があります。

デプロイした ML スキルでマシンラーニング抽出器を使用している場合は、アクティビティの [ML スキル] 引数を、AI Center でホストされている ML スキルリストから正しく選択して設定する必要があります。

両方のオプションを設定しようとすると、設定ウィザードまたは直接ワークフローにエラーが表示されます。

マシンラーニング抽出器の機能を設定する

[データ抽出スコープ] に初めてドロップされると、マシンラーニング抽出器は設定ウィザードを開きます。[データ抽出スコープ] の抽出器を設定ウィザードを開き、抽出器名の下にある設定アイコンをクリックしても、同じウィザードを使用できます。

このウィザードでは、[エンドポイント] または [ML スキル] を入力し、[API キー] を指定できます (必要な場合)。[エンドポイント] と [API キー] を入力する場合は、引用符なしで入力する必要があり、値を変数にすることはできません。

[アクティビティの引数を更新] オプションを使用して、ウィザードで追加した値をアクティビティの引数にあらかじめ設定することもできます。

[機能を取得] オプションをクリックすると、データ抽出を正しく設定できるように、マシンラーニング抽出器は内部機能 (どのドキュメントの種類およびどのフィールドの処理が可能か) を「読み取って報告」します。

ワークフローで使用する ML スキルまたはエンドポイントを変更するたびに、マシンラーニング抽出器機能のウィザードを使用して、[データ抽出スコープ] での設定とタクソノミーのマッピングが有効なままであることを確認することをお勧めします。

[データ抽出スコープ] でマシンラーニング抽出器を設定する

ML Extractor Capabilities ウィザードを実行すると、抽出器を設定ウィザードで、タクソノミーマッピング用のテキストボックスは表示されず、ドロップダウンリストが表示されることがわかります。

データを抽出するドキュメントの種類を展開して、対象とするフィールドの選択を開始します。対象のフィールドの横にあるチェックボックスをチェックし、表示されるドロップダウンリストから、特定の各フィールドにマッピングする ML モデルの適切なフィールドを選択します。ドロップダウンリストには、[マシンラーニング抽出器] が、[マシンラーニング抽出器] ウィザードで入力されたエンドポイントを使用し、抽出機能として宣言した、すべてのフィールドが含まれます。

抽出器の最新機能を使用しているかどうかを確認するには、[抽出器機能を取得または更新] をクリックして、[マシンラーニング抽出器] ウィザードを開きます。

重要: 2 つの異なるフィールドに対して同じオプションを選択することはできません。

抽出器のトレーニング機能も使用する場合は、[フレームワークエイリアス] 設定フィールドに一意の英数字の文字列値を入力し、完全なトレーニングデータを受け取る必要のあるトレーナーに対して、[抽出器トレーニングスコープ] 設定の対応する [フレームワークエイリアス] フィールドでまったく同じ文字列値を使用することを強くお勧めします。

すべてのデータを適切に設定したら、[保存] ボタンを選択します。

トレーニング方法

マシンラーニング抽出器モデルインスタンスのトレーニングデータを収集するには、[抽出器トレーニングスコープ] で [マシンラーニング抽出器トレーナー] アクティビティを使用します。このように収集されたデータは、AI Center (クラウドまたはオンプレミス) のインスタンスでキュレーションに使用し、その後トレーニングのためにインポートできます。

マシンラーニング抽出器とは
特別な要件
設定方法
アクティビティの設定
マシンラーニング抽出器の機能を設定する
[データ抽出スコープ] でマシンラーニング抽出器を設定する
トレーニング方法

このページは役に立ちましたか?

前へインテリジェントフォーム抽出器

次へFlexiCapture 抽出器

マシン ラーニング抽出器

マシン ラーニング抽出器とは