- 基本情報
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- データ マネージャー (Data Manager)
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
インテリジェント フォーム抽出器
インテリジェント フォーム抽出器は、レイアウトが固定されたドキュメントのデータを抽出するための処理を行う専用ツールです。フォーム抽出器をベースにして構築され、フォーム抽出器の機能に加えて次のような機能も利用できます。
- 手書き認識および手書きデータの抽出
- 署名の検出
インテリジェント フォーム抽出器の追加機能は、フォーム抽出器と比較して、以下のようなすべての種類のフォームの処理に非常に適しています。
- 印刷または手書き
- フォームが署名されているか否かの確認が必要
フォーム抽出器に既に存在する設定に加えて、これら 2 つの追加機能を、アクティビティのテンプレート マネージャー ウィザードで設定できます。
この抽出器には学習 (トレーニング) 機能がなく、事前の設定が必要です。
インテリジェント フォーム抽出器について詳しくは、以下のページをご覧ください。
- [インテリジェント フォーム抽出器] アクティビティのページ
- タクソノミー マネージャー - 設定手順
- テンプレート マネージャー ウィザード - 設定手順
- アンカーベースのワークフローの例
このツールを使用するには、Automation Cloud Document Understanding の API キーを使用するか、オンプレミスの AI Center でインテリジェント フォーム抽出器の独自インスタンスをホストする必要があります。
インテリジェント フォーム抽出器には、考慮すべき主要な設定が 2 つあります。
- テンプレート マネージャー ウィザード - 処理するドキュメントに適用するテンプレートを定義できます。このウィザードでは、テンプレート エディターを使用したり、ブール値フィールドの解釈を設定したりできます。
- [重複率の最小値] の設定 - 値領域の一致度の厳密さを制御できます。
0
から100
の値を指定できます。単語の位置がテンプレートで定義された領域にどの程度適合しているかに基づいて、その単語を特定の値の一部として受け入れるか拒否するかを決定します。
分類データで定義されたドキュメントの種類のテンプレートの作成、編集、管理ならびにエクスポート/インポートを可能にします。
テンプレートを作成する
- [データ抽出スコープ] 内のワークフローに [インテリジェント フォーム抽出器] アクティビティを追加します。
- [テンプレートを管理] ボタンをクリックして抽出器を構成します。
- [テンプレート マネージャー] ウィンドウが開きます。
- [テンプレート マネージャー] ウィンドウが開きます。
- [テンプレートを作成] ボタンをクリックして新しいテンプレートを作成します。
- [ドキュメントの種類] ドロップダウン リストから、テンプレートのドキュメントの種類を選択します。
注: [ドキュメントの種類] は、すべてタクソノミーに基づいています。必ず、プロジェクトのフォルダー内にタクソノミーを追加または作成してください。
- [テンプレート名]] フィールドに名前を追加します。ドキュメントのバージョンやレイアウトを反映する適切な名前を選択してください。
- [テンプレート ドキュメント] フィールドにドキュメント パスを追加します。
- [参照] ボタンにより、ファイルのパスに移動します。
- [OCR エンジン] ドロップダウン リストから OCR エンジンを選択し、必要に応じて設定します。
- [設定] ボタンをクリックして、テンプレートの編集をトリガーします。
OCR エンジンは必要な場合にのみ適用されます。テンプレートを作成するために選択されたドキュメントがネイティブ PDF である場合、OCR エンジンは実行されません。ただし、[OCR を強制適用] オプションをオンにした場合を除きます。このオプションをオンにすると、ネイティブ PDF ファイルにも OCR が適用されます。
各 OCR エンジンには、それぞれ独自のカスタム オプションが付属しています。各 OCR エンジンで利用可能なすべてのオプションに関する詳細は、こちらをご覧ください。
テンプレートを作成済みの場合、これを編集、エクスポート、または削除できます。
[削除] と [エクスポート] ボタンは、テンプレートを少なくとも 1 つ選択したときのみ使用できるようになります。個別のテンプレートの [編集] および [削除] オプションは、いつでも使用できます。
Boolean フィールド処理を設定する
チェック ボックスを含むドキュメントの場合、[はい] や [いいえ] のオプションに関して既知の類義語を追加できます。または UiPath がコンパイルしたリストから始めることも可能です ([推奨する文字列を追加] の提示をご覧ください)。これらの値は、Boolean の内容解釈に使用されます。この解釈では、キャプチャした値を報告する値 ([はい] または [いいえ])にマッピングします。
テンプレートをエクスポートおよびインポートする
他のワークフローで作成およびエクスポートされたテンプレートをインポートできます。これらの機能を使用してプロジェクト間でテンプレートを共有します。インテリジェント フォーム抽出器を使用してドキュメントの種類を設定した後は、新しい実装でテンプレートを再設定する必要はありません。
エクスポートの手順
テンプレートをエクスポートするときに従う必要がある手順を以下に示します。
- このページの前半で説明した手順に従い、1 つ以上のテンプレートを作成します。
- エクスポートするテンプレートを選択します。
- 次のスクリーンショットのように、[エクスポート] オプション (元のファイルを含める/含めない) を選択します。元のファイルを含めるエクスポートでは、元のファイルが添付されます。
- 希望の名前でテンプレートのアーカイブを保存します。
- テンプレートが保存されると、メッセージが表示されます。[OK] ボタンを選択します。
注:
テンプレートを作成したドキュメントのコンテンツを共有できない場合は、「元のファイルを含めない」オプションを使用します。他のプロジェクトでテンプレート アーカイブを共有およびインポートすることはできますが、編集や表示はできなくなります。
別のプロジェクトでインポートしたテンプレートを編集する場合は、エクスポートしてからインポートする際に「元のファイルを含める」オプションを使用してください。
インポートの手順
テンプレートをインポートするときに従う必要がある手順を以下に示します。
- [インポート] ボタンを選択します。
- アーカイブを選択します。インポート ウィザードが表示され、選択したエクスポート アーカイブで使用できるドキュメントの種類とテンプレートがすべて提示されます。インポートするテンプレートを、適切なインポート オプション (元のファイル含む / 含まない) とともに選択します。
注:
- テンプレートがインポートされると、プロジェクトの分類データ内にドキュメントの種類が自動的に作成されます。同名のドキュメントの種類が既に存在する場合、名前の末尾に数字を付加して、もう 1 つのドキュメントの種類が作成されます。
- 元のファイルなしでエクスポートされたテンプレートをインポートする場合、または元のファイル含めずにテンプレートをインポートする場合、それらのテンプレートに対しては表示または編集のオプションを使用できません。
テンプレートのインポート時の特殊な状況
テンプレートをインポートすると、いくつかの特殊な状況が発生する場合があります。次の表で、各状況について、その特殊性を含めて説明します。
インポートの種類 |
アクティビティの動作 |
---|---|
新しいドキュメントの種類 |
新しいドキュメントの種類をインポートすると、ウィザード コンフィギュレーターに新しいフィールドが追加され、新しいテンプレートが作成されることを知らせます。 |
重複するドキュメントの種類 |
同一のドキュメントの種類をインポートすると、次の警告メッセージが表示されます。
|
拡張テンプレート |
既存のフィールド以外のフィールドが追加されたドキュメントの種類のテンプレートをインポートすると、次の警告メッセージが表示されます。
|
拡張されたドキュメントの種類 |
既存のフィールド以外のフィールドが追加されたドキュメントの種類をインポートすると、次の警告メッセージが表示されます。
|
同じ名前で内容が異なるドキュメントの種類 |
既存のものと同じ名前でありながら、フィールドが異なるドキュメントの種類をインポートすると、次の警告メッセージが表示されます。
|
表が欠落したドキュメントの種類 |
ユーザーが表を含まないドキュメントの種類をインポートすると、次の警告メッセージが表示されます。
|
表が拡張されたドキュメントの種類 |
余分な列がある表を含むドキュメントの種類をインポートすると、次の警告メッセージが表示されます。
|
表が縮小されたドキュメントの種類 |
列が欠落した表を含むドキュメントの種類をインポートすると、次の警告メッセージが表示されます。
|
異なるドキュメントの種類による表のテンプレート |
異なるドキュメントの種類の表を含むドキュメントの種類のテンプレートをインポートした場合、新しいテンプレートが作成されます。 タクソノミーに、ドキュメントの種類が異なるフィールドを持つ表が含まれている場合、次の警告メッセージが表示されます。
|
一般的な考慮事項
テンプレート エディターは、検証ステーションにある機能をベースにして構築されています。アクセスするには、テンプレートの ボタンをクリックします。
検証ステーションの基本的な使用法については、こちらのセクションをご覧ください。
検証ステーション画面の右側で利用可能なオプションのほかに、テンプレート エディター固有のオプションが 2 つあります。
オプション |
説明 |
---|---|
|
アンカー選択モードを設定します。 |
|
アンカーの選択をすべてクリアします。 |
新しいテンプレートを作成すると、テンプレート エディターを最初に開くときに説明のテキストが表示されます。テキストに再度アクセスする場合は、以下の手順を実行します。
アンカーを設定する
テンプレート マネージャーからテンプレート エディターを開いたら、アンカーを定義できます。アンカーは [選択モード] オプションに含まれています。
ページレベルのテンプレートを定義または編集するときに最初に実行すべきことは (任意ですが)、[ページ 1 の一致情報] を選択することです。この手順は、固定フォーム テンプレートの場合にのみ必要になります。
画面左側に表示される [ページ 1 の一致情報] の選択には、テンプレートの最初のページからのテキスト入力 (トークンのみが受け入れられます) が必要です。これは、その特定のテンプレート レイアウト内で常に同じ位置にあり、特定のドキュメントの種類に定義されたすべてのテンプレートで一意の単語のグラフを (単語間の相対距離や角度を考慮して) 形成します。
言い換えれば、[ページ 1 の一致情報] (および他のすべてのページ一致情報フィールド) は特定ページの「指紋」であり、実行時に適合するテンプレートを識別するのに幅広く使用されます。
このため、[ページ 1 の一致情報] フィールドには 10 ~ 20 の単語を選択することが強く推奨されます。できれば、ページ領域全体に渡るくらいの長さにしてください。
他の「ページの一致情報」系のフィールド (テンプレート ページごとに 1 つ) には、その特定のページからデータ抽出を試みていて、テンプレート間の一意性が不要な場合にのみ値を入力する必要があります。特定のページからフィールドを抽出する必要がない場合、そのページのページレベルの一致情報の定義は必須ではありません。
単純フィールドを設定する
テーブル以外のすべてのフィールドでは、テンプレートの設定は、カスタム領域の選択とそれらの特定フィールドへの割り当てで構成されます。
固定フォームの設定の場合、データ フィールドはカスタム領域の選択を使用してのみ設定できます。
1 つのフィールドに対して、(+) ボタンを使用してこうしたカスタム領域を 1 つ以上定義できます。1 つのフィールドに 2 つ以上のカスタム領域が定義されている場合、実行時に、フィールドが分類データで単一の値として定義されていると、すべての値が 1 つの報告値に連結されます。フィールドが複数値として定義されていると、各値が個別に報告されます。
以下のアニメーションは、トークンとカスタム領域の選択の違いを示しています。
各フィールドの横のアイコンは、サポートされている選択の種類を示します。
空の領域を選択した場合、選択領域は自動的に [カスタム領域] として設定されます。選択した領域にテキストが検出されると、選択領域の種類として [トークン] または [カスタム領域] のどちらかを選択するよう求められます。
検証ステーションの「選択モード」機能を使用して、トークンとカスタム領域間の選択の切り替えをロックします。
テーブルを設定する
上記のように、トークンによってのみ (「ページの一致情報」系のフィールドなど) またはカスタム領域によってのみ (簡易フィールドなど)、情報を追加できるフィールドがあります。「テーブル」系のフィールドでは、以下を行うことができます。
- テーブル エディターを展開したら、各セルを 1 つずつ定義する - 各セルに個別にカスタム領域の選択を追加します。
- テーブル マークアップ機能を使用する - テーブル領域をマークし、行および列の区切りを作成して、マークしたテーブルをフィールドに割り当てます。抽出領域の列数と行数がテンプレート領域と同じであることを確認します。
テーブル マークアップ機能の使用方法については、以下のアニメーションをご覧ください。
データの抽出元のカスタム領域の境界は、フィールドレベルのアンカーの使用という特殊な方法で定義します。それにより、フィールドレベルの設定に基づいてデータ抽出の対象を指定し、フォーム抽出ルールをより柔軟に定義できるようになります。
その結果、実行時にインテリジェント フォーム抽出器が以下の方法を認識します。
- ページレベルのテンプレートが一致するかどうかを明らかにし、認識する最適なページレベルのテンプレートの一致に従って情報を抽出する。
- アンカーベースの設定が一致するかどうかを明らかにし、処理するドキュメントでの用途に応じて情報を抽出する。
- すべての利用可能なオプションの最高の結果 (最も可能性の高い一致) を報告できるように、考えられるすべての一致に対する適切な信頼度スコアを計算する。
新しいアンカーの設定を作成する
- アンカー選択モードになっていることを確認します。
- 値の領域の周囲にボックスを描画します。
- 値の領域のラベル (メイン アンカー) を選択します。具体的には、選択範囲の最初の単語をクリックしてから、最後の単語を Ctrl キーを押しながらクリックするか、単語範囲の開始位置でマウスをクリックし、そのままドラッグして、終了位置で放してキャプチャします。
注: ラベルには、同じ表示ラインからの連続する単語だけを含めることができます。
- ラベルを一意に特定する追加のアンカーを選択します。同じ選択の原則が適用されます。
- 特定のフィールドで [値を抽出] を選択することによって、アンカーの構成を適切なフィールドに割り当てます。
注: こちらの例を使用して、テンプレートを作成し、抽出領域とアンカーを定義する方法を学ぶこともできます。
既存のアンカーの設定を編集する
- アンカーの設定を強調表示します。
- アンカーの設定を変更します (アンカー、ラベル、(必要に応じて) 値領域の削除、新しい要素の追加など)。
- [抽出値を変更] オプションを使用して、フィールドの関連付けを更新します。
注:- 対象の領域を削除するとすべてのアンカーが削除されるので、最初からやり直します。
- ラベル (メイン アンカー) を削除すると、残りのアンカーのうち最初に作成されたものが新しいラベルになります。
既存のアンカー設定を削除する
アンカーの設定を削除するには、以下の操作を実行します。
- 保存された値に対して、[不足としてマーク] オプションを使用します。
- 指定したフィールドに定義されたアンカーのリストの場合は、[値を削除] を使用します。
さまざまな設定を組み合わせる
同じドキュメントの種類に対して、必要な数のテンプレートを定義できます。複数のページレベル テンプレート、同じフィールドに対する複数のアンカー、ページレベルとフィールドレベルの両方のアンカーを含むテンプレートも利用できます。
- フィールドレベルのアンカーを定義するときは、ラベルが値領域の近くにあることを確認してください。また、同じドキュメント内の複数の場所に同じテキスト構造がある場合は、ラベルが追加のアンカーでサポートされていることを確認してください。
- ラベルとアンカーが長いほど、精度が高くなります。
- 値の領域は常に、ラベル (メイン アンカー) に対する相対位置に基づいて計算されます。それに応じて、メイン アンカーを選択します。
- フィールドレベルのアンカーを使用すると、フィールドをテンプレート内で移動して、引き続きキャプチャできるため、ドキュメント レイアウトをさらに自由に変更できるようになります。