- 基本情報
- フレームワーク コンポーネント
- データ抽出の検証の概要
- 検証ステーション
- データ抽出の検証関連のアクティビティ
- ML パッケージ
- パイプライン
- データ マネージャー (Data Manager)
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
検証ステーション
検証ステーションは、Document Understanding フレームワークを使用してドキュメントから抽出されたデータを検証および修正するために使用できるユーザー インターフェイスです。
検証ステーションは、スタンドアロン ツールとして使用することも、Orchestrator/Automation Cloud Orchestrator と統合して使用することもできます。
また、[検証ステーションを提示] を使用することによって Attended アクティビティとして使用できます。あるいは Orchestrator タスクの一部である [ドキュメント検証アクションを作成]、[ドキュメント検証アクション完了まで待機し再開] を使用すれば、Action Center でのアクションの種類としても使用できます。
検証ステーションが機能するには、特定の入力を行う必要があります。検証ステーションを Attended アクティビティとして設定するために必要な最小限の入力のリストを以下に示します。
- ドキュメントの処理に必要なタクソノミーを入力します。タクソノミーは、タクソノミー マネージャー ウィザードを使用してワークフロー内で直接作成し、[タクソノミーを読み込み] アクティビティを使用して読み込むことができます。また、
DocumentTaxonomy
変数として入力する必要があります。 - 検証するファイルのドキュメント パスを入力します。
- [ドキュメントをデジタル化] アクティビティの出力として得られる、ファイルのドキュメント オブジェクト モデルを入力します。
- 同じ [ドキュメントをデジタル化] アクティビティの出力として得られる、ファイルのドキュメント テキストを入力します。
-
ロボットによって自動的に抽出されたデータを表す自動抽出結果を入力します。この結果は、人間による検証が必要です。このデータは [データ抽出スコープ] アクティビティの出力として得られます。
注: [AutomaticExtractionResults] プロパティ フィールドに変数が入力されていない場合、または入力された変数に分類がまったくパブリッシュされていない場合、検証ステーションは、完全手動処理モードで開きます。
[検証ステーションを提示] アクティビティは、ワークフローのどこでも使用できます。
Attended アクティビティは、処理が必要なファイルが、プロセスを実行するマシンでローカルに使用できる場合にのみ機能します。
実行時にウィンドウが開き、検証ステーションが表示されます。これにより、ユーザー側からの操作が可能になります。
On-Prem Orchestrator またはそれに対応する Automation Cloud Orchestrator の両方で、Action Center にドキュメント検証アクションを追加するオーケストレーション プロセスを作成することにより、生産性を向上させます。このアクションにより、ドキュメントをローカルに保存したり、人間が操作する各マシンにロボットをインストールしたり、人間のユーザーが検証を完了するのをロボットに待機させたりする必要がなくなります。
このアプローチでは、ロボットを Orchestrator に接続し、UiPath Studio でオーケストレーション プロセスの種類のプロジェクトを構築する必要があります。準備ができたら、プロジェクトを Orchestrator にパブリッシュできます。このプロセスの詳細については、こちらをご覧ください。
UiPath Orchestrator でプロジェクトを実行するときは、[ドキュメント検証アクションを作成] アクティビティと [ドキュメント検証アクション完了まで待機し再開] アクティビティを使用する必要があります。これにより、自動の部分を実行する Unattended ロボットと Action Center (オンプレミスまたはクラウドベース) からアクションを選択できる Knowledge Workers との間の接続を作成します。
このシナリオでは、検証ステーションの UI が UiPath Orchestrator の Action Center に直接表示されますが、Attended アクティビティとして実行されるのと同様の機能があります。
検証ステーションは、ファイルから自動抽出されたデータをレビューおよび修正したり、データ抽出用にファイルを手動で処理するための強力なツールです。
検証ステーションを開くと、抽出されたすべての情報が処理されているファイルとともに表示されます。
検証ステーションに表示されるフィールドは、ワークフローで使用されているタクソノミーで定義されたフィールドです。
検証ステーションの右側の領域には、デジタル化プロセスの出力に基づいて、元のドキュメントのインタラクティブ バージョンが表示されます。ここでは、テキストまたはドキュメントを選択し、単語をクリックできます。
また、この領域には、ズーム (拡大/縮小)、ページの選択と回転、ドキュメント内の検索、またはテキスト ビューへの切り替えのオプションがあります。
検証ステーション画面の右側で使用可能なオプションは次のとおりです。
オプション |
説明 |
---|---|
|
ドキュメントのテキストビューとイメージビューを切り替えます。 |
|
ドキュメントを拡大表示します。 |
|
ドキュメントのズーム レベルをリセットします。このオプションは、ドキュメントが以前に拡大または縮小されている場合にのみ有効化されます。 |
|
ドキュメントを縮小表示します。 |
|
現在のページを時計回りに回転します。 |
|
画像ビューにおける選択モードを設定します。 |
|
テキスト ビューにおける選択モードを設定します。 |
|
検証ステーションが使用するドキュメントの結果間の検索を開始します。 |
|
検証ステーションでサポートされている使用可能なすべてのキーボード ショートカットを表示します。 |
[トグル]、[拡大]、[縮小]、および [ズームをリセット] オプションの使用方法の例を以下に示します。
拡大/縮小には、Ctrl + マウス ホイールのスクロールの組み合わせも使用できます。Ctrl + 上スクロールはドキュメントの限定された領域を表示します。Ctrl + 下スクロールはドキュメントのより広い領域を表示します。
以下の例は、[回転] のオプションを示しています。
イメージ ビューでの領域選択の動作例を以下に示します。
また、テキスト ビューでの領域選択は以下のようになります。
次の例では、[検索] オプションの使用方法について説明します。
検証ステーションでの人の操作を最適化するためのキーボード ショートカットが数多くあります。できる限り使用することをお勧めします。これらは、[キーボード ショートカット] ポップアップで確認できます。
ショートカット |
説明 |
---|---|
n |
次のフィールドに移動します。 |
p |
前のフィールドに移動します。 |
f v |
値を検証済みとしてマークします |
f c |
抽出された値を変更します |
f z |
前の値に戻します |
f a |
追加値を追加 |
f s |
候補を切り替え |
Esc |
|
Del |
|
d + |
拡大 |
d - |
縮小 |
d 0 |
ズームをリセットします |
d r |
ページを時計回りに回転します。 |
d t |
テキスト モードを切り替えます |
/ |
検索を開始します |
d s |
選択モードを変更します。 |
→ |
右のセルに移動します |
← |
左のセルに移動します |
↑ |
上のセルに移動します |
↓ |
下のセルに移動します |
t v |
セルを検証済みとしてマークします |
t c |
抽出されたセルを変更します |
t z |
前のセル値に戻します |
t DEL |
選択したセルを削除します |
s ← |
選択した線を左に移動します |
s → |
選択した線を右に移動します |
s ↑ |
選択した線を上に移動します |
s ↓ |
選択した線を下に移動します |
s d |
選択した線を複製します |
s v |
垂直線を選択します。 |
s f |
水平線を選択します。 |
s a |
マウスを移動して線を自動検出します。 |
s t |
てのひらツールによる選択 - 線を移動および削除します。 |
? |
キーボードショートカットリストを開きます |
! |
ドキュメントを例外として報告します |
CTRL Enter |
すべてのデータを保存します |
CTRL DEL |
現在の変更をすべて破棄します。 |
1 2 3 4 5 6 7 8 9 q w e r y u i o a g h j k l b m @ # $ % ^ & ***** ( ) [ ] { ** |
|
使用可能なキーボードショートカットを視覚化します。
左の領域には、実行中の検証に選択したドキュメント型が表示されます。ここでは、各要素のステートを選択して、ドキュメント内の対応するワードや領域にリンクすることができます。
フィールドへの値の割り当てやフィールド間の切り替えに、フィールド ショートカットを使用できます。フィールドに値が割り当てられると、選択されたフィールドの色に応じて、その値が強調表示されます。
代入値に関しては、表フィールドにドキュメントのクロップが表示されます。これは、値の抽出元の場所を特定するために役立つとともに、ドキュメント クロップと比較することで値をダブルチェックする手段としても使用できます。
[ドキュメントの種類] フィールドは特殊なフィールドで、以下のように扱います。
- 抽出結果にドキュメントの種類が含まれ、そのドキュメントの種類が正しい場合、アクションは不要です。
- 抽出結果にドキュメントの種類が含まれ、そのドキュメントの種類が正しくない場合、正しい種類を選択して、ドキュメントからその証拠を提供する必要があります。
- 抽出結果が提供されておらず、タクソノミーに存在するドキュメントの種類が 1 つだけの場合、そのドキュメントの種類があらかじめ選択されていますが、証拠が必要です。
- 抽出結果が提供されておらず、タクソノミーにドキュメントの種類が複数ある場合、必要なドキュメントの種類を手動で選択して、その証拠を提出する必要があります。
情報を含むすべてのフィールドには、 ボタンをクリックしてアクセスできる [オプション] ドロップダウン メニューがあります。ドロップダウン リストが表示され、複数の編集オプションが表示されます。
メニューには、次のオプションが含まれます。
- 抽出値を変更 - 手動で選択した値で自動的に抽出された値を変更します。このフィールドは、ドキュメントから 1 つまたは複数の値が選択され、元の値と異なる場合にのみアクティブになります。
- 前の値に戻す - フィールドの値を最後のステートにリセットします。このオプションは、値が以前に変更または削除された場合にのみアクティブになります。
- 値なしとしてマーク - 情報がドキュメントで利用できない場合、フィールドを値なしとしてマークします。
[検証ステーション] ウィザードの使用時は、さまざまな方法でテキストを選択できます。これらの方法を使用することで、ドキュメント全体にわたりすばやく移動して、フィールド検証の対象とする単語を簡単に選択できます。
以下に、使用可能なすべての選択オプションのリストを示します。
- 1 つの単語を選択 - 目的の単語をクリックします。
- 連続する単語を選択 - 範囲の最初の単語をクリックしてから最後の単語を Shift キーを押しながらクリックします。
- 複数の離れた単語を選択 - 最初の単語をクリックしてから、それ以外の目的の単語を CTRL キーを押しながらクリックします。
- 複数の選択を組み合わせる - 最初の選択範囲の最初の単語をクリックしてから最後の単語を SHIFT キーを押しながらクリックします。その後、他の選択範囲をすべて選択し終わるまで、CTRL キーを押しながらクリックするか、SHIFT キーを押しながらクリックして繰り返し追加します。
- 領域選択 - 領域を選択します。次のいずれかの選択の種類を選択してください。
- トークン - 選択した領域のすべての単語を選択します。
- カスタム領域 - 領域だけをキャプチャし、その内部の単語は選択しません。
フィールドの値の編集 - そのフィールド上にマウスを乗せ、値をクリックし、目的の入力を追加することにより、フィールドの内容を変更します。
オプション - その前のステートにフィールドを戻します。このオプションを 1 回クリックすると、1 ステップ戻ります。そのフィールドで複数の変更を行った場合、特定の値に戻るには複数回のクリックが必要になる場合があります。このフィールドは、値が以前に変更または削除されたときにのみアクティブになります。
オプション - カスタム エリアまたはトークンを選択して、フィールドに値を追加します。このボタンは、ドキュメントでフィールドでの選択とは異なる選択が行われたときに使用できます。選択は常に複数値フィールドに対して行うことができ、単一値フィールドに対しては、そのフィールドに値が存在しない場合にのみ行うことができます。
オプション - フィールドに含まれる情報を確認します。確認されると、 のようにチェックボックスが青色に変わります。
検証ステーションのインターフェイスは対話型です。左側でフィールドが選択されると、右側でフィールドが強調表示されてフォーカスが移動します。
これは、テキスト ビューにも当てはまります。
オプション - 特定のフィールドにドキュメントから追加の値を選択して追加することができます。
オプション - ドキュメントからの参照なしでフィールドに値を追加できるようにします。
以下に、テーブル フィールドで使用可能なすべてのオプションの説明があります。
Icon |
説明 |
---|---|
|
ドキュメント内の表の領域を示します。 |
|
次のオプションを含むドロップダウン リストが開きます。
|
|
選択されていると、データの精度を確認します。 |
|
フィールドの値がない場合に有効化されます。 |
|
最初に抽出された値が変更または削除されたときに有効化されます。選択されていると、以前の値が復元されます。 |
|
値、この場合は既存の表を削除します。 |
すべての表フィールドに次のオプションを含むドロップダウン メニューがあります。
- 抽出値を変更 - ドキュメントから新しい値を選択し、最初の値を置き換えます。このフィールドは、新しく選択された値が元の選択と異なる場合にのみ使用できます。
- 前の値に戻す - 実際の値を前の値に置き換えます。このフィールドは、初期値を変更する場合にのみアクティブです。
- 値なしとしてマーク - 情報がドキュメントで利用できない場合、フィールドを値なしとしてマークします。
各行の最後にあるドロップダウン メニューには、次のオプションがあります。
- 表のヘッダーにする - 選択した行を表のヘッダーにします。行は表の本文に表示されなくなりますが、ヘッダーのフィールドが選択されるといつでも情報を視覚化できます。
-
上に行を挿入 - 選択した行の上に新しい行を追加できます。行は、すべてのフィールドを未抽出とマークする以外は、自動的に表に追加されます。手動でドキュメントから値を選択して、[抽出された値の追加] オプションを使用して、それを追加する必要があります。このオプションの使用方法の例を以下に示します。
- 下の行を挿入 - [上に行を挿入] オプションと同じ原理を適用し、唯一の違いは、行は実際の選択の上ではなく下に挿入される点です。
- 行を削除 - 選択した行を削除します。
[新しい表を抽出] オプションを使用する場合、[ヘッダーを抽出] 機能を有効にすることで表のヘッダーを定義できます。そのためには、ドキュメントからの情報を選択するか、既存の行のいずれか 1 つを表のヘッダーに変換します。
-
[新しい表を抽出] オプションをアクティブ化したうえで [ヘッダーを抽出] 機能を有効にすることで、ヘッダーを定義済みの表を抽出します。
-
ヘッダーに自身を配置し、表からそれに相当するものを選択することにより、表のヘッダーを確認します。値を選択したら、ドロップダウン メニューの [抽出値を変更] をクリックします。
-
行の 1 つ上に自身を配置し、[表のヘッダーにする] オプションをドロップダウン メニューから選択して、表のヘッダーに既存の行を変換します。
検証ステーション ウィザードから直接、表を手動で選択して定義できます。表が選択されていない場合、または自動選択では不十分な場合は、最初の行の最後にあるドロップダウン メニューにあるオプションを使用できます。
表のセルの値が抽出されない場合は、表のセルに手動で値を追加できます。それには、選択モードにして [カスタム領域] オプションを選択し、表のセル領域をマークします。
[新しい表を抽出] と [ここから行を抽出] オプションは、同じ機能を使用し、新しい値を定義できます。
- 新しい表を抽出 - 新しく選択した表で既存の表を置き換えます。すべての行と列をマークする必要があります。最初の行が表のヘッダーになることに注意してください。
- ここから行を抽出 - カスタム選択ツールを有効化し、新しい行を手動で選択し、現在選択されている行の下に追加できるようにします。新しい行の領域を選択したら、各列を定義する必要があります。これを行うには、次の表に示す使用可能なオプションを使用します。
- 行を強調表示 - 表の選択した行を強調表示します。
-
表を強調表示 - 抽出した表領域全体を強調表示します。
-
すべての行を削除 - 既存の表を削除します。
Icon
機能
選択範囲に表示されているすべての行を削除します。
選択範囲から選択した行のみを削除します。
選択範囲の水平線を有効化します。
選択範囲の垂直線を有効化します。
マウスを使用して線の方向を調整できます。
行の選択、再配置、および削除を有効化します。
-
以下に、新しいテーブル行を抽出する方法と使用可能なオプションを利用する方法の例を示します。行の追加時にはヘッダー抽出機能を利用できません。
[新しい表を抽出] オプションを使用して、新しい表を抽出する方法は次のとおりです。
[新しい表を保存] ボタンをクリックして自動的にすべてのフィールドを確認したり、[いいえ] ボタンをクリックして操作を拒否し、表に戻り、手動で各フィールドを確認することができます。
[数値]、[日付]、[アドレス] フィールドを使用すると、特定の値の書式設定された (解析された) 部分をレビューおよび修正できます。編集可能な部分は次のとおりです。
フィールドの種類 |
編集可能な書式設定された部分 |
---|---|
Number |
値 (Value) |
日付 |
|
Address |
|
名前 |
|
これらいずれかの種類のフィールドの値を抽出または修正すると、検証ステーションは、値を書式設定されたコンポーネントに自動的に解析しようします。
言語設定では、デジタル化処理の過程で特定され、検出された、ドキュメント内で最も頻繁に使用されている言語が表示されます。これにより、検証ステーションは、ドキュメントの言語に従って、数値や日付をより正確に解析できます。言語設定はドロップダウン メニューから変更できます。
変更した場合、ユーザーが日付や数値を手動で抽出または変更すると、検証ステーションは、選択された文字列を、まずは選択された言語で書式設定しようとします。そして、解析が適切に行われなかった場合に、米国英語にフォールバックします。書式設定機能は、値の編集可能な書式設定された部分に対してのみ適用され、元の文字列値には適用されません。
書式設定された値の自動検出を最適化できるように、検出された言語を確認し、必要に応じて修正することをお勧めします。
ドキュメントを例外として報告するオプションがあります。例外が発生した場合は、[検証ステーションを提示] により例外がスローされるので、RPA ワークフローでそれを捕捉して個別に処理する必要があります。例外メッセージには、ユーザーが入力した「例外の理由」が表示されます。
ドキュメントを例外として報告する方法は以下のとおりです。
すべてのフィールドを手動または自動で確認するオプションがあります。手動で確認するには、各フィールドのチェック ボックスを選択する必要があります。チェック ボックスが手動で確認されない場合、[保存] ボタンをクリックするとこのプロセスが自動的に実行され、[続行 & 保存] ボタンをクリックするとアクションが確認されます。
検証ステーションの下部では、次のオプションを使用できます。
ボタン |
機能 |
---|---|
|
確認済みのフィールドを保存します。 |
|
表選択領域を保存して閉じます。このボタンは、テーブル フィールドがアクティブな場合にのみ有効化されます。 |
|
ドキュメントを例外として報告します。 |
|
すべての値が手動で確認されない場合にのみ有効化されます。これを選択すると、すべてのデータが自動的に確認および保存されます。 |
|
表に変更が加えられていない場合に有効化されます。 |
|
表が変更された後に有効化されます。 |
|
ユーザーが [無視] をクリックすると有効化されます。表に対する変更がすべて無視されます。 |