- 概要
- Document Understanding Process
- クイックスタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- データ マネージャー (Data Manager)
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
Data Manager について
UiPath Document Manager は、Document Understanding マシン ラーニング モデルのトレーニングと評価に必要なデータセットを準備、レビュー、修正できる軽量の Web アプリケーションです。
オンプレミスでのデプロイ方法は以下のとおりです。
- オンプレミス版の AI Center 内の Data Manager です。一般提供されており、運用シナリオでの使用が完全にサポートされています。インポートできるデータセットのサイズに制限はありません。ただし、自動再トレーニングは例外であり、1 回のインポートあたり 2000 ページまたは 2 GB の制限があります。オンプレミスで利用可能な AI Center のすべてのデプロイ方法については、こちらのページをご覧ください。
Data Manager によって、データのバッチ、データの準備、モデルの設定に伴う各種操作を複数のユーザーが実行できます。
ML モデルで抽出するフィールドを定義・設定します。
ラベル付けのためにドキュメントをインポートします。
UiPath が提供する、すぐに使える既存の ML モデル (請求書抽出や領収書抽出など) や、AI Center でトレーニングしたモデルを使用して、ドキュメントの事前ラベル付けを行います。
ドキュメントのラベル付けを行います。
AI Center のトレーニング パイプラインで使用できる形式で、ドキュメントをエクスポートします。
Data Manager インターフェイスには、以下のパネルがあります。
Data Manager のページの上部に表示されます。
複数の操作を実行できます (ドキュメント間の移動、ドキュメントの削除/復元、ドキュメントの検索/フィルター処理、AI モデルの予測の実行、ドキュメントのインポートとエクスポート)。
以下に、管理バーで利用可能なオプションを示します。
オプション |
Icon |
説明 |
---|---|---|
ナビゲーション |
|
アクティブなフィルターに一致するドキュメント間を移動します。2 つの矢印の間にカウンターが表示されます。アクティブな検索/フィルターに一致するドキュメントの総数のうち、現在のドキュメントの数を示します。 |
|
ドキュメントを検索またはフィルター処理します。フィルターはドキュメントのエクスポート時にも適用されます。ドキュメント内の単語またはドキュメント名でフィルター処理することもできます。 | |
削除/復元 |
/ |
ドキュメントを削除または復元します。削除したドキュメントは、deleted フィルターで検索できます。 |
予測 |
|
AI モデルの予測を実行し、結果を表示します。 事前ラベル付けを設定すると、管理バーでこのボタンが有効化されます。このボタンをクリックすると、現在のドキュメントの事前ラベル付けが行われます。 現時点では、パブリック エンドポイントを使用して [予測] オプションを使用すると、ドキュメントの最初の 10 ページにしか事前ラベル付けが行われません。これは既知の問題であり、現在修正が行われています。なお、AI Center で ML スキルを使用して [予測] オプションを使用した場合には、そのような制限はありません。 |
|
[データをインポート] ダイアログ ボックスを開きます。 | |
|
[ファイルをエクスポート] ダイアログ ボックスを開きます。 | |
|
アイコンをクリックすると、元のドキュメントを含む Zip ファイルをダウンロードできます。 | |
|
OCR と事前ラベル付けの設定を行ったり、[使い方] パネルにアクセスしたりします。詳しくは、以下をご覧ください。 |
ダウンロードする
.jpeg
画像に変換されたすべてのページもダウンロードされます。
ドキュメントの名前、種類、セッション名
アイコンの右側には、現在アクティブなドキュメントの名前、その種類、およびセッション名が表示されます。
ドキュメントには以下の 3 種類があります。
- トレーニング ドキュメント
- 検証ドキュメント
- 評価ドキュメント
トレーニング ドキュメントと検証ドキュメントは、トレーニング パイプラインで使用されるトレーニング データセットの一部です。
評価ドキュメントはトレーニング パイプラインでは無視され、AI Center の評価パイプラインでのみ使用されるようになっています。評価ドキュメントは、[データをインポート] ダイアログ ボックスの [これを評価セットにする] チェックボックスをオンにして評価用としてマークしたドキュメントを指します。
Data Manager にドキュメントをインポートするために使用する OCR エンジンの選択は、重要です。
モデルをデプロイする際 (実行時) に使用する OCR と同じ OCR を、トレーニング データをインポートする際 (トレーニング時) にも使用することをお勧めします。
いくつかの異なる OCR を試して、使用するドキュメントに最適な OCR を見定めてからその OCR に決めるのが理想的です。
オンプレミスのオプションは以下のとおりです。
- UiPath OCR コンテナー - 西ヨーロッパの主要な言語をサポートします。
- Microsoft Read コンテナー (Microsoft でプレビュー版として利用可能) - 多数の言語をカバーしています。
- UiPath OCR ML スキル - v2020.10 以降のオンプレミス版 AI Center でデプロイされています。
クラウドベースのオプションは以下のとおりです。
- UiPath Document OCR - https://du.uipath.com/ocr
- Google Cloud Vision OCR - 対応している言語の種類は最多です。
- Google Cloud Vision OCR for Japanese - 日本語ドキュメントの読み取りに最適です。
- Microsoft Read OCR
OCR を設定するには、OCR サービスに URL が必要です。使用できる URL は以下のとおりです。
- パブリック URL (例: https://du.uipath.com/ocr) または Google Vision OCR や Microsoft Read OCR のサードパーティの URL
- オンプレミスでデプロイされた UiPath によって提供される UiPath Document OCR のスタンドアロン コンテナーの URL
-
v2020.10 以降のオンプレミス版 AI Center で公開されている、ML スキルとしてデプロイされた OCR ML パッケージの URL
重要:Data Manager と同じマシンで OCR を実行している場合は、ローカル マシンを参照する際にlocalhost
は使用せず、ローカル マシンの IP アドレスまたはドメイン名を使用してください。オンプレミス版の AI Center にパブリック ML スキルとしてデプロイされた OCR の URL の場合は、AI Center の ML スキルの詳細画面に表示される URL を使用してください。
選択した OCR エンジンに対応する API キーです。たとえば、UiPath Document OCR の場合、Document Understanding の API キーを使用する必要があります。Data Manager Cloud および Data Manager On-Prem Online の場合は必須です。オンプレミスのエアギャップされた Data Manager では不要です。
事前ラベル付け
ラベル付けが必要なフィールドの一部を抽出できるモデルを既に所持しており、追加で手動のラベル付けが必要なフィールドがほとんどない場合、Data Manager の事前ラベル付け機能を使用すると、時間を大幅に節約できます。
次のオプションを使用できます。
事前ラベル付けを行うには、ML モデルに URL が必要です。使用できる URL は以下のとおりです。
- パブリック URL (例: https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders)
- エンドポイントの完全なリストについてはこちらをご覧ください。
- オンプレミスの AI Center または AI Center Cloud で公開されている ML スキルの URL
エアギャップ環境にデプロイされたオンプレミス版 AI Center の ML スキルは、事前ラベル付けに使用できません。
localhost
は使用せず、ローカル マシンの IP アドレスまたはドメイン名を使用してください。
オンプレミス版 AI Center の、パブリック ML スキルの URL の場合は、AI Center の ML スキルの詳細画面に表示される URL を使用してください。
Document Understanding の API キーです。Data Manager Cloud および Data Manager On-Prem Online の場合は必須です。オンプレミスのエアギャップされた Data Manager では不要です。
使い方
[使い方] オプションから、Data Manager のヘルプ メニューにアクセスできます。
以下の項目が含まれます。
- Data Manager のバージョン
- 製品ガイドのページへのリンク です。
- [ラベル付けのコントロール] セクション: データを処理するときに使用されるコントロールが表示されます。
- [ドキュメントのショートカット] セクション: ナビゲーションや UI のスケーリングなどのさまざまな操作の実行に使用されるショートカットが表示されます。
- [構成] セクション: インストール時に実行されたインスタンス構成に関する詳細が表示されます。
Ctrl
キーを押しながらマウスをスクロールします。
ドキュメント ビューでは、ドキュメントのラベル付けを行えます。単語ボックスを選択し、キーを押してそれらのボックスをフィールドに割り当てます。また、単語ボックスを右クリックして、抽出された情報を検証することもできます。
ドキュメントのラベル付けの方法について詳しくは、こちらのページをご覧ください。
新しい Data Manager セッションを開く場合、またはフィルターが空の場合は、ドキュメント ビューに特定のガイドラインが表示されます。
また、読み込みの失敗もドキュメント ビューに表示されます。