- 概要
- Document Understanding Process
- クイックスタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- Document Manager
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
Document Manager について
UiPath Document Manager は、Document Understanding マシン ラーニング モデルのトレーニングと評価に必要なデータセットを準備、レビュー、修正できる軽量の Web アプリケーションです。Document Manager を使用すると、複数のユーザーが以下のようなさまざまな操作を実行できます。
- ML モデルで抽出するフィールドを定義・設定します。
- ラベル付けのためにドキュメントをインポートします。
- UiPath が提供する、すぐに使える既存の ML モデル (請求書抽出や領収書抽出など) や、AI Center でトレーニングしたモデルを使用して、ドキュメントの事前ラベル付けを行います。
- ドキュメントのラベル付けを行います。
- AI Center のトレーニング パイプラインで使用できる形式で、ドキュメントをエクスポートします。
Document Manager のインターフェイスには、以下のパネルがあります。
Document Manager のページの上部に表示されます。
複数の操作を実行できます (ドキュメント間の移動、ドキュメントの削除/復元、ドキュメントの検索/フィルター処理、AI モデルの予測の実行、ドキュメントのインポートとエクスポート)。
以下に、管理バーで利用可能な項目を示します。
アイテム |
Icon |
説明 |
---|---|---|
ナビゲーション |
|
アクティブなフィルターに一致するドキュメント間を移動します。 2 つの矢印の間にカウンターが表示されます。アクティブな検索/フィルターに一致するドキュメントの総数のうち、現在のドキュメントの数を示します。 |
検索 |
|
ドキュメントを検索またはフィルター処理します。フィルターはドキュメントのエクスポート時にも適用されます。ドキュメント内の単語またはドキュメント名でフィルター処理することもできます。 |
削除/復元 |
/ |
ドキュメントを削除または復元します。削除したドキュメントは、deleted フィルターで検索できます。 |
インポート |
|
[データをインポート] ダイアログ ボックスを開きます。 |
エクスポート |
|
[ファイルをエクスポート] ダイアログ ボックスを開きます。 |
ドキュメントの名前と種類 |
なし |
現在アクティブなドキュメントの名前と種類です。 ドキュメントには以下の 3 種類があります。
トレーニング ドキュメントと検証ドキュメントは、トレーニング パイプラインで使用されるトレーニング データセットの一部です。 評価ドキュメントはトレーニング パイプラインでは無視され、AI Center の評価パイプラインでのみ使用されるようになっています。評価ドキュメントは、[データをインポート] ダイアログ ボックスの [これを評価セットにする] チェックボックスをオンにして、評価用としてマークしたドキュメントです。 |
ダウンロードする |
|
このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。 アイコンをクリックすると、元のドキュメントを含む Zip ファイルをダウンロードできます。元のドキュメントに加えて、Document Manager によって内部で
.jpeg 画像に変換されたすべてのページもダウンロードされます。
|
完全に削除 |
|
このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。 個々のファイルを完全に削除します。
.pdf とそのファイルのすべての .jpeg イメージが AI Center のデータセットから削除され、すべてのメタデータがデータベースから削除されます。
ボタンをクリックすると、ドキュメントを完全に削除するかどうかを確認するポップアップ メッセージが表示されます。[OK] クリックして続行するか、[キャンセル] をクリックして前の画面に戻ります。 |
セッション名 |
なし |
現在のセッションの名前です。 |
予測 |
|
AI モデルの予測を実行し、結果を表示します。 事前ラベル付けを設定すると、管理バーでこのボタンが有効化されます。このボタンをクリックすると、現在のドキュメントの事前ラベル付けが行われます。
|
設定 |
|
OCR と事前ラベル付けの設定を行ったり、[使い方] パネルにアクセスしたりできます。詳しくは、以下をご覧ください。 |
設定ボタンには、2 つの利用可能なオプションがあります。
OCR
Document Manager にドキュメントをインポートするには、OCR サービスの設定が必須です。
次のオプションを使用できます。
OCR メソッド
クラウドベースのオプションは以下のとおりです。
- UiPath Document OCR - https://du.uipath.com/ocr
- Google Cloud Vision OCR - 対応している言語の種類は最多です。
- Google Cloud Vision OCR for Japanese - 日本語ドキュメントの読み取りに最適です。
- Microsoft Read OCR
OCR の URL
OCR を設定するには、OCR サービスに URL が必要です。使用できる URL は以下のとおりです。
- パブリック URL (例: https://du.uipath.com/ocr) または Google Vision OCR や Microsoft Read OCR のサードパーティの URL
OCR キー
選択した OCR エンジンに対応する API キーです。たとえば、UiPath Document OCR の場合、Document Understanding の API キーを使用する必要があります。クラウドの Document Manager およびオンプレミスのオンラインの Document Manager の場合は必須です。オンプレミスのエアギャップ環境の Document Manager では不要です。
事前ラベル付け
ラベル付けが必要なフィールドの一部を抽出できるモデルを既に所持しており、追加で手動のラベル付けが必要なフィールドがほとんどない場合は、Document Manager の事前ラベル付け機能を使用すると、時間を大幅に節約できます。
次のオプションを使用できます。
事前ラベル付け URL
事前ラベル付けを行うには、ML モデルに URL が必要です。使用できる URL は以下のとおりです。
- パブリック URL (例: https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders)
- エンドポイントの完全なリストについてはこちらをご覧ください。
- オンプレミスの AI Center または AI Center Cloud で公開されている ML スキルの URL
事前ラベル付けキー
Document Understanding の API キーです。クラウドの Document Manager およびオンプレミスのオンラインの Document Manager の場合は必須です。オンプレミスのエアギャップ環境の Document Manager では不要です。
使い方
[使い方] オプションから、Document Manager のヘルプ メニューにアクセスできます。
以下の項目が含まれます。
- Document Manager のバージョン
- 製品ガイドのページへのリンク です。
- [ラベル付けのコントロール] セクション: データを処理するときに使用されるコントロールが表示されます。
- [ドキュメントのショートカット] セクション: ナビゲーションや UI のスケーリングなどのさまざまな操作の実行に使用されるショートカットが表示されます。
- [構成] セクション: インストール時に実行されたインスタンス構成に関する詳細が表示されます。
列フィールドでは、以下のオプションを利用できます。
- 新しい列フィールドを作成
- フィールドを編集
- 列フィールドの値を展開/折りたたみ
- 列フィールドについて詳しくは、こちらのセクションをご覧ください。
標準フィールドでは、以下のオプションを利用できます。
- 新しい標準フィールドを作成
- フィールドを編集
- 標準フィールドについて詳しくは、こちらのセクションをご覧ください。
分類フィールドでは、以下のオプションを利用できます。
- 新しい分類フィールドを作成
- フィールドを編集
- 分類フィールドについて詳しくは、こちらのセクションをご覧ください。
Ctrl
キーを押しながらマウスをスクロールします。
ドキュメント ビューでは、ドキュメントのラベル付けを行えます。単語ボックスを選択し、キーを押してそれらのボックスをフィールドに割り当てます。また、単語ボックスを右クリックして、抽出された情報を検証することもできます。
- ドキュメントのラベル付けの方法について詳しくは、こちらのページをご覧ください。
新しい Document Manager セッションを開いた場合、またはフィルターが空の場合は、ドキュメント ビューに特定のガイドラインが表示されます。
また、読み込みの失敗もドキュメント ビューに表示されます。