- 概要
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- ハードウェア要件
- パイプライン
- Document Manager
- OCR サービス
- ディープ ラーニング
- Insights のダッシュボード
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- アクティビティ
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
ユーザー インターフェイス
Document Manager のインターフェイスには、以下のパネルがあります。
- 管理バー
- 列フィールド
- 標準フィールド
- 分類フィールド
- ドキュメント ビュー
Document Manager のページの上部に表示されます。
複数の操作を実行できます (ドキュメント間の移動、ドキュメントの削除/復元、ドキュメントの検索/フィルター処理、AI モデルの予測の実行、ドキュメントのインポートとエクスポート)。
以下に、管理バーで利用可能な項目を示します。
アイテム |
Icon |
説明 |
---|---|---|
ナビゲーション |
|
アクティブなフィルターに一致するドキュメント間を移動します。 2 つの矢印の間にカウンターが表示されます。アクティブな検索/フィルターに一致するドキュメントの総数のうち、現在のドキュメントの数を示します。 |
検索 |
|
次の 2 つの検索機能があります。
|
削除/復元 |
|
ドキュメントを削除または復元します。削除したドキュメントは、deleted フィルターで検索できます。 |
インポート |
|
[データをインポート] ダイアログ ボックスを開きます。 |
エクスポート |
|
[ファイルをエクスポート] ダイアログ ボックスを開きます。 |
ドキュメントの名前と種類 |
なし |
現在アクティブなドキュメントの名前と種類です。 ドキュメントには以下の 3 種類があります。
トレーニング ドキュメントと検証ドキュメントは、トレーニング パイプラインで使用されるトレーニング データセットの一部です。 評価ドキュメントはトレーニング パイプラインでは無視され、AI Center の評価パイプラインでのみ使用されるようになっています。評価ドキュメントは、[データをインポート] ダイアログ ボックスの [これを評価セットにする] チェックボックスをオンにして、評価用としてマークしたドキュメントです。 |
ダウンロードする |
このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。 アイコンをクリックすると、元のドキュメントを含む Zip ファイルをダウンロードできます。元のドキュメントに加えて、Document Manager によって内部で
.jpeg 画像に変換されたすべてのページもダウンロードされます。
| |
完全に削除 |
このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。 個々のファイルを完全に削除します。
.pdf とそのファイルのすべての .jpeg イメージが AI Center のデータセットから削除され、すべてのメタデータがデータベースから削除されます。
ボタンをクリックすると、ドキュメントを完全に削除するかどうかを確認するポップアップ メッセージが表示されます。[OK] クリックして続行するか、[キャンセル] をクリックして前の画面に戻ります。 | |
バッチ名 |
なし |
現在のバッチの名前です。 |
セッション名 |
なし |
現在のセッションの名前です。 |
予測 |
AI モデルの予測を実行し、結果を表示します。 事前ラベル付けを設定すると、管理バーでこのボタンが有効化されます。このボタンをクリックすると、現在のドキュメントの事前ラベル付けが行われます。 | |
設定 |
OCR と事前ラベル付けの設定を行ったり、[使い方] パネルにアクセスしたりできます。詳しくは、以下をご覧ください。 |
[削除] オプションと [完全に削除] オプションの違いを理解できるよう、もう少し詳しく説明します。
- [削除] オプションを使用するとファイルが削除されますが、プロジェクトから完全に削除されるわけではありません。削除したファイルは [検索] バーから [削除済み] フィルターで検索し、[復元] オプションを使用して復元できます。
-
[完全に削除] オプションを使用すると、選択したファイルが削除され、一切復元できません。
公開されている検索機能には、次の 2 つの部分があります。
-
組み込みフィルターを使用して検索する: ドロップダウン メニューで選択できるバッチ/カテゴリ オプションに基づいて、ドキュメントをフィルター処理します。
他のオプションも選択すると、検索をさらに制限できます。たとえば、[Batch import1] と [削除済み] を選択すると、[Batch import1] でインポートされた、削除済みのドキュメントのみが検索されます。
常に空のリストが返される組み合わせに注意してください。[Batch import1] と [Batch import2] を選択すると、ドキュメントは返されません。この選択は制限が厳しく、一度に 2 つのバッチに存在できるドキュメントはないからです。
-
キーワードを使用してドキュメントを検索する: この検索バーでは、テキスト入力に基づいて情報をフィルター処理します。[検索] バーにキーワードをフリー テキストとして入力する必要があります。ドキュメントの内容またはドキュメント名でキーワードが検索されます。複数語検索では、単語が隣接している場合に結果が返されます (単語間の句読点はすべて除外されます)。
-
ドキュメント内を検索します。現在のドキュメント内にのみ存在するテキスト インスタンスを検索できます。検索バー は、画面の左下にあります。
This setting is available only for Document Types (Data Manager sessions) created in AI Center. When created in Document UnderstandingTM, this setting is inherited from the Project Settings. If you want to modify these settings in Document UnderstandingTM, go back to the Project view and open Project Settings from the bottom left.
クラウドベースのオプションは以下のとおりです。
- UiPath® Document OCR -
https://du.uipath.com/ocr
; - OCR for Chinese, Japanese and Korean
- Google Cloud Vision OCR - 対応している言語の種類は最多です。
- Google Cloud Vision OCR for Japanese - 日本語ドキュメントの読み取りに最適です。
- Microsoft Read OCR
OCR を設定するには、OCR サービスに URL が必要です。使用できる URL は以下のとおりです。
- パブリック URL (例:
https://du.uipath.com/ocr
) または Google Vision OCR や Microsoft Read OCR のサードパーティの URL
選択した OCR エンジンに対応する API キーです。たとえば、UiPath Document OCR の場合、Document Understanding の API キーを使用する必要があります。クラウドの Document Manager およびオンプレミスのオンラインの Document Manager の場合は必須です。オンプレミスのエアギャップ環境の Document Manager では不要です。
詳しくは、「クラウドおよびオンプレミスでの使用」をご覧ください。
ラベル付けが必要なフィールドの一部を抽出できるモデルをすでに所持しており、追加で手動のラベル付けが必要なフィールドがほとんどない場合は、Document Manager の事前ラベル付け機能を使用すると、時間を節約できます。
事前ラベル付けでは、[事前ラベル付け] 設定で設定した事前ラベル付けエンドポイントの結果がマージされます。
次のオプションを使用できます。
事前ラベル付けを行うには、ML モデルに URL が必要です。使用できる次の URL を確認してください。
- パブリック URL (例:
https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders
)エンドポイントの完全なリストについては、「パブリック エンドポイント」をご覧ください。
- オンプレミス版の AI Center または Cloud AI Center で公開されている ML スキルの URL
AI ユニット/Document Understanding の API キーです。事前ラベル付け API キーは、スキルが存在する組織の Document Understanding API のキーです。
このキーは、Cloud Document Manager およびオンプレミスのオンラインの Document Manager では必須です。オンプレミスのエアギャップ環境の Document Manager では任意です。
[使い方] オプションから、Document Manager のヘルプ メニューを開きます。
ヘルプ メニューでは以下の情報を確認できます。
- Document Manager のバージョンです。
- 製品ガイドのページへのリンク です。
- [ラベル付けのコントロール] セクション: データを処理するときに使用されるコントロールが表示されます。
- [ドキュメントのショートカット] セクション: ナビゲーションや UI のスケーリングなどのさまざまな操作の実行に使用されるショートカットが表示されます。
- [構成] セクション: インストール時に実行されたインスタンス構成に関する詳細が表示されます。
ラベル付けのコントロール
コマンド |
説明 |
---|---|
左クリック | ボックスを選択します。フィールドのホットキーと一緒に使用した場合、選択した情報がフィールドに割り当てられます。 |
Backspace/Delete | フィールドのタグ付けされた値を削除します。 |
右クリック | OCR テキストと現在のラベルを表示します。 |
Enter キーまたはバックスラッシュ | 複数行のテキストにまたがる表の行をグループ化またはグループ化解除します。 |
ドキュメントのショートカット
ショートカット |
説明 |
---|---|
Alt + 左矢印/右矢印 | ドキュメント間を移動します。 |
Alt + Delete | ドキュメントを削除または回復します。 |
Ctrl + スクロール | 拡大/縮小してドキュメントのスケーリングを変更します。 |
- 新しい列フィールドを作成
- フィールドを編集
- 列フィールドの値を展開/折りたたみ
列フィールドについて詳しくは、こちらのセクションをご覧ください。
- 新しい標準フィールドを作成
- フィールドを編集
標準フィールドについて詳しくは、こちらのセクションをご覧ください。
- 新しい分類フィールドを作成
- フィールドを編集
分類フィールドについて詳しくは、こちらのセクションをご覧ください。
Ctrl
キーを押しながらマウスをスクロールします。
ドキュメント ビューでは、ドキュメントのラベル付けを行えます。単語ボックスを選択し、キーを押してそれらのボックスをフィールドに割り当てます。また、単語ボックスを右クリックして、抽出された情報を検証することもできます。
ドキュメントのラベル付けの方法について詳しくは、こちらのページをご覧ください。
新しい Document Manager セッションを開いた場合、またはフィルターが空の場合は、ドキュメント ビューに特定のガイドラインが表示されます。
また、読み込みの失敗もドキュメント ビューに表示されます。