- 概要
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- ハードウェア要件
- パイプライン
- Document Manager
- OCR サービス
- ディープ ラーニング
- Insights のダッシュボード
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- アクティビティ
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
ユーザー インターフェイス
Document Manager のインターフェイスには、以下のパネルがあります。
- 管理バー
- 列フィールド
- 標準フィールド
- 分類フィールド
- ドキュメント ビュー
Document Manager のページの上部に表示されます。
複数の操作を実行できます (ドキュメント間の移動、ドキュメントの削除/復元、ドキュメントの検索/フィルター処理、AI モデルの予測の実行、ドキュメントのインポートとエクスポート)。
以下に、管理バーで利用可能な項目を示します。
アイテム |
Icon |
説明 |
---|---|---|
ナビゲーション |
|
アクティブなフィルターに一致するドキュメント間を移動します。 2 つの矢印の間にカウンターが表示されます。アクティブな検索/フィルターに一致するドキュメントの総数のうち、現在のドキュメントの数を示します。 |
検索 |
|
次の 2 つの検索機能があります。
|
削除/復元 |
|
ドキュメントを削除または復元します。削除したドキュメントは、deleted フィルターで検索できます。 |
インポート |
|
[データをインポート] ダイアログ ボックスを開きます。 |
エクスポート |
|
[ファイルをエクスポート] ダイアログ ボックスを開きます。 |
ドキュメントの名前と種類 |
なし |
現在アクティブなドキュメントの名前と種類です。 ドキュメントには以下の 3 種類があります。
トレーニング ドキュメントと検証ドキュメントは、トレーニング パイプラインで使用されるトレーニング データセットの一部です。 評価ドキュメントはトレーニング パイプラインでは無視され、AI Center の評価パイプラインでのみ使用されるようになっています。評価ドキュメントは、[データをインポート] ダイアログ ボックスの [これを評価セットにする] チェックボックスをオンにして、評価用としてマークしたドキュメントです。 |
ダウンロードする |
このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。 アイコンをクリックすると、元のドキュメントを含む Zip ファイルをダウンロードできます。元のドキュメントに加えて、Document Manager によって内部で
.jpeg 画像に変換されたすべてのページもダウンロードされます。
| |
完全に削除 |
このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。 個々のファイルを完全に削除します。
.pdf とそのファイルのすべての .jpeg イメージが AI Center のデータセットから削除され、すべてのメタデータがデータベースから削除されます。
ボタンをクリックすると、ドキュメントを完全に削除するかどうかを確認するポップアップ メッセージが表示されます。[OK] クリックして続行するか、[キャンセル] をクリックして前の画面に戻ります。 | |
バッチ名 |
なし |
現在のバッチの名前です。 |
セッション名 |
なし |
現在のセッションの名前です。 |
予測 |
AI モデルの予測を実行し、結果を表示します。 事前ラベル付けを設定すると、管理バーでこのボタンが有効化されます。このボタンをクリックすると、現在のドキュメントの事前ラベル付けが行われます。 | |
設定 |
OCR と事前ラベル付けの設定を行ったり、[使い方] パネルにアクセスしたりできます。詳しくは、以下をご覧ください。 |
[削除] オプションと [完全に削除] オプションの違いを理解できるよう、もう少し詳しく説明します。
- [削除] オプションを使用するとファイルが削除されますが、プロジェクトから完全に削除されるわけではありません。削除したファイルは [検索] バーから [削除済み] フィルターで検索し、[復元] オプションを使用して復元できます。
-
[完全に削除] オプションを使用すると、選択したファイルが削除され、一切復元できません。
公開されている検索機能には、次の 2 つの部分があります。
-
組み込みフィルターを使用して検索する: ドロップダウン メニューで選択できるバッチ/カテゴリ オプションに基づいて、ドキュメントをフィルター処理します。
他のオプションも選択すると、検索をさらに制限できます。たとえば、[Batch import1] と [削除済み] を選択すると、[Batch import1] でインポートされた、削除済みのドキュメントのみが検索されます。
常に空のリストが返される組み合わせに注意してください。[Batch import1] と [Batch import2] を選択すると、ドキュメントは返されません。この選択は制限が厳しく、一度に 2 つのバッチに存在できるドキュメントはないからです。
-
キーワードを使用してドキュメントを検索する: この検索バーでは、テキスト入力に基づいて情報をフィルター処理します。[検索] バーにキーワードをフリー テキストとして入力する必要があります。ドキュメントの内容またはドキュメント名でキーワードが検索されます。複数語検索では、単語が隣接している場合に結果が返されます (単語間の句読点はすべて除外されます)。
-
ドキュメント内を検索します。現在のドキュメント内にのみ存在するテキスト インスタンスを検索できます。検索バー は、画面の左下にあります。
この設定は、AI Center で作成されたドキュメントの種類 (Data Manager セッション) でのみ使用できます。Document UnderstandingTM で作成すると、この設定は [プロジェクト設定] から継承されます。Document UnderstandingTM のこれらの設定を変更する場合は、プロジェクト ビューに戻り、左下の [プロジェクト設定] を開きます。
クラウドベースのオプションは以下のとおりです。
- UiPath® Document OCR -
https://du.uipath.com/ocr
- OCR for Chinese, Japanese and Korean
- Google Cloud Vision OCR - 対応している言語の種類は最多です。
- Google Cloud Vision OCR for Japanese - 日本語ドキュメントの読み取りに最適です。
- Microsoft Read OCR
OCR を設定するには、OCR サービスに URL が必要です。使用できる URL は以下のとおりです。
- パブリック URL (例:
https://du.uipath.com/ocr
) または Google Vision OCR や Microsoft Read OCR のサードパーティの URL
選択した OCR エンジンに対応する API キーです。たとえば、UiPath Document OCR の場合、Document Understanding の API キーを使用する必要があります。クラウドの Document Manager およびオンプレミスのオンラインの Document Manager の場合は必須です。オンプレミスのエアギャップ環境の Document Manager では不要です。
詳しくは、「クラウドおよびオンプレミスでの使用」をご覧ください。
ラベル付けが必要なフィールドの一部を抽出できるモデルをすでに所持しており、追加で手動のラベル付けが必要なフィールドがほとんどない場合は、Document Manager の事前ラベル付け機能を使用すると、時間を節約できます。
事前ラベル付けでは、[事前ラベル付け] 設定で設定した事前ラベル付けエンドポイントの結果がマージされます。
次のオプションを使用できます。
事前ラベル付けを行うには、ML モデルに URL が必要です。使用できる次の URL を確認してください。
- パブリック URL (例:
https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders
)エンドポイントの完全なリストについては、「パブリック エンドポイント」をご覧ください。
- オンプレミス版の AI Center または Cloud AI Center で公開されている ML スキルの URL
AI ユニット/Document Understanding の API キーです。事前ラベル付け API キーは、スキルが存在する組織の Document Understanding API のキーです。
このキーは、Cloud Document Manager およびオンプレミスのオンラインの Document Manager では必須です。オンプレミスのエアギャップ環境の Document Manager では任意です。
[使い方] オプションから、Document Manager のヘルプ メニューを開きます。
ヘルプ メニューでは以下の情報を確認できます。
- Document Manager のバージョンです。
- 製品ガイドのページへのリンク です。
- [ラベル付けのコントロール] セクション: データを処理するときに使用されるコントロールが表示されます。
- [ドキュメントのショートカット] セクション: ナビゲーションや UI のスケーリングなどのさまざまな操作の実行に使用されるショートカットが表示されます。
- [構成] セクション: インストール時に実行されたインスタンス構成に関する詳細が表示されます。
ラベル付けのコントロール
コマンド |
説明 |
---|---|
左クリック | ボックスを選択します。フィールドのホットキーと一緒に使用した場合、選択した情報がフィールドに割り当てられます。 |
Backspace/Delete | フィールドのタグ付けされた値を削除します。 |
右クリック | OCR テキストと現在のラベルを表示します。 |
Enter キーまたはバックスラッシュ | 複数行のテキストにまたがる表の行をグループ化またはグループ化解除します。 |
ドキュメントのショートカット
ショートカット |
説明 |
---|---|
Alt + 左矢印/右矢印 | ドキュメント間を移動します。 |
Alt + Delete | ドキュメントを削除または回復します。 |
Ctrl + スクロール | 拡大/縮小してドキュメントのスケーリングを変更します。 |
- 新しい列フィールドを作成
- フィールドを編集
- 列フィールドの値を展開/折りたたみ
列フィールドについて詳しくは、こちらのセクションをご覧ください。
- 新しい標準フィールドを作成
- フィールドを編集
標準フィールドについて詳しくは、こちらのセクションをご覧ください。
- 新しい分類フィールドを作成
- フィールドを編集
分類フィールドについて詳しくは、こちらのセクションをご覧ください。
Ctrl
キーを押しながらマウスをスクロールします。
ドキュメント ビューでは、ドキュメントのラベル付けを行えます。単語ボックスを選択し、キーを押してそれらのボックスをフィールドに割り当てます。また、単語ボックスを右クリックして、抽出された情報を検証することもできます。
ドキュメントのラベル付けの方法について詳しくは、こちらのページをご覧ください。
新しい Document Manager セッションを開いた場合、またはフィルターが空の場合は、ドキュメント ビューに特定のガイドラインが表示されます。
また、読み込みの失敗もドキュメント ビューに表示されます。