- 概要
- 基本情報
- アクティビティ
- Insights のダッシュボード
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- トラフィック制限
- OCR の設定
- パイプライン
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- ライセンス
Document Understanding ガイド
フォーム AI
フォーム AI は Document UnderstandingTM の一部であり、標準のレイアウトとフィールドを持つ構造化されたフォームのアップロードおよび処理に使用できます。
フォーム AI は、Document Understanding で使用できる最初の抽出方法です。Document Understanding で新しいプロジェクトを作成する方法について詳しくは、こちらをご覧ください。
プロジェクトを作成したら、プロジェクト内でフォーム AI を使用してドキュメントの種類を作成するための手順を次のとおり実行する必要があります。
- プロジェクトを開きます。
- [新しいドキュメントの種類] ボタンを選択します。
- ドキュメントの種類の名前を追加します。
ドキュメント分類器を Document Understanding から直接トレーニングする場合は、ワン クリック分類機能を使用できます。
ドキュメントの種類をフォーム AI から半構造化ドキュメントに変換できます。
ドキュメントの種類をフォーム AI から半構造化 (Document Manager) に変換するときには、Document Manager で提供されているすべての機能を使用できます。
変換オプションは、複雑なシナリオでより強力なディープ ラーニング マシン ラーニング モデルをトレーニングするのに最適です。
プロジェクトの [ドキュメントの種類] リストから直接ドキュメントの種類を変換できます。
変換するドキュメントの種類の [アクション メニューを開く] にアクセスし、[半構造化ドキュメントに変換] オプションをクリックします。操作の確定を求めるポップアップ ウィンドウが表示されます。
ドキュメントの種類を変換した後は、操作を元に戻すことができません。
新しいフォーム AI が作成されると、新しいウィンドウが開いてデータをインポートするよう求められます。最低 2 個から最大 20 個のドキュメントをインポートできます。各ドキュメントの最大ページ数は 5 ページです。アップロードするファイルをドラッグ アンド ドロップまたは参照します。
ドキュメントのインポートは、フォーム AI を半構造化 AI ドキュメントの種類に変換するもう 1 つの方法です。20 を超えるドキュメントをアップロードしようとした場合、またはいずれかのドキュメントが 20 ページを超える場合は、オプションが表示されます。フォーム AI セッションを半構造化セッションに変換するかどうかを確認するポップアップが画面に表示されます。
自動的に抽出されたフィールドについては、コンテンツの種類が正しいかどうかも確認する必要があります。たとえば、日付フィールドが自動的に抽出された場合、コンテンツの種類は [日付] である必要があります。不正確な情報は手動で修正する必要があります。
ページ上部には管理バーがあります。このバーでは、ドキュメント間の移動、ドキュメントの削除/復元、ドキュメントの検索/フィルター処理、AI モデルの予測の実行、ドキュメントのインポートとエクスポートなどの複数の操作を実行できます。
以下に、管理バーで利用可能な項目を示します。
アイテム |
Icon |
説明 |
---|---|---|
ナビゲーション |
|
アクティブなフィルターに一致するドキュメント間を移動します。 2 つの矢印の間にカウンターが表示されます。アクティブな検索/フィルターに一致するドキュメントの総数のうち、現在のドキュメントの数を示します。 |
検索とドキュメント内を検索 |
|
検索 - ドキュメントの検索またはフィルター処理を開始します。フィルターはドキュメントのエクスポート時にも適用されます。ドキュメント内の単語またはドキュメント名でフィルター処理できます。 ドキュメント内を検索 - ドキュメント内のテキスト検索を開始します。 をクリックするか、ショートカット キー Ctrl + Shift + F を使用します。 |
削除/復元 |
/ |
ドキュメントを削除または復元します。削除したドキュメントは、deleted フィルターで検索できます。 |
インポート |
|
[データをインポート] ダイアログ ボックスを開きます。 |
エクスポート |
|
[ファイルをエクスポート] ダイアログ ボックスを開きます。 |
ドキュメントの名前と種類 |
なし |
現在アクティブなドキュメントの名前と種類です。 |
ダウンロードする |
|
このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。 アイコンをクリックすると、元のドキュメントを含む Zip ファイルをダウンロードできます。元のドキュメントに加えて、Document Manager によって内部で
.jpeg 画像に変換されたすべてのページもダウンロードされます。
|
完全に削除 |
このオプションは、ドキュメント名の横にあるドロップダウン リストから利用できます。 個々のファイルを完全に削除します。
.pdf とそのファイルのすべての .jpeg イメージが AI Center のデータセットから削除され、すべてのメタデータがデータベースから削除されます。
ボタンをクリックすると、ドキュメントを完全に削除するかどうかを確認するポップアップ メッセージが表示されます。[OK] クリックして続行するか、[キャンセル] をクリックして前の画面に戻ります。 | |
予測 |
|
AI モデルの予測を実行し、結果を表示します。 事前ラベル付けを設定すると、管理バーでこのボタンが有効化されます。このボタンをクリックすると、現在のドキュメントの事前ラベル付けが行われます。 現時点では、パブリック エンドポイントを使用して [予測] オプションを使用すると、ドキュメントの最初の 10 ページにしか事前ラベル付けが行われません。これは既知の問題であり、現在修正が行われています。なお、AI Center で ML スキルを使用して [予測] オプションを使用した場合には、そのような制限はありません。 |
公開 |
|
フォーム AI 抽出器をパブリッシュして関連リンクを作成します。プロジェクトの抽出器のリストで確認できます。 |
設定 |
|
OCR と事前ラベル付けの設定を行ったり、[使い方] パネルにアクセスしたりできます。 設定ボタンには、2 つの利用可能なオプションがあります。
|
セッション |
なし |
ページの上部に表示される、現在のセッションの名前です。UiPath® Document UnderstandingTM のロゴの横にあります。 |
[削除] オプションと [完全に削除] オプションの違いを理解できるよう、もう少し詳しく説明します。
- [削除] オプションを使用するとファイルが削除されますが、プロジェクトから完全に削除されるわけではありません。削除したファイルは [検索] バーから [削除済み] フィルターで検索し、[復元] オプションを使用して復元できます。
- [完全に削除] オプションを使用すると、選択したファイルが削除され、一切復元できません。
設定ボタンには、2 つの利用可能なオプションがあります。
- 設定: OCR サービスを設定できます。
- 使い方: ヘルプ メニューです。
- ページ上部の表セクションの アイコンをクリックし、新しい列フィールドを追加します。[新しい列フィールドを作成] ウィンドウが表示されます。
- [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_
)、およびダッシュ (-
) のみを含めることができます。 - [OK] をクリックします。
[フィールドを編集] ボタンをクリックします。列フィールドで利用可能なオプションは下表のとおりです。
オプション |
説明 |
---|---|
フィールド名 |
フィールドの一意の名前です。 このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_ )、およびダッシュ (- ) のみを含めることができます。
|
コンテンツの種類 |
フィールドのコンテンツの種類です。
|
ショートカット |
フィールドのショートカット キーです。1 つまたは 2 つのキーを使用できます。 |
項目を分割 |
このフィールドを明細項目や表の行の区切り文字として使用する場合は、このチェックボックスをオンにします。行にこのフィールドが表示されている場合は、新しい明細項目または表の行とみなされます。通常は、請求書の明細項目の「明細金額」フィールドで使用されます。 |
[保存] をクリックして設定を保存します。
表の行のグループ化は、AI Center の Document Manager とは異なる方法で行われます。フォーム AI では、各列フィールドの [項目を分割] チェックボックスのステートに基づいて行が自動的にグループ化されます。これは複数行のテキストを含む行がある表にのみ適しているため、表内でテキストが 1 行しかないフィールドでは [項目を分割] チェックボックスをオンに設定する必要があります。たとえば、請求書の場合、[項目を分割] オプションをオンに設定する一般的なフィールドは明細項目の金額です。フォーム AI のコンテキストでは、フォームと同様の対応を行います。
- [フィールド] セクションの右側のペインで アイコンをクリックします。[新しい標準フィールドを作成] ウィンドウが表示されます。
- [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_
)、およびダッシュ (-
) のみを含めることができます。 - [OK] をクリックします。
- ページ上部の表セクションの をクリックし、作成したフィールドをすべて削除します。この機能を使用すると、標準フィールドと列フィールドを含むすべてのフィールドと、現在のドキュメントの種類のコレクション内にあるドキュメントに付けられたすべてのラベルを削除できます。この操作は元に戻せません。
- [すべてのフィールドを削除] ダイアログ ボックスで、[削除] ボタンをクリックします。
フィールドを編集する
[フィールドを編集] ボタンをクリックします。標準フィールドで利用可能なオプションは下表のとおりです。
オプション |
説明 |
---|---|
フィールド名 |
フィールドの一意の名前です。 このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_ )、およびダッシュ (- ) のみを含めることができます。
|
コンテンツの種類 |
フィールドのコンテンツの種類です。
|
ショートカット |
フィールドのショートカット キーです。1 つまたは 2 つのキーを使用できます。 |
複数行 |
全般 |
[保存] をクリックして設定を保存します。
Ctrl
キーを押しながらマウスをスクロールします。
ドキュメント ビューでは、ドキュメントのラベル付けを行えます。単語ボックスを選択し、キーを押してそれらのボックスをフィールドに割り当てます。また、単語ボックスを右クリックして、抽出された情報を検証することもできます。
ドキュメントのラベル付けの方法について詳しくは、こちらのページをご覧ください。