- 概要
- 基本情報
- アクティビティ
- Insights のダッシュボード
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- トラフィック制限
- OCR の設定
- パイプライン
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- ライセンス
Document Understanding ガイド
フィールドを作成および設定する
フィールドの名前は変更できます。[フィールドを編集] ボタンをクリックして、ウィンドウ上部のフィールドの名前を編集するだけです。
後でフィールドを ML モデルのトレーニングに使用しないと決めた場合は、そのフィールドを削除するか、[フィールドを編集] ウィンドウの [非表示] チェックボックスをオンにしてそのフィールドを常に非表示にすることができます。
請求書ドキュメントの明細項目である説明または単価は、列フィールドの例となります。
- ページ上部の表セクションの アイコンをクリックし、新しい列フィールドを追加します。[新しい列フィールドを作成] ウィンドウが表示されます。
- [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_
)、およびダッシュ (-
) のみを含めることができます。 -
[OK] をクリックします。[フィールドを編集] ウィンドウが表示され、[全般] タブが開きます。
- [コンテンツの種類] ドロップダウン リストからコンテンツの種類を選択します。
- [ホットキー] フィールドをクリックし、お使いのキーボードのキーを押すと、キーが自動的に設定されます。
-
このフィールドを明細項目や表の行の区切り文字として使用する場合は、[項目を分割] チェックボックスをオンに選択します。行にこのフィールドが表示されている場合は、新しい明細項目または表の行と見なされます。通常は、請求書の明細項目の「明細金額」フィールドで使用されます。
- エクスポートされるデータセットにこのフィールドを含めたくない場合は、[非表示] チェックボックスをオンにします。
- [詳細設定] タブをクリックします。
- [スコアリング] ドロップダウン リストから、モデル予測の評価を実行する際の精度の決定に使用する尺度を選択します。
- [色] フィールドに、フィールドの目的の色の 16 進コードを入力します。
- [保存] をクリックして設定を保存します。
[フィールドを編集] ボタンをクリックします。列フィールドで利用可能なオプションは下表のとおりです。
オプション |
タブ |
説明 |
---|---|---|
フィールド名 |
なし |
フィールドの一意の名前です。 このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_ )、およびダッシュ (- ) のみを含めることができます。
|
コンテンツの種類 |
全般 |
フィールドのコンテンツの種類です。
|
ショートカット |
全般 |
フィールドのショートカット キーです。1 つまたは 2 つのキーを使用できます。 |
項目を分割 |
全般 |
このフィールドを明細項目や表の行の区切り文字として使用する場合は、このチェックボックスをオンにします。行にこのフィールドが表示されている場合は、新しい明細項目または表の行とみなされます。通常は、請求書の明細項目の「明細金額」フィールドで使用されます。 |
非表示 |
全般 |
エクスポートされるデータセットにこのフィールドが含まれないようにしたい場合は、このチェックボックスをオンにします。 |
色 |
Advanced (カスタム) |
フィールドの色です (16 進数表記)。値が有効でない場合、新しい値が生成されます。 |
スコアリング |
Advanced (カスタム) |
モデルの予測の評価を実行するときの精度を決定するために使用する尺度です。コンテンツの種類が string の場合にのみ設定できます。他のすべてのコンテンツの種類では、完全一致のスコアリング方法が使用されます。オプション:
|
これらは、特定のドキュメントに 1 回だけ表示されるフィールドです。列フィールドの例としては、請求書ドキュメントの明細項目である請求書番号または合計金額があります。
- [標準フィールド] セクションの右側のペインで アイコンをクリックします。[新しい標準フィールドを作成] ウィンドウが表示されます。
- [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_
)、およびダッシュ (-
) のみを含めることができます。 - [OK] をクリックします。[フィールドを編集] ウィンドウが表示され、[全般] タブが開きます。
- [コンテンツの種類] ドロップダウン リストからコンテンツの種類を選択します。
- [ショートカット] フィールドをクリックしてお使いのキーボードのキーを押すと、キーが自動的に設定されます。
- 確認対象のフィールドが、住所や説明のように、複数のテキスト行にまたがる可能性がある場合は、[複数行] チェック ボックスをオンにします。このオプションをオンにしない場合は、最初の行だけが返されます。
- ドキュメントで検出されたすべての値のリストを取得するには、この [複数値] チェックボックスをオンにします。[複数行] または [複数値] チェックボックスをオンにできます。
- エクスポートされるデータセットにこのフィールドを含めたくない場合は、[非表示] チェックボックスをオンにします。
- [詳細設定] タブをクリックします。
- 指定したページ上の単一のフィールドで、モデルが複数のインスタンスを予測する場合は、[後処理] ドロップダウン リストから後処理のメカニズムを選択します。
- [スコアリング] ドロップダウン リストから、モデル予測の評価を実行する際の精度の決定に使用する尺度を選択します。
- [色] フィールドに、目的のフィールド色の 16 進コードを入力します。
- [保存] をクリックして設定を保存します。
[フィールドを編集] ボタンをクリックします。標準フィールドで利用可能なオプションは下表のとおりです。
オプション |
タブ |
説明 |
---|---|---|
フィールド名 |
なし |
フィールドの一意の名前です。 このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_ )、およびダッシュ (- ) のみを含めることができます。
|
コンテンツの種類 |
全般 |
フィールドのコンテンツの種類です。
|
後処理 |
Advanced (カスタム) |
後処理のメカニズムです。モデルは、指定したページでフィールドが複数箇所に出現すると予測した場合、以下の値を返します。
|
ショートカット |
全般 |
フィールドのショートカット キーです。1 つまたは 2 つのキーを使用できます。 |
複数行 |
全般 |
複数のテキスト行にまたがる可能性があるフィールド (住所や説明) の場合に、このチェックボックスをオンにします。オンにしない場合は、最初の行だけが返されます。 |
複数値 | 全般 | ドキュメントで検出されたすべての値のリストを取得するには、このチェックボックスをオンにします。[複数行] または [複数値] チェックボックスをオンにできます。 |
非表示 |
全般 |
エクスポートされるデータセットにこのフィールドが含まれないようにしたい場合は、このチェックボックスをオンにします。 |
スコアリング |
Advanced (カスタム) |
モデルの予測の評価を実行するときの精度を決定するために使用する尺度です。コンテンツの種類が string の場合にのみ設定できます。他のすべてのコンテンツの種類では、完全一致のスコアリング方法が使用されます。オプション:
|
色 |
Advanced (カスタム) |
フィールドの色です (16 進数表記)。値が有効でない場合、新しい値が生成されます。 |
ドキュメント全体を参照するデータ ポイントです。たとえば、領収書の経費の種類 (飲食、宿泊、飛行機、輸送) または請求書の通貨 (米ドル、ユーロ、日本円) が分類フィールドの例となります。
- [分類フィールド] セクションの右側のペインで アイコンをクリックします。[新しい分類フィールドを作成] ウィンドウが表示されます。
- [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_
)、およびダッシュ (-
) のみを含めることができます。 - [OK] をクリックします。[フィールドを編集] ウィンドウが表示されます。
- テキスト領域にクラスのリストを入力し、名前をコンマ区切りのリストとして入力します。
- [保存] をクリックして設定を保存します。
:
) の後に入力できます (オプション 1: 説明 1)。