- 概要
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- ハードウェア要件
- パイプライン
- Document Manager
- OCR サービス
- ディープ ラーニング
- Insights のダッシュボード
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- アクティビティ
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Manager を使用する
このページでは、Document Manager を使用して新しいデータセットをラベル付けし、ML モデルを再トレーニングする方法を説明します。
「初回の操作」で作成したデータのラベル付けセッションを起動し、設定に移動して OCR を設定します。
Choose the OCR you intend to use in the OCR method dropdown menu. For UiPathDocumentOCR, paste the Document UnderstandingTM license key (retrieve the Document Understanding API key from the Admin > License page) and then paste the OCR URL you generated when you deployed UiPathDocumentOCR.
こちらの指示に従ってデプロイしたモデルで、事前ラベル付けを設定します。モデルのパブリック ML スキル エンドポイントと Document Understanding ライセンス キーを貼り付け、[保存] をクリックします。
詳しくは、「事前定義されたスキーマを使用する」をご覧ください。
- Document Manager セッションの [インポート] ボタン を選択します。
- データセットに名前を付け、[アップロードするファイルを参照] を選択します。
- アップロードするドキュメントを選択します。
- [はい] をクリックします。
をクリックして、抽出するフィールドを作成します。
最大 40 個のフィールドを作成できます。
この検証の演習では、一般的な請求書フィールドをいくつか作成できます。たとえば、日付、名前、請求書番号、合計金額などです。[コンテンツの種類] は、日付 (date)、名前 (string)、請求書番号 (string)、合計金額 (number) のように適切に選択します。
ドキュメントのラベル付けを開始します。
画面上部にある予測ボタン をクリックし、請求書のベース モデルを使用して定義済みフィールドのラベルを予測します。予測が誤っている場合はラベルを修正します。
d
を押して日付をラベル付けする)。
画面上部にある矢印を使用して次のドキュメントに切り替え、アップロードしたすべての請求書のラベルを検証します。
- データセットのフィルターで正しいデータセットを選択していることを確認し、[エクスポート] ボタン をクリックします。
- [エクスポート] を選択します。
- 同じ AI Center プロジェクトの下の [データセット] に移動すると、エクスポートしたトレーニング データセットが表示されています。
AI Center でカスタム モデルをトレーニングする
- [パイプライン] > [新規作成] に移動します。評価の実行の種類を選択し、モデル パッケージと入力データセットを選択します。
- 入力データセットとして使用する、export 下のサブフォルダーを選択します。
- [作成] を選択してパイプラインを開始します。CPU マシン上でのパイプラインの実行には 1 時間から 2 時間かかる場合があります。
[ML スキル] に移動し、新しい ML スキルを作成します。
前に作成したのと同じ請求書モデルのパッケージを選択します。モデルは再トレーニング済みなので、新しいマイナー パッケージ バージョンが表示されます (1 と 0)。最新のバージョンを選択します。
ML スキルを作成した後は、[現在のデプロイを変更] に移動して ML スキルを公開します。トグルを切り替え、[確認] をクリックします。
後で使用するために、パブリック ML スキルの URL をコピーします。
これで、独自のデータセットで Invoices (請求書) モデルを再トレーニングし、モデルにアクセスするためのエンドポイントを作成できました。