- 概要
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- ハードウェア要件
- パイプライン
- Document Manager
- OCR サービス
- ディープ ラーニング
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- アクティビティ
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Manager を使用する
このページでは、Document Manager を使用して新しいデータセットをラベル付けし、ML モデルを再トレーニングする方法を説明します。
「初回の操作」で作成したデータのラベル付けセッションを起動し、設定に移動して OCR を設定します。
[OCR メソッド] ドロップダウン メニューから、使用する OCR を選択します。[UiPathDocumentOCR] を使用する場合は、Document UnderstandingTM ライセンス キー ([管理] > [ライセンス] ページから Document Understanding の API キーを取得) を貼り付け、次に、UiPathDocumentOCR のデプロイ時に生成した OCR URL を貼り付けます。
こちらの指示に従ってデプロイしたモデルで、事前ラベル付けを設定します。モデルのパブリック ML スキル エンドポイントと Document Understanding ライセンス キーを貼り付け、[保存] をクリックします。
詳しくは、「事前定義されたスキーマを使用する」をご覧ください。
- Document Manager セッションの [インポート] ボタン を選択します。
- データセットに名前を付け、[アップロードするファイルを参照] を選択します。
- アップロードするドキュメントを選択します。
- [はい] をクリックします。
をクリックして、抽出するフィールドを作成します。
最大 40 個のフィールドを作成できます。
この検証の演習では、一般的な請求書フィールドをいくつか作成できます。たとえば、日付、名前、請求書番号、合計金額などです。[コンテンツの種類] は、日付 (date)、名前 (string)、請求書番号 (string)、合計金額 (number) のように適切に選択します。
ドキュメントのラベル付けを開始します。
画面上部にある予測ボタン をクリックし、請求書のベース モデルを使用して定義済みフィールドのラベルを予測します。予測が誤っている場合はラベルを修正します。
d
を押して日付をラベル付けする)。
画面上部にある矢印を使用して次のドキュメントに切り替え、アップロードしたすべての請求書のラベルを検証します。
- データセットのフィルターで正しいデータセットを選択していることを確認し、[エクスポート] ボタン をクリックします。
- [エクスポート] を選択します。
- 同じ AI Center プロジェクトの下の [データセット] に移動すると、エクスポートしたトレーニング データセットが表示されています。
AI Center でカスタム モデルをトレーニングする
- [パイプライン] > [新規作成] に移動します。評価の実行の種類を選択し、モデル パッケージと入力データセットを選択します。
- 入力データセットとして使用する、export 下のサブフォルダーを選択します。
- [作成] を選択してパイプラインを開始します。CPU マシン上でのパイプラインの実行には 1 時間から 2 時間かかる場合があります。
[ML スキル] に移動し、新しい ML スキルを作成します。
前に作成したのと同じ請求書モデルのパッケージを選択します。モデルは再トレーニング済みなので、新しいマイナー パッケージ バージョンが表示されます (1 と 0)。最新のバージョンを選択します。
ML スキルを作成した後は、[現在のデプロイを変更] に移動して ML スキルを公開します。トグルを切り替え、[確認] をクリックします。
後で使用するために、パブリック ML スキルの URL をコピーします。
これで、独自のデータセットで Invoices (請求書) モデルを再トレーニングし、モデルにアクセスするためのエンドポイントを作成できました。