- 概要
- Document Understanding Process
- クイックスタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- Document Manager
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
ML パッケージのオフライン インストール
使用するモデルに応じて、以下が必要です。
- 2022.10 以降のモデル:
- 必要な Document Understanding バンドルをダウンロードします。利用可能なすべてのバンドルのリンクについては、こちらをご覧ください。du バンドルには、特定のバージョンに含まれるすべてのモデルの情報が入っています。たとえば、
dusemistructured-2022.10.0.tar.gz
には、v2023.4.0 に含まれる、すぐに使える事前トレーニング済みの ML パッケージすべてに関する情報が入っています。
- 必要な Document Understanding バンドルをダウンロードします。利用可能なすべてのバンドルのリンクについては、こちらをご覧ください。du バンドルには、特定のバージョンに含まれるすべてのモデルの情報が入っています。たとえば、
- 2022.4 以前のモデル (
python37duv3
およびpython37duv4
):- ML パッケージはすべて
.zip
ファイルで提供されており、AI Center 内にカスタム パッケージとして直接アップロードされています。モデルをダウンロードするには、アカウント マネージャー、CSM、またはサポートにお問い合わせください。パッケージ単位でのダウンロード リンクを入手できます。 - 必要な Document Understanding バンドルをダウンロードします。利用可能なすべてのバンドルのリンクについては、こちらをご覧ください。
- ML パッケージはすべて
du-ondemand.tar.gz
に変更する必要があります。たとえば、dusemistructured-2023.4.0.tar.gz
という名前の du バンドルをダウンロードした場合は、インストール時に名前を du-ondemand.tar.gz
に変更する必要があります。
- Windows マシンの場合は、バンドルのリンクから直接ダウンロードして、ファイル名を
du-ondemand.tar.gz
に変更します。 -
Linux マシンの場合は、インターネットにアクセスできるマシンから、以下のコマンドを実行して必要なバンドルをダウンロードします。
wget -O ~/<bundle-name.tar.gz> 'bundle-link'
wget -O ~/<bundle-name.tar.gz> 'bundle-link'以下に、Linux に必要なバンドルをダウンロードする方法の例を示します。
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.4.0/dusemistructured-2023.4.0.tar.gz'
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.4.0/dusemistructured-2023.4.0.tar.gz' -
クラスターのメイン マシンの
/uipath/tmp
フォルダー (インストールが行われたフォルダー) に、以下のバンドルをコピーします。scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
このメイン マシンに接続し、バンドルを読み込ます。
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
モデルのダウンロードとインストールが完了したら、こちらの手順に従って AI Center にアップロードします。
各オフライン バンドルには、複数の ML パッケージで使用されるベース イメージが含まれています。モデルの特定のバージョンを使用するためにどのバンドルをダウンロードすればよいか確認するには、対応しているモデルのバージョンを確認します。
モデルのバージョン | プラットフォーム バージョン | ||||
---|---|---|---|---|---|
2024.10 | 2023.10 | v2023.4 | 2022.10 | 2022.4 | |
2024.10 | |||||
2023.10 | |||||
v2023.4 | |||||
2022.10 | * | * | |||
2022.4 | * | * | * | * |
オフライン バンドル UiPath Document OCR は、v22.10.8 の ML パッケージ UiPathDocumentOCR (UiPath ドキュメント OCR) を使用する場合にのみインストールする必要があります。
ML パッケージ |
モデルのバージョン |
メタデータ |
---|---|---|
UiPathDocument OCR (UiPath ドキュメント OCR) AI Center スタンドアロン環境にインストールされている DU 専用 |
22.10.8 |
下表の ML パッケージを使用するには、オフライン バンドル UiPathDocumentOCR_CPU (UiPath ドキュメント OCR_CPU) をインストールする必要があります。
ML パッケージ |
モデルのバージョン |
メタデータ |
---|---|---|
UiPathDocumentOCR_CPU |
22.10.8 |
下表の ML パッケージを使用するには、オフライン バンドル OCR for Chinese, Japanese, Korean (OCR - 中国語、日本語、韓国語) をインストールする必要があります。このバンドルは CPU の仮想マシンでのみ使用できます。
オフライン環境で中国語、日本語、韓国語の OCR を有効化する場合は、こちらの手順も実行する必要があります。
ML パッケージ |
モデルのバージョン |
メタデータ |
---|---|---|
OCR for Chinese, Japanese, Korean |
22.10.8 |
N/A |
下表の ML パッケージを使用するには、すぐに使える事前トレーニング済みの ML パッケージのオフライン バンドルをインストールする必要があります。
ML パッケージ |
モデルのバージョン |
メタデータ |
---|---|---|
DocumentUnderstanding (ドキュメントの理解) |
22.10.8 | |
Invoices (請求書) |
22.10.8 | |
InvoicesAustralia (請求書 - オーストラリア) |
22.10.8 | |
InvoicesIndia (請求書 - インド) |
22.10.8 | |
InvoicesJapan (請求書 - 日本) |
22.10.8 | |
InvoicesChina (請求書 - 中国) |
22.10.8 | |
Receipts (領収書) |
22.10.8 | |
PurchaseOrders (発注書) |
22.10.8 | |
UtilityBills (公共料金の請求書) |
22.10.8 | |
IDCards (ID カード) |
22.10.8 | |
Passports (パスポート) |
22.10.8 | |
RemittanceAdvices (送金通知書) |
22.10.8 | |
BillsOfLading (船荷証券) |
22.10.8 | |
W2 (米国の源泉徴収票) |
22.10.8 | |
W9 (米国の納税申告書) |
22.10.8 | |
ACORD125 (企業向け保険契約申込書) |
22.10.8 | |
I9 (米国の就労資格証明書) |
22.10.8 | |
990 (米国の所得税非課税団体申告書) |
22.10.8 (プレビュー) | |
4506T (米国の納税申告証明依頼書) |
22.10.8 | |
FM1003 (米国の統一住宅ローン申請書) |
22.10.8 (プレビュー) | |
ACORD25 (賠償責任保険証明書) |
22.10.8 | |
ACORD131 (アンブレラ/エクセス保険) |
22.10.8 | |
ACORD126 (企業総合賠償責任保険) |
22.10.8 | |
ACORD140 (商業保険申込書の財物補償条項) |
22.10.8 | |
1040 (米国の個人所得税申告書) |
22.10.8 | |
Checks (小切手) |
22.10.8 | |
Bank Statements (銀行預金残高証明書) |
22.10.8 | |
Financial Statements (財務諸表) |
22.10.8 | |
Packing Lists (梱包明細書) |
22.10.8 | |
Vehicle Titles (自動車の権利書) |
22.10.8 |
オフライン バンドル Document Classifier (ドキュメント分類器) は、v22.10.8 の ML パッケージ UiPathDocumentOCR (UiPath ドキュメントOCR) を使用する場合にのみインストールする必要があります。
ML パッケージ |
モデルのバージョン |
メタデータ |
---|---|---|
Document Classifier AI Center スタンドアロン環境にインストールされている DU 専用 |
22.10.8 |
オフライン バンドル dulv4 は、v2022.4 の AI Center で v2022.10.8 のエンタープライズ リリースの ML パッケージを使用する場合にのみインストールする必要があります。
ML パッケージ |
モデルのバージョン |
メタデータ |
---|---|---|
DocumentUnderstanding (ドキュメントの理解) |
22.10.8 | |
Invoices (請求書) |
22.10.8 | |
InvoicesAustralia (請求書 - オーストラリア) |
22.10.8 | |
InvoicesIndia (請求書 - インド) |
22.10.8 | |
InvoicesJapan (請求書 - 日本) |
22.10.8 (プレビュー) | |
InvoicesChina (請求書 - 中国) |
22.10.8 (プレビュー) | |
Receipts (領収書) |
22.10.8 | |
PurchaseOrders (発注書) |
22.10.8 | |
UtilityBills (公共料金の請求書) |
22.10.8 | |
IDCards (ID カード) |
22.10.8 | |
Passports (パスポート) |
22.10.8 | |
RemittanceAdvices (送金通知書) |
22.10.8 | |
BillsOfLading (船荷証券) |
22.10.8 | |
W2 (米国の源泉徴収票) |
22.10.8 | |
W9 (米国の納税申告書) |
22.10.8 | |
ACORD125 (企業向け保険契約申込書) |
22.10.8 | |
I9 (米国の就労資格証明書) |
22.10.8 | |
990 (米国の所得税非課税団体申告書) |
22.10.8 (プレビュー) | |
4506T (米国の納税申告証明依頼書) |
22.10.8 | |
FM1003 (米国の統一住宅ローン申請書) |
22.10.8 (プレビュー) | |
ACORD25 (賠償責任保険証明書) |
22.10.8 | |
ACORD131 (アンブレラ/エクセス保険) |
22.10.8 | |
ACORD126 (企業総合賠償責任保険) |
22.10.8 | |
ACORD140 (商業保険申込書の財物補償条項) |
22.10.8 | |
1040 (米国の個人所得税申告書) |
22.10.8 | |
Checks (小切手) |
22.10.8 | |
Bank Statements (銀行預金残高証明書) |
22.10.8 | |
Financial Statements (財務諸表) |
22.10.8 | |
Packing Lists (梱包明細書) |
22.10.8 | |
Vehicle Titles (自動車の権利書) |
22.10.8 |
オフライン バンドル dulv3 は、v2022.10 の AI Center で v2021.10 のエンタープライズ リリースの ML パッケージを使用する場合にのみインストールする必要があります。
メタデータのリンクについては、v2021.10 の『Document Understanding ガイド』の表をご覧ください
オフライン バンドル dulv2 は、v2022.10.8 の AI Center で v2021.10 のエンタープライズ リリースの ML パッケージを使用する場合にのみインストールする必要があります。
メタデータのリンクについては、v2021.10 の『Document Understanding ガイド』の表をご覧ください
- 基本情報
- オフライン バンドルをインストールする
- モデルを AI Center にアップロードする
- オフライン バンドル 2022.10.8
- UiPathDocumentOCR (UiPath ドキュメント OCR) のオフライン バンドル
- UiPath Document OCR_CPU のオフライン バンドル
- OCR for Chinese, Japanese, Korean (OCR - 中国語、日本語、韓国語) のオフライン バンドル
- すぐに使える事前トレーニング済みの ML パッケージのオフライン バンドル
- Document Classifier (ドキュメント分類器) のオフライン バンドル
- オフライン バンドル dulv4
- オフライン バンドル dulv3
- オフライン バンドル dulv2