- 概要
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- ハードウェア要件
- パイプライン
- Document Manager
- OCR サービス
- ディープ ラーニング
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- アクティビティ
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
ML パッケージのオフライン インストール
使用するモデルに応じて、以下が必要です。
- 2022.10 以降のモデル:
- 必要な Document UnderstandingTM バンドルをダウンロードします。利用可能なすべてのバンドルのリンクについては、こちらをご覧ください。du バンドルには、特定のバージョンに含まれるすべてのモデルの情報が入っています。たとえば、
dusemistructured-2023.10.0.tar.gz
には、v2023.10.0 に含まれる、すぐに使える事前トレーニング済みの ML パッケージすべてに関する情報が入っています。
- 必要な Document UnderstandingTM バンドルをダウンロードします。利用可能なすべてのバンドルのリンクについては、こちらをご覧ください。du バンドルには、特定のバージョンに含まれるすべてのモデルの情報が入っています。たとえば、
- 2022.4 以前のモデル (
python37duv3
およびpython37duv4
):- ML パッケージはすべて
.zip
ファイルで提供されており、AI Center 内にカスタム パッケージとして直接アップロードされています。モデルをダウンロードするには、アカウント マネージャー、CSM、またはサポートにお問い合わせください。パッケージ単位でのダウンロード リンクを入手できます。 - 必要な Document Understanding バンドルをダウンロードします。利用可能なすべてのバンドルのリンクについては、こちらをご覧ください。
- ML パッケージはすべて
du-ondemand.tar.gz
に変更する必要があります。たとえば、dusemistructured-2023.10.0.tar.gz
という名前の du バンドルをダウンロードした場合は、インストール時に名前を du-ondemand.tar.gz
に変更する必要があります。
- Windows マシンの場合は、バンドルのリンクから直接ダウンロードして、ファイル名を
du-ondemand.tar.gz
に変更します。 -
Linux マシンの場合は、インターネットにアクセスできるマシンから、以下のコマンドを実行して必要なバンドルをダウンロードします。
wget -O ~/<bundle-name.tar.gz> 'bundle-link'
wget -O ~/<bundle-name.tar.gz> 'bundle-link'以下に、Linux に必要なバンドルをダウンロードする方法の例を示します。
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz'
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz' -
クラスターのメイン マシンの
/uipath/tmp
フォルダー (インストールが行われたフォルダー) に、以下のバンドルをコピーします。scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
このメイン マシンに接続し、バンドルを読み込ます。
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
モデルのダウンロードとインストールが完了したら、こちらの手順に従って AI Center にアップロードします。
以下のパブリック URL を使用して、フォーム抽出器とインテリジェント キーワード分類器にアクセスします。
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
プレースホルダーを実際の環境の情報に置き換えます。たとえば <FQDN>/du_/svc/formextractor
をワークフローで使用する場合は https://servicefabricserver.domain.com/du_/svc/formextractor
とします。
Document Understanding バンドルを外部 Docker レジストリにアップロードするには、以下の手順に従います。
- registry.uipath.com でホストされている UiPath® レジストリから目的の DU イメージをプルする
- イメージ ホストの名前を Docker レジストリの名前に従って変更します。
- イメージを外部 Docker レジストリにプッシュする
docker pull <uipath_registry_server>/<image_name>
docker pull <uipath_registry_server>/<image_name>
以下に、registry.uipath.com というレジストリから UiPathDocumentOCR バンドルのイメージをプルする方法の例を示します。
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
次のコマンドを実行して、イメージ ホストの名前を変更します。
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
以下に、UiPathDocumentOCR バンドルのイメージの名前を、registry.uipath.com というレジストリから registory.mycompany.com というレジストリに変更する方法の例を示します。
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
次のコマンドを実行して、イメージを外部 Docker レジストリにプッシュします。
docker push <your_registry_server>/<image_name>
docker push <your_registry_server>/<image_name>
以下に、UiPathDocumentOCR バンドルのイメージを外部 Docker レジストリにプッシュする方法の例を示します。
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Document Understanding バンドル | 画像 |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10-12.01-rc01 |
Document Understanding バンドル | 画像 |
---|---|
UiPathDocument OCR (UiPath ドキュメント OCR) | aicenter/du-doc-ocr:v23.10-09.25-rc08 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10-09.25-rc08 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10-10.15-rc03 |
DocumentClassifier (ドキュメント分類) | aicenter/du-ml-document-type-text-classifier:v23.10-09.25-rc08 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10-09.25-rc08 |
Document Understanding バンドル | 画像 |
---|---|
UiPathDocument OCR (UiPath ドキュメント OCR) | aicenter/du-doc-ocr:v23.10-rc28 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10-rc28 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10-rc58 |
DocumentClassifier (ドキュメント分類) | aicenter/du-ml-document-type-text-classifier:v23.10-rc28 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10-rc28 |
Document Understanding バンドル | 画像 |
---|---|
UiPathDocument OCR (UiPath ドキュメント OCR) | aicenter/du-doc-ocr:v23.10.4-rc125 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.4-rc125 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.4-rc45 |
DocumentClassifier (ドキュメント分類) | aicenter/du-ml-document-type-text-classifier:v23.10.4-rc125 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.4-rc125 |
Document Understanding バンドル | 画像 |
---|---|
UiPathDocument OCR (UiPath ドキュメント OCR) | aicenter/du-doc-ocr:v23.10.3-rc04 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.3-rc20 |
DocumentClassifier (ドキュメント分類) | aicenter/du-ml-document-type-text-classifier:v23.10.3-rc04 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.3-rc04 |
Document Understanding バンドル | 画像 |
---|---|
UiPathDocument OCR (UiPath ドキュメント OCR) | aicenter/du-doc-ocr:v23.10.2-rc22 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.2-rc22 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.2-rc13 |
DocumentClassifier (ドキュメント分類) | aicenter/du-ml-document-type-text-classifier:v23.10.2-rc42 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.2-rc22 |
Document Understanding バンドル | 画像 |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.1-rc19 |
Document Understanding バンドル | 画像 |
---|---|
UiPathDocument OCR (UiPath ドキュメント OCR) | aicenter/du-doc-ocr:v23.10.0-rc68 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.0-rc68 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.0-rc82 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.0-rc68 |
- 基本情報
- オフライン バンドルをインストールする
- モデルを AI Center にアップロードする
- フォーム抽出器とインテリジェント キーワード分類器
- Document Understanding™ バンドルを外部 Docker レジストリにアップロードする
- 目的の Document Understanding イメージをプルする
- イメージ ホストの名前を変更する
- イメージを外部 Docker レジストリにプッシュする
- 各 Document Understanding バンドルのイメージ
- 2023.10.7
- 2023.10.6
- 2023.10.5
- 2023.10.4
- 2023.10.3
- 2023.10.2
- 2023.10.1
- 2023.10.0