- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- FlexiCapture Classifier
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Dokumentklassifizierung – verwandte Aktivitäten
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 4506T – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Deep Learning
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Offlineinstallation von ML-Paketen
Abhängig von den Modellen, die Sie verwenden möchten, benötigen Sie Folgendes:
- Für Modelle ab 2022.10:
- Download the needed Document UnderstandingTM bundle. Here are the links for all the available bundles. The du bundle contains information about all models included into a specific version. For example, the
dusemistructured-2023.10.0.tar.gz
contains information about all out-of-the-box pre-trained ML Packages included in the 2023.10.0 version.
- Download the needed Document UnderstandingTM bundle. Here are the links for all the available bundles. The du bundle contains information about all models included into a specific version. For example, the
- Für Modelle vor 2022.4 (
python37duv3
undpython37duv4
):- Alle ML-Pakete werden als
.zip
-Datei bereitgestellt, die direkt als benutzerdefiniertes Paket in das AI Center hochgeladen wird. Um die Modelle herunterzuladen, wenden Sie sich an Ihren Account Manager, CSM oder Support, um einen Downloadlink pro Paket zu erhalten. - Laden Sie das erforderliche Document Understanding-Paket herunter. Hier sind die Links für alle verfügbaren Pakete.
- Alle ML-Pakete werden als
du-ondemand.tar.gz
umbenannt wird. Wenn Sie beispielsweise das du-Paket mit dem Namen dusemistructured-2023.10.0.tar.gz
heruntergeladen haben, müssen Sie es bei der Installation in du-ondemand.tar.gz
umbenennen.
- Bei Windows-Maschinen laden Sie das Paket direkt über den Paketlink herunter und benennen es um in
du-ondemand.tar.gz
. -
Bei Linux-Maschinen laden Sie das benötigte Paket von einer Maschine mit Internetzugang herunter, indem Sie den folgenden Befehl ausführen:
wget -O ~/<bundle-name.tar.gz> 'bundle-link'
wget -O ~/<bundle-name.tar.gz> 'bundle-link'Hier ist ein Beispiel für das Herunterladen des erforderlichen Pakets für Linux:
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz'
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz' -
Kopieren Sie das folgende Paket in den
/uipath/tmp
-Ordner auf der Hauptmaschine des Clusters (auf dem die Installation durchgeführt wurde):scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
Stellen Sie eine Verbindung mit dieser Hauptmaschine her und laden Sie das Paket:
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
Führen Sie nach dem Herunterladen und Installieren der Modelle die hier beschriebenen Schritte aus, um sie in das AI Center hochzuladen.
Greifen Sie auf den Form Extractor und den Intelligent Keyword Classifier mit der folgenden öffentlichen URL zu:
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
durch die tatsächlichen Umgebungsinformationen. Zum Beispiel wird <FQDN>/du_/svc/formextractor
zu https://servicefabricserver.domain.com/du_/svc/formextractor
, wenn es in einem Workflow verwendet wird.
Führen Sie die folgenden Schritte aus, um ein Document Understanding-Paket in Ihre externe Docker-Registrierung hochzuladen:
- Pull the desired DU image from the UiPath® registry hosted on registry.uipath.com
- Benennen Sie den Image-Host gemäß Ihrem Docker-Registrierungsnamen um.
- Pushen Sie das Image in die externe Docker-Registrierung.
docker pull <uipath_registry_server>/<image_name>
docker pull <uipath_registry_server>/<image_name>
Hier ist ein Beispiel dafür, wie das Image des UiPathDocumentOCR-Pakets aus einer Registrierung namens registry.uipath.com abgerufen wird:
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
Benennen Sie den Image-Host um, indem Sie den folgenden Befehl ausführen:
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
Hier ist ein Beispiel dafür, wie das Image des UiPathDocumentOCR-Pakets von einer Registrierung namens registry.uipath.com in eine Registrierung namens registory.mycompany.com umbenannt wird:
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Pushen Sie das Image in Ihre externe Docker-Registrierung, indem Sie den folgenden Befehl ausführen:
docker push <your_registry_server>/<image_name>
docker push <your_registry_server>/<image_name>
Hier ist ein Beispiel dafür, wie das Image des UiPathDocumentOCR-Pakets in eine externe Docker-Registrierung gepusht wird:
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Document Understanding-Paket |
Bild |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10.0 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.0 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.0 |
Dokumentklassifizierer | aicenter/du-ml-document-type-text-classifier:v23.10.0 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.0 |
Dulv4 | aicenter/python37duv4:23.10.0 |
Dulv3 | aicenter/python37duv3:23.10.0 |
Dulv2 | aicenter/python37duv2:23.10.0 |
- Erste Schritte
- Installieren des Offlinepakets
- Hochladen des Modells ins AI Center
- Form Extractor und Intelligent Keyword Classifier
- Hochladen des Document Understanding™-Pakets in die externe Docker-Registrierung
- Rufen Sie die gewünschten Document Understanding-Images ab
- Den Image-Host umbenennen
- Pushen Sie das Image in die externe Docker-Registrierung.
- Bilder für jedes Document Understanding-Paket