- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- FlexiCapture Classifier
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Dokumentklassifizierung – verwandte Aktivitäten
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 4506T – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Deep Learning
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Document Understanding-Benutzerhandbuch.
Installieren und verwenden
Auf dieser Seite wird beschrieben, wie Document UnderstandingTM bereitgestellt und konfiguriert wird. Sie enthält außerdem spezielle Anweisungen zur Verwendung von Document UnderstandingTM auf der Automation Suite.
Document Understanding hat eine Abhängigkeit vom AI Center, was bedeutet, dass das AI Center immer installiert werden muss, wenn Document Understanding installiert ist.
Außerdem muss der Orchestrator aktiviert werden, bevor Document Understanding verwendet wird.
Bevor Sie mit der Document Understanding-Installation beginnen, stellen Sie hier sicher, dass alle Anforderungen an die Automation Suite für Einzelknoten und mehrere Knoten erfüllt sind.
In einem der folgenden Szenarien wird dringend eine GPU für Document Understanding empfohlen:
-
Wenn Sie die Document Understanding-Modelle (DocumentUnderstanding – das allgemeine Modell, Invoices, Receipts usw.) im AI Center erneut trainieren.
Training mit der CPU ist 5–7-mal langsamer und die Modellleistung verschlechtert sich im Vergleich zum Training mit der GPU.
-
Wenn Sie UiPathDocumentOCR (Nicht-Edge-Version) im AI Center ausführen, um mehr als 2 Millionen Seiten pro Jahr zu verarbeiten.
Wenn Sie keine GPU verwenden, kann sich die langsame Leistung auf das Produkterlebnis auswirken.
Weitere Informationen zum Bereitstellen einer GPU finden Sie unter Hinzufügen eines dedizierten Agent-Knotens mit GPU-Unterstützung.
Document Understanding erfordert, dass die FullTextSearch-Funktion auf dem SQL-Server aktiviert ist. Andernfalls schlägt die Installation ohne explizite Fehlermeldung fehl.
Sehen Sie sich hier die Document Understanding-Konfigurationsdatei an.
Greifen Sie auf den Form Extractor und den Intelligent Keyword Classifier mit der folgenden öffentlichen URL zu:
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
durch die tatsächlichen Umgebungsinformationen. Zum Beispiel wird <FQDN>/du_/svc/formextractor
zu https://servicefabricserver.domain.com/du_/svc/formextractor
, wenn es in einem Workflow verwendet wird.
Nach der Installation können Sie Document Understanding aktivieren oder deaktivieren. Weitere Details finden Sie hier.
Wenn Sie den Endpunkt von OCR for Chinese, Japanese, Korean in einer Offlineumgebung verwenden möchten, müssen Sie das Offlinepaket installieren, indem Sie diese Anweisungen befolgen. Sobald das Paket installiert ist, müssen Sie die OCR in ArgoCD aktivieren.
- Wenn OCR für Chinesisch, Japanisch, Koreanisch in Document Understanding verwendet wird, stellen Sie sicher, dass Sie die Aktivität mit dem öffentlichen Endpunkt von OCR und dem Document Understanding-API-Schlüssel konfiguriert haben.
- OCR for Chinese, Japanese, Korean wird nur in Document Understanding unterstützt, das in der Automation Suite bereitgestellt wird. In Document Understanding, das im AI Center eingesetzt wird und mit einem externen Orchestrator verbunden ist, wird dies nicht unterstützt.
Hier sind die Schritte, die Sie ausführen müssen, um die OCR in ArgoCD zu aktivieren:
- Greifen Sie auf ArgoCD zu.
- Öffnen Sie das Document Understanding-Framework.
- Klicken Sie auf die Registerkarte „Parameter“ und wechseln Sie zu
du-cjk-ocr.enabled
. - Klicken Sie auf die Schaltfläche Bearbeiten, legen Sie den Wert auf
TRUE
fest und klicken Sie auf die Schaltfläche Speichern.
{Cluster_FQDN}/du_/cjk-ocr/
.
Sehen Sie sich hier die Probleme im Zusammenhang mit Document Understanding an.