- Überblick
- Erste Schritte
- Aktivitäten
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
- Insights-Dashboards
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Einschränkungen für den Datenverkehr
- OCR-Konfiguration
- Pipelines
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Lizenzierung
Einschränkungen für den Datenverkehr
Die ML-Pakete zur Extraktion und Klassifizierung erfordern eine beträchtliche Menge an Rechenressourcen, was einige Einschränkungen mit sich bringt, wenn die Größe der Dokumente und/oder die Anzahl an Dokumenten pro Minute wachsen.
Bei Dokumenten, die größer als 100 Seiten sind, werden voraussichtlich Rechen- oder Latenzbeschränkungen auftreten, was dazu führt, dass ML-Fähigkeiten instabil sind oder HTTP-Fehler zurückgeben. Eine genaue Obergrenze ist schwer zu definieren, da die Textdichte und Bildauflösung von Dokumenten stark variieren können und die Textdichte (Anzahl der Wörter pro Seite) sich auf die erforderlichen Rechen- und RAM-Ressourcen sowie auf die Latenz auswirkt. Darüber hinaus hängt die Kapazität einer ML-Fähigkeit von der Kapazität der Hardware ab, die für ihre Bereitstellung verwendet wird, die vom AI Center gesteuert wird. Beispielsweise können ML-Fähigkeiten auf der GPU oder auf der CPU bereitgestellt werden, was einen großen Einfluss auf die Kapazität und Geschwindigkeit der ML-Fähigkeit hat.
Was den Durchsatz angeht: ML-Fähigkeiten können jeweils nur ein Dokument verarbeiten. Das bedeutet, dass Sie warten müssen, bis ein Dokument fertig gestellt ist, bevor Sie das nächste senden. Je größer die Dokumente, desto weniger Dokumente können Sie pro Zeiteinheit verarbeiten.
Um diese Probleme zu verringern, sollten Sie bei der Verarbeitung sehr großer Dokumente bedenken, dass sich die relevanten Daten in vielen Fällen auf einer kleineren Teilmenge von Seiten befinden und diese Teilmenge mit dem Intelligent Keyword Classifier aufgeteilt werden kann. Dies kann sehr effektiv sein, da so Fehler/Ausfälle/Timeouts bei ML-Fähigkeiten eliminiert werden, der Durchsatz und die Reaktionsfähigkeit steigen, die Extraktionsgenauigkeit durch die Reduzierung von falsch positiven Ergebnissen erhöht wird und die Kosten sinken, indem unnötiger Verbrauch von AI Units verhindert wird.