- Überblick
- Erste Schritte
- Aktivitäten
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
- Insights-Dashboards
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 4506T – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Gründungsurkunde – ML-Paket
- Ursprungszertifikat – ML-Paket
- Checks – ML-Paket
- Produktzertifikat für Kinder – ML-Paket
- CMS 1500 – ML-Paket
- EU-Konformitätserklärung – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- Invoices Australia - ML package
- Invoices China - ML package
- Invoices India - ML package
- Invoices Japan - ML package
- Rechnungen Versand – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Einschränkungen für den Datenverkehr
- OCR-Konfiguration
- Pipelines
- OCR-Dienste
- Deep Learning
- Lizenzierung
Einschränkungen für den Datenverkehr
Die ML-Pakete zur Extraktion und Klassifizierung erfordern eine beträchtliche Menge an Rechenressourcen, was einige Einschränkungen mit sich bringt, wenn die Größe der Dokumente und/oder die Anzahl an Dokumenten pro Minute wachsen.
Bei Dokumenten, die größer als 100 Seiten sind, werden voraussichtlich Rechen- oder Latenzbeschränkungen auftreten, was dazu führt, dass ML-Fähigkeiten instabil sind oder HTTP-Fehler zurückgeben. Eine genaue Obergrenze ist schwer zu definieren, da die Textdichte und Bildauflösung von Dokumenten stark variieren können und die Textdichte (Anzahl der Wörter pro Seite) sich auf die erforderlichen Rechen- und RAM-Ressourcen sowie auf die Latenz auswirkt. Darüber hinaus hängt die Kapazität einer ML-Fähigkeit von der Kapazität der Hardware ab, die für ihre Bereitstellung verwendet wird, die vom AI Center gesteuert wird. Beispielsweise können ML-Fähigkeiten auf der GPU oder auf der CPU bereitgestellt werden, was einen großen Einfluss auf die Kapazität und Geschwindigkeit der ML-Fähigkeit hat.
Was den Durchsatz angeht: ML-Fähigkeiten können jeweils nur ein Dokument verarbeiten. Das bedeutet, dass Sie warten müssen, bis ein Dokument fertig gestellt ist, bevor Sie das nächste senden. Je größer die Dokumente, desto weniger Dokumente können Sie pro Zeiteinheit verarbeiten.
Um diese Probleme zu verringern, sollten Sie bei der Verarbeitung sehr großer Dokumente bedenken, dass sich die relevanten Daten in vielen Fällen auf einer kleineren Teilmenge von Seiten befinden und diese Teilmenge mit dem Intelligent Keyword Classifier aufgeteilt werden kann. Dies kann sehr effektiv sein, da so Fehler/Ausfälle/Timeouts bei ML-Fähigkeiten eliminiert werden, der Durchsatz und die Reaktionsfähigkeit steigen, die Extraktionsgenauigkeit durch die Reduzierung von falsch positiven Ergebnissen erhöht wird und die Kosten sinken, indem unnötiger Verbrauch von AI Units verhindert wird.