- Überblick
- Erste Schritte
- Aktivitäten
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
- Insights-Dashboards
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Einschränkungen für den Datenverkehr
- OCR-Konfiguration
- Pipelines
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Lizenzierung
Kontrollkästchen und Signaturen
Es gibt mehrere Arten von Multiple-Choice-Feldern, die Kontrollkästchen verwenden:
- sich gegenseitig ausschließende Kontrollkästchen
- die Kontrollkästchen, die sich nicht gegenseitig ausschließen, und mit denen Sie mehr als eine Option auswählen können.
Ein weiterer wichtiger Aspekt ist die Anzahl der verfügbaren Auswahlmöglichkeiten für ein bestimmtes Mehrfachauswahlfeld. In manchen Fällen gibt es nur eine einzige Option, bei der das Kontrollkästchen entweder angekreuzt oder nicht angekreuzt wird, während es in anderen Fällen 10, 20 oder mehr Optionen gibt, die in einem Raster oder in einer Tabelle angeordnet sind, wie bei vielen Gesundheitsformularen.
Es gibt zwei Hauptmöglichkeiten, diese Art von Multiple-Choice-Feldern zu beschriften.
Im Folgenden soll anhand eines Beispiels erläutert werden, wie Sie die Optionen beschriften können. Formulare können die Optionen Project oder Policy enthalten. In diesem Fall haben Sie nur ein Feld und Sie beschriften nur das ausgewählte Wort, d. h. Sie beschriften das Wort Project, wenn das Kontrollkästchen daneben aktiviert ist, oder das Wort Policy, wenn das Kontrollkästchen daneben aktiviert ist. Ist keines von beiden markiert, wird auch keines beschriftet, und wenn beide markiert sind, ist das nicht möglich. Solche Dokumente würden einfach aus der Trainingsmenge gelöscht.
Dieser Ansatz hat den Vorteil, dass Sie ein einziges Feld haben, das weniger Daten erfordert. Ein weiterer Vorteil ist, dass er nicht von einer erfolgreichen Erkennung von Kontrollkästchen abhängt. Wenn ein Kontrollkästchen als Buchstabe X erkannt wird, kann das Modell dennoch erlernen zu erkennen, dass die Option daneben ausgewählt ist.
Der Nachteil besteht darin, dass Sie sicherstellen müssen, dass beide Optionen ungefähr gleich vertreten sind, was nicht immer der Fall ist. Möglicherweise haben 90 % der Dokumente in Ihrem Trainingsset Project angekreuzt. In diesem Fall kann das Modell keine gute Leistung erbringen und dieser Ansatz schlägt fehl. Das Problem wird noch schlimmer, wenn Sie mehr Optionen haben, da einige davon fast immer selten sind. In diesen Fällen müssen Sie möglicherweise gefälschte Dokumente erstellen, bei denen die seltenen Optionen aktiviert sind, um einen Ausgleich zu schaffen.
Ab Release 2022.4 von LTS Enterprise können Unterschriften mit UiPath Document OCR erkannt werden, sodass Machine Learning-Modelle Unterschriften direkt erkennen können.
Beschriften Sie eine Signatur wie jedes andere Feld in Ihrem Dokument. Sobald die UiPath Document OCR das Feld erkannt hat, kann das Machine Learning-Modell das Feld als Signatur erkennen.