- Überblick
- Erste Schritte
- Aktivitäten
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
- Insights-Dashboards
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- Modelldetails
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Zahlungsbelege – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Einschränkungen für den Datenverkehr
- OCR-Konfiguration
- Pipelines
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Daten und Sicherheit
- Lizenzierungs- und Gebührenlogik

Document Understanding classic user guide
Kontrollkästchen und Signaturen
Kontrollkästchen
Es gibt mehrere Arten von Multiple-Choice-Feldern, die Kontrollkästchen verwenden:
- sich gegenseitig ausschließende Kontrollkästchen
- die Kontrollkästchen, die sich nicht gegenseitig ausschließen, und mit denen Sie mehr als eine Option auswählen können.
Ein weiterer wichtiger Aspekt ist die Anzahl der verfügbaren Auswahlmöglichkeiten für ein bestimmtes Mehrfachauswahlfeld. In manchen Fällen gibt es nur eine einzige Option, bei der das Kontrollkästchen entweder angekreuzt oder nicht angekreuzt wird, während es in anderen Fällen 10, 20 oder mehr Optionen gibt, die in einem Raster oder in einer Tabelle angeordnet sind, wie bei vielen Gesundheitsformularen.
Es gibt zwei Möglichkeiten, diese Arten von Mehrfachauswahlfeldern zu beschriften.
Label the options
Let's take an example to understand how you can label the options. Forms can include the options Project or Policy. In this case, you only have one field, and you only label the selected word, i.e. label the word Project if the checkbox next to it is checked or the word Policy if the checkbox next to it is checked. If neither is checked then you label neither, and both being checked is not possible, and such documents would just be deleted from the training set.

Dieser Ansatz hat den Vorteil, dass Sie ein einziges Feld haben, das weniger Daten erfordert. Ein weiterer Vorteil ist, dass er nicht von einer erfolgreichen Erkennung von Kontrollkästchen abhängt. Wenn ein Kontrollkästchen als Buchstabe X erkannt wird, kann das Modell dennoch erlernen zu erkennen, dass die Option daneben ausgewählt ist.
The disadvantage is that you need to make sure both options are roughly equally represented, which is not always the case. Potentially, in your training set, 90% of the documents might have Project checked. In this case, the model cannot perform well and this approach fails. The problem gets worse when you have more options because some of them are almost always rare. In these cases you may need to create fake documents with the rare options checked to balance things out.
Beschriften der Optionen mit einem einzelnen mehrwertigen Feld
Dies erleichtert auch die Beschriftung und ist weniger anfällig für Fehler bei der Erkennung von Kontrollkästchen, allerdings reagiert es möglicherweise empfindlicher auf unausgeglichene Optionen, genau wie die erste Option.

Signaturerkennung
Starting with the 2022.4 LTS Enterprise release, signatures can be detected using the UiPath Document OCR, hence, Machine Learning Models can directly detect signatures.
Beschriften Sie eine Signatur wie jedes andere Feld in Ihrem Dokument. Sobald die UiPath Document OCR das Feld erkannt hat, kann das Machine Learning-Modell das Feld als Signatur erkennen.
For a more in depth signature analysis, you can also use the Signature Comparison model that resides in the UiPath Image Analysis ML Packages.