- Überblick
- Erstellen von Modellen
- Verbrauchen von Modellen
- ML-Pakete
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 9465 – ML-Paket
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Öffentliche Endpunkte
- Unterstützte Sprachen
- Daten und Sicherheit
- Lizenzierungs- und Gebührenlogik
- Anleitungen zu …
- Tabellen und Tabellenzeilen gruppieren
- Kontrollkästchen und Signaturen
- Dokumente automatisch klassifizieren
- Trainieren eines Klassifizierers
Kontrollkästchen und Signaturen
Kontrollkästchen und Signaturen sind zwei Elemente, die in verschiedenen Dokumenttypen eine entscheidende Rolle spielen, von vertraglichen Vereinbarungen bis hin zu Registrierungsformularen. Es ist wichtig, dass Sie wissen, wie Kontrollkästchen und Signaturen korrekt mit Anmerkungen versehen werden, um Ihr Modell optimal nutzen zu können.
- Sich gegenseitig ausschließende Kontrollkästchen.
- Kontrollkästchen, die sich nicht gegenseitig ausschließen, in denen Sie mehr als eine Option auswählen können.
Ein wichtiger Aspekt, der berücksichtigt werden muss, ist die Anzahl der Auswahlmöglichkeiten, die in einem bestimmten Mehrfachauswahlfeld angeboten werden. In manchen Fällen gibt es nur eine Option, bei der das Kontrollkästchen entweder angekreuzt oder nicht angekreuzt wird. In vielen Fällen gibt es jedoch 10, 20 oder sogar mehr Optionen, die oft in einem Raster- oder Tabellenformat organisiert sind, das bei Gesundheitsformularen üblich ist.
Für die Anmerkungen dieser vielfältigen Multiple-Choice-Felder gibt es zwei Hauptmethoden, die Sie verwenden können.
Im Folgenden soll anhand eines Beispiels erläutert werden, wie Sie die Optionen beschriften können.
Dieser Ansatz hat den Vorteil, dass Sie ein einziges Feld haben, das weniger Daten erfordert. Dies hängt auch nicht von der erfolgreichen Erkennung von Kontrollkästchen ab. Wenn beispielsweise ein Kontrollkästchen fälschlicherweise als Buchstabe X erkannt wird, kann das Modell dennoch lernen, dass es die Auswahl der daneben stehenden Option bedeutet.
Ein potenzieller Nachteil besteht jedoch darin, dass sichergestellt werden muss, dass beide Optionen ungefähr gleich vertreten sind, was möglicherweise nicht immer der Fall ist. Wenn beispielsweise bei 90 % der Dokumente in Ihrem Dataset 2018 angekreuzt ist, könnte die Leistung des Modells beeinträchtigt werden, was zum Fehlschlagen dieses Ansatzes führt. Das Problem wird noch schlimmer, wenn Sie mehr Optionen haben, da einige davon fast immer selten sind. In diesen Fällen müssen Sie möglicherweise gefälschte Dokumente erstellen, bei denen die seltenen Optionen aktiviert sind, um einen Ausgleich zu schaffen.
Dieser Ansatz vereinfacht auch den Anmerkungsprozess und ist weniger anfällig für Fehler bei der Erkennung von Kontrollkästchen. Er kann jedoch empfindlicher auf unausgewogene Optionen reagieren.
Signaturen können mit UiPath Document OCR identifiziert werden, sodass ML-Modelle sie direkt erkennen können.
Sie können eine Signatur wie jedes andere Feld in Ihrem Dokument mit Anmerkungen versehen. Sobald die Signatur durch die UiPath Document OCR identifiziert wurde, lernt das ML-Modell, das Feld als Signatur zu erkennen.
Zur Inferenzzeit wird die Signatur so abgerufen, wie sie in den Dokumenten angezeigt wird. Anschließend müssen Sie dies mithilfe der RPA-Logik in ein boolesches Feld (Ja/Nein) konvertieren.