- Überblick
- Erstellen von Modellen
- Verbrauchen von Modellen
- ML-Pakete
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Öffentliche Endpunkte
- Unterstützte Sprachen
- Daten und Sicherheit
- Lizenzierungs- und Gebührenlogik
- Anleitungen zu …
Kontrollkästchen und Signaturen
Kontrollkästchen und Signaturen sind zwei Elemente, die in verschiedenen Dokumenttypen eine entscheidende Rolle spielen, von vertraglichen Vereinbarungen bis hin zu Registrierungsformularen. Es ist wichtig, dass Sie wissen, wie Kontrollkästchen und Signaturen korrekt mit Anmerkungen versehen werden, um Ihr Modell optimal nutzen zu können.
- Sich gegenseitig ausschließende Kontrollkästchen.
- Kontrollkästchen, die sich nicht gegenseitig ausschließen, in denen Sie mehr als eine Option auswählen können.
Ein wichtiger Aspekt, der berücksichtigt werden muss, ist die Anzahl der Auswahlmöglichkeiten, die in einem bestimmten Mehrfachauswahlfeld angeboten werden. In manchen Fällen gibt es nur eine Option, bei der das Kontrollkästchen entweder angekreuzt oder nicht angekreuzt wird. In vielen Fällen gibt es jedoch 10, 20 oder sogar mehr Optionen, die oft in einem Raster- oder Tabellenformat organisiert sind, das bei Gesundheitsformularen üblich ist.
Für die Anmerkungen dieser vielfältigen Multiple-Choice-Felder gibt es vier Hauptmethoden, die Sie verwenden können.
Im Folgenden soll anhand eines Beispiels erläutert werden, wie Sie die Optionen beschriften können.
Dieser Ansatz hat den Vorteil, dass Sie ein einziges Feld haben, das weniger Daten erfordert. Dies hängt auch nicht von der erfolgreichen Erkennung von Kontrollkästchen ab. Wenn beispielsweise ein Kontrollkästchen fälschlicherweise als Buchstabe X erkannt wird, kann das Modell dennoch lernen, dass es die Auswahl der daneben stehenden Option bedeutet.
Ein potenzieller Nachteil besteht jedoch darin, dass sichergestellt werden muss, dass beide Optionen ungefähr gleich vertreten sind, was möglicherweise nicht immer der Fall ist. Wenn beispielsweise bei 90 % der Dokumente in Ihrem Dataset 2018 angekreuzt ist, könnte die Leistung des Modells beeinträchtigt werden, was zum Fehlschlagen dieses Ansatzes führt. Das Problem wird noch schlimmer, wenn Sie mehr Optionen haben, da einige davon fast immer selten sind. In diesen Fällen müssen Sie möglicherweise gefälschte Dokumente erstellen, bei denen die seltenen Optionen aktiviert sind, um einen Ausgleich zu schaffen.
Im vorherigen Beispiel haben Sie möglicherweise zwei verschiedene Felder erstellt: eines mit der Bezeichnung 2018, in dem Sie das Kontrollkästchen für dieses Jahr konsistent mit Anmerkungen versehen, und ein weiteres mit der Bezeichnung 2019, in dem Sie das Kontrollkästchen für 2019 kontinuierlich mit Anmerkungen versehen, unabhängig davon, ob es aktiviert ist oder nicht. Der positive Aspekt dieser Methode ist, dass die Ausgewogenheit weniger kritisch wird. Selbst wenn eine Option in 90 % der Fälle ausgewählt wird, kann das Modell dennoch lernen, sie zu identifizieren, da die Kontrollkästchen feste Positionen haben.
Der Nachteil ist, dass Sie zwei Felder anstelle von einem haben. Auch wenn dies bei zwei Optionen möglicherweise kein großes Problem darstellt, kann die Handhabung von 10–20 Optionen und dementsprechend die Erstellung von 10–20 Feldern anstelle eines einzelnen den Anmerkungsprozess erheblich komplizieren. Zudem führt dies auch zu einem schwierigeren Modelltrainingsprozess, der mehr Trainingsdaten erfordert.
Ein weiterer Nachteil ist die gelegentliche falsche Erkennung des Kontrollkästchens, was dazu führen kann, dass eine komplexere Logik im Workflow erforderlich ist, um alle zurückgegebenen X-, V- oder K-Zeichen zu verwalten. In einigen Fällen kann die OCR sogar das Kontrollkästchen mit dem Wort daneben zusammenführen, z. B. X2018. Dies erfordert eine noch komplexere RPA-Logik, um die Situation zu bewältigen.
Felder mit mehreren Werten erleichtern das Hinzufügen von Anmerkungen und bleiben von Ungleichgewichten bei den ausgewählten Optionen oder einer großen Auswahl unberührt. Diese Felder unterliegen jedoch immer noch der Genauigkeit der Kontrollkästchenerkennung und dem potenziellen Risiko, dass Kontrollkästchen mit benachbarten Optionen zusammengeführt werden. OCR-Fehler sind sehr schwer zu vermeiden.
Dieser Ansatz vereinfacht auch den Anmerkungsprozess und ist weniger anfällig für Fehler bei der Erkennung von Kontrollkästchen. Er kann jedoch empfindlicher auf unausgewogene Optionen reagieren.
Alle diese Optionen können in bestimmten Situationen angemessen sein. Zunächst wird die erste Option bevorzugt. Da sich die Genauigkeit der Kontrollkästchenerkennung in UiPath® Document OCR verbessert hat, werden die Optionen zwei und drei bevorzugt.
Signaturen können mit UiPath Document OCR identifiziert werden, sodass ML-Modelle sie direkt erkennen können.
Sie können eine Signatur wie jedes andere Feld in Ihrem Dokument mit Anmerkungen versehen. Sobald die Signatur durch die UiPath Document OCR identifiziert wurde, lernt das ML-Modell, das Feld als Signatur zu erkennen.
Zur Inferenzzeit wird die Signatur so abgerufen, wie sie in den Dokumenten angezeigt wird. Anschließend müssen Sie dies mithilfe der RPA-Logik in ein boolesches Feld (Ja/Nein) konvertieren.
- Kontrollkästchen
- Versehen Sie die Option mit einer Anmerkung
- Beschriften der Kontrollkästchen mit einem separaten Feld für jedes Kontrollkästchen
- Versehen Sie nur die Kontrollkästchen mit einem einzelnen mehrwertigen Feld mit Anmerkungen.
- Beschriften der Optionen mit einem einzelnen mehrwertigen Feld
- Signaturerkennung