document-understanding
2023.4
false
UiPath logo, featuring letters U and I in white

Document Understanding-Benutzerhandbuch.

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Letzte Aktualisierung 18. Dez. 2024

Kontrollkästchen und Signaturen

Kontrollkästchen

Es gibt mehrere Arten von Multiple-Choice-Feldern, die Kontrollkästchen verwenden:

  • sich gegenseitig ausschließende Kontrollkästchen
  • die Kontrollkästchen, die sich nicht gegenseitig ausschließen, und mit denen Sie mehr als eine Option auswählen können.

Ein weiterer wichtiger Aspekt ist die Anzahl der verfügbaren Auswahlmöglichkeiten für ein bestimmtes Mehrfachauswahlfeld. In manchen Fällen gibt es nur eine einzige Option, bei der das Kontrollkästchen entweder angekreuzt oder nicht angekreuzt wird, während es in anderen Fällen 10, 20 oder mehr Optionen gibt, die in einem Raster oder in einer Tabelle angeordnet sind, wie bei vielen Gesundheitsformularen.

There are two major ways in which you may label these kinds of multiple choice fields.

Label the options

Im Folgenden soll anhand eines Beispiels erläutert werden, wie Sie die Optionen beschriften können. Formulare können die Optionen Project oder Policy enthalten. In diesem Fall haben Sie nur ein Feld und Sie beschriften nur das ausgewählte Wort, d. h. Sie beschriften das Wort Project, wenn das Kontrollkästchen daneben aktiviert ist, oder das Wort Policy, wenn das Kontrollkästchen daneben aktiviert ist. Ist keines von beiden markiert, wird auch keines beschriftet, und wenn beide markiert sind, ist das nicht möglich. Solche Dokumente würden einfach aus der Trainingsmenge gelöscht.



Dieser Ansatz hat den Vorteil, dass Sie ein einziges Feld haben, das weniger Daten erfordert. Ein weiterer Vorteil ist, dass er nicht von einer erfolgreichen Erkennung von Kontrollkästchen abhängt. Wenn ein Kontrollkästchen als Buchstabe X erkannt wird, kann das Modell dennoch erlernen zu erkennen, dass die Option daneben ausgewählt ist.

Der Nachteil besteht darin, dass Sie sicherstellen müssen, dass beide Optionen ungefähr gleich vertreten sind, was nicht immer der Fall ist. Möglicherweise haben 90 % der Dokumente in Ihrem Trainingsset Project angekreuzt. In diesem Fall kann das Modell keine gute Leistung erbringen und dieser Ansatz schlägt fehl. Das Problem wird noch schlimmer, wenn Sie mehr Optionen haben, da einige davon fast immer selten sind. In diesen Fällen müssen Sie möglicherweise gefälschte Dokumente erstellen, bei denen die seltenen Optionen aktiviert sind, um einen Ausgleich zu schaffen.

Label the checkboxes, with separate field for each checkbox

Im obigen Beispiel haben Sie möglicherweise ein Feld namens Project, in dem Sie immer das Kontrollkästchen für Project beschriften, und ein Feld namens policy, in dem Sie immer das Kontrollkästchen für Policy beschriften, unabhängig davon, ob sie aktiviert sind oder nicht. Dies hat den Vorteil, dass der Saldo viel weniger wichtig ist. Selbst wenn eine der Optionen in 90 % der Fälle angekreuzt ist, lernt das Modell, sie zu erkennen, weil die Kontrollkästchen immer an der gleichen Stelle sind.

Der Nachteil ist, dass Sie zwei Felder anstelle von einem haben. Wenn es zwei Optionen gibt, ist dies vielleicht keine große Sache, aber wenn es 10 bis 20 Optionen gibt, ist die Beschriftung mit 10 bis 20 Feldern viel schwieriger, das Modell ist schwieriger zu trainieren und erfordert mehr Trainingsdaten.

Ein weiterer Nachteil ist, dass das Kontrollkästchen manchmal nicht richtig erkannt wird und Sie möglicherweise eine komplexere Logik im Workflow einbauen müssen, um alle zurückgegebenen X-, V- oder K-Zeichen zu erfassen. In einigen Fällen kann die OCR sogar das Kontrollkästchen mit dem Wort daneben zusammenführen, z. B. XProject. Dies erfordert eine noch komplexere RPA-Logik, um die Situation zu bewältigen.



Beschriften nur der Kontrollkästchen mit einem einzigen mehrwertigen Feld

Felder mit mehreren Werten sind Teil des Release 2022.10 von Document UnderstandingTM. Dadurch wird die Beschriftung einfacher. Sie wird nicht durch unausgewogene Auswahlmöglichkeiten oder durch eine große Anzahl von Optionen beeinträchtigt. Es hängt jedoch immer noch von der Genauigkeit der Kontrollkästchenerkennung oder dem Risiko ab, dass Kontrollkästchen mit den Optionen neben ihnen zusammengeführt werden. OCR-Fehler sind sehr schwer zu vermeiden.



Beschriften der Optionen mit einem einzelnen mehrwertigen Feld

Dies erleichtert auch die Beschriftung und ist weniger anfällig für Fehler bei der Erkennung von Kontrollkästchen, allerdings reagiert es möglicherweise empfindlicher auf unausgeglichene Optionen, genau wie die erste Option.



Signaturerkennung

Ab Release 2022.4 von LTS Enterprise können Unterschriften mit UiPath Document OCR erkannt werden, sodass Machine Learning-Modelle Unterschriften direkt erkennen können.

Beschriften Sie eine Signatur wie jedes andere Feld in Ihrem Dokument. Sobald die UiPath Document OCR das Feld erkannt hat, kann das Machine Learning-Modell das Feld als Signatur erkennen.

Hinweis: Für eine detailliertere Signaturanalyse können Sie auch das Signaturvergleichsmodell verwenden, das sich in den UiPath Image Analysis ML-Paketen befindet.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten