document-understanding
latest
false
Document Understanding-Benutzerhandbuch.
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 21. Okt. 2024

Kontrollkästchen und Signaturen

Kontrollkästchen und Signaturen sind zwei Elemente, die in verschiedenen Dokumenttypen eine entscheidende Rolle spielen, von vertraglichen Vereinbarungen bis hin zu Registrierungsformularen. Es ist wichtig, dass Sie wissen, wie Kontrollkästchen und Signaturen korrekt mit Anmerkungen versehen werden, um Ihr Modell optimal nutzen zu können.

Kontrollkästchen

Wenn Sie Ihre Dokumente mit Anmerkungen versehen, können Sie auf mehrere Typen von Multiple-Choice-Feldern stoßen, die Kontrollkästchen verwenden:
  • Sich gegenseitig ausschließende Kontrollkästchen.
  • Kontrollkästchen, die sich nicht gegenseitig ausschließen, in denen Sie mehr als eine Option auswählen können.

Ein wichtiger Aspekt, der berücksichtigt werden muss, ist die Anzahl der Auswahlmöglichkeiten, die in einem bestimmten Mehrfachauswahlfeld angeboten werden. In manchen Fällen gibt es nur eine Option, bei der das Kontrollkästchen entweder angekreuzt oder nicht angekreuzt wird. In vielen Fällen gibt es jedoch 10, 20 oder sogar mehr Optionen, die oft in einem Raster- oder Tabellenformat organisiert sind, das bei Gesundheitsformularen üblich ist.

Für die Anmerkungen dieser vielfältigen Multiple-Choice-Felder gibt es vier Hauptmethoden, die Sie verwenden können.

Versehen Sie die Option mit einer Anmerkung

Im Folgenden soll anhand eines Beispiels erläutert werden, wie Sie die Optionen beschriften können.

Hinweis: Bevor Sie mit dem Kommentieren von Optionen beginnen, stellen Sie sicher, dass Sie für jede relevante Option ein reguläres Feld erstellt haben.


Berücksichtigen Sie Situationen, in denen ein Dokument Optionen für das Jahr enthält. In diesen Szenarien haben Sie nur ein Feld und kommentieren nur das ausgewählte Wort. Zum Beispiel können Sie 2018 mit einer Anmerkung versehen, wenn das Kontrollkästchen daneben aktiviert ist, oder 2019, wenn diese Option ausgewählt ist. Wenn keine der Optionen ausgewählt ist, sollte keine mit Anmerkungen versehen werden. Ein Szenario, in dem beide Optionen aktiviert sind, ist nicht möglich; Dokumente mit solchen Instanzen sollten im Set weggelassen werden.


Dieser Ansatz hat den Vorteil, dass Sie ein einziges Feld haben, das weniger Daten erfordert. Dies hängt auch nicht von der erfolgreichen Erkennung von Kontrollkästchen ab. Wenn beispielsweise ein Kontrollkästchen fälschlicherweise als Buchstabe X erkannt wird, kann das Modell dennoch lernen, dass es die Auswahl der daneben stehenden Option bedeutet.

Ein potenzieller Nachteil besteht jedoch darin, dass sichergestellt werden muss, dass beide Optionen ungefähr gleich vertreten sind, was möglicherweise nicht immer der Fall ist. Wenn beispielsweise bei 90 % der Dokumente in Ihrem Dataset 2018 angekreuzt ist, könnte die Leistung des Modells beeinträchtigt werden, was zum Fehlschlagen dieses Ansatzes führt. Das Problem wird noch schlimmer, wenn Sie mehr Optionen haben, da einige davon fast immer selten sind. In diesen Fällen müssen Sie möglicherweise gefälschte Dokumente erstellen, bei denen die seltenen Optionen aktiviert sind, um einen Ausgleich zu schaffen.

Beschriften der Kontrollkästchen mit einem separaten Feld für jedes Kontrollkästchen

Hinweis: Bevor Sie mit dem Kommentieren von Optionen beginnen, stellen Sie sicher, dass Sie für jede relevante Option ein reguläres Feld erstellt haben.


Im vorherigen Beispiel haben Sie möglicherweise zwei verschiedene Felder erstellt: eines mit der Bezeichnung 2018, in dem Sie das Kontrollkästchen für dieses Jahr konsistent mit Anmerkungen versehen, und ein weiteres mit der Bezeichnung 2019, in dem Sie das Kontrollkästchen für 2019 kontinuierlich mit Anmerkungen versehen, unabhängig davon, ob es aktiviert ist oder nicht. Der positive Aspekt dieser Methode ist, dass die Ausgewogenheit weniger kritisch wird. Selbst wenn eine Option in 90 % der Fälle ausgewählt wird, kann das Modell dennoch lernen, sie zu identifizieren, da die Kontrollkästchen feste Positionen haben.

Der Nachteil ist, dass Sie zwei Felder anstelle von einem haben. Auch wenn dies bei zwei Optionen möglicherweise kein großes Problem darstellt, kann die Handhabung von 10–20 Optionen und dementsprechend die Erstellung von 10–20 Feldern anstelle eines einzelnen den Anmerkungsprozess erheblich komplizieren. Zudem führt dies auch zu einem schwierigeren Modelltrainingsprozess, der mehr Trainingsdaten erfordert.

Ein weiterer Nachteil ist die gelegentliche falsche Erkennung des Kontrollkästchens, was dazu führen kann, dass eine komplexere Logik im Workflow erforderlich ist, um alle zurückgegebenen X-, V- oder K-Zeichen zu verwalten. In einigen Fällen kann die OCR sogar das Kontrollkästchen mit dem Wort daneben zusammenführen, z. B. X2018. Dies erfordert eine noch komplexere RPA-Logik, um die Situation zu bewältigen.



Versehen Sie nur die Kontrollkästchen mit einem einzelnen mehrwertigen Feld mit Anmerkungen.

Hinweis: Um diesen Ansatz zu verwenden, erstellen Sie ein Feld mit mehreren Werten, das Sie für die Anmerkung der Kontrollkästchen verwenden werden.


Felder mit mehreren Werten erleichtern das Hinzufügen von Anmerkungen und bleiben von Ungleichgewichten bei den ausgewählten Optionen oder einer großen Auswahl unberührt. Diese Felder unterliegen jedoch immer noch der Genauigkeit der Kontrollkästchenerkennung und dem potenziellen Risiko, dass Kontrollkästchen mit benachbarten Optionen zusammengeführt werden. OCR-Fehler sind sehr schwer zu vermeiden.



Beschriften der Optionen mit einem einzelnen mehrwertigen Feld

Hinweis: Um diesen Ansatz zu verwenden, erstellen Sie ein Feld mit mehreren Werten, das Sie für die Anmerkung der Kontrollkästchen verwenden werden.


Dieser Ansatz vereinfacht auch den Anmerkungsprozess und ist weniger anfällig für Fehler bei der Erkennung von Kontrollkästchen. Er kann jedoch empfindlicher auf unausgewogene Optionen reagieren.

Alle diese Optionen können in bestimmten Situationen angemessen sein. Zunächst wird die erste Option bevorzugt. Da sich die Genauigkeit der Kontrollkästchenerkennung in UiPath® Document OCR verbessert hat, werden die Optionen zwei und drei bevorzugt.



Signaturerkennung

Signaturen können mit UiPath Document OCR identifiziert werden, sodass ML-Modelle sie direkt erkennen können.

Sie können eine Signatur wie jedes andere Feld in Ihrem Dokument mit Anmerkungen versehen. Sobald die Signatur durch die UiPath Document OCR identifiziert wurde, lernt das ML-Modell, das Feld als Signatur zu erkennen.

Zur Inferenzzeit wird die Signatur so abgerufen, wie sie in den Dokumenten angezeigt wird. Anschließend müssen Sie dies mithilfe der RPA-Logik in ein boolesches Feld (Ja/Nein) konvertieren.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten