document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Document Understanding-Benutzerhandbuch für moderne Projekte

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Letzte Aktualisierung 20. Nov. 2024

Kontrollkästchen und Signaturen

Kontrollkästchen und Signaturen sind zwei Elemente, die in verschiedenen Dokumenttypen eine entscheidende Rolle spielen, von vertraglichen Vereinbarungen bis hin zu Registrierungsformularen. Es ist wichtig, dass Sie wissen, wie Kontrollkästchen und Signaturen korrekt mit Anmerkungen versehen werden, um Ihr Modell optimal nutzen zu können.

Kontrollkästchen

Wenn Sie Ihre Dokumente mit Anmerkungen versehen, können Sie auf mehrere Typen von Multiple-Choice-Feldern stoßen, die Kontrollkästchen verwenden:
  • Sich gegenseitig ausschließende Kontrollkästchen.
  • Kontrollkästchen, die sich nicht gegenseitig ausschließen, in denen Sie mehr als eine Option auswählen können.

Ein wichtiger Aspekt, der berücksichtigt werden muss, ist die Anzahl der Auswahlmöglichkeiten, die in einem bestimmten Mehrfachauswahlfeld angeboten werden. In manchen Fällen gibt es nur eine Option, bei der das Kontrollkästchen entweder angekreuzt oder nicht angekreuzt wird. In vielen Fällen gibt es jedoch 10, 20 oder sogar mehr Optionen, die oft in einem Raster- oder Tabellenformat organisiert sind, das bei Gesundheitsformularen üblich ist.

Für die Anmerkungen dieser vielfältigen Multiple-Choice-Felder gibt es zwei Hauptmethoden, die Sie verwenden können.

Versehen Sie die Option mit einer Anmerkung

Im Folgenden soll anhand eines Beispiels erläutert werden, wie Sie die Optionen beschriften können.

Hinweis: Bevor Sie mit dem Kommentieren von Optionen beginnen, stellen Sie sicher, dass Sie für jede relevante Option ein reguläres Feld erstellt haben.


Berücksichtigen Sie Situationen, in denen ein Dokument Optionen für das Jahr enthält. In diesen Szenarien haben Sie nur ein Feld und kommentieren nur das ausgewählte Wort. Zum Beispiel können Sie 2018 mit einer Anmerkung versehen, wenn das Kontrollkästchen daneben aktiviert ist, oder 2019, wenn diese Option ausgewählt ist. Wenn keine der Optionen ausgewählt ist, sollte keine mit Anmerkungen versehen werden. Ein Szenario, in dem beide Optionen aktiviert sind, ist nicht möglich; Dokumente mit solchen Instanzen sollten im Set weggelassen werden.


Dieser Ansatz hat den Vorteil, dass Sie ein einziges Feld haben, das weniger Daten erfordert. Dies hängt auch nicht von der erfolgreichen Erkennung von Kontrollkästchen ab. Wenn beispielsweise ein Kontrollkästchen fälschlicherweise als Buchstabe X erkannt wird, kann das Modell dennoch lernen, dass es die Auswahl der daneben stehenden Option bedeutet.

Ein potenzieller Nachteil besteht jedoch darin, dass sichergestellt werden muss, dass beide Optionen ungefähr gleich vertreten sind, was möglicherweise nicht immer der Fall ist. Wenn beispielsweise bei 90 % der Dokumente in Ihrem Dataset 2018 angekreuzt ist, könnte die Leistung des Modells beeinträchtigt werden, was zum Fehlschlagen dieses Ansatzes führt. Das Problem wird noch schlimmer, wenn Sie mehr Optionen haben, da einige davon fast immer selten sind. In diesen Fällen müssen Sie möglicherweise gefälschte Dokumente erstellen, bei denen die seltenen Optionen aktiviert sind, um einen Ausgleich zu schaffen.

Beschriften der Optionen mit einem einzelnen mehrwertigen Feld

Hinweis: Um diesen Ansatz zu verwenden, erstellen Sie ein Feld mit mehreren Werten, das Sie für die Anmerkung der Kontrollkästchen verwenden werden.


Dieser Ansatz vereinfacht auch den Anmerkungsprozess und ist weniger anfällig für Fehler bei der Erkennung von Kontrollkästchen. Er kann jedoch empfindlicher auf unausgewogene Optionen reagieren.



Signaturerkennung

Signaturen können mit UiPath Document OCR identifiziert werden, sodass ML-Modelle sie direkt erkennen können.

Sie können eine Signatur wie jedes andere Feld in Ihrem Dokument mit Anmerkungen versehen. Sobald die Signatur durch die UiPath Document OCR identifiziert wurde, lernt das ML-Modell, das Feld als Signatur zu erkennen.

Zur Inferenzzeit wird die Signatur so abgerufen, wie sie in den Dokumenten angezeigt wird. Anschließend müssen Sie dies mithilfe der RPA-Logik in ein boolesches Feld (Ja/Nein) konvertieren.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten