Document Understanding – Kontrollkästchen und Signaturen

document-understanding

2021.10

false

Document Understanding-Benutzerhandbuch.

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Kontrollkästchen und Signaturen

Kontrollkästchen

Im Kontext eines ML-Extraktionsmodells ist ein Kontrollkästchen kein tatsächlicher Wert, sondern eine Möglichkeit, einen bestimmten Textteil auszuwählen.

Deshalb wird das Wort daneben zum Fokuspunkt und nicht das Kontrollkästchen. Und genau dies ist der Zweck des Kontrollkästchens: als Anker für ein bestimmtes Wort zu fungieren.

Um ein ML-Modell zu trainieren, müssen Sie daher das Wort und nicht das Kontrollkästchen beschriften.

In einigen Fällen wird das Kontrollkästchen nicht erkannt. Zum Beispiel könnte der OCR es als X lesen, oder vielleicht ist es nur ein handgeschriebenes Zeichen, das überhaupt nicht aufgenommen wird. Das ML-Modell kann diese Situationen lernen und mit dem Wort neben der Markierung verknüpfen.

Es ist also robuster, ein Modell so zu trainieren, dass ein Wort erkannt wird, unabhängig davon, wie es ausgewählt wird: mit einem Kontrollkästchen, mit einem X oder mit einem handschriftlichen Zeichen (eingekreist, unterstrichen usw.).

Kontrollkästchen mit einzelnen Optionen

Im obigen Beispiel können Sie zwei Felder in Data Manager wie folgt erstellen:

Erkrankung-Beschäftigung (das Wort JA beschriften)
Erkrankung-Selbstunfall (das Wort JA beschriften)

Das ML-Modell lernt, diese Wörter zu erkennen, ganz gleich, ob sie durch Kontrollkästchen, X oder die Einkreisung mit einem Stift gekennzeichnet sind. Dazu könnten Sie UiPath Document OCR verwenden, das sogar Kontrollkästchen erkennen kann.

Kontrollkästchen ohne Beschriftung

Es gibt Fälle, in denen einem Kontrollkästchen keine Beschriftung zugeordnet ist. Zum Beispiel, wenn Kontrollkästchen Teil von Tabellen sind.

Hier ist ein typisches Beispiel:

In diesem Fall müssen die Kästchen beschriftet werden. Der Extraktor gibt den Zeichenfolgenwert des Kontrollkästchens zurück, das eines dieser beiden Zeichen ist:

Diese beiden Zeichen lassen sich wie jedes andere kopieren und einfügen sowie in Workflows verwenden, um zu überprüfen, ob ein Kontrollkästchen als checked oder unchecked zurückgegeben wurde. Darüber hinaus weiß das Framework IntelligentOCR, wie man diese erkennt, insbesondere wenn ein Feld als Boolean definiert ist:

wenn der Extraktor ☒ zurückgibt, entspricht dies JA
wenn der Extraktor ☐ zurückgibt, entspricht dies NEIN.

In Fällen, in denen ein deaktiviertes Kästchen als O oder D bzw. ein aktiviertes Kontrollkästchen als X, V, K oder R zurückgegeben wird, können diese auch in die RPA Workflowlogik aufgenommen werden, um den Workflow stabiler zu machen, wenn solche OCR-Fehler auftreten.

Signaturerkennung

Signaturen sind visuelle Funktionen, die von keiner OCR Engine erkannt werden, sodass ein ML-Modell sie nicht direkt erkennen kann.

UiPath ML-Modelle lernen jedoch, indem sowohl Wörter als auch Pixel auf dem Bild erfasst werden. Dies kann zur Erkennung von Unterschriften eingesetzt werden.

Nehmen wir als Beispiel das folgende Formular.

Am Ende der Seite befindet sich neben der Unterschrift der Text Signature of U.S. person. Der Textinhalt spielt keine Rolle, solange er sich nahe genug an der (ggf. vorhandenen) Unterschrift befindet. Unterschriften werden ähnlich wie Kontrollkästchen behandelt – siehe Abschnitt Kontrollkästchen oben.

Sie können ein Textfeld mit dem Namen Signatur erstellen und wenn das Dokument eine Signatur hat, beschriften Sie die Wörter Unterschrift der US-Person als Signaturfeld. Wenn das Dokument keine Signatur hat, lassen Sie das Feld leer.

Dann müssen Sie sicherstellen, dass ungefähr auf der Hälfte der Dokumente Ihres Satzes eine Signatur ist und auf der anderen Hälfte keine. Es kann auch 60/40 % sein, aber nicht 80/20 % oder 90/10 %. Außerdem müssen Sie jeweils mindestens 20-30 Beispiele haben, damit das Modell dies lernen kann.

So können Sie das ML-Modell für die Signaturerkennung verwenden.

Auf dieser Seite

Kontrollkästchen
Kontrollkästchen mit einzelnen Optionen
Kontrollkästchen ohne Beschriftung
Signaturerkennung

War diese Seite hilfreich?

Vorherige (previous)Exportieren von Dokumenten

WeiterOCR-Dienste