- Erste Schritte
- Framework-Komponenten
- Document Understanding im AI Center
- Pipelines
- ML-Pakete
- Data Manager
- OCR-Dienste
- Lizenzierung
- Referenzen
Kontrollkästchen und Signaturen
Im Kontext eines ML-Extraktionsmodells ist ein Kontrollkästchen kein tatsächlicher Wert, sondern eine Möglichkeit, einen bestimmten Textteil auszuwählen.
Deshalb wird das Wort daneben zum Fokuspunkt und nicht das Kontrollkästchen. Und genau dies ist der Zweck des Kontrollkästchens: als Anker für ein bestimmtes Wort zu fungieren.
Um ein ML-Modell zu trainieren, müssen Sie daher das Wort und nicht das Kontrollkästchen beschriften.
In einigen Fällen wird das Kontrollkästchen nicht erkannt. Zum Beispiel könnte der OCR es als X lesen, oder vielleicht ist es nur ein handgeschriebenes Zeichen, das überhaupt nicht aufgenommen wird. Das ML-Modell kann diese Situationen lernen und mit dem Wort neben der Markierung verknüpfen.
Es ist also robuster, ein Modell so zu trainieren, dass ein Wort erkannt wird, unabhängig davon, wie es ausgewählt wird: mit einem Kontrollkästchen, mit einem X oder mit einem handschriftlichen Zeichen (eingekreist, unterstrichen usw.).
Im obigen Beispiel können Sie drei Felder in Data Manager wie folgt erstellen:
- Erkrankung-Beschäftigung (das Wort JA beschriften)
- Erkrankung-Selbstunfall (das Wort JA beschriften)
- Erkrankung-anderer Unfall (das Wort NEIN beschriften).
Das ML-Modell lernt, diese Wörter zu erkennen, ganz gleich, ob sie durch Kontrollkästchen, X oder die Einkreisung mit einem Stift gekennzeichnet sind. Dazu könnten Sie UiPath Document OCR verwenden, das sogar Kontrollkästchen erkennen kann.
Es gibt Fälle, in denen einem Kontrollkästchen keine Beschriftung zugeordnet ist. Zum Beispiel, wenn Kontrollkästchen Teil von Tabellen sind.
Hier ist ein typisches Beispiel:
In diesem Fall müssen die Kästchen beschriftet werden. Der Extraktor gibt den Zeichenfolgenwert des Kontrollkästchens zurück, das eines dieser beiden Zeichen ist:
- ☒
- ☐
checked
oder unchecked
zurückgegeben wurde. Darüber hinaus weiß das Framework IntelligentOCR, wie man diese erkennt, insbesondere wenn ein Feld als Boolean
definiert ist:
- wenn der Extraktor ☒ zurückgibt, entspricht dies JA
- wenn der Extraktor ☐ zurückgibt, entspricht dies NEIN.
In Fällen, in denen ein deaktiviertes Kästchen als O oder D bzw. ein aktiviertes Kontrollkästchen als X, V, K oder R zurückgegeben wird, können diese auch in die RPA Workflowlogik aufgenommen werden, um den Workflow stabiler zu machen, wenn solche OCR-Fehler auftreten.
Signaturen sind visuelle Funktionen, die von keiner OCR Engine erkannt werden, sodass ein ML-Modell sie nicht direkt erkennen kann.
UiPath ML-Modelle lernen jedoch, indem sowohl Wörter als auch Pixel auf dem Bild erfasst werden. Dies kann zur Erkennung von Unterschriften eingesetzt werden.
Nehmen wir als Beispiel das folgende Formular.
Am Ende der Seite befindet sich neben der Unterschrift der Text Signature of U.S. person. Der Textinhalt spielt keine Rolle, solange er sich nahe genug an der (ggf. vorhandenen) Unterschrift befindet. Unterschriften werden ähnlich wie Kontrollkästchen behandelt – siehe Abschnitt Kontrollkästchen oben.
Sie können ein Textfeld mit dem Namen Signatur erstellen und wenn das Dokument eine Signatur hat, beschriften Sie die Wörter Unterschrift der US-Person als Signaturfeld. Wenn das Dokument keine Signatur hat, lassen Sie das Feld leer.
Dann müssen Sie sicherstellen, dass ungefähr auf der Hälfte der Dokumente Ihres Satzes eine Signatur ist und auf der anderen Hälfte keine. Es kann auch 60/40 % sein, aber nicht 80/20 % oder 90/10 %. Außerdem müssen Sie jeweils mindestens 20-30 Beispiele haben, damit das Modell dies lernen kann.
So können Sie das ML-Modell für die Signaturerkennung verwenden.