document-understanding
2022.4
false
UiPath logo, featuring letters U and I in white

Document Understanding-Benutzerhandbuch.

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Letzte Aktualisierung 11. Nov. 2024

Erstellen und Konfigurieren von Feldern

Felder können nicht umbenannt werden. Seien Sie sich also sicher, bevor Sie ein Feld benennen. Wenn Sie später jedoch entscheiden, dass Sie bestimmte Felder nicht zum Training eines ML-Modells verwenden möchten, können Sie sie entweder löschen oder sie jederzeit mit dem Kontrollkästchen Ausgeblendet im Fenster Feld bearbeiten ausblenden.

Hinweis: Maximal 300 Felder können erstellt werden.

Spaltenfelder

Ein Zeilenelement Beschreibung oder Stückpreis in einem Rechnungsdokument wären Beispiele für Spaltenfelder.

Erstellen eines neuen Spaltenfelds

  1. Klicken Sie im Tabellenabschnitt oben auf der Seite auf docs image, um ein neues Spaltenfeld hinzuzufügen. Das Fenster Spaltenfeld erstellen wird angezeigt.
  2. Geben Sie einen eindeutigen Namen für das Feld im Feld Eindeutigen Feldnamen eingeben ein. Das Feld akzeptiert keine Großbuchstaben. Es darf nur Kleinbuchstaben, Ziffern, Unterstriche _ und Bindestriche - enthalten.
  3. Klicken Sie auf Erstellen. Das Fenster Feld bearbeiten wird angezeigt.
  4. Wählen Sie in der Dropdownliste Inhaltstyp den Inhaltstyp aus.
  5. Wählen Sie in der Dropdownliste Punktzahl das Maß aus, das zur Bestimmung der Genauigkeit beim Auswerten von Modellvorhersagen verwendet wird.
  6. Klicken Sie auf das Feld Hotkey und drücken Sie eine Taste auf Ihrer Tastatur, um sie automatisch einzufügen.
  7. Geben Sie den Hex-Code der gewünschten Feldfarbe auf dem Feld Farbe ein.
  8. Aktivieren Sie das Kontrollkästchen Elemente aufteilen, wenn dieses Feld als Trennzeichen zwischen Positionen oder Zeilen in einer Tabelle verwendet werden soll. Jede Zeile, in der dieses Feld erscheint, wird als neue Position oder neue Zeile in der Tabelle betrachtet. Am häufigsten wird dies für Zeilenbetrag-Felder in Rechnungspositionen verwendet.
  9. Aktivieren Sie das Kontrollkästchen Ausgeblendet, wenn dieses Feld nicht zu den exportierten Datasets gehören soll.
  10. Klicken Sie auf Speichern, um Ihre Einstellungen zu speichern.

Bearbeiten eines Spaltenfelds

Klicken Sie auf die Schaltfläche Feld bearbeiten . Die verfügbaren Optionen für Spaltenfelder finden Sie in der nachfolgenden Tabelle.

Option

Beschreibung

Inhaltstyp

Der Inhaltstyp eines Felds:

  • string: Geeignet für Firmennamen oder Adressen sowie Zahlungsbedingungen und andere Felder, in denen RPA-Entwickler die Analyse- oder Formatierungslogik manuell im RPA-Workflow erstellen möchten.
  • number: Geeignet für Beträge oder Mengen, mit intelligenter Analyse der Dezimal-/Tausendertrennzeichen.
  • date: Das Modell analysiert, formatiert und vereinheitlicht die Ausgabe im Format yyyy-mm-dd.
  • ** phone**: Geeignet für Telefonnummern. Bei der Formatierung werden Buchstaben und Klammern entfernt. Leerzeichen werden durch Bindestriche ersetzt.
  • id-no: Geeignet für alphanumerische Codes und IDs. Ähnlich wie der Inhaltstyp „string“, enthält aber die Bereinigung aller Zeichen, die vor einem Doppelpunkt : stehen. Wenn die zu extrahierende ID-Nummer Doppelpunkte : enthält, verwenden Sie stattdessen string als Inhaltstyp, damit keine Informationen verloren gehen.

Verknüpfung

Die Tastenkombination für das Feld. Ein oder zwei Schlüssel sind zulässig.

Farbe

Die Farbe für das Feld im HEX-Format. Wenn der Wert nicht gültig ist, wird ein neuer generiert.

Punktzahl

Maß zur Bestimmung der Genauigkeit beim Auswerten von Modellvorhersagen. Kann nur für den Inhaltstyp string konfiguriert werden. Alle anderen Inhaltstypen verwenden eine „Exact Match“-Bewertungsstrategie. Optionen:

  • exact match: Eine Vorhersage gilt nur dann als richtig (Punktzahl 1), wenn sie exakt dem wahren Wert entspricht. Unterscheidet sie sich auch nur um ein einziges Zeichen, so gilt sie als falsch (Punktzahl 0).
  • levenshtein: Eine Vorhersage wird gemäß der Levenshtein-Distanz zwischen der Vorhersage und dem true-Wert als teilweise richtig erachtet. Wenn ein 10-Buchstaben-Wert bis auf die letzten 2 Zeichen korrekt vorhergesagt wird, dann beträgt die Punktzahl dieser Vorhersage 0,8.

Elemente aufteilen

Aktivieren Sie dieses Kontrollkästchen, wenn dieses Feld als Trennzeichen zwischen Elementen oder Zeilen in einer Tabelle verwendet werden soll. Jede Zeile, in der dieses Feld erscheint, wird als neue Position oder neue Zeile in der Tabelle betrachtet. Am häufigsten wird dies für Zeilenbetrag-Felder in Rechnungspositionen verwendet.

Ausgeblendet

Aktivieren Sie dieses Kontrollkästchen, wenn dieses Feld nicht zu den exportierten Datasets gehören soll.

Löschen eines Spaltenfelds

Führen Sie die folgenden Schritte aus, um ein Spaltenfeld zu löschen:

  1. Klicken Sie beim Spaltenfeld, das Sie löschen möchten, auf die Schaltfläche Feld bearbeiten docs image.
  2. Klicken Sie auf die Schaltfläche Löschen.
  3. Geben Sie den genauen Namen des Felds ein.


  4. Klicken Sie auf OK.
  5. Das Spaltenfeld und die zugehörigen beschrifteten Daten werden gelöscht.

Reguläre Felder

Dies sind Felder, die nur einmal in einem bestimmten Dokument angezeigt werden. Ein Zeilenelement Rechnungsnummer oder Gesamtbetrag in einem Rechnungsdokument wären Beispiele für Spaltenfelder.

Ein neues reguläres Feld erstellen

  1. Klicken Sie im rechten Bereich des Abschnitts Reguläre Felder auf docs image. Das Fenster Reguläres Feld erstellen wird angezeigt.
  2. Geben Sie einen eindeutigen Namen für das Feld im Feld Eindeutigen Feldnamen eingeben ein. Das Feld akzeptiert keine Großbuchstaben. Es darf nur Kleinbuchstaben, Ziffern, Unterstriche _ und Bindestriche - enthalten.
  3. Klicken Sie auf Erstellen. Das Fenster Feld bearbeiten wird angezeigt.
  4. Wählen Sie den Inhaltstyp aus der Dropdownliste Inhaltstyp aus.
  5. Wählen Sie den Nachverarbeitungsmechanismus aus, falls das Modell mehr als eine Instanz eines Felds auf einer bestimmten Seite von der Dropdownliste Nachverarbeitung vorhersagt.
  6. Klicken Sie auf das Feld Hotkey und drücken Sie eine Taste auf Ihrer Tastatur, um sie automatisch einzufügen.
  7. Geben Sie im Feld Farbe den Hex-Code der gewünschten Feldfarbe ein.
  8. Wählen Sie im Dropdownmenü Mehrere Seiten die Datenabrufstrategie aus. Diese Option wird verwendet, wenn Felder auf mehreren verschiedenen Seiten eines mehrseitigen Dokuments erscheinen. Mit dieser Option wird definiert, wie das Modell entscheidet, welches zurückgegeben werden soll.
  9. Wählen Sie in der Dropdownliste Punktzahl das Maß aus, das zur Bestimmung der Genauigkeit beim Auswerten von Modellvorhersagen verwendet wird.
  10. Aktivieren Sie das Kontrollkästchen Mehrzeilig, wenn sich das zu prüfende Feld über mehrere Textzeilen erstrecken kann, z. B. Adressen oder Beschreibungen. Wenn diese Option nicht aktiviert ist, wird nur die erste Zeile zurückgegeben.
  11. Aktivieren Sie das Kontrollkästchen Ausgeblendet, wenn dieses Feld nicht zu den exportierten Datasets gehören soll.
  12. Klicken Sie auf Speichern, um Ihre Einstellungen zu speichern.

Bearbeiten eines regulären Felds

Klicken Sie auf die Schaltfläche Feld bearbeiten . Die verfügbaren Optionen für reguläre Felder finden Sie in der Tabelle unten.

Option

Beschreibung

Inhaltstyp

Der Inhaltstyp eines Felds:

  • string: Geeignet für Firmennamen oder Adressen sowie Zahlungsbedingungen und andere Felder, in denen RPA-Entwickler die Analyse- oder Formatierungslogik manuell im RPA-Workflow erstellen möchten.
  • number: Geeignet für Beträge oder Mengen, mit intelligenter Analyse der Dezimal-/Tausendertrennzeichen.
  • date: Das Modell analysiert, formatiert und vereinheitlicht die Ausgabe im Format yyyy-mm-dd.
  • ** phone**: Geeignet für Telefonnummern. Bei der Formatierung werden Buchstaben und Klammern entfernt. Leerzeichen werden durch Bindestriche ersetzt.
  • id-no: Geeignet für alphanumerische Codes und IDs. Ähnlich wie der Inhaltstyp „string“, enthält aber die Bereinigung aller Zeichen, die vor einem Doppelpunkt : stehen. Wenn die zu extrahierende ID-Nummer Doppelpunkte : enthält, verwenden Sie stattdessen string als Inhaltstyp, damit keine Informationen verloren gehen.

Nachverarbeitung

Der Mechanismus nach der Verarbeitung. Wenn das Modell mehr als eine Instanz eines Felds auf einer bestimmten Seite vorhersagt, gibt das Modell die erste Instanz zurück.

  • highest_confidence: Der Wert mit der höchsten Konfidenz.
  • first_span: Der erste Wert.
  • largest_value: Der größte numerische Wert. Wird nur für den Inhaltstyp number angezeigt und ist für die Felder Gesamtbetrag geeignet.
  • longest_value:der Wert, der aus der größten Anzahl von Zeichen besteht.

Verknüpfung

Die Tastenkombination für das Feld. Ein oder zwei Schlüssel sind zulässig.

Farbe

Die Farbe für das Feld im HEX-Format. Wenn der Wert nicht gültig ist, wird ein neuer generiert.

Mehrseitig

Die Datenrückgabestrategie für den Fall, dass ein Feld auf verschiedenen Seiten eines mehrseitigen Dokuments erscheint.

  • highest_confidence – Die Standardauswahl für die Inhaltstypen string, phone und number.
  • first_occurrence – Die Standardauswahl für die Inhaltstypen id-no und date.
  • last_occurrence

    longest_string

  • shortest_string
  • highest_num_value – Wird nur für den Inhaltstyp number angezeigt.
  • lowest_num_value – wird nur für den Inhaltstyp number angezeigt.

Punktzahl

Maß zur Bestimmung der Genauigkeit beim Auswerten von Modellvorhersagen. Kann nur für den Inhaltstyp string konfiguriert werden. Alle anderen Inhaltstypen verwenden eine „Exact Match“-Bewertungsstrategie. Optionen:

  • exact match: Eine Vorhersage gilt nur dann als richtig (Punktzahl 1), wenn sie exakt dem wahren Wert entspricht. Unterscheidet sie sich auch nur um ein einziges Zeichen, so gilt sie als falsch (Punktzahl 0).
  • levenshtein: Eine Vorhersage wird gemäß der Levenshtein-Distanz zwischen der Vorhersage und dem true-Wert als teilweise richtig erachtet. Wenn ein 10-Buchstaben-Wert bis auf die letzten 2 Zeichen korrekt vorhergesagt wird, dann beträgt die Punktzahl dieser Vorhersage 0,8.

Mehrzeilig

Aktivieren Sie dieses Kontrollkästchen für Felder, die sich über mehrere Textzeilen erstrecken können (Adressen oder Beschreibungen), da andernfalls nur die erste Zeile zurückgegeben wird.

Ausgeblendet

Aktivieren Sie dieses Kontrollkästchen, wenn dieses Feld nicht zu den exportierten Datasets gehören soll.

Löschen eines regulären Felds

Führen Sie die folgenden Schritte aus, um ein reguläres Feld zu löschen:

  1. Klicken Sie beim regulären Feld, das Sie löschen möchten, auf die Schaltfläche Feld bearbeiten docs image.
  2. Klicken Sie auf die Schaltfläche Löschen.
  3. Geben Sie den genauen Namen des Felds ein.


  4. Klicken Sie auf OK.
  5. Das reguläre Feld und die zugehörigen beschrifteten Daten werden gelöscht.

Klassifizierungsfelder

Datenpunkte, die sich auf ein Dokument als Ganzes beziehen. Beispiele für Klassifizierungsfelder wären der Ausgabentyp einer Quittung (Essen, Hotel, Fluglinie, Transport) oder die Währung einer Rechnung (USD, EUR, JPY).

Erstellen Sie ein neues Klassifizierungsfeld.

  1. Klicken Sie docs image auf im rechten Bereich des Abschnitts Klassifizierungsfelder. Das Fenster Klassifizierungsfeld erstellen wird angezeigt.
  2. Geben Sie einen eindeutigen Namen für das Feld im Feld Eindeutigen Feldnamen eingeben ein. Das Feld akzeptiert keine Großbuchstaben. Es darf nur Kleinbuchstaben, Ziffern, Unterstriche _ und Bindestriche - enthalten.
  3. Klicken Sie auf Erstellen. Das Fenster Feld bearbeiten wird angezeigt.
  4. Füllen Sie im Textbereich die Liste der Klassen aus, und geben Sie die Namen als durch Kommas getrennte Liste ein.
  5. Klicken Sie auf Speichern, um Ihre Einstellungen zu speichern.

Klassifizierungsfeld bearbeiten

Klicken Sie auf die Schaltfläche Feld bearbeiten docs image. Definieren Sie eine Liste möglicher Werte. Kommas müssen Werte trennen. Eine optionale Beschreibung des Werts kann nach dem Doppelpunkt : (Option 1: Beschreibung 1) eingefügt werden.


Löschen eines Klassifizierungsfelds

Führen Sie die folgenden Schritte aus, um ein Klassifizierungsfeld zu löschen:

  1. Klicken Sie auf die Schaltfläche Feld bearbeiten docs image für das Klassifizierungsfeld, das Sie löschen möchten.
  2. Klicken Sie auf die Schaltfläche Löschen.
  3. Geben Sie den genauen Namen des Felds ein.


  4. Klicken Sie auf OK.
  5. Das Klassifizierungsfeld und die zugehörigen beschrifteten Daten werden gelöscht.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten