Abonnieren

UiPath Document Understanding

UiPath Document Understanding

Erstellen und Konfigurieren von Feldern

Felder können nicht umbenannt werden. Seien Sie sich also sicher, bevor Sie ein Feld benennen. Wenn Sie später jedoch entscheiden, dass Sie bestimmte Felder nicht zum Training eines ML-Modells verwenden möchten, können Sie sie entweder löschen oder sie jederzeit mit dem Kontrollkästchen Ausgeblendet im Fenster Feld bearbeiten ausblenden.

📘

Hinweis:

Maximal 300 Felder können erstellt werden.

Spaltenfelder

Ein Zeilenelement Beschreibung oder Stückpreis in einem Rechnungsdokument wären Beispiele für Spaltenfelder.

Erstellen eines neuen Spaltenfelds


  1. Klicken Sie auf create_fieldcreate_field im Tabellenabschnitt oben auf der Seite, um ein neues Spaltenfeld hinzuzufügen. Das Fenster Spaltenfeld erstellen wird angezeigt.
  2. Geben Sie einen eindeutigen Namen für das Feld im Feld Eindeutigen Feldnamen eingeben ein. Das Feld akzeptiert keine Großbuchstaben. Darf nur Kleinbuchstaben, Ziffern, Unterstriche _ und Bindestriche - enthalten.
  3. Klicken Sie auf Erstellen. Das Fenster Feld bearbeiten wird angezeigt.
  4. Wählen Sie in der Dropdownliste Inhaltstyp den Inhaltstyp aus.
  5. Wählen Sie in der Dropdownliste Punktzahl das Maß aus, das zur Bestimmung der Genauigkeit beim Auswerten von Modellvorhersagen verwendet wird.
  6. Klicken Sie auf das Feld Hotkey und drücken Sie eine Taste auf Ihrer Tastatur, um sie automatisch einzufügen.
  7. Geben Sie den Hex-Code der gewünschten Feldfarbe auf dem Feld Farbe ein.
  8. Aktivieren Sie das Kontrollkästchen Elemente aufteilen, wenn dieses Feld als Trennzeichen zwischen Positionen oder Zeilen in einer Tabelle verwendet werden soll. Jede Zeile, in der dieses Feld erscheint, wird als neue Position oder neue Zeile in der Tabelle betrachtet. Am häufigsten wird dies für Zeilenbetrag-Felder in Rechnungspositionen verwendet.
  9. Aktivieren Sie das Kontrollkästchen Ausgeblendet, wenn dieses Feld nicht zu den exportierten Datasets gehören soll.
  10. Klicken Sie auf Speichern, um Ihre Einstellungen zu speichern.

Bearbeiten eines Spaltenfelds


Click the Edit field edit_fieldedit_field button. The available options for column fields can be found in the table below.

OptionDescription
Content typeThe content type of a field:
string: appropriate for company names or addresses, as well as payment terms, or for any other field where the RPA developer prefers to build the parsing or formatting logic manually, in the RPA workflow.
number: appropriate for amounts or quantities, with intelligent parsing of the decimal/thousands separators.
date: the model parses, formats and unifies the output in a yyyy-mm-dd format.
phone: appropriate for phone numbers. Formatting removes letters and parentheses, and replaces spaces with dashes.
id-no: appropriate for alphanumeric codes, numbers of IDs, it is similar to the string content type, but includes cleaning of any characters coming before a colon :. If the id number you need to extract might contain colon : characters, please use string as content type instead to avoid data loss.
ShortcutThe shortcut key for the field. One or two keys allowed.
ColorThe color for the field in hex format. If the value is not valid, a new one is generated.
ScoringThe measure used to determine accuracy when running evaluations of model predictions. It can only be configured for string content type. All other content types use an Exact Match scoring strategy. Options:
exact match: a prediction is only deemed to be correct (score of 1) if it exactly matches the true value. If it differs by even a single character, then it is deemed to be incorrect (score of 0).
levenshtein: a prediction is deemed to be partially correct according to the Levenshtein distance between the prediction and the true value. If a 10-letter value is predicted correctly, except for the last 2 characters, then the score of that prediction will be 0.8.
Split itemsSelect this checkbox if you want this field to be used as a delimiter between line items or rows in a table. Any line on which this field appears is considered to be a new line item or row in the table. Most commonly, this is used on Line Amount fields on Invoice line items.
HiddenSelect this checkbox if you do not want this field to be part of exported datasets.

Löschen eines Spaltenfelds


Führen Sie die folgenden Schritte aus, um ein Spaltenfeld zu löschen:

  1. Klicken Sie beim Spaltenfeld, das Sie löschen möchten, auf die Schaltfläche Feld bearbeiten edit_fieldedit_field.
  2. Klicken Sie auf die Schaltfläche Löschen.
  3. Geben Sie den genauen Namen des Felds ein.




  4. Klicken Sie auf OK.
  5. Das Spaltenfeld und die zugehörigen beschrifteten Daten werden gelöscht.

Reguläre Felder

Dies sind Felder, die nur einmal in einem bestimmten Dokument angezeigt werden. Ein Zeilenelement Rechnungsnummer oder Gesamtbetrag in einem Rechnungsdokument wären Beispiele für Spaltenfelder.

Ein neues reguläres Feld erstellen


  1. Klicken Sie auf create_fieldcreate_field im rechten Bereich des Abschnitts Reguläre Felder. Das Fenster Reguläres Feld erstellen wird angezeigt.
  2. Geben Sie einen eindeutigen Namen für das Feld im Feld Eindeutigen Feldnamen eingeben ein. Das Feld akzeptiert keine Großbuchstaben. Darf nur Kleinbuchstaben, Ziffern, Unterstriche _ und Bindestriche - enthalten.
  3. Klicken Sie auf Erstellen. Das Fenster Feld bearbeiten wird angezeigt.
  4. Wählen Sie den Inhaltstyp aus der Dropdownliste Inhaltstyp aus.
  5. Wählen Sie den Nachverarbeitungsmechanismus aus, falls das Modell mehr als eine Instanz eines Felds auf einer bestimmten Seite von der Dropdownliste Nachverarbeitung vorhersagt.
  6. Klicken Sie auf das Feld Hotkey und drücken Sie eine Taste auf Ihrer Tastatur, um sie automatisch einzufügen.
  7. Geben Sie im Feld Farbe den Hex-Code der gewünschten Feldfarbe ein.
  8. Wählen Sie im Dropdownmenü Mehrere Seiten die Datenabrufstrategie aus. Diese Option wird verwendet, wenn Felder auf mehreren verschiedenen Seiten eines mehrseitigen Dokuments erscheinen. Mit dieser Option wird definiert, wie das Modell entscheidet, welches zurückgegeben werden soll.
  9. Wählen Sie in der Dropdownliste Punktzahl das Maß aus, das zur Bestimmung der Genauigkeit beim Auswerten von Modellvorhersagen verwendet wird.
  10. Aktivieren Sie das Kontrollkästchen Mehrzeilig, wenn sich das zu prüfende Feld über mehrere Textzeilen erstrecken kann, z. B. Adressen oder Beschreibungen. Wenn diese Option nicht aktiviert ist, wird nur die erste Zeile zurückgegeben.
  11. Aktivieren Sie das Kontrollkästchen Ausgeblendet, wenn dieses Feld nicht zu den exportierten Datasets gehören soll.
  12. Klicken Sie auf Speichern, um Ihre Einstellungen zu speichern.

Bearbeiten eines regulären Felds


Click the Edit field edit_fieldedit_field button. The available options for regular fields can be found in the table below.

OptionDescription
Content typeThe content type of a field:
string: appropriate for company names or addresses, as well as payment terms, or for any other field where the RPA developer prefers to build the parsing or formatting logic manually, in the RPA workflow.
number: appropriate for amounts or quantities, with intelligent parsing of the decimal/thousands separators.
date: the model parses, formats and unifies the output in a yyyy-mm-dd format.
phone: appropriate for phone numbers. Formatting removes letters and parentheses, and replaces spaces with dashes.
id-no: appropriate for alphanumeric codes, numbers of IDs, it is similar to the string content type, but includes cleaning of any characters coming before a colon :. If the id number you need to extract might contain colon : characters, please use string as content type instead to avoid data loss.
Post processingThe post-processing mechanism. If the model predicts more than one instance of a field on a given page, the model returns:
highest_confidence: the value with the highest confidence.
first_span: the first value.
largest_value: the largest numeric value. This is only displayed for number content type and is appropriate for Total Amount fields.
longest_value: the value consisting of the largest number of characters.
ShortcutThe shortcut key for the field. One or two keys allowed.
ColorThe color for the field in hex format. If the value is not valid, a new one is generated.
Multi pageThe data return strategy in case a field appears on different pages of a multipage document.
highest_confidence - the default choice for string, phone, and number content types.
first_occurrence - the default choice for id-no and date content types.
last_occurrence
longest_string
shortest_string
highest_num_value - only displayed for number content type.
lowest_num_value - only displayed for number content type.
ScoringThe measure used to determine accuracy when running evaluations of model predictions. It can only be configured for string content type. All other content types use an Exact Match scoring strategy. Options:
exact match: a prediction is only deemed to be correct (score of 1) if it exactly matches the true value. If it differs by even a single character, then it is deemed to be incorrect (score of 0).
levenshtein: a prediction is deemed to be partially correct according to the Levenshtein distance between the prediction and the true value. If a 10-letter value is predicted correctly, except for the last 2 characters, then the score of that prediction will be 0.8.
Multi lineSelect this checkbox for fields which may span across multiple text lines (addresses or descriptions), otherwise, only the first line is returned.
HiddenSelect this checkbox if you do not want this field to be part of exported datasets.

Löschen eines regulären Felds


Führen Sie die folgenden Schritte aus, um ein reguläres Feld zu löschen:

  1. Klicken Sie beim regulären Feld, das Sie löschen möchten, auf die Schaltfläche Feld bearbeiten edit_fieldedit_field.
  2. Klicken Sie auf die Schaltfläche Löschen.
  3. Geben Sie den genauen Namen des Felds ein.




  4. Klicken Sie auf OK.
  5. Das reguläre Feld und die zugehörigen beschrifteten Daten werden gelöscht.

Klassifizierungsfelder

Datenpunkte, die sich auf ein Dokument als Ganzes beziehen. Beispiele für Klassifizierungsfelder wären der Ausgabentyp einer Quittung (Essen, Hotel, Fluglinie, Transport) oder die Währung einer Rechnung (USD, EUR, JPY).

Erstellen Sie ein neues Klassifizierungsfeld.


  1. Klicken Sie auf create_fieldcreate_field im rechten Bereich des Abschnitts Klassifizierungsfelder. Das Fenster Klassifizierungsfeld erstellen wird angezeigt.
  2. Geben Sie einen eindeutigen Namen für das Feld im Feld Eindeutigen Feldnamen eingeben ein. Das Feld akzeptiert keine Großbuchstaben. Darf nur Kleinbuchstaben, Ziffern, Unterstriche _ und Bindestriche - enthalten.
  3. Klicken Sie auf Erstellen. Das Fenster Feld bearbeiten wird angezeigt.
  4. Füllen Sie im Textbereich die Liste der Klassen aus, und geben Sie die Namen als durch Kommas getrennte Liste ein.
  5. Klicken Sie auf Speichern, um Ihre Einstellungen zu speichern.

Klassifizierungsfeld bearbeiten


Click the Edit field edit_fieldedit_field button. Define a list of possible values. Commas must separate values. An optional description of the value may be included after colon : (option 1 : description 1).

564564

Löschen eines Klassifizierungsfelds


Führen Sie die folgenden Schritte aus, um ein Klassifizierungsfeld zu löschen:

  1. Klicken Sie beim Klassifizierungsfeld, das Sie löschen möchten, auf die Schaltfläche Feld bearbeiten edit_fieldedit_field.
  2. Klicken Sie auf die Schaltfläche Löschen.
  3. Geben Sie den genauen Namen des Felds ein.




  4. Klicken Sie auf OK.
  5. Das Klassifizierungsfeld und die zugehörigen beschrifteten Daten werden gelöscht.

Aktualisiert vor 8 Monaten


Erstellen und Konfigurieren von Feldern


Auf API-Referenzseiten sind Änderungsvorschläge beschränkt

Sie können nur Änderungen an dem Textkörperinhalt von Markdown, aber nicht an der API-Spezifikation vorschlagen.