document-understanding
2020.10
false
UiPath logo, featuring letters U and I in white
Veraltet

Document Understanding-Benutzerhandbuch.

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Letzte Aktualisierung 29. Juli 2024

Erstellen und Konfigurieren von Feldern

Hinzufügen von Feldern

Felder können nicht gelöscht oder umbenannt werden. Denken Sie also sorgfältig nach, bevor Sie neue Felder hinzufügen. Wenn Sie jedoch später entscheiden, dass Sie keine Felder zum Training eines ML-Modells verwenden möchten, können Sie sie immer noch mit dem Kontrollkästchen Ausgeblendet im Fenster Feld bearbeiten ausblenden.

Klicken Sie hier für Details zu Feldern, deren Bedeutung und wann sie verwendet werden sollen.

Hinweis: Maximal 40 Felder können erstellt werden.

Spaltenfelder

Ein Zeilenelement Beschreibung oder Stückpreis in einem Rechnungsdokument wären Beispiele für Spaltenfelder.

  1. Klicken Sie auf + im Tabellenabschnitt oben auf der Seite, um ein neues Spaltenfeld hinzuzufügen. Das Fenster Spaltenfeld erstellen wird angezeigt.
  2. Geben Sie im Feld Eindeutigen Feldnamen eingeben einen eindeutigen Namen für das Feld ein. Das Feld akzeptiert keine Großbuchstaben.
  3. Klicken Sie auf Erstellen. Das Fenster Feld bearbeiten wird angezeigt.
  4. Wählen Sie in der Dropdownliste Inhaltstyp den Inhaltstyp aus.
  5. Wählen Sie in der Dropdownliste Punktzahl das Maß aus, das zur Bestimmung der Genauigkeit beim Auswerten von Modellvorhersagen verwendet wird.
  6. Klicken Sie auf das Feld Hotkey und drücken Sie eine Taste auf Ihrer Tastatur, um sie automatisch einzufügen.
  7. Geben Sie den Hex-Code der gewünschten Feldfarbe im Feld Farbe ein.
  8. Aktivieren Sie das Kontrollkästchen Mehrzeilig, wenn sich das zu prüfende Feld über mehrere Textzeilen erstrecken kann, z. B. Adressen oder Beschreibungen. Wenn diese Option nicht aktiviert ist, wird nur die erste Zeile zurückgegeben.
  9. Aktivieren Sie das Kontrollkästchen Elemente aufteilen, wenn dieses Feld als Trennzeichen zwischen Positionen oder Zeilen in einer Tabelle verwendet werden soll. Jede Zeile, in der dieses Feld erscheint, wird als neue Position oder neue Zeile in der Tabelle betrachtet. Am häufigsten wird dies für Zeilenbetrag-Felder in Rechnungspositionen verwendet.
  10. Aktivieren Sie das Kontrollkästchen Ausgeblendet, wenn dieses Feld nicht zu den exportierten Datasets gehören soll.
  11. Klicken Sie auf Speichern, um Ihre Einstellungen zu speichern.

Reguläre Felder

Dies sind Felder, die nur einmal in einem bestimmten Dokument angezeigt werden. Ein Zeilenelement Rechnungsnummer oder Gesamtbetrag in einem Rechnungsdokument wären Beispiele für Spaltenfelder.

  1. Klicken Sie auf + im rechten Bereich des Abschnitts Reguläre Felder. Das Fenster Reguläres Feld erstellen wird angezeigt.
  2. Geben Sie einen eindeutigen Namen für das Feld im Feld Eindeutigen Feldnamen eingeben ein. Das Feld akzeptiert keine Großbuchstaben.
  3. Klicken Sie auf Erstellen. Das Fenster Feld bearbeiten wird angezeigt.
  4. Wählen Sie den Inhaltstyp aus der Dropdownliste Inhaltstyp aus.
  5. Wählen Sie den Nachverarbeitungsmechanismus aus, falls das Modell mehr als eine Instanz eines Felds auf einer bestimmten Seite von der Dropdownliste Nachverarbeitung vorhersagt.
  6. Klicken Sie auf das Feld Hotkey und drücken Sie eine Taste auf Ihrer Tastatur, um sie automatisch einzufügen.
  7. Geben Sie im Feld Farbe den Hex-Code der gewünschten Feldfarbe ein.
  8. Wählen Sie im Dropdownmenü Mehrere Seiten die Datenabrufstrategie aus. Diese Option wird verwendet, wenn Felder auf mehreren verschiedenen Seiten eines mehrseitigen Dokuments erscheinen. Mit dieser Option wird definiert, wie das Modell entscheidet, welches zurückgegeben werden soll.
  9. Wählen Sie in der Dropdownliste Punktzahl das Maß aus, das zur Bestimmung der Genauigkeit beim Auswerten von Modellvorhersagen verwendet wird.
  10. Aktivieren Sie das Kontrollkästchen Mehrzeilig, wenn sich das zu prüfende Feld über mehrere Textzeilen erstrecken kann, z. B. Adressen oder Beschreibungen. Wenn diese Option nicht aktiviert ist, wird nur die erste Zeile zurückgegeben.
  11. Aktivieren Sie das Kontrollkästchen Ausgeblendet, wenn dieses Feld nicht zu den exportierten Datasets gehören soll.
  12. Klicken Sie auf Speichern, um Ihre Einstellungen zu speichern.

Klassifizierungsfelder

Datenpunkte, die sich auf ein Dokument als Ganzes beziehen. Beispiele für Klassifizierungsfelder wären der Ausgabentyp einer Quittung (Essen, Hotel, Fluglinie, Transport) oder die Währung einer Rechnung (USD, EUR, JPY).

  1. Klicken Sie auf + im rechten Bereich des Abschnitts Klassifizierungsfelder. Das Fenster Klassifizierungsfeld erstellen wird angezeigt.
  2. Geben Sie einen eindeutigen Namen für das Feld im Feld Eindeutigen Feldnamen eingeben ein. Das Feld akzeptiert keine Großbuchstaben.
  3. Klicken Sie auf Erstellen. Das Fenster Feld bearbeiten wird angezeigt.
  4. Füllen Sie im Textbereich die Liste der Klassen aus, und geben Sie die Namen als durch Kommas getrennte Liste ein.
  5. Klicken Sie auf Speichern, um Ihre Einstellungen zu speichern.
    Wichtig: Im Gegensatz zu regulären und Spaltenfeldern werden Klassifizierungsfelder nicht neu trainiert. Wenn Sie beispielsweise für das Feld „Währung“ das Modell „Invoices“ auf einem Dataset, das nur USD- und INR-Rechnungen enthält, erneut trainieren, dann kann das resultierende Modell nur diese beiden Währungen erkennen.

Feldbeschreibungen

Verwaltungsleiste

Wird oben auf der Seite in Data Manager angezeigt. Ermöglicht Ihnen die Durchführung mehrerer Vorgänge: Navigieren zwischen Dokumenten, Löschen eines Dokuments, Filtern von Dokumenten, Ausführen von KI-Modellvorhersagen, Importieren und Exportieren von Dokumenten.

Feld

Beschreibung

Navigieren Sie zwischen Dokumenten, die mit dem aktiven Filter übereinstimmen.

Zwischen den beiden Pfeilen wird ein Zähler angezeigt.

Er zeigt die Nummer des aktuellen Dokuments aus der Gesamtzahl der Dokumente, die dem aktiven Filter entsprechen.

Löschen / Wiederherstellen

Zum Löschen oder Wiederherstellen eines Dokuments.

Filter-Dropdownmenü

Filtern Sie Dokumente. Dieser Filter gilt auch für exportierte Daten. Die folgenden Optionen sind verfügbar:

  • train-validate-set

    -test-set

    -deleted

    -labeled

    -unlabeled

    -<batch_name>

Predict

Führen Sie KI-Modellvorhersagen aus und zeigen Sie die Ergebnisse an.

Importieren

Importieren Sie ein neues Dokument, das beschriftet werden soll.

Exportieren

Exportieren Sie beschriftete Daten.

Der aktive Filter gilt für die exportierten Daten.

[DocumentName]

Der Name des aktuell aktiven Dokuments.

[UserName]

Der Benutzername des aktuell aktiven Benutzers.

Abmelden

Melden Sie sich von Data Manager ab.

Beim Abmelden werden auch die Cookies gelöscht.

Help

Feldfenster erstellen

Ermöglicht Ihnen, den Namen des hinzuzufügenden Felds zu konfigurieren.

Feld

Beschreibung

Eindeutigen Feldnamen eingeben

Der Name des Felds. Darf nur Kleinbuchstaben, Ziffern, Unterstriche „_“ und Strich „-“ enthalten.

Feldfenster bearbeiten

Ermöglicht das Konfigurieren eines regulären und Spaltenfelds.

Feld

Beschreibung

Inhaltstyp

Der Inhaltstyp eines Felds. Die folgenden Optionen sind verfügbar:

  • string – Geeignet für Firmennamen oder Adressen sowie Zahlungsbedingungen und andere Felder, in denen RPA-Entwickler die Analyse- oder Formatierungslogik manuell im RPA-Workflow erstellen möchten.
  • number – Geeignet für Beträge oder Mengen, mit intelligenter Analyse der Dezimal-/Tausendertrennzeichen.
  • date – Das Modell analysiert, formatiert und vereinheitlicht die Ausgabe im Format yyyy-mm-dd.
  • phone – Geeignet für Telefonnummern.
  • id-no – für alphanumerische Codes geeignet, IDs, ähnlich wie der Inhaltstyp „string“, enthält aber die Bereinigung aller Zeichen, die vor einem „:“ stehen. Wenn die zu extrahierende ID-Nummer möglicherweise ":"-Zeichen enthält, verwenden Sie stattdessen string als Inhaltstyp, um Datenverlust zu vermeiden.

Nachverarbeitung

Wird nur für reguläre Felder angezeigt.

Der Mechanismus nach der Verarbeitung. Die folgenden Optionen sind verfügbar:

  • first span – Wenn das Modell mehr als eine Instanz eines Felds auf einer bestimmten Seite vorhersagt, gibt das Modell die erste Instanz zurück.
  • largest value – Wenn das Modell mehr als eine Instanz eines Felds auf einer bestimmten Seite vorhersagt, gibt das Modell den höchsten numerischen Wert zurück. Dies wird nur für den Inhaltstyp number angezeigt und ist für die Felder „Gesamtbetrag“ geeignet.
  • longest value – wenn das Modell mehr als eine Instanz eines Felds auf einer bestimmten Seite vorhersagt, gibt das Modell den Wert der längsten Zeichenfolge zurück.

Hotkey

Die Tastenkombination für das Feld.

Farbe

Die Farbe für das Feld.

Mehrseitig

Die Datenrückgabestrategie für den Fall, dass ein Feld auf mehreren Seiten in einem Dokument erscheint. Die folgenden Optionen sind verfügbar:

  • highest confidence – Die Standardauswahl für die Inhaltstypen string, phone und number.
  • first_occurrence – Die Standardauswahl für die Inhaltstypen id-no und date.
  • Letztes Vorkommen

    longest string – Wird nur für den Inhaltstyp string angezeigt.

    shortest string – Wird nur für den Inhaltstyp string angezeigt.

    highest numeric value – Wird nur für den Inhaltstyp number angezeigt.

    lowest numeric value – Wird nur für den Inhaltstyp number angezeigt.

Punktzahl

Kann nur für Inhalte des Typs „string“ konfiguriert werden. Alle anderen Inhaltstypen verwenden eine „Exact Match“-Bewertungsstrategie.

Maß zur Bestimmung der Genauigkeit beim Auswerten von Modellvorhersagen.

  • exact match – eine Vorhersage gilt nur dann als richtig (Punktzahl 1), wenn sie exakt dem wahren Wert entspricht. Unterscheidet sie sich auch nur um ein einziges Zeichen, so gilt sie als falsch (Punktzahl 0).
  • levenshtein – eine Vorhersage wird gemäß der Levenshtein-Distanz zwischen der Vorhersage und dem true-Wert als teilweise richtig erachtet. Wenn ein 10-Buchstaben-Wert bis auf die letzten 2 Zeichen korrekt vorhergesagt wird, dann beträgt die Punktzahl dieser Vorhersage 0,8.

Mehrzeilig

Aktivieren Sie dieses Kontrollkästchen für Felder, die sich über mehrere Zeilen erstrecken können, z. B. Adressen oder Beschreibungen. Andernfalls wird nur die erste Zeile zurückgegeben.

Elemente aufteilen

Wird nur für Spaltenfelder angezeigt.

Aktivieren Sie dieses Kontrollkästchen, wenn dieses Feld als Trennzeichen zwischen Elementen oder Zeilen in einer Tabelle verwendet werden soll. Jede Zeile, in der dieses Feld erscheint, wird als neue Position oder neue Zeile in der Tabelle betrachtet. Am häufigsten wird dies für die Felder „Zeilenbetrag“ in Rechnungspositionen verwendet.

Ausgeblendet

Aktivieren Sie dieses Kontrollkästchen, wenn dieses Feld nicht zu den exportierten Datasets gehören soll.

Das Hilfemenü von Data Manager

Im Abschnitt Beschriftungssteuerelemente werden die Steuerelemente angezeigt, die beim Umgang mit Daten verwendet werden sollen.

Im Abschnitt Dokumentverknüpfungen werden die Verknüpfungen angezeigt, die zum Ausführen verschiedener Vorgänge wie Navigation und UI-Skalierung verwendet werden.

Im Abschnitt Konfiguration werden Details zur Instanz-Konfiguration angezeigt, die während der Installation durchgeführt wurde.

Im Abschnitt Fehlerberichterstattung können Sie kürzlich generierte Protokolle ansehen.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten