UiPath Documentation
document-understanding
latest
false
Wichtig :
Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.
UiPath logo, featuring letters U and I in white

Document Understanding classic user guide

Letzte Aktualisierung 23. Apr. 2026

Über Pipelines

Tipp:

The ability to train extractors and classifiers is now more convenient be leveraging the One Click Extraction and the One Click Classification features.

Document Understanding-ML-Pakete können alle drei Pipelinetypen ausführen:

Nach Abschluss hat eine Pipelineausführung zugehörige Ausgaben und Protokolle. Um diese Informationen auf der Registerkarte Pipelines in der linken Seitenleiste anzuzeigen, klicken Sie auf eine Pipeline. Es öffnet sich die Pipelineansicht, die aus Folgendem besteht:

  • the Pipeline details such as type, ML Package name and version, dataset, GPU usage, parameters, and execution time
  • the Outputs pane; this always includes a _results.json file containing a summary of the Pipeline details
  • the Logs page; the logs can also be obtained in the ML Logs tab from the left sidebar

Alle Pipelines geben Punktzahlen in drei verschiedenen Dateien zurück:

  • evaluation_scores_<package name>.txt – Diese Datei enthält Genauigkeitsbewertungen für alle Felder.
  • evaluation_<package name>.xlsx – Diese Datei enthält eine detaillierte Genauigkeitsaufschlüsselung pro Feld und pro Batch sowie einen Direktvergleich für jedes Feld, mit farblicher Hervorhebung für fehlende (rot) oder teilweise übereinstimmende (gelb) Felder.
  • evaluation_F1_scores.txt – Diese Datei enthält die F1-Ergebnisse für alle Felder.

Die Genauigkeit wird ermittelt, indem die Anzahl der Übereinstimmungen durch die Gesamtzahl der Vorhersagen geteilt wird. Eine Übereinstimmung erhält eine Gewichtung von 1, während eine teilweise Übereinstimmung eine Gewichtung erhält, die der Levenshtein-Distanz zwischen der Vorhersage und dem wahren Wert entspricht.

Teilweise Übereinstimmungen mit der Levenshtein-Distanz sind die Standardbewertungsmethode für Felder mit dem Inhaltstyp: String. Alle anderen Inhaltstypen (Datumsangaben, Nummern, ID-Nummern, Telefonnummern) verwenden nur die exakte Übereinstimmungsbewertung.

Für String-Felder können Sie diese Einstellung auf der Registerkarte Erweitert des Dialogfelds Feldeinstellungen in der Ansicht Dokumenttyp von Document Understanding ändern.

Wenn ein Auswertungs-Dataset beispielsweise 100 Dokumente enthält und ein Feld, z. B. „Bestellnummer“, auf der Hälfte der Dokumente erscheint und das Modell dann 40 davon korrekt vorhergesagt hat und 10 von ihnen mit einer Levenshtein-Distanz von 0,8 teilweise korrekt ist, dann ist die die Genauigkeit (40 + 10 x 0,8 + 50)/100 = 98 % wäre.

Beachten Sie, dass die 50 Dokumente, bei denen das Feld fehlt und das Modell nichts vorhergesagt hat, ebenfalls als erfolgreiche Vorhersagen gezählt werden.

Bei Trainingspipelines werden die Punktzahlen für das Validierungs-Dataset berechnet. Das Validierungs-Dataset ist eine zufällig ausgewählte Teilmenge von 20 % des gesamten Trainings-Datasets, der in der Trainingspipeline eingereicht wurde.

Trainingspipelines oder vollständige Pipelines können auch verwendet werden für:

  • Fine-tune ML models with data from Validation Station
  • Auto-Fine-tune an ML model
    Hinweis:

    Training Pipelines and Full Pipelines support training sets of maximum 18.000 labelled pages.

War diese Seite hilfreich?

Verbinden

Benötigen Sie Hilfe? Support

Möchten Sie lernen? UiPath Academy

Haben Sie Fragen? UiPath-Forum

Auf dem neuesten Stand bleiben