document-understanding

2024.10

false

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Document Understanding-Benutzerhandbuch für moderne Projekte

BEREITSTELLUNG:

Letzte Aktualisierung 16. Jan. 2026

Messung

Sie können den Gesamtstatus Ihres Projekts überprüfen und die Bereiche mit Verbesserungspotenzial im Abschnitt Messen überprüfen.

Projektmessung

Die Hauptmetrik auf der Seite ist die gesamte Projektpunktzahl.

Diese Messung berücksichtigt die Klassifizierer- und Extraktorpunkzahlen für alle Dokumenttypen. Die Punktzahl jedes Faktors entspricht der Modellbewertung und kann unter Klassifizierungsmaßnahme bzw. Extraktionsmessung angezeigt werden.

Die Modellpunktzahl ist eine Funktion, mit der Sie die Leistung eines Klassifizierungsmodells visualisieren können. Sie wird als Modellpunktzahl von 0 bis 100 wie folgt ausgedrückt:

Schlecht (0–49)
Durchschnitt (50–69)
Gut (70–89)
Ausgezeichnet (90–100)

Unabhängig von der Punktzahl des Modells müssen Sie je nach Projektbedarf entscheiden, wann Sie das Training beenden. Auch wenn ein Modell als exzellent eingestuft wird, bedeutet das nicht, dass es allen geschäftlichen Anforderungen gerecht wird.

Klassifizierungsmessung

Die Klassifizierungspunktzahl berücksichtigt die Leistung des Modells sowie die Größe und Qualität des Datasets.

Hinweis: Die Klassifizierungspunktzahl ist nur verfügbar, wenn Sie mehr als einen Dokumenttyp erstellt haben.

Wenn Sie Klassifizierung wählen, werden zwei Registerkarten auf der rechten Seite angezeigt:

Faktoren: Gibt Empfehlungen zur Verbesserung der Leistung Ihres Modells an. Sie können Empfehlungen zur Dataset-Größe oder zur Leistung des trainierten Modells für jeden Dokumenttyp erhalten.
Metriken: Liefert nützliche Metriken, wie die Anzahl der Trainings- und Testdokumente, Präzision, Genauigkeit, Rückrufe und F1-Punktzahl für jeden Dokumenttyp.

Extraktionsmessung

Die Extraktionspunktzahl berücksichtigt die Gesamtleistung des Modells sowie die Größe und Qualität des Datasets. Diese Ansicht ist in Dokumenttypen unterteilt. Sie können auch direkt zur Ansicht Anmerkung hinzufügen jedes Dokumenttyps wechseln, indem Sie Anmerkung hinzufügen auswählen.

Wenn Sie einen der verfügbaren Dokumenttypen in der Extraktionsansicht wählen, werden drei Registerkarten auf der rechten Seite angezeigt:

Faktoren: Gibt Empfehlungen zur Verbesserung der Leistung Ihres Modells an. Sie können Empfehlungen zur Dataset-Größe (Anzahl der hochgeladenen Dokumente, Anzahl der mit Anmerkungen versehenen Dokumente) oder zur Leistung des trainierten Modells (Feldgenauigkeit) für den ausgewählten Dokumenttyp erhalten.
Dataset: Enthält Informationen zu den Dokumenten, die zum Trainieren des Modells verwendet werden, die Gesamtzahl der importierten Seiten und die Gesamtzahl der beschrifteten Seiten.
Metriken: Stellt nützliche Informationen und Metriken bereit, z. B. den Feldnamen, die Nummer des Trainingsstatus und die Genauigkeit für den ausgewählten Dokumenttyp. Sie können auch auf erweiterte Metriken für Ihre Extraktionsmodelle zugreifen, indem Sie die Schaltfläche Erweiterte Metriken herunterladen verwenden. Mit dieser Funktion können Sie eine Excel-Datei mit detaillierten Metriken und Modellergebnissen pro Batch herunterladen.

Dataset-Diagnose

Die Registerkarte Dataset hilft Ihnen beim Erstellen effektiver Datasets, indem es Ihnen Feedback und Empfehlungen zu den Schritten gibt, die erforderlich sind, um eine hohe Genauigkeit des trainierten Modells zu erreichen.

In der Verwaltungsleiste sind drei Dataset-Statusebenen verfügbar:

Rot – Weitere beschriftete Trainingsdaten erforderlich.
Orange – Weitere beschriftete Trainingsdaten werden empfohlen.
Grün – Die erforderliche Menge an beschrifteten Trainingsdaten ist erreicht.

Wenn in der Sitzung keine Felder erstellt werden, ist die Statusebene des Datasets grau.

Auf dieser Seite

Projektmessung
Klassifizierungsmessung
Extraktionsmessung
Dataset-Diagnose

War diese Seite hilfreich?

Vorherige (previous)Erstellen

WeiterVeröffentlichen