- Überblick
- Erste Schritte
- Erstellen von Modellen
- Verbrauchen von Modellen
- Modelldetails
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Öffentliche Endpunkte
- Unterstützte Sprachen
- Insights-Dashboards
- Daten und Sicherheit
- Lizenzierungs- und Gebührenlogik
- Anleitungen zu …
Document Understanding-Benutzerhandbuch für moderne Projekte
Migrieren klassischer Projekte
- Exportieren Sie das Dataset aus dem Projekt basierend auf dem AI Center.
- Importieren Sie das Dataset in das moderne Projekt.
- Derzeit wird das Importieren von Datasets, die größer als 3000 Seiten sind, nicht unterstützt. Nur die ersten 3000 Seiten werden erfolgreich importiert, alle zusätzlichen Seiten nicht. Wenn Ihr Dataset beispielsweise aus 2999 Seiten besteht und Sie versuchen, ein Dokument mit 4 Seiten zu importieren, ist der Prozess nicht erfolgreich.
- Batchnamen und entsprechende Batchergebnisse sind derzeit nicht verfügbar. Wenn Ihre Daten in Batches organisiert sind, wird diese Information noch nicht angezeigt, aber sie wird gespeichert.
Sobald das Dataset importiert wurde, beginnt das Modelltraining. Nach Abschluss des Trainings wird die Modellbewertung angezeigt. Um detaillierte Modellbewertungen zu überprüfen, wählen Sie die Bewertung und dann Detaillierte Modellbewertungen aus.
Mit dieser Aktion werden Sie zur Seite Measure weitergeleitet, auf der Sie auf detaillierte Modellmetriken zugreifen können.
Wenn zwei Mal dasselbe Dataset für ein ML-Training verwendet wird, können Sie leicht unterschiedliche Modellmetriken beobachten. Dafür kann es verschiedene Gründe geben:
- Initialisierung: Machine Learning verwendet Optimierungsmethoden, die anfängliche Schätzungen benötigen, um die Optimierungsalgorithmen auszulösen. Unterschiedliche anfängliche Schätzungen während jedes Trainings können aufgrund der Unvorhersehbarkeit dieser Algorithmen zu unterschiedlichen Ergebnissen führen.
- Zufälliger Status: Einige Algorithmen verwenden Zufälligkeit in ihren Operationen. Beim Training eines neuronalen Netzwerks führen beispielsweise Verfahren wie der stochastische Gradientenabstieg und der Mini-Batch-Gradientenabstieg Zufälligkeiten ein. Daher kann die Leistung von Modellen auch bei identischen anfänglichen Modellparametern und Datasets in verschiedenen Ausführungen variieren.
- Regularisierung: Bestimmte Algorithmen enthalten einen Strafausdruck, durch den das Modell kleinere Gewichtungen anwendet. Aufgrund der Zufälligkeit kann das Modell jedes Mal mit einem anderen Satz an Gewichtungen arbeiten.
Diese geringfügigen Unterschiede bedeuten jedoch nicht unbedingt, dass ein Modell einem anderen überlegen oder unterlegen ist. Selbst bei leicht unterschiedlichen Metriken bleibt die Fähigkeit der Modelle, Daten zu verstehen, im Wesentlichen gleich, sofern die Unterschiede nicht sehr groß sind. Zudem sollten die mehrfache Wiederholung dieses Prozesses und die Ermittlung eines Durchschnitts zu ähnlichen Leistungsmetriken führen.
Bei klassischen Projekten gibt es verschiedene Methoden zum Exportieren von Daten. Nicht alle Typen exportierter Daten sind mit dem Import in moderne Projekte kompatibel. Wenn Sie die Modellergebnisse für beide Projekttypen vergleichen möchten, sollten Sie die Dokumente nach Trainings- und Validierungssatzug filtern und die Option Suchergebnisse auswählen auswählen, um das Dataset zu exportieren. Weitere Informationen zu den jeweiligen Optionen finden Sie auf den folgenden Seiten:
Exporttyp | Exportierte Daten | Was mit importierten Daten passiert |
---|---|---|
Aktuelle Suchergebnisse | Exportiert das aktuell gefilterte Dataset. Verwenden Sie es zusammen mit dem Filter für Trainings- und Validierungssätze. | Zum Trainieren des Modells werden Dokumente verwendet, die als Training gekennzeichnet sind. Dokumente, die als Validierung gekennzeichnet sind, werden zur Messung der Modellleistung verwendet.
Tipp: Um Modellergebnisse zwischen zwei Projekttypen zu vergleichen, exportieren und importieren Sie das Dataset immer als Trainieren und Validieren.
|
Alle beschrifteten | Exportiert alle mit Anmerkungen versehenen Dokumente aus dem Dataset:
|
|
Schema | Exportiert die Liste der Felder und ihre jeweiligen Einstellungen. | Ein Schema wird importiert, wenn keines vorhanden ist. Wenn bereits ein Schema definiert ist, schlägt der Import fehl. |
Alle | Exportiert alle Dokumente mit und ohne Anmerkungen |
|
- Erstellen Sie einen benutzerdefinierten Dokumenttyp im Abschnitt Erstellen.
- Importieren Sie die ZIP-Datei, die das Schema enthält.
- Schema-Importe sind auf benutzerdefinierte Dokumenttypen ohne bereits vorhandene Schemas beschränkt.
- Wenn Sie ein Schema in einen Dokumenttyp importieren, der bereits ein Schema enthält, schlägt der Import fehl.