- Überblick
- Erste Schritte
- Erstellen von Modellen
- Verbrauchen von Modellen
- Modelldetails
- Öffentliche Endpunkte
- 1040 – Dokumententyp
- 1040 Formular C – Dokumententyp
- 1040 Formular D – Dokumententyp
- 1040 Formular E – Dokumententyp
- 1040x – Dokumententyp
- 3949a – Dokumententyp
- 4506T – Dokumententyp
- 709 – Dokumententyp
- 941x – Dokumententyp
- 9465 – Dokumententyp
- ACORD125 – Dokumententyp
- ACORD126 – Dokumententyp
- ACORD131 – Dokumententyp
- ACORD140 – Dokumententyp
- ACORD25 – Dokumententyp
- Kontoauszüge – Dokumententyp
- Frachtbrief – Dokumententyp
- Gründungsurkunde – Dokumententyp
- Ursprungszeugnis – Dokumententyp
- Überprüfungen – Dokumententyp
- Children Product Certificate – Dokumententyp
- CMS 1500 – Dokumententyp
- EU-Konformitätserklärung – Dokumententyp
- Finanzberichte – Dokumententyp
- FM1003 – Dokumententyp
- I9 – Dokumententyp
- Ausweise – Dokumententyp
- Rechnungen – Dokumententyp
- Rechnungen2 – Dokumententyp
- Rechnungen Australien – Dokumententyp
- Rechnungen China – Dokumententyp
- Rechnungen Hebräisch – Dokumententyp
- Rechnungen Indien – Dokumententyp
- Rechnungen Japan – Dokumententyp
- Rechnungen Versand – Dokumententyp
- Packlisten – Dokumententyp
- Gehaltsabrechnungen – Dokumententyp
- Reisepässe – Dokumententyp
- Bestellungen – Dokumententyp
- Zahlungsbelege – Dokumententyp
- Belege2 – Dokumententyp
- Zahlungsbelege Japan – Dokumententyp
- Zahlungsavis – Dokumententyp
- UB04 – Dokumententyp
- Angaben zum Abschluss von Hypotheken in den USA – Dokumententyp
- Betriebskostenabrechnungen – Dokumententyp
- Fahrzeugbrief – Dokumententyp
- W2 – Dokumententyp
- W9 – Dokumententyp
- Unterstützte Sprachen
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Protokollierung
- Lizenzierungs- und Gebührenlogik
- Anleitungen zu …
- Fehlersuche und ‑behebung

Document Understanding modern projects user guide
Migrieren klassischer Projekte
Verwenden Sie die Anweisungen auf dieser Seite, um ein Projekt basierend auf dem AI Center zu migrieren. Es gibt zwei Hauptschritte bei der Migration eines Projekts:
- Exportieren Sie das Dataset aus dem Projekt basierend auf dem AI Center.
- Importieren Sie das Dataset in das moderne Projekt.
Aktuelle Einschränkungen
- Derzeit wird das Importieren von Datasets, die größer als 3000 Seiten sind, nicht unterstützt. Nur die ersten 3000 Seiten werden erfolgreich importiert, alle zusätzlichen Seiten nicht. Wenn Ihr Dataset beispielsweise aus 2999 Seiten besteht und Sie versuchen, ein Dokument mit 4 Seiten zu importieren, ist der Prozess nicht erfolgreich.
- Batchnamen und entsprechende Batchergebnisse sind derzeit nicht verfügbar. Wenn Ihre Daten in Batches organisiert sind, wird diese Information noch nicht angezeigt, aber sie wird gespeichert.
- Exporte aus dem AI Center werden nicht unterstützt. Es werden nur Exporte aus dem Document Manager unterstützt.
Exportieren eines Datasets aus einem Projekt basierend auf AI Center
-
Open AI Center and navigate to the Data Labeling page.
-
Select the Data Labeling Session you want to migrate.

-
Once Document Manager is open, from the Filter documents drop-down list, select Training and validation set.
Figure 1. Training and validation set

-
Wählen Sie Exportieren aus.
-
Leave Current search results selected and fill in a name for your export job.
-
Select Download.
Figure 2. Download export

Importieren eines Datasets
-
Navigieren Sie zu dem Projekt, in das Sie Daten importieren möchten, und öffnen Sie es.
-
Select Add document type and create a new custom document type.
Figure 3. Add document type

-
On the new custom document type, select Upload and choose the zip file of the classic project you exported. Wait for the upload to finish.
Hinweis:Exporte aus dem AI Center werden nicht unterstützt. Es werden nur Exporte aus dem Document Manager unterstützt.
Figure 4. Upload processing

Sobald der Upload abgeschlossen ist, sind die Dokumente für das Training verfügbar.
Modelltraining
Once the dataset is imported, the model training starts. After the training is complete, the model score is displayed. To check detailed model scores, select the score, and then Detailed model scores.

This action takes you to the Measure page where you can access detailed model metrics.
Wenn zwei Mal dasselbe Dataset für ein ML-Training verwendet wird, können Sie leicht unterschiedliche Modellmetriken beobachten. Dafür kann es verschiedene Gründe geben:
- Initialization: Machine learning uses optimization methods that need initial guesses to trigger the optimization algorithms. Different initial guesses during each training could lead to various outcomes due to the unpredictable nature of these algorithms.
- Random state: Some algorithms use randomness in their operations. For instance, when training a neural network, procedures like stochastic gradient descent and mini-batch gradient descent introduce randomness. Therefore, even with identical initial model parameters and datasets, the performance of models may vary in different runs.
- Regularization: Certain algorithms include a penalty term that encourages the model to maintain smaller weights. Due to the randomness involved, the model could operate with a different weight set each time.
Diese geringfügigen Unterschiede bedeuten jedoch nicht unbedingt, dass ein Modell einem anderen überlegen oder unterlegen ist. Selbst bei leicht unterschiedlichen Metriken bleibt die Fähigkeit der Modelle, Daten zu verstehen, im Wesentlichen gleich, sofern die Unterschiede nicht sehr groß sind. Zudem sollten die mehrfache Wiederholung dieses Prozesses und die Ermittlung eines Durchschnitts zu ähnlichen Leistungsmetriken führen.
Ändern des Basismodells im Dokumenttypmanager
Wenn es einen signifikanten Unterschied zwischen den Modellergebnissen Ihres klassischen und Ihres modernen Projekts gibt, könnte dies an einem unterschiedlichen Basismodell liegen.Um das Basismodell zu ändern, führen Sie folgende Schritte aus:
-
Select the three-dot menu from your custom document type and choose Document type manager.

-
Navigate to the Settings tab.
-
Select the desired model from the Base model drop-down list.

-
After making your selection, select Save. To exit, select Back.
Exporttypen
For classic projects, there are various methods for exporting data. Not all types of exported data are compatible for importing into modern projects. To compare the model results across both project types,filter documents by Training and validation set and select Choose search results to export the dataset. For more information on each option, check the following table.
| Exporttyp | Exportierte Daten | Was mit importierten Daten passiert |
|---|---|---|
| Aktuelle Suchergebnisse | Exports the current filtered dataset. Use it together with the Training and validation set filter. | Documents tagged as training are used to train the model. Documents tagged as validation are used to measure the model performance. Tip: To compare model results between two project types, always export and import the dataset as Train and validation . |
| Alle beschrifteten | Exportiert alle mit Anmerkungen versehenen Dokumente aus dem Dataset:
|
|
| Schema | Exportiert die Liste der Felder und ihre jeweiligen Einstellungen. | Ein Schema wird importiert, wenn keines vorhanden ist. Wenn bereits ein Schema definiert ist, schlägt der Import fehl. |
| Alle | Exportiert alle Dokumente mit und ohne Anmerkungen |
|
Importieren von Schemas
Sie können Schemas zusammen mit Datasets in moderne Projekte importieren. Führen Sie die folgenden Schritte aus, um ein Schema zu importieren:
- Create a custom document type in the Build section.
- Importieren Sie die ZIP-Datei, die das Schema enthält.
- Schema-Importe sind auf benutzerdefinierte Dokumenttypen ohne bereits vorhandene Schemas beschränkt.
- Wenn Sie ein Schema in einen Dokumenttyp importieren, der bereits ein Schema enthält, schlägt der Import fehl.