UiPath Documentation
document-understanding
latest
false

Document Understanding-Benutzerhandbuch.

Letzte Aktualisierung 7. Mai 2026

Migrieren klassischer Projekte

Verwenden Sie die Anweisungen auf dieser Seite, um ein klassisches Projekt oder ein Projekt basierend auf AI Center zu migrieren. Bei der Migration eines Projekts gibt es zwei Hauptschritte:

  1. Exportieren Sie das Dataset aus dem klassischen Projekt oder dem Projekt basierend auf dem AI Center.
  2. Importieren Sie das Dataset in das moderne Projekt.

Aktuelle Einschränkungen

  • Derzeit wird das Importieren von Datasets, die größer als 5000 Seiten sind, nicht unterstützt. Nur die ersten 5000 Seiten werden erfolgreich importiert, alle zusätzlichen Seiten werden nicht importiert. Wenn Ihr Dataset beispielsweise aus 4999 Seiten besteht und Sie versuchen, ein Dokument mit 4 Seiten zu importieren, ist der Prozess nicht erfolgreich.
  • Batchnamen und entsprechende Batchergebnisse sind derzeit nicht verfügbar. Wenn Ihre Daten in Batches organisiert sind, wird diese Information noch nicht angezeigt, aber sie wird gespeichert.
  • Exporte aus dem AI Center werden nicht unterstützt. Es werden nur Exporte aus dem Document Manager unterstützt.

Exportieren eines Datasets aus einem klassischen Projekt

  1. Navigieren Sie zu dem klassischen Projekt, das Sie migrieren möchten, und öffnen Sie es.
  2. Wechseln Sie zum Dokumenttyp, den Sie exportieren möchten, und wählen Sie Dokumenttyp öffnen aus.

Abbildung 1. Dokumenttyp öffnen

Screenshot des Dokumententyps „Beleg“.

  1. Wählen Sie in der Dropdownliste Dokumente filtern die Option Trainings- und Validierungssatz aus.

Abbildung 2. Trainings- und Validierungssatz

Screenshot des Felds „Filtern“.

  1. Wählen Sie Exportieren aus.
  2. Lassen Sie Aktuelle Suchergebnisse ausgewählt und geben Sie einen Namen für Ihren Exportauftrag ein.
  3. Select Download.

Abbildung 3. Export herunterladen

Screenshot der Oberfläche „Dateien exportieren“.

Exportieren eines Datasets aus einem Projekt basierend auf AI Center

  1. Öffnen Sie das AI Center und wechseln Sie zur Seite Datenbeschriftung.

  2. Wählen Sie die Datenbeschriftungssitzung aus, die Sie migrieren möchten.

    Screenshot der Oberfläche Neue App zur Datenbeschriftung erstellen.

  3. Sobald Document Manager geöffnet ist, wählen Sie in der Dropdownliste Dokumente filtern die Option Trainings- und Validierungssatz aus.

Abbildung 4. Trainings- und Validierungssatz

Screenshot des Felds „Filtern“.

  1. Wählen Sie Exportieren aus.
  2. Lassen Sie Aktuelle Suchergebnisse ausgewählt und geben Sie einen Namen für Ihren Exportauftrag ein.
  3. Select Download.

Abbildung 5. Export herunterladen

Screenshot der Oberfläche „Dateien exportieren“.

Importieren eines Datasets

  1. Navigieren Sie zu dem Projekt, in das Sie Daten importieren möchten, und öffnen Sie es.
  2. Wählen Sie Dokumenttyp hinzufügen aus und erstellen Sie einen neuen benutzerdefinierten Dokumenttyp.

Abbildung 6. Dokumenttyp hinzufügen

Screenshot der Oberfläche „Dokumententypen hinzufügen“.

  1. Wählen Sie im neuen benutzerdefinierten Dokumenttyp die Option Hochladen und dann die ZIP-Datei des klassischen Projekts aus, das Sie exportiert haben. Warten Sie, bis der Upload abgeschlossen ist.
    Hinweis:

    Exporte aus dem AI Center werden nicht unterstützt. Es werden nur Exporte aus dem Document Manager unterstützt.

Abbildung 7. Upload-Verarbeitung

Screenshot der Ladeoberfläche „Verarbeitung des Uploads“.

Sobald der Upload abgeschlossen ist, sind die Dokumente für das Training verfügbar.

Modelltraining

Sobald das Dataset importiert wurde, beginnt das Modelltraining. Nach Abschluss des Trainings wird die Modellbewertung angezeigt. Um detaillierte Modellbewertungen zu überprüfen, wählen Sie die Bewertung und dann Detaillierte Modellbewertungen aus.

Screenshot der Oberfläche „Modellbewertung“.

Mit dieser Aktion werden Sie zur Seite Measure weitergeleitet, auf der Sie auf detaillierte Modellmetriken zugreifen können.

Wenn zwei Mal dasselbe Dataset für ein ML-Training verwendet wird, können Sie leicht unterschiedliche Modellmetriken beobachten. Dafür kann es verschiedene Gründe geben:

  • Initialisierung: Machine Learning verwendet Optimierungsmethoden, die erste Schätzungen erfordern, um die Optimierungsalgorithmen auszulösen. Unterschiedliche anfängliche Schätzungen während jedes Trainings können aufgrund der unvorhersehbaren Natur dieser Algorithmen zu unterschiedlichen Ergebnissen führen.
  • Zufälliger Status: Einige Algorithmen verwenden Zufälligkeit in ihren Operationen. Beim Training eines neuronalen Netzwerks führen beispielsweise Verfahren wie der stochastische Gradientenabstieg und der Mini-Batch-Gradientenabstieg Zufälligkeiten ein. Daher kann die Leistung von Modellen auch bei identischen anfänglichen Modellparametern und Datasets in verschiedenen Ausführungen variieren.
  • Regularisierung: Bestimmte Algorithmen enthalten einen Strafausdruck, durch den das Modell kleinere Gewichtungen anwendet. Aufgrund der Zufälligkeit kann das Modell jedes Mal mit einem anderen Satz an Gewichtungen arbeiten.

Diese geringfügigen Unterschiede bedeuten jedoch nicht unbedingt, dass ein Modell einem anderen überlegen oder unterlegen ist. Selbst bei leicht unterschiedlichen Metriken bleibt die Fähigkeit der Modelle, Daten zu verstehen, im Wesentlichen gleich, sofern die Unterschiede nicht sehr groß sind. Zudem sollten die mehrfache Wiederholung dieses Prozesses und die Ermittlung eines Durchschnitts zu ähnlichen Leistungsmetriken führen.

Ändern des Basismodells im Dokumenttypmanager

Wenn es einen signifikanten Unterschied zwischen den Modellergebnissen Ihres klassischen und Ihres modernen Projekts gibt, könnte dies an einem unterschiedlichen Basismodell liegen.Um das Basismodell zu ändern, führen Sie folgende Schritte aus:

  1. Wählen Sie das Drei-Punkte-Menü aus Ihrem benutzerdefinierten Dokumenttyp und dann Dokumenttypmanager aus.

    Screenshot der Taste „Dokumententypmanager“.

  2. Navigieren Sie zur Registerkarte Einstellungen.

  3. Wählen Sie das gewünschte Modell aus der Dropdownliste Basismodell aus.

    Screenshot der Auswahlliste „Basismodell“.

  4. Nachdem Sie Ihre Auswahl getroffen haben, wählen Sie Speichern. Wählen Sie zum Beenden Zurück aus.

Exporttypen

Bei klassischen Projekten gibt es verschiedene Methoden zum Exportieren von Daten. Nicht alle Typen exportierter Daten sind mit dem Import in moderne Projekte kompatibel. Wenn Sie die Modellergebnisse für beide Projekttypen vergleichen möchten, sollten Sie die Dokumente nach Trainings- und Validierungssatzug filtern und die Option Suchergebnisse auswählen auswählen, um das Dataset zu exportieren. Weitere Informationen zu den jeweiligen Optionen finden Sie auf den folgenden Seiten:

Tabelle 1. Exporttypen
Exporttyp Exportierte Daten Was mit importierten Daten passiert
Aktuelle Suchergebnisse Exportiert das aktuell gefilterte Dataset. Verwenden Sie es zusammen mit dem Filter für Trainings- und Validierungssätze. Zum Trainieren des Modells werden Dokumente verwendet, die als Training gekennzeichnet sind. Dokumente, die als Validierung gekennzeichnet sind, werden zur Messung der Modellleistung verwendet. Tipp: Um Modellergebnisse zwischen zwei Projekttypen zu vergleichen, exportieren und importieren Sie das Dataset immer als Training und Validierung .
Alle beschrifteten Exportiert alle mit Anmerkungen versehenen Dokumente aus dem Dataset:
  • Trainingssatz
  • Validierungssatz (Validation set)
  • Auswertungssatz (Evaluation set)
  • Zum Trainieren des Modells werden Dokumente verwendet, die als Training gekennzeichnet sind.
  • Dokumente, die als Validierung gekennzeichnet sind, werden zur Messung der Modellleistung verwendet.
  • Dokumente, die als Auswertung gekennzeichnet sind, werden ignoriert.
Schema Exportiert die Liste der Felder und ihre jeweiligen Einstellungen. Ein Schema wird importiert, wenn keines vorhanden ist. Wenn bereits ein Schema definiert ist, schlägt der Import fehl.
Alle Exportiert alle Dokumente mit und ohne Anmerkungen
  • Zum Trainieren des Modells werden Dokumente verwendet, die als Training gekennzeichnet sind.
  • Dokumente, die als Validierung gekennzeichnet sind, werden zur Messung der Modellleistung verwendet.
  • Dokumente, die als Auswertung gekennzeichnet sind, werden ignoriert.
  • Dokumente ohne Anmerkungen werden mit Voranmerkungen versehen und als nicht bestätigt behandelt.

Importieren von Schemas

Sie können Schemas zusammen mit Datasets in moderne Projekte importieren. Führen Sie die folgenden Schritte aus, um ein Schema zu importieren:

  1. Erstellen Sie einen benutzerdefinierten Dokumenttyp im Abschnitt Erstellen.
  2. Importieren Sie die ZIP-Datei, die das Schema enthält.
    Hinweis:
    • Schema-Importe sind auf benutzerdefinierte Dokumenttypen ohne bereits vorhandene Schemas beschränkt.
    • Wenn Sie ein Schema in einen Dokumenttyp importieren, der bereits ein Schema enthält, schlägt der Import fehl.

Migrieren Sie den Automatisierungsworkflow

Die Migration von einem klassischen DU-Projekt zu einem modernen in Ihrer RPA-Automatisierung erfordert eine einzige Änderung: Ersetzen Sie die ML Extractor-Aktivität im Data Extraction Scope durch einen Document Understanding Projektextraktor. Keine anderen Aktivitäten müssen geändert werden – Digitalisierung, Validierung und Trainingsaktivitäten bleiben gleich.

Hinweis:

Wenn Ihr Workflow die Dokumentklassifizierung verwendet, ersetzen Sie auch den vorhandenen Klassifizierer durch einen Document Understanding Projektklassifizierer. Siehe Klassifizierung migrieren unten.

Ersetzen Sie die Aktivität „ML Extractor“.

  1. Öffnen Sie in Ihrem Studio-Projekt die Aktivität Data Extraction Scope .
  2. Entfernen Sie die vorhandene ML Extractor-Aktivität.
  3. Fügen Sie einen Document Understanding Projektextraktor im Data Extraction Scope hinzu.
  4. Wählen Sie Extraktor-Funktionen abrufen oder aktualisieren, um den Konfigurationsassistenten zu öffnen.
  5. Geben Sie unter Anmeldeinformationen zur Entwurfszeit, Ihr App-ID, das App-Geheimnis und die Mandanten-URL ein.
  6. Wählen Sie Projekte abrufen aus , um die Liste der verfügbaren modernen Projekte zu laden.
  7. Wählen Sie für Projekt das gewünschte moderne Projekt aus der Dropdownliste aus.
  8. Wählen Sie unter Version eine bereitgestellte Version des Projekts aus. Alternativ können Sie ein Tag auswählen, das mit einer bestimmten Version verknüpft ist. Version und Tag schließen sich gegenseitig aus.
  9. Wählen Sie Funktionen abrufen aus.
  10. Stellen Sie sicher, dass Aktivitätsargumente aktualisieren aktiviert ist.
Hinweis:

Wenn Sie eine Verbindung mit einem Projekt in einem anderen Mandanten herstellen, konfigurieren Sie die Authentifizierungseigenschaften der Aktivität – Runtime-Anmeldeinformationen-Asset und Runtime-Mandanten-URL – so, dass sie mit den im Assistenten verwendeten Anmeldeinformationen übereinstimmen.

Ausführliche Konfigurationsdetails finden Sie unter Document Understanding-Projektextraktor.

Klassifizierung migrieren

Wenn Ihre Automatisierung die Dokumentklassifizierung verwendet, ersetzen Sie den vorhandenen Klassifizierer durch einen Document Understanding Project Classifier im Classify Document Scope. Die Konfigurationsschritte spiegeln die des Extraktors wider: Öffnen Sie den Assistenten zum Konfigurieren von Klassifizierern, geben Sie Ihre Entwurfszeit-Anmeldeinformationen ein, wählen Sie Ihr Projekt und Ihre Version oder Ihr Tag aus und wählen Sie dann Funktionen abrufen.

Vollständige Konfigurationsdetails finden Sie unter Document Understanding Project Classifier.

War diese Seite hilfreich?

Verbinden

Benötigen Sie Hilfe? Support

Möchten Sie lernen? UiPath Academy

Haben Sie Fragen? UiPath-Forum

Auf dem neuesten Stand bleiben