- Überblick
- Erste Schritte
- Erstellen von Modellen
- Verbrauchen von Modellen
- Modelldetails
- Öffentliche Endpunkte
- 1040 – Dokumententyp
- 1040 Formular C – Dokumententyp
- 1040 Formular D – Dokumententyp
- 1040 Formular E – Dokumententyp
- 1040x – Dokumententyp
- 3949a – Dokumententyp
- 4506T – Dokumententyp
- 709 – Dokumententyp
- 941x – Dokumententyp
- 9465 – Dokumententyp
- ACORD125 – Dokumententyp
- ACORD126 – Dokumententyp
- ACORD131 – Dokumententyp
- ACORD140 – Dokumententyp
- ACORD25 – Dokumententyp
- Kontoauszüge – Dokumententyp
- Frachtbrief – Dokumententyp
- Gründungsurkunde – Dokumententyp
- Ursprungszeugnis – Dokumententyp
- Überprüfungen – Dokumententyp
- Children Product Certificate – Dokumententyp
- CMS 1500 – Dokumententyp
- EU-Konformitätserklärung – Dokumententyp
- Finanzberichte – Dokumententyp
- FM1003 – Dokumententyp
- I9 – Dokumententyp
- Ausweise – Dokumententyp
- Rechnungen – Dokumententyp
- Rechnungen2 – Dokumententyp
- Rechnungen Australien – Dokumententyp
- Rechnungen China – Dokumententyp
- Rechnungen Hebräisch – Dokumententyp
- Rechnungen Indien – Dokumententyp
- Rechnungen Japan – Dokumententyp
- Rechnungen Versand – Dokumententyp
- Packlisten – Dokumententyp
- Gehaltsabrechnungen – Dokumententyp
- Reisepässe – Dokumententyp
- Bestellungen – Dokumententyp
- Zahlungsbelege – Dokumententyp
- Belege2 – Dokumententyp
- Zahlungsbelege Japan – Dokumententyp
- Zahlungsavis – Dokumententyp
- UB04 – Dokumententyp
- Angaben zum Abschluss von Hypotheken in den USA – Dokumententyp
- Betriebskostenabrechnungen – Dokumententyp
- Fahrzeugbrief – Dokumententyp
- W2 – Dokumententyp
- W9 – Dokumententyp
- Unterstützte Sprachen
- Insights-Dashboards
- Daten und Sicherheit
- Protokollierung
- Lizenzierung
- Anleitungen zu …
- Fehlersuche und ‑behebung

Document Understanding-Benutzerhandbuch für moderne Projekte
Beim Erstellen eines neuen Projekts können Mandanten in Europa und in den USA unser neues Trenn- und Klassifizierermodell aktivieren. Dieses trainierbare Modell kann trainiert werden, um komplexe Dokumente aufzuteilen und zu klassifizieren, sodass Sie Dokumentpakete verarbeiten können.
Folgen Sie den Anweisungen auf dieser Seite zu einem Document UnderstandingTM- Projekt und aktivieren Sie das neue Aufteilungs- und Klassifizierermodell:
- Öffnen Sie Document Understanding.
- Wählen Sie Projekt erstellen aus.
- Geben Sie den gewünschten Projektnamen ein.
- Wählen Sie Modern aus, um die moderne Umgebung zu verwenden.
- Aktivieren Sie den Umschalter Neues Trenn- und Klassifizierermodell aktivieren.
- Konfigurieren Sie bei Bedarf Erweiterte Optionen.
- Aktivieren Sie den Umschalter Aufteilung aktivieren , damit das Modell Dokumente vor der Klassifizierung in einzelne Dateien aufteilen kann. Sie können diese Funktion auch über den Bildschirm Projekteinstellungen aktivieren.
Wichtig: Wenn die Option Aufteilung aktivieren deaktiviert ist, werden alle Dokumente als Ganzes klassifiziert.
- Wählen Sie die OCR, die Sie für Ihr neues Projekt verwenden möchten, aus der Dropdownliste OCR-Methode aus.
- Geben Sie den OCR-API-Schlüssel ein.
Hinweis: Dieses Feld wird automatisch ausgefüllt, wenn Sie eine UiPath®-OCR auswählen.
- Geben Sie die OCR-URL ein. Die vollständige Liste der URLs für UiPath-OCRs finden Sie auf der Seite Öffentliche Endpunkte.
- Wählen Sie aus, ob Sie OCR auf PDF-Dateien anwenden möchten. Das ist standardmäßig auf Auto festgelegt.
- Aktivieren Sie den Umschalter Aufteilung aktivieren , damit das Modell Dokumente vor der Klassifizierung in einzelne Dateien aufteilen kann. Sie können diese Funktion auch über den Bildschirm Projekteinstellungen aktivieren.
- Wählen Sie Erstellen.
Nach der erfolgreichen Erstellung Ihres Projekts können Sie Ihre Dokumente aus dem Abschnitt Erstellen hochladen.
Wählen Sie eine der beiden verfügbaren Optionen:
- Daten aus Dokumenten extrahieren: Extrahiert bestimmte Felder, wie Rechnungsnummern, Datumsangaben, Gesamtsumme aus Ihren Dokumenten usw.
Hinweis: Wir empfehlen, diese Option zu wählen, wenn Sie Felder aus Dokumenten extrahieren müssen.
- Dokumente klassifizieren und aufteilen: Sortiert Dokumente nach Typ und trennt mehrere Dokumente innerhalb einer einzigen Datei.
Hinweis: Wir empfehlen, diese Option zu wählen, wenn Sie Dokumente aufteilen und klassifizieren müssen.
- Wählen Sie einen Dokumenttyp aus.
- Wählen Sie Hochladen aus oder ziehen Sie Ihre Dateien per Drag-and-drop in den neuen Dokumenttyp. Warten Sie, bis der Upload abgeschlossen ist.
Bestimmte komplexe Dateien enthalten mehrere Dokumenttypen. Unser neues Modell kann erkennen, wo jedes Unterdokument beginnt und endet und jeden Abschnitt entsprechend klassifizieren.
-
Klicken Sie auf Dokumente klassifizieren und aufteilen und laden Sie Ihre Dokumentpakete hoch. Warten Sie, bis das Dokument hochgeladen und verarbeitet wurde.
-
Wählen Sie beliebige Dokumente aus dem Upload-Abschnitt aus und klicken Sie auf Aufteilen. Dadurch wird die Oberfläche zum Aufteilen von Anmerkungen geöffnet.
Hinweis: Wenn das Projekt bereits über ein trainiertes Modell verfügt, werden hochgeladene Dokumente mit diesem Modell vorab kommentiert. Dies beschleunigt das Hinzufügen von Anmerkungen und ermöglicht es Ihnen, Vorhersageergebnisse für neue Dokumente anzuzeigen. -
Klicken Sie auf Neuer Dokumenttyp, um für jedes Element in der gewünschten Taxonomie einen Dokumenttyp zu erstellen. Sie können einen vordefinierten Dokumenttyp auswählen oder einen benutzerdefinierten erstellen.
Hinweis: Geben Sie für benutzerdefinierte Dokumenttypen einen Namen, eine kurze Beschreibung, die seinen Zweck erläutert, und durch Kommas getrennte Schlüsselindikatoren (z. B. eindeutige Felder oder Begriffe) an, die bei der Identifizierung helfen. -
Geben Sie an, wo Dokumente getrennt werden sollen. Weisen Sie jeden Seitenbereich mithilfe des Dropdownmenüs einem Dokumenttyp zu. Wenn Sie mit dem Kommentieren des Dokuments fertig sind, klicken Sie auf Bestätigen.
Hinweis: Wenn Sie auf Bestätigen klicken, wird die Dokumentverarbeitung ausgelöst. Nach der Verarbeitung wird jedes Unterdokument unter dem entsprechenden Dokumenttyp im Abschnitt Erstellen angezeigt.Hinweis: Jedes Unterdokument, das in einen Dokumenttyp verschoben wird, wird mit dem Schema des Dokumenttyps vorab kommentiert.
Modelltraining
Modelltraining wird erst ausgelöst nach:
- Mindestens fünf Unterdokumente wurden erstellt und mit Anmerkungen versehen
Hinweis: Wenn Sie z. B. ein einzelnes PDF verwenden, stellen Sie sicher, dass es mindestens fünf Unterdokumente enthält, um das Training zu initiieren. Wenn Sie zwei PDF-Dokumente verwenden, sollte eines mindestens zwei Unterdokumente und das andere mindestens drei enthalten.
- Ein Dokument wurde bestätigt.
Der Trainingsstatus wird in der oberen rechten Ecke des Klassifizierungsbereichs angezeigt.
- Die maximale Dokumentgröße beträgt 160 MB oder 500 Seiten.
- Seiten können nicht neu angeordnet oder gelöscht werden.
Aufteilung und Klassifizierungsvorhersagen
Jedes Mal, wenn ein neues Modell trainiert wird, erhalten alle Dokumente innerhalb des Projekts Vorhersagen vom trainierten Modell. Auf diese Weise können Sie die Leistung des Klassifizierungsmodells überprüfen.
Die Spalte „Typ“ zeigt die Ground Truth an, d. h. den Dokumenttyp, der mit Anmerkungen versehen wurde. Die Spalte „Vorhergesagter Typ“ zeigt den vom Modell vorhergesagten Typ an.
Standardmäßig werden nur die Dokumentpakete auf der Benutzeroberfläche angezeigt. Um die Unterdokumente innerhalb jedes Pakets anzuzeigen, klicken Sie auf Anzeigen und aktivieren Sie das Kontrollkästchen Unterdokumente einbeziehen.
Vorhersagen können auch in der Anmerkungsoberfläche angezeigt werden, indem Sie den Umschalter „Vorhersage anzeigen“ aktivieren.