- Überblick
- Erste Schritte
- Erstellen von Modellen
- Verbrauchen von Modellen
- Modelldetails
- Öffentliche Endpunkte
- 1040 – Dokumententyp
- 1040 Formular C – Dokumententyp
- 1040 Formular D – Dokumententyp
- 1040 Formular E – Dokumententyp
- 1040x – Dokumententyp
- 3949a – Dokumententyp
- 4506T – Dokumententyp
- 709 – Dokumententyp
- 941x – Dokumententyp
- 9465 – Dokumententyp
- ACORD125 – Dokumententyp
- ACORD126 – Dokumententyp
- ACORD131 – Dokumententyp
- ACORD140 – Dokumententyp
- ACORD25 – Dokumententyp
- Kontoauszüge – Dokumententyp
- Frachtbrief – Dokumententyp
- Gründungsurkunde – Dokumententyp
- Ursprungszeugnis – Dokumententyp
- Überprüfungen – Dokumententyp
- Children Product Certificate – Dokumententyp
- CMS 1500 – Dokumententyp
- EU-Konformitätserklärung – Dokumententyp
- Finanzberichte – Dokumententyp
- FM1003 – Dokumententyp
- I9 – Dokumententyp
- Ausweise – Dokumententyp
- Rechnungen – Dokumententyp
- Rechnungen2 – Dokumententyp
- Rechnungen Australien – Dokumententyp
- Rechnungen China – Dokumententyp
- Rechnungen Hebräisch – Dokumententyp
- Rechnungen Indien – Dokumententyp
- Rechnungen Japan – Dokumententyp
- Rechnungen Versand – Dokumententyp
- Packlisten – Dokumententyp
- Gehaltsabrechnungen – Dokumententyp
- Reisepässe – Dokumententyp
- Bestellungen – Dokumententyp
- Zahlungsbelege – Dokumententyp
- Belege2 – Dokumententyp
- Zahlungsbelege Japan – Dokumententyp
- Zahlungsavis – Dokumententyp
- UB04 – Dokumententyp
- Angaben zum Abschluss von Hypotheken in den USA – Dokumententyp
- Betriebskostenabrechnungen – Dokumententyp
- Fahrzeugbrief – Dokumententyp
- W2 – Dokumententyp
- W9 – Dokumententyp
- Unterstützte Sprachen
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Daten und Sicherheit
- Protokollierung
- Lizenzierung
- Anleitungen zu …
- Fehlersuche und ‑behebung

Document Understanding-Benutzerhandbuch für moderne Projekte
Beim Erstellen eines neuen Projekts können Mandanten in Europa und den USA unser neues Splitter- und Klassifizierungsmodell aktivieren. Dieses trainierbare Modell kann darauf trainiert werden, komplexe Dokumente aufzuteilen und zu klassifizieren, sodass Sie Dokumentenpakete verarbeiten können.
Folgen Sie den Anweisungen auf dieser Seite, um ein Document UnderstandingTM Projekt zu erstellen und das neue Splitter- und Klassifizierungsmodell zu aktivieren:
- Öffnen Sie Document Understanding.
- Wählen Sie Projekt erstellen aus.
- Geben Sie den gewünschten Projektnamen ein.
- Wählen Sie Modern aus, um die moderne Umgebung zu verwenden.
- Aktivieren Sie den Schalter Neues Splitter- und Klassifizierungsmodell aktivieren.
- Konfigurieren Sie bei Bedarf Erweiterte Optionen.
- Aktivieren Sie den Schalter Aufteilung aktivieren um das Modell zu aktivieren, Dokumente vor der Klassifizierung in einzelne Dateien aufzuteilen. Sie können diese Funktion auch auf der Seite Projekteinstellungen aktivieren.
Wichtig: Wenn die Option Aufteilung aktivieren deaktiviert ist, werden alle Dokumente als Ganzes klassifiziert.
- Wählen Sie die OCR, die Sie für Ihr neues Projekt verwenden möchten, aus der Dropdownliste OCR-Methode aus.
- Geben Sie den OCR-API-Schlüssel ein.
Hinweis: Dieses Feld wird automatisch ausgefüllt, wenn Sie eine UiPath®-OCR auswählen.
- Geben Sie die OCR-URL ein. Die vollständige Liste der URLs für UiPath-OCRs finden Sie auf der Seite Öffentliche Endpunkte.
- Wählen Sie aus, ob Sie OCR auf PDF-Dateien anwenden möchten. Das ist standardmäßig auf Auto festgelegt.
- Aktivieren Sie den Schalter Aufteilung aktivieren um das Modell zu aktivieren, Dokumente vor der Klassifizierung in einzelne Dateien aufzuteilen. Sie können diese Funktion auch auf der Seite Projekteinstellungen aktivieren.
- Wählen Sie Erstellen.
Nach der erfolgreichen Erstellung Ihres Projekts können Sie Ihre Dokumente aus dem Abschnitt Erstellen hochladen.
Wählen Sie eine der beiden verfügbaren Optionen aus:
- Daten aus Dokumenten extrahieren: Ruft bestimmte Felder wie Rechnungsnummern, Daten und Gesamtsumme aus Ihren Dokumenten ab.
Hinweis: Wir empfehlen, diese Option zu wählen, wenn Sie Felder aus Dokumenten extrahieren müssen.
- Dokumente klassifizieren und aufteilen: Sortiert Dokumente nach Typ und trennt mehrere Dokumente innerhalb einer einzigen Datei.
Hinweis: Wir empfehlen, diese Option zu wählen, wenn Sie Dokumente aufteilen und klassifizieren müssen.
- Wählen Sie einen Dokumenttyp aus.
- Wählen Sie Hochladen aus oder ziehen Sie Ihre Dateien per Drag-and-Drop in den neuen Dokumenttyp. Warten Sie, bis der Upload abgeschlossen ist.
Bestimmte komplexe Dateien enthalten mehrere Dokumenttypen. Unser neues Modell kann erkennen, wo jedes Unterdokument beginnt und endet, und jeden Abschnitt entsprechend klassifizieren.
-
Klicken Sie auf Dokumente klassifizieren und aufteilen und laden Sie Ihre Dokumentpakete hoch. Warten Sie, bis das Dokument vollständig hochgeladen und verarbeitet wurde.
-
Wählen Sie beliebige Dokumente aus dem Upload-Bereich aus und klicken Sie auf Aufteilen. Dadurch wird die Oberfläche für die Aufteilungsanmerkung geöffnet.
Hinweis: Wenn das Projekt bereits ein trainiertes Modell enthält, werden die hochgeladenen Dokumente mithilfe dieses Modells vorab mit Anmerkungen versehen. Dies beschleunigt die Anmerkung und ermöglicht es Ihnen, die Vorhersageergebnisse für neue Dokumente anzuzeigen. -
Klicken Sie auf Neuer Dokumenttyp, um einen Dokumenttyp für jedes Element in der gewünschten Taxonomie zu erstellen. Sie können einen vordefinierten Dokumenttyp auswählen oder einen benutzerdefinierten Typ erstellen.
Hinweis: Geben Sie für benutzerdefinierte Dokumenttypen einen Namen, eine kurze Beschreibung ihres Zwecks und durch Komma getrennte Schlüsselindikatoren an (z. B. eindeutige Felder oder Begriffe), die die Identifizierung erleichtern. -
Geben Sie an, wo Dokumente getrennt werden sollen. Weisen Sie jeden Seitenbereich über das Dropdown-Menü einem Dokumenttyp zu. Wenn Sie mit den Anmerkungen am Dokument fertig sind, klicken Sie auf Bestätigen.
Hinweis: Das Klicken auf Bestätigen löst die Dokumentverarbeitung aus. Nach der Verarbeitung wird jedes Unterdokument unter seinem entsprechenden Dokumenttyp im Abschnitt Erstellen angezeigt.Hinweis: Jedes Unterdokument, das einem Dokumenttyp zugeordnet wird, wird mit dem Schema des Dokumenttyps vorannotiert.
Modelltraining
Das Modelltraining wird erst ausgelöst, nachdem:
- Mindestens fünf Unterdokumente wurden erstellt und mit Anmerkungen versehen
Hinweis: Wenn Sie beispielsweise eine einzelne PDF verwenden, stellen Sie sicher, dass sie mindestens fünf Unterdokumente enthält, um das Training zu starten. Wenn Sie zwei PDF-Dateien verwenden, sollte eine mindestens zwei Unterdokumente und die andere mindestens drei enthalten.
- Ein Dokument wurde bestätigt.
Der Trainingsstatus kann in der oberen rechten Ecke des Klassifizierungs-Bereichs angezeigt werden.
- Die maximale Dokumentgröße beträgt 160 MB oder 500 Seiten.
- Seiten können nicht neu angeordnet oder gelöscht werden.
Aufteilungs- und Klassifizierungsvorhersagen
Immer wenn ein neues Modell trainiert wird, erhalten alle Dokumente innerhalb des Projekts Vorhersagen vom trainierten Modell. Dadurch können Sie die Leistung des Klassifizierungsmodells überprüfen.
Die Spalte „Typ“ zeigt die Ground Truth an, d. h. den Dokumenttyp, wie er annotiert wurde.Die Spalte „Vorhergesagter Typ“ zeigt den vom Modell vorhergesagten Typ an.
Standardmäßig werden nur die Dokumentpakete in der Benutzeroberfläche angezeigt. Um die Unterdokumente innerhalb jedes Pakets anzuzeigen, klicken Sie auf Anzeigen und aktivieren Sie das Kontrollkästchen Unterdokumente einschließen.
Vorhersagen können auch in der Anmerkungsoberfläche angezeigt werden, indem Sie den Schalter „Vorhersage anzeigen“ aktivieren.