- Überblick
- Erste Schritte
- Erstellen von Modellen
- Verbrauchen von Modellen
- Modelldetails
- Öffentliche Endpunkte
- 1040 – Dokumententyp
- 1040 Formular C – Dokumententyp
- 1040 Formular D – Dokumententyp
- 1040 Formular E – Dokumententyp
- 1040x – Dokumententyp
- 3949a – Dokumententyp
- 4506T – Dokumententyp
- 709 – Dokumententyp
- 941x – Dokumententyp
- 9465 – Dokumententyp
- ACORD125 – Dokumententyp
- ACORD126 – Dokumententyp
- ACORD131 – Dokumententyp
- ACORD140 – Dokumententyp
- ACORD25 – Dokumententyp
- Kontoauszüge – Dokumententyp
- Frachtbrief – Dokumententyp
- Gründungsurkunde – Dokumententyp
- Ursprungszeugnis – Dokumententyp
- Überprüfungen – Dokumententyp
- Children Product Certificate – Dokumententyp
- CMS 1500 – Dokumententyp
- EU-Konformitätserklärung – Dokumententyp
- Finanzberichte – Dokumententyp
- FM1003 – Dokumententyp
- I9 – Dokumententyp
- Ausweise – Dokumententyp
- Rechnungen – Dokumententyp
- Rechnungen2 – Dokumententyp
- Rechnungen Australien – Dokumententyp
- Rechnungen China – Dokumententyp
- Rechnungen Hebräisch – Dokumententyp
- Rechnungen Indien – Dokumententyp
- Rechnungen Japan – Dokumententyp
- Rechnungen Versand – Dokumententyp
- Packlisten – Dokumententyp
- Gehaltsabrechnungen – Dokumententyp
- Reisepässe – Dokumententyp
- Bestellungen – Dokumententyp
- Zahlungsbelege – Dokumententyp
- Belege2 – Dokumententyp
- Zahlungsbelege Japan – Dokumententyp
- Zahlungsavis – Dokumententyp
- UB04 – Dokumententyp
- Angaben zum Abschluss von Hypotheken in den USA – Dokumententyp
- Betriebskostenabrechnungen – Dokumententyp
- Fahrzeugbrief – Dokumententyp
- W2 – Dokumententyp
- W9 – Dokumententyp
- Unterstützte Sprachen
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Daten und Sicherheit
- Protokollierung
- Lizenzierung
- Anleitungen zu …
- Fehlersuche und ‑behebung

Document Understanding-Benutzerhandbuch für moderne Projekte
Das DocPath Large Language Model (LLM) ist unsere neueste Datenextraktionsmodelltechnologie, die entwickelt wurde, um Modelle der aktuellen Generation zu ersetzen, die in UiPath® Document UnderstandingTM verwendet werden . DocPath funktioniert zwar ähnlich wie frühere Modelle, wurde aber mit einer Vielzahl von Dokumenten trainiert. Dadurch kann er gängige Dokumenttypen mit wenig oder gar keinem Schulungsaufwand verarbeiten. Das, was DocPath LLM auszeichnet, ist die generative Architektur, die die Genauigkeit erheblich verbessert und die Extraktion vereinfacht. Darüber hinaus können Sie das Modell mit Ihren eindeutigen Datasets feinabstimmen.
Weitere Informationen zur DocPath- Architektur und den für das Training verwendeten Techniken finden Sie auf der DocPath- Seite in unserem KI-Blog.
Derzeit ist UiPath DocPath nur für in den USA ansässige Mandanten (ausgenommen GxP und Government Cloud) in modernen Document Understanding-Projekten verfügbar.
- Öffentliche Endpunkte für Extraktionsmodelle in Europa basieren auf DocPath, mit Ausnahme von Financial Statements.
- Die folgenden öffentlichen Endpunkte für Extraktionsmodelle basieren auf DocPath in der Region Japan:
- Rechnungen China
- Rechnungen Japan
- Receipts Japan
DocPath LLM bietet zahlreiche Verbesserungen gegenüber früheren Modellen. Es verbessert die Genauigkeit, insbesondere bei Tabellen, passt sich an verschiedene Dokumentlayouts an, um den Aufwand für Anmerkungen zu reduzieren, und erhöht die Automatisierungsraten.
- Verbesserte Genauigkeit: DocPath LLM bietet eine höhere Genauigkeitsrate und eine bessere F1-Punktzahl für halbstrukturierte Dokumente wie Rechnungen, Belege und Bestellungen. Dies gewährleistet eine präzise und konsistente Datenextraktion.
- Problemlose Anmerkung: Das Modell reduziert die manuelle Arbeit, da nur eine Anmerkung pro Dokument erforderlich ist, sodass nicht mehr jede Feldinstanz auf jeder Seite mit Anmerkungen versehen werden muss.
- Verbesserte Automatisierung: Mit einer größeren Korrelation zwischen Konfidenzniveau und Genauigkeit verbessert DocPath LLM die Automatisierungsraten und reduziert gleichzeitig die Anzahl der Dokumente, die bei gleicher Genauigkeit an das Action Center gesendet werden.
In unseren internen Tests hat DocPath seinen Vorgänger in Bezug auf die Leistung übertroffen. Es reduzierte die Falsch-Positiv-Rate um etwa 15 % und die Falsch-Negativ-Rate um fast 17 %.
DocPath LLM ist ausschließlich für moderne Document Understanding-Projekte verfügbar. Trotz der Einführung von DocPath werden in allen vorhandenen Projektversionen weiterhin aktuelle Modellversionen verwendet. Dadurch wird ein nahtloser Übergang ohne Unterbrechung der laufenden Produktionsworkflows gewährleistet.
Um einen vorhandenen Dokumenttyp in DocPath zu trainieren, heben Sie die Bestätigung auf und bestätigen Sie alle Felder in einigen Dokumenten.
Die von Ihnen gewählten Feldnamen können sich erheblich auf die Leistung des Modells auswirken. Um optimale Ergebnisse sicherzustellen, verwenden Sie natürliche Sprache und die richtige Grammatik für Feldnamen. Sie sollten nur allgemein akzeptierte Akronyme wie Number (No), Account (Acct), Address (Addr) und Suite (Apt) verwenden. Derzeit werden nur westeuropäische Sprachen unterstützt. Stellen Sie daher sicher, dass die ausgewählten Feldnamen mit diesen Sprachen übereinstimmen. Verwenden Sie keine nicht beschreibenden Namen wie „Spalte 3“, es sei denn, das Dokument verwendet diese Terminologie ausdrücklich.
UiPath DocPath unterstützt derzeit nur Sprachen mit lateinischer Schrift. Wenn Sie ein Modell in Sprachen mit nicht-lateinischen Skripten trainieren müssen, wählen Sie den Legacy-Modelltyp aus. Wenn das Legacy-Modell ausgewählt wird, wählen Sie das entsprechende Basismodell für Ihren Dokumenttyp aus.
Um zwischen DocPath oder Legacy zu wählen, navigieren Sie zur Registerkarte Einstellungen im Document Type Manager und wählen Sie den erforderlichen Modelltyp aus der Dropdownliste Modelltyp aus.
- Die extrahierten Felder müssen genau mit dem Text in den Dokumenten übereinstimmen. Dieser Prozess beinhaltet keine Zusammenfassung oder andere Arten der Textanalyse.
- Die folgenden Dokumenttypen basieren derzeit nicht auf DocPath und funktionieren noch auf der vorherigen Generation:
- Financial Statements
- Rechnungen China
- Rechnungen Hebräisch
- Rechnungen Japan
Der Dokumententyp wird mithilfe des Legacy-Modells trainiert.
UiPath DocPath unterstützt derzeit keine Sprachen mit nicht-lateinischen Skripten.