document-understanding
latest
false
UiPath logo, featuring letters U and I in white

Document Understanding-Benutzerhandbuch für moderne Projekte

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Letzte Aktualisierung 12. Dez. 2024

UiPath® DocPath

Das DocPath Large Language Model (LLM) ist unsere neueste Technologie für Datenextraktionsmodelle, die Modelle der aktuellen Generation ersetzt, die in UiPath® Document UnderstandingTM verwendet werden. DocPath funktioniert zwar ähnlich wie frühere Modelle, wurde jedoch mit einer Vielzahl von Dokumenten trainiert. Dadurch kann er gängige Dokumenttypen mit geringem bis gar keinem Schulungsaufwand verarbeiten. DocPath LLM zeichnet sich durch seine generative Architektur aus, die die Genauigkeit erheblich verbessert und die Extraktion vereinfacht. Zudem können Sie das Modell auch mit Ihren eindeutigen Datasets optimieren.

Weitere Informationen zur DocPath-Architektur und den für das Training verwendeten Techniken finden Sie auf der DocPath- Seite in unserem KI-Blog.

Verfügbarkeit

Derzeit ist UiPath DocPath nur für Mandanten in den USA verfügbar. Die Unterstützung für andere Regionen soll Anfang 2025 eingeführt werden.

Verbesserungen gegenüber der vorherigen Generierung

DocPath LLM bietet zahlreiche Verbesserungen gegenüber früheren Modellen. Sie verbessert die Genauigkeit, insbesondere bei Tabellen, passt sich an verschiedene Dokumentlayouts an, um den Aufwand für Anmerkungen zu reduzieren, und erhöht die Automatisierungsraten.

Zu den wichtigsten Verbesserungen gehören:
  • Verbesserte Genauigkeit: DocPath LLM bietet eine höhere Genauigkeitsrate und eine bessere F1-Punktzahl für halbstrukturierte Dokumente wie Rechnungen, Belege und Bestellungen. Dies gewährleistet eine präzise und konsistente Datenextraktion.
  • Problemlose Anmerkung: Das Modell reduziert die manuelle Arbeit, da nur eine Anmerkung pro Dokument erforderlich ist, sodass nicht mehr jede Feldinstanz auf jeder Seite mit Anmerkungen versehen werden muss.
  • Verbesserte Automatisierung: Mit einer größeren Korrelation zwischen Konfidenzniveau und Genauigkeit verbessert DocPath LLM die Automatisierungsraten und reduziert gleichzeitig die Anzahl der Dokumente, die für dieselbe Genauigkeitsstufe an das Action Center gesendet werden.

In unseren internen Tests hat DocPath seinen Vorgänger in Bezug auf die Leistung übertroffen. Sie reduzierte die Falsch-Positiv-Rate um etwa 15 % und die Falsch-Negativ-Rate um fast 17 %.

So verwenden Sie DocPath

Das DocPath LLM ist ausschließlich für moderne Document Understanding-Projekte verfügbar. Trotz der Einführung von DocPath werden alle vorhandenen Projektversionen weiterhin die aktuellen Modellversionen verwenden. Dies gewährleistet einen nahtlosen Übergang ohne Unterbrechung der laufenden Produktionsworkflows.

Um einen vorhandenen Dokumenttyp in DocPath zu trainieren, heben Sie die Bestätigung für alle Felder in einigen Dokumenten auf und bestätigen Sie sie.

  1. Wählen Sie den Dokumenttyp aus, den Sie in DocPath trainieren möchten.
  2. Wählen Sie ein Dokument aus.
  3. Wählen Sie alle Felder aus dem Dokument aus, und wählen Sie Löschen aus.


  4. Versehen Sie alle Felder aus dem Dokument mit Anmerkungen und wählen Sie Bestätigen aus.
    Hinweis: Wiederholen Sie die Schritte 3 und 4 , bis das Training für den ausgewählten Dokumenttyp gestartet wird.


So können Sie überprüfen, ob DocPath aktiviert ist

Nachdem Sie Ihre Modelle in DocPath trainiert haben, überprüfen Sie die Modellversion, um sicherzustellen, dass DocPath aktiviert ist.
  1. Gehen Sie zur Seite Veröffentlichen und erstellen Sie eine neue Projektversion.
  2. Wählen Sie das Drei-Punkte-Symbol neben der Projektversion und Version bearbeiten aus, um die Modellversion zu überprüfen.
    Hinweis: Alle Modelle ab Version 24.7 sind UiPath DocPath-Modelle.


Optimieren der Ergebnisse

Die von Ihnen gewählten Feldnamen können sich erheblich auf die Leistung des Modells auswirken. Um optimale Ergebnisse sicherzustellen, verwenden Sie natürliche Sprache und die richtige Grammatik für Feldnamen. Sie sollten nur allgemein akzeptierte Akronyme wie Number (No), Account (Acct), Address (Addr) und Suite (Apt) verwenden. Derzeit werden nur westeuropäische Sprachen unterstützt. Stellen Sie daher sicher, dass die ausgewählten Feldnamen mit diesen Sprachen übereinstimmen. Verwenden Sie keine nicht beschreibenden Namen wie „Spalte 3“, es sei denn, das Dokument verwendet diese Terminologie ausdrücklich.

Bekannte Einschränkungen von UiPath® DocPath

The following limitations currently apply for UiPath DocPath:
  • The extracted fields must match exactly with the text in the documents. This process does not include summarization or other types of text analysis.
  • Custom training is not applicable for the following document types. If you attempt to use DocPath for these, it will result in an error:
    • Rechnungen China
    • Rechnungen Hebräisch
    • Rechnungen Japan

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten