Document Understanding – UiPath Helix Extractor 1.0 [Veraltet]

document-understanding

latest

false

Document Understanding-Benutzerhandbuch.

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

UiPath Helix Extractor 1.0 [Veraltet]

Warnung:

UiPath Helix Extractor 1.0 ist veraltet. Stattdessen können Sie UiPath Helix Extractor 2.0 verwenden.

Weitere Informationen finden Sie in den Versionshinweisen zur Ankündigung der Einstellung von Helix Extractor 1.0 und im Abschnitt Demnächst veraltete Funktionen .

Das Helix Extractor 1.0 Large Language Model (LLM) ist das allgemein verfügbare Datenextraktionsmodell für UiPath® Document Understanding^TM. Während Helix Extractor 1.0 ähnlich wie frühere Modelle funktioniert, wurde es mit einer Vielzahl von Dokumenten trainiert. Dadurch können gängige Dokumenttypen mit wenig bis keinem Prozess verarbeitet werden. Was Helix Extractor 1.0 LLM auszeichnet, ist seine generative Architektur, die die Genauigkeit erheblich verbessert und die Extraktion vereinfacht. Darüber hinaus können Sie das Modell mit Ihren individuellen Datensätzen optimieren.

Weitere Informationen zur Helix Extractor 1.0-Architektur und den für das Training verwendeten Techniken finden Sie auf der Seite Helix Extractor 1.0 in unserem KI-Blog.

Verfügbarkeit

Derzeit ist der UiPath Helix Extractor in modernen Document Understanding-Projekten nur für Mandanten mit Sitz in den USA (ausgenommen GxP und Government Cloud) verfügbar.

Der UiPath Helix Extractor ist sowohl für klassische als auch für moderne Projekte verfügbar, wenn öffentliche Endpunkte in den folgenden Regionen verwendet werden:

Öffentliche Endpunkte für Extraktionsmodelle in Europa basieren auf dem Helix Extractor, mit Ausnahme von Finanzberichten.
Die folgenden öffentlichen Endpunkte für Extraktionsmodelle basieren auf dem Helix Extractor in der Region Japan:
- Rechnungen China
- Rechnungen Japan
- Receipts Japan

Verbesserungen gegenüber der vorherigen Generation

Das Helix Extractor LLM bietet zahlreiche Verbesserungen gegenüber vorherigen Modellen.Es verbessert die Genauigkeit, insbesondere bei Tabellen, passt sich an verschiedene Dokumentlayouts an, um den Anmerkungsaufwand zu reduzieren, und erhöht die Automatisierungsraten.

Zu den wichtigsten Verbesserungen gehören:

Verbesserte Genauigkeit: Das Helix Extractor LLM bietet eine höhere Genauigkeitsrate und eine bessere F1-Punktzahl für halbstrukturierte Dokumente wie Rechnungen, Belege und Bestellungen. Dies gewährleistet eine präzise und konsistente Datenextraktion.
Problemlose Anmerkung: Das Modell reduziert die manuelle Arbeit, da nur eine Anmerkung pro Dokument erforderlich ist, sodass jede Feldinstanz auf jeder Seite mit einer Anmerkung versehen werden muss.
Verbesserte Automatisierung: Mit einer größeren Korrelation zwischen Konfidenzniveau und Genauigkeit verbessert das Helix Extractor LLM die Automatisierungsraten und reduziert gleichzeitig die Anzahl der Dokumente, die für die gleiche Genauigkeit an das Action Center gesendet werden.

In unseren internen Tests hat der Helix Extractor seinen Vorgänger in der Leistung übertroffen. Die False-Positive-Rate wurde um etwa 15 % reduziert, und die False-Negative-Rate sank um nahezu 17 %.

So verwenden Sie den Helix Extractor

Das Helix Extractor LLM ist exklusiv für moderne Document Understanding-Projekte verfügbar.Trotz der Einführung des Helix Extractor verwenden alle bestehenden Projektversionen weiterhin die aktuellen Modellversionen. Dadurch wird ein nahtloser Übergang ohne Unterbrechung der laufenden Produktionsworkflows sichergestellt.

Um mit dem Trainieren eines vorhandenen Dokumenttyps im Helix Extractor zu beginnen, heben Sie in einigen Dokumenten die Bestätigung aller Felder auf und bestätigen Sie sie erneut.

Wählen Sie den Dokumenttyp aus, den Sie im Helix Extractor trainieren möchten.
Wählen Sie ein Dokument aus.
Wählen Sie alle Felder aus dem Dokument aus und wählen Sie Löschen aus.
Versehen Sie alle Felder aus dem Dokument mit Anmerkungen und wählen Sie Bestätigen aus.

Hinweis:
Wiederholen Sie die Schritte 3 und 4 , bis das Training für den ausgewählten Dokumenttyp initiiert wird.

So überprüfen Sie, ob der Helix Extractor aktiviert ist

Überprüfen Sie nach dem Trainieren Ihrer Modelle im Helix Extractor die Modellversion, um sicherzustellen, dass der Helix Extractor aktiviert ist.

Wechseln Sie zur Seite Veröffentlichen und erstellen Sie eine neue Projektversion.
Wählen Sie das Drei-Punkte-Symbol ⋮ neben der Projektversion und Version bearbeiten aus, um die Modellversion zu überprüfen.

Hinweis:
Alle Modelle, Version 24.7 und höher, sind UiPath Helix Extractor Modelle.

Optimieren der Ergebnisse

Die von Ihnen gewählten Feldnamen können sich erheblich auf die Leistung des Modells auswirken. Um optimale Ergebnisse sicherzustellen, verwenden Sie natürliche Sprache und die richtige Grammatik für Feldnamen. Sie sollten nur allgemein akzeptierte Akronyme wie Number (No), Account (Acct), Address (Addr) und Suite (Apt) verwenden. Derzeit werden nur westeuropäische Sprachen unterstützt. Stellen Sie daher sicher, dass die ausgewählten Feldnamen mit diesen Sprachen übereinstimmen. Verwenden Sie keine nicht beschreibenden Namen wie „Spalte 3“, es sei denn, das Dokument verwendet diese Terminologie ausdrücklich.

Auswahl zwischen dem Helix Extractor und dem Legacy-Modelltyp

Der UiPath Helix Extractor unterstützt derzeit nur lateinische Skriptsprachen. Wenn Sie ein Modell in anderen als lateinischen Skriptsprachen trainieren müssen, wählen Sie den Legacy-Modelltyp. Wenn das Legacy-Modell ausgewählt ist, wählen Sie das entsprechende Basismodell für Ihren Dokumententyp.

Um zwischen dem Helix Extractor- oder dem Legacy-Modelltyp zu wählen, navigieren Sie zur Registerkarte Einstellungen im Document Type Manager und wählen Sie den benötigten Modelltyp aus der Dropdownliste Modelltyp aus.

Wichtig:

Es ist erforderlich, eine neue Projektversion zu veröffentlichen, nachdem die Änderungen bereitgestellt wurden.

Bekannte Einschränkungen von UiPath® Helix Extractor

Die folgenden Einschränkungen gelten derzeit für UiPath Helix Extractor:

Die extrahierten Felder müssen genau mit dem Text in den Dokumenten übereinstimmen. Dieser Prozess beinhaltet keine Zusammenfassung oder andere Arten der Textanalyse.
Die folgenden Dokumenttypen basieren derzeit nicht auf dem Helix Extractor und arbeiten weiterhin mit der vorherigen Generation:
- Financial Statements
- Rechnungen China
- Rechnungen Hebräisch
- Rechnungen Japan

Tipp:

Dokumenttypen, die derzeit vom Helix Extractor-Modell nicht unterstützt werden, haben folgende Meldung in der Dropdown-Liste Dokumenttyp hinzufügen : Der Dokumenttyp wird mit dem Legacy-Modell trainiert.

Der UiPath Helix Extractor unterstützt derzeit keine nicht-lateinischen Skriptsprachen.

Auf dieser Seite

Verfügbarkeit
Verbesserungen gegenüber der vorherigen Generation
So verwenden Sie den Helix Extractor
So überprüfen Sie, ob der Helix Extractor aktiviert ist
Optimieren der Ergebnisse
Auswahl zwischen dem Helix Extractor und dem Legacy-Modelltyp
Bekannte Einschränkungen von UiPath® Helix Extractor

War diese Seite hilfreich?

Vorherige (previous)UiPath Helix Extractor 2.0

WeiterInfrastruktur

Verfügbarkeit​

Verbesserungen gegenüber der vorherigen Generation​

So verwenden Sie den Helix Extractor​

So überprüfen Sie, ob der Helix Extractor aktiviert ist​

Optimieren der Ergebnisse​

Auswahl zwischen dem Helix Extractor und dem Legacy-Modelltyp​

Bekannte Einschränkungen von UiPath® Helix Extractor​