document-understanding
latest
false
Wichtig :
Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.
UiPath logo, featuring letters U and I in white

Document Understanding-Benutzerhandbuch für moderne Projekte

Letzte Aktualisierung 16. Jan. 2026

UiPath® Helix Extractor 1.0

The Helix Extractor 1.0 large language model (LLM) is our latest data extraction model technology, designed to replace current generation models used within UiPath® Document UnderstandingTM. While Helix Extractor 1.0 operates similarly to previous models, it was trained using a wide variety of documents. This enables it to process common document types with little to no training needed. What sets Helix Extractor 1.0 LLM apart is its generative architecture, which significantly improves accuracy and simplifies extraction. Additionally, you can also fine-tune the model with your unique datasets.

To gain further insights into the Helix Extractor 1.0 architecture and the techniques used for training, check the Helix Extractor 1.0 page from our AI blog.

Verfügbarkeit

Currently, the UiPath Helix Extractor is only available for US-based tenants (excluding GxP and Government Cloud) in Document Understanding modern projects.

The UiPath Helix Extractor is available for both classic and modern projects when using public endpoints in the following regions:
  • Public endpoints for extraction models in Europe are based on the Helix Extractor, except for Financial Statements.
  • The following public endpoints for extraction models are based on the Helix Extractor in the Japan region:
    • Rechnungen China
    • Rechnungen Japan
    • Receipts Japan

Verbesserungen gegenüber der vorherigen Generation

The Helix Extractor LLM offers numerous enhancements over previous models. It improves accuracy, especially with tables, adapts to various document layouts to reduce annotation efforts, and boosts automation rates.

Zu den wichtigsten Verbesserungen gehören:
  • Improved accuracy: The Helix Extractor LLM delivers a higher accuracy rate and superior F1 score for semi-structured documents such as invoices, receipts, and purchase orders. This ensures precise and consistent data extraction.
  • Problemlose Anmerkung: Das Modell reduziert die manuelle Arbeit, da nur eine Anmerkung pro Dokument erforderlich ist, sodass nicht mehr jede Feldinstanz auf jeder Seite mit Anmerkungen versehen werden muss.
  • Enhanced automation: With a greater correlation between confidence level and accuracy, the Helix Extractor LLM enhances automation rates while reducing the number of documents sent to Action Center for the same accuracy level.

From our internal tests, the Helix Extractor outperformed its predecessor in performance. It reduced the false positive rate by around 15%, and the false negative rate dropped by nearly 17%.

How to use the Helix Extractor

The Helix Extractor LLM is available exclusively for Document Understanding modern projects. Despite the introduction of the Helix Extractor, all existing project versions will still use current model versions. This ensures a seamless transition without any disruption to ongoing production workflows.

To start training an exisiting document type on the Helix Extractor, unconfirm and confirm all fields in a few documents.

  1. Choose the document type you want to train on the Helix Extractor.
  2. Wählen Sie ein Dokument aus.
  3. Wählen Sie alle Felder aus dem Dokument aus, und wählen Sie Löschen aus.


  4. Versehen Sie alle Felder aus dem Dokument mit Anmerkungen und wählen Sie Bestätigen aus.
    Hinweis: Wiederholen Sie die Schritte 3 und 4 , bis das Training für den ausgewählten Dokumenttyp gestartet wird.


How to check if the Helix Extractor is enabled

After training your models on the Helix Extractor, check the model version to make sure that the Helix Extractor is enabled.
  1. Gehen Sie zur Seite Veröffentlichen und erstellen Sie eine neue Projektversion.
  2. Wählen Sie das Drei-Punkte-Symbol neben der Projektversion und Version bearbeiten aus, um die Modellversion zu überprüfen.
    Note: All models version 24.7 and above are UiPath Helix Extractor models.


Optimieren der Ergebnisse

Die von Ihnen gewählten Feldnamen können sich erheblich auf die Leistung des Modells auswirken. Um optimale Ergebnisse sicherzustellen, verwenden Sie natürliche Sprache und die richtige Grammatik für Feldnamen. Sie sollten nur allgemein akzeptierte Akronyme wie Number (No), Account (Acct), Address (Addr) und Suite (Apt) verwenden. Derzeit werden nur westeuropäische Sprachen unterstützt. Stellen Sie daher sicher, dass die ausgewählten Feldnamen mit diesen Sprachen übereinstimmen. Verwenden Sie keine nicht beschreibenden Namen wie „Spalte 3“, es sei denn, das Dokument verwendet diese Terminologie ausdrücklich.

Choosing between the Helix Extractor and legacy model type

The UiPath Helix Extractor currently supports only Latin script languages. If you need to train a model in non-Latin script languages, choose the legacy model type. If the legacy model is selected, choose the appropriate base model for your document type.

To choose between the Helix Extractor or legacy model type, navigate to the Settings tab in Document Type Manager and select the needed model type from the Model type drop-down list.



Wichtig: Es ist erforderlich, eine neue Projektversion zu veröffentlichen, nachdem die Änderungen bereitgestellt wurden.

UiPath® Helix Extractor known limitations

The following limitations currently apply for UiPath Helix Extractor:
  • Die extrahierten Felder müssen genau mit dem Text in den Dokumenten übereinstimmen. Dieser Prozess beinhaltet keine Zusammenfassung oder andere Arten der Textanalyse.
  • The following document types are not currently based on the Helix Extractor and still work on the previous generation:
    • Financial Statements
    • Rechnungen China
    • Rechnungen Hebräisch
    • Rechnungen Japan
Tip: Document types that are not currently supported by the Helix Extractor model have the following message in the Add document type drop-down list:

Der Dokumententyp wird mithilfe des Legacy-Modells trainiert.



The UiPath Helix Extractor does not currently support non-Latin script languages.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo
Vertrauen und Sicherheit
© 2005–2026 UiPath. Alle Rechte vorbehalten