UiPath Documentation
document-understanding
latest
false
Wichtig :
Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.
UiPath logo, featuring letters U and I in white

Document Understanding-Versionshinweise

Letzte Aktualisierung 23. Apr. 2026

Allgemeine ML-Pakete und öffentliche Endpunkte

Freigabe des öffentlichen Endpunkts von UiPath Document OCR

Veröffentlichungsdatum: 20. Januar 2026

Verbesserungen

  • Verbesserte Behandlung von Firmennamen, die während der OCR in Document Understanding als Logos oder stilisierter Text angezeigt werden.
  • Verbesserte OCR für arabische ID-Nummern mit arabischen Ziffern. Diese Aktualisierung verbessert die Ziffernerkennung in unterstützten arabischen ID-Formaten und trägt dazu bei, Fälle zu reduzieren, in denen Zeichen während der Extraktion fehlten oder falsch erkannt wurden.

Freigabe des öffentlichen Endpunkts von UiPath Document OCR

Veröffentlichungsdatum: 4. Dezember 2025

Verbesserungen

Unterstützung für hawaiianische diakritische Zeichen wurde hinzugefügt, um die Erkennungsgenauigkeit in Dokumenten zu verbessern, die Text in hawaiianischer Sprache enthalten.

UiPath Helix Extractor public endpoints improvements

Veröffentlichungsdatum: 7. November 2025

Neuigkeiten

  • Public endpoints for extraction models in the United States, with the exception of Financial Statements, are now based on the Helix Extractor.
  • Public endpoints for the United States now include Receipts2, Invoices2, Receipts Japan, and US Mortgage Closing Disclosures. For more information, go to the Public endpoints documentation and expand the table for a full, scrollable list. We recommend you make sure your activity is connected to the correct endpoint according to each server region.

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

UiPath Helix Extractor public endpoints improvements

Neuigkeiten

  • Public endpoints for extraction models in Japan, with the exception of Financial Statements, are now based on the Helix Extractor.
  • Public endpoints for Japan now include Receipts2, Invoices2, and US Mortgage Closing Disclosures. For more information, go to the Public endpoints documentation and expand the table for a full, scrollable list. We recommend you make sure your activity is connected to the correct endpoint according to each server region.

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

UiPath Helix Extractor public endpoints improvements

Veröffentlichungsdatum: 14. August 2025

Neuigkeiten

We are excited to announce the release of improved accuracy for public endpoints based on the UiPath Helix Extractor in Europe region.

With this release, the following models are now based on the UiPath Helix Extractor in Europe region as well:

  • 9465
  • Rechnungen China
  • Rechnungen Hebräisch
  • Rechnungen Japan
  • Receipts Japan

With this addition, all models are now based on the UiPath Helix Extractor in Europe region, except for Financial Statements.

Neue Dokumententypen

In dieser Version finden Sie folgende neue Dokumententypen:

  • Invoices2: this document type is trained to extract key data points from a wide variety of invoice types, including standard invoices, credit notes, Indian invoices, and shipping invoices. The enhanced schema consists of 55 regular fields, two structured tables—one for line items (13 columns) and one for bank payment details (9 columns)—and a currency classifier.
  • Receipts2: this document type is trained to extract key data points from a wide range of receipt types, including but not limited to parking receipts, train tickets, hotel bills, airport purchases, meals, pharmacy receipts, electronic receipts, and more. The enhanced schema consists of 60 regular fields and a structured table of items with 6 columns.
  • US Mortgage Closing Disclosures: this document type is trained to extract key data points from standard US closing disclosure forms. The schema includes 20 regular fields capturing borrower details, property information, loan terms, transaction summaries, and cash to close figures.

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

Verbesserte Funktionen zur Zeichenerkennung

Versionshinweise: 23. Juni 2025

Dieses Update bringt eine Reihe von Verbesserungen an unserer Optical Character Recognition-Engine (OCR) mit sich, die die Genauigkeit und Zuverlässigkeit über eine größere Auswahl an Eingabestilen hinweg erhöhen sollen:

  • Bessere Erkennung von Handschriften.
  • Klarere Unterscheidung zwischen „O“ und „0“ in Monospace-Schriftarten.
  • Verbesserte Erkennung von mit Punktmatrix gedrucktem Text.

Diese Verbesserungen erhöhen die Zuverlässigkeit verschiedener Dokumententypen.

Über APIs und Aktivitäten verfügbarer Dokumententyp „Zahlungsbelege Japan“

Versionshinweise: 19. Mai 2025

You can now use the Receipts Japan document type through APIs and IntelligentOCR and Document Understanding activities as well. This is available for all tenants based in the Japan region.

Entfernung von einsatzbereiten Modellen älter als 2023.4

Veröffentlichungsdatum: 11. April 2025

Entfernung von einsatzbereiten Modellen älter als 2023.4

Da wir neue Alternativen und verbesserte Lösungen veröffentlichen, werden einsatzbereite Modelle, einschließlich UiPath Document Understanding OCR und OCR_CPU, Daten Extraction ML-Pakete und DocumentClassifier, nicht mehr unterstützt.

In folgender Tabelle wird der Zeitplan für die Entfernung beschrieben.

Funktion oder FähigkeitEntfernung angekündigtEntfernt amHinweise
Sofort einsatzbereite ML-Pakete älter als 2023.4April 2025April 2025Wir empfehlen die Verwendung der neuesten Version von sofort einsatzbereiten ML-Paketen.

For more information on deprecations, check the Deprecation timeline in the Overview guide.

Freigabe des öffentlichen Endpunkts von UiPath Document OCR

Release-Datum: 19. März 2025

Verbesserungen

  • Die Erkennung von Kontrollkästchen sowie von handgeschriebenem und gedrucktem Text insgesamt wurde verbessert.
  • Die Genauigkeit der Erkennung von handgeschriebenem Text wurde verbessert.
  • Die Stempelerkennung für japanische Amtsstempel wurde verbessert.
  • Die Größe und Positionierungsgenauigkeit von Begrenzungsrahmen wurde verbessert.

UiPath Helix Extractor public endpoints release

Release-Datum: 28. November 2024

Neuer Dokumenttyp

Mit dieser Version wird ein neuer Dokumententyp eingeführt, Zahlungsbelege Japan. Dieser neue öffentliche Endpunkt kann wichtige Details aus einer Vielzahl von Dokumenttypen extrahieren, wie reguläre Kassenbelege, Restaurant- und Hotelrechnungen, Zugtickets, Parkticket und andere Arten von Belegen, die auf Japanisch verfasst sind.

Public endpoints for Invoices China and Invoices Japan based on UiPath Helix Extractor

We are excited to announce the release of improved endpoints for Invoices China and Invoices Japan. This new generation of endpoints, based on the UiPath Helix Extractor, the new UiPath LLM, brings enhanced accuracy and performance.

Verbesserungen bei Invoices Japan

We have made significant improvements to the Invoices Japan public endpoint, adding new fields, such as:

  • Reguläre Felder:
    • Nettobetrag reduziert
    • Steuer reduziert
    • Nettobetrag nicht reduziert
    • Steuer nicht reduziert
    • Betrag der Quellensteuer
    • Einzahlung
  • Spaltenfelder:
    • Elementsteuersatz
    • Elementregistrierungssteuer
    • Elementgebühr

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

Invoices Japan – öffentliche Endpunkte wurden veröffentlicht

Release-Datum: 29. Oktober 2024

Veröffentlicht in Endpunkten für Invoices Japan

Verbesserungen

Wir haben unseren Prozess zur Digitalisierung von Dokumenten erheblich verbessert. Wenn Sie jetzt „UiPath Extended Languages OCR“ oder die OCR für Chinesisch, Koreanisch und Japanisch verwenden, erfolgt die Ausgabe in regulären Wortfeldern anstelle einzelner Zeichen.

Neue öffentliche Endpunkte für Invoices Japan verfügbar

Release-Datum: 15. Oktober 2024

Veröffentlicht in Endpunkten für Invoices Japan

Verbesserungen

  • Die Genauigkeit des ML-Pakets Invoices Japan wurde verbessert.
  • Wir haben die Abstände und Wortanalyse verbessert, wenn chinesische, japanische oder koreanische Zeichen mit lateinischen Zeichen, Interpunktion und Zahlen in Dokumenten gemischt werden.
  • Wir haben ein Problem behoben, das dazu führte, dass AI Center-Trainingspipelines ungenau hohe Punktzahlen für die Feldtypen ID Number und Phone Number meldeten. Dadurch wird sichergestellt, dass die gemeldeten Punktzahlen mit den tatsächlichen Punktzahlen übereinstimmen.

UiPath Extended Languages OCR – allgemeine Verfügbarkeit

Release-Datum: 3. Oktober 2024

We are excited to announce that our latest OCR engine, UiPath Extended Languages OCR, is now in general availability. The new OCR is capable of digitizing documents in over 200 languages, bringing a significant improvement over its predecessor, especially in regards to Chinese, Japanese, and Korean. Additionally, it can process documents in Thai, Vietnamese, all major languages from India, as well as languages using the Cyrilic alphabet, and Greek.

The UiPath Extended Languages OCR is currently only available as a public endpoint.

New public endpoints based on UiPath® Helix Extractor

Release-Datum: 17. September 2024

Improved performance and new model endpoints enrolled on UiPath Helix Extractor

This release brings enhanced accuracy and performance for models based on the UiPath Helix Extractor, the new UiPath LLM. Furthermore, the following models are now based on the UiPath Helix Extractor as well:

  • 709
  • 941x
  • 1040x
  • 3949
  • 3949a

Modellendpunkt auf die alte Generation umgeleitet

Due to performance issues, the Financial Statement model endpoint is redirected to the old generation.

Vorschaumodell entfernt

The 990 (Preview) model is removed from both public endpoints and Data Extraction ML packages.

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

Veraltete UiPath-OCR für Chinesisch, Japanisch und Koreanisch

Release-Datum: 8. Juli 2024

The UiPath Chinese, Japanese, Korean OCR will be deprecated starting with January 2025. We recommend using the UiPath Extended Languages OCR instead.

Check the Deprecation timeline page for more information about upcoming deprecations and removals.

Public endpoints for Invoices and Receipts based on UiPath® Helix Extractor

Release-Datum: 12. Juni 2024

We are excited to announce the release of improved endpoints for Invoices and Receipts. This new generation, based on the UiPath Helix Extractor, the new UiPath LLM, brings enhanced accuracy and performance.

We are gradually replacing our models with a new generation. For now, all public endpoints are based on the Helix Extractor, except for the following endpoints:

  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • Rechnungen China
  • Rechnungen Hebräisch
  • Rechnungen Japan

Prüfen Sie die Versionshinweise für zukünftige Ankündigungen.

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

Public endpoints based on Helix Extractor

Release-Datum: 29. Mai 2024

We are excited to announce the release of improved endpoints for our pre-trained, out-of-the-box ML packages. This new generation, based on the UiPath Helix Extractor, the new UiPath® LLM, brings enhanced accuracy and performance.

We are gradually replacing our models with a new generation. For now, all public endpoints are based on the Helix Extractor, except for the following endpoints:

  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • Rechnungen
  • Rechnungen China
  • Rechnungen Hebräisch
  • Rechnungen Japan
  • Belege

Prüfen Sie die Versionshinweise für zukünftige Ankündigungen.

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

UiPath Extended Languages OCR in der öffentlichen Vorschau

Release-Datum: 28. März 2024

We are excited to announce that our latest OCR engine, UiPath Extended Languages OCR, is now in Public Preview. The new OCR is capable of digitizing documents in over 200 languages, bringing a significant improvement over its predecessor, especially in regards to Chinese, Japanese, and Korean. Additionally, it can process documents in Thai, Vietnamese, all major languages from India, as well as languages using the Cyrilic alphabet, and Greek.

The UiPath Extended Languages OCR is currently only available as a public endpoint.

Frozen Backbone-Training

Release-Datum: 27. April 2023

The ML packages versions v23.4 and higher, now have the option to train using Frozen Backbone. This new approach trains faster and gives better results for small or low diversity training sets below 400 pages. You can override this behavior by using the new Training Pipeline environment variables documented in the official documentation.

Rechnungen Australien veraltet

Release-Datum: 29. November 2022

An upcoming deprecation is announced for the Invoices Australia pre-trained ML package. We recommend using instead the Invoices ML package instead. Here you can find more details about it.

ML-Klassifizierungsendpunkt – öffentliche Vorschau

Release-Datum: 27. Juni 2022

Veröffentlicht in Endpunkten

The ML Classification endpoint is now available in public preview.

Release von UiPath-OCR für Chinesisch, Japanisch, Koreanisch

Endpunkte

Release-Datum: 20. Juni 2022

Veröffentlicht in Endpunkten

The UiPath Chinese, Japanese, Korean OCR public endpoint has become generally available.

ML-Pakete zur Datenextraktion

Release-Datum: 6. Juni 2022

Freigegeben in der AI Center-Cloud, für Datenextraktion ML-Pakete

A new OCR method, UiPath Chinese, Japanese, Korean OCR, is now available and can be applied to new or already created projects from Document Understanding, cloud only.

War diese Seite hilfreich?

Verbinden

Benötigen Sie Hilfe? Support

Möchten Sie lernen? UiPath Academy

Haben Sie Fragen? UiPath-Forum

Auf dem neuesten Stand bleiben