- Document Understanding for Automation Cloud and Test Cloud
- Document Understanding for Automation Cloud and Test Cloud Public Sector
- Document Understanding for Automation Cloud and Test Cloud Dedicated
- ML packages and public endpoints
- Allgemeine ML-Pakete und öffentliche Endpunkte
- Versionsverlauf bei ML-Paketen und öffentlichen Endpunkten

Document Understanding-Versionshinweise
Allgemeine ML-Pakete und öffentliche Endpunkte
Freigabe des öffentlichen Endpunkts von UiPath Document OCR
Veröffentlichungsdatum: 20. Januar 2026
Verbesserungen
- Verbesserte Behandlung von Firmennamen, die während der OCR in Document Understanding als Logos oder stilisierter Text angezeigt werden.
- Verbesserte OCR für arabische ID-Nummern mit arabischen Ziffern. Diese Aktualisierung verbessert die Ziffernerkennung in unterstützten arabischen ID-Formaten und trägt dazu bei, Fälle zu reduzieren, in denen Zeichen während der Extraktion fehlten oder falsch erkannt wurden.
Freigabe des öffentlichen Endpunkts von UiPath Document OCR
Veröffentlichungsdatum: 4. Dezember 2025
Verbesserungen
Unterstützung für hawaiianische diakritische Zeichen wurde hinzugefügt, um die Erkennungsgenauigkeit in Dokumenten zu verbessern, die Text in hawaiianischer Sprache enthalten.
UiPath Helix Extractor public endpoints improvements
Veröffentlichungsdatum: 7. November 2025
Neuigkeiten
- Public endpoints for extraction models in the United States, with the exception of Financial Statements, are now based on the Helix Extractor.
- Public endpoints for the United States now include Receipts2, Invoices2, Receipts Japan, and US Mortgage Closing Disclosures. For more information, go to the Public endpoints documentation and expand the table for a full, scrollable list. We recommend you make sure your activity is connected to the correct endpoint according to each server region.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
UiPath Helix Extractor public endpoints improvements
Neuigkeiten
- Public endpoints for extraction models in Japan, with the exception of Financial Statements, are now based on the Helix Extractor.
- Public endpoints for Japan now include Receipts2, Invoices2, and US Mortgage Closing Disclosures. For more information, go to the Public endpoints documentation and expand the table for a full, scrollable list. We recommend you make sure your activity is connected to the correct endpoint according to each server region.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
UiPath Helix Extractor public endpoints improvements
Veröffentlichungsdatum: 14. August 2025
Neuigkeiten
We are excited to announce the release of improved accuracy for public endpoints based on the UiPath Helix Extractor in Europe region.
With this release, the following models are now based on the UiPath Helix Extractor in Europe region as well:
- 9465
- Rechnungen China
- Rechnungen Hebräisch
- Rechnungen Japan
- Receipts Japan
With this addition, all models are now based on the UiPath Helix Extractor in Europe region, except for Financial Statements.
Neue Dokumententypen
In dieser Version finden Sie folgende neue Dokumententypen:
- Invoices2: this document type is trained to extract key data points from a wide variety of invoice types, including standard invoices, credit notes, Indian invoices, and shipping invoices. The enhanced schema consists of 55 regular fields, two structured tables—one for line items (13 columns) and one for bank payment details (9 columns)—and a currency classifier.
- Receipts2: this document type is trained to extract key data points from a wide range of receipt types, including but not limited to parking receipts, train tickets, hotel bills, airport purchases, meals, pharmacy receipts, electronic receipts, and more. The enhanced schema consists of 60 regular fields and a structured table of items with 6 columns.
- US Mortgage Closing Disclosures: this document type is trained to extract key data points from standard US closing disclosure forms. The schema includes 20 regular fields capturing borrower details, property information, loan terms, transaction summaries, and cash to close figures.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
Verbesserte Funktionen zur Zeichenerkennung
Versionshinweise: 23. Juni 2025
Dieses Update bringt eine Reihe von Verbesserungen an unserer Optical Character Recognition-Engine (OCR) mit sich, die die Genauigkeit und Zuverlässigkeit über eine größere Auswahl an Eingabestilen hinweg erhöhen sollen:
- Bessere Erkennung von Handschriften.
- Klarere Unterscheidung zwischen „O“ und „0“ in Monospace-Schriftarten.
- Verbesserte Erkennung von mit Punktmatrix gedrucktem Text.
Diese Verbesserungen erhöhen die Zuverlässigkeit verschiedener Dokumententypen.
Über APIs und Aktivitäten verfügbarer Dokumententyp „Zahlungsbelege Japan“
Versionshinweise: 19. Mai 2025
You can now use the Receipts Japan document type through APIs and IntelligentOCR and Document Understanding activities as well. This is available for all tenants based in the Japan region.
Entfernung von einsatzbereiten Modellen älter als 2023.4
Veröffentlichungsdatum: 11. April 2025
Entfernung von einsatzbereiten Modellen älter als 2023.4
Da wir neue Alternativen und verbesserte Lösungen veröffentlichen, werden einsatzbereite Modelle, einschließlich UiPath Document Understanding OCR und OCR_CPU, Daten Extraction ML-Pakete und DocumentClassifier, nicht mehr unterstützt.
In folgender Tabelle wird der Zeitplan für die Entfernung beschrieben.
| Funktion oder Fähigkeit | Entfernung angekündigt | Entfernt am | Hinweise |
|---|---|---|---|
| Sofort einsatzbereite ML-Pakete älter als 2023.4 | April 2025 | April 2025 | Wir empfehlen die Verwendung der neuesten Version von sofort einsatzbereiten ML-Paketen. |
For more information on deprecations, check the Deprecation timeline in the Overview guide.
Freigabe des öffentlichen Endpunkts von UiPath Document OCR
Release-Datum: 19. März 2025
Verbesserungen
- Die Erkennung von Kontrollkästchen sowie von handgeschriebenem und gedrucktem Text insgesamt wurde verbessert.
- Die Genauigkeit der Erkennung von handgeschriebenem Text wurde verbessert.
- Die Stempelerkennung für japanische Amtsstempel wurde verbessert.
- Die Größe und Positionierungsgenauigkeit von Begrenzungsrahmen wurde verbessert.
UiPath Helix Extractor public endpoints release
Release-Datum: 28. November 2024
Neuer Dokumenttyp
Mit dieser Version wird ein neuer Dokumententyp eingeführt, Zahlungsbelege Japan. Dieser neue öffentliche Endpunkt kann wichtige Details aus einer Vielzahl von Dokumenttypen extrahieren, wie reguläre Kassenbelege, Restaurant- und Hotelrechnungen, Zugtickets, Parkticket und andere Arten von Belegen, die auf Japanisch verfasst sind.
Public endpoints for Invoices China and Invoices Japan based on UiPath Helix Extractor
We are excited to announce the release of improved endpoints for Invoices China and Invoices Japan. This new generation of endpoints, based on the UiPath Helix Extractor, the new UiPath LLM, brings enhanced accuracy and performance.
Verbesserungen bei Invoices Japan
We have made significant improvements to the Invoices Japan public endpoint, adding new fields, such as:
- Reguläre Felder:
- Nettobetrag reduziert
- Steuer reduziert
- Nettobetrag nicht reduziert
- Steuer nicht reduziert
- Betrag der Quellensteuer
- Einzahlung
- Spaltenfelder:
- Elementsteuersatz
- Elementregistrierungssteuer
- Elementgebühr
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
Invoices Japan – öffentliche Endpunkte wurden veröffentlicht
Release-Datum: 29. Oktober 2024
Veröffentlicht in Endpunkten für Invoices Japan
Verbesserungen
Wir haben unseren Prozess zur Digitalisierung von Dokumenten erheblich verbessert. Wenn Sie jetzt „UiPath Extended Languages OCR“ oder die OCR für Chinesisch, Koreanisch und Japanisch verwenden, erfolgt die Ausgabe in regulären Wortfeldern anstelle einzelner Zeichen.
Neue öffentliche Endpunkte für Invoices Japan verfügbar
Release-Datum: 15. Oktober 2024
Veröffentlicht in Endpunkten für Invoices Japan
Verbesserungen
- Die Genauigkeit des ML-Pakets Invoices Japan wurde verbessert.
- Wir haben die Abstände und Wortanalyse verbessert, wenn chinesische, japanische oder koreanische Zeichen mit lateinischen Zeichen, Interpunktion und Zahlen in Dokumenten gemischt werden.
- Wir haben ein Problem behoben, das dazu führte, dass AI Center-Trainingspipelines ungenau hohe Punktzahlen für die Feldtypen
ID NumberundPhone Numbermeldeten. Dadurch wird sichergestellt, dass die gemeldeten Punktzahlen mit den tatsächlichen Punktzahlen übereinstimmen.
UiPath Extended Languages OCR – allgemeine Verfügbarkeit
Release-Datum: 3. Oktober 2024
We are excited to announce that our latest OCR engine, UiPath Extended Languages OCR, is now in general availability. The new OCR is capable of digitizing documents in over 200 languages, bringing a significant improvement over its predecessor, especially in regards to Chinese, Japanese, and Korean. Additionally, it can process documents in Thai, Vietnamese, all major languages from India, as well as languages using the Cyrilic alphabet, and Greek.
The UiPath Extended Languages OCR is currently only available as a public endpoint.
New public endpoints based on UiPath® Helix Extractor
Release-Datum: 17. September 2024
Improved performance and new model endpoints enrolled on UiPath Helix Extractor
This release brings enhanced accuracy and performance for models based on the UiPath Helix Extractor, the new UiPath LLM. Furthermore, the following models are now based on the UiPath Helix Extractor as well:
- 709
- 941x
- 1040x
- 3949
- 3949a
Modellendpunkt auf die alte Generation umgeleitet
Due to performance issues, the Financial Statement model endpoint is redirected to the old generation.
Vorschaumodell entfernt
The 990 (Preview) model is removed from both public endpoints and Data Extraction ML packages.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
Veraltete UiPath-OCR für Chinesisch, Japanisch und Koreanisch
Release-Datum: 8. Juli 2024
The UiPath Chinese, Japanese, Korean OCR will be deprecated starting with January 2025. We recommend using the UiPath Extended Languages OCR instead.
Check the Deprecation timeline page for more information about upcoming deprecations and removals.
Public endpoints for Invoices and Receipts based on UiPath® Helix Extractor
Release-Datum: 12. Juni 2024
We are excited to announce the release of improved endpoints for Invoices and Receipts. This new generation, based on the UiPath Helix Extractor, the new UiPath LLM, brings enhanced accuracy and performance.
We are gradually replacing our models with a new generation. For now, all public endpoints are based on the Helix Extractor, except for the following endpoints:
- 709
- 941x
- 1040x
- 3949a
- 9465
- Rechnungen China
- Rechnungen Hebräisch
- Rechnungen Japan
Prüfen Sie die Versionshinweise für zukünftige Ankündigungen.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
Public endpoints based on Helix Extractor
Release-Datum: 29. Mai 2024
We are excited to announce the release of improved endpoints for our pre-trained, out-of-the-box ML packages. This new generation, based on the UiPath Helix Extractor, the new UiPath® LLM, brings enhanced accuracy and performance.
We are gradually replacing our models with a new generation. For now, all public endpoints are based on the Helix Extractor, except for the following endpoints:
- 709
- 941x
- 1040x
- 3949a
- 9465
- Rechnungen
- Rechnungen China
- Rechnungen Hebräisch
- Rechnungen Japan
- Belege
Prüfen Sie die Versionshinweise für zukünftige Ankündigungen.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
UiPath Extended Languages OCR in der öffentlichen Vorschau
Release-Datum: 28. März 2024
We are excited to announce that our latest OCR engine, UiPath Extended Languages OCR, is now in Public Preview. The new OCR is capable of digitizing documents in over 200 languages, bringing a significant improvement over its predecessor, especially in regards to Chinese, Japanese, and Korean. Additionally, it can process documents in Thai, Vietnamese, all major languages from India, as well as languages using the Cyrilic alphabet, and Greek.
The UiPath Extended Languages OCR is currently only available as a public endpoint.
Frozen Backbone-Training
Release-Datum: 27. April 2023
The ML packages versions v23.4 and higher, now have the option to train using Frozen Backbone. This new approach trains faster and gives better results for small or low diversity training sets below 400 pages. You can override this behavior by using the new Training Pipeline environment variables documented in the official documentation.
Rechnungen Australien veraltet
Release-Datum: 29. November 2022
An upcoming deprecation is announced for the Invoices Australia pre-trained ML package. We recommend using instead the Invoices ML package instead. Here you can find more details about it.
ML-Klassifizierungsendpunkt – öffentliche Vorschau
Release-Datum: 27. Juni 2022
Veröffentlicht in Endpunkten
The ML Classification endpoint is now available in public preview.
Release von UiPath-OCR für Chinesisch, Japanisch, Koreanisch
Endpunkte
Release-Datum: 20. Juni 2022
Veröffentlicht in Endpunkten
The UiPath Chinese, Japanese, Korean OCR public endpoint has become generally available.
ML-Pakete zur Datenextraktion
Release-Datum: 6. Juni 2022
Freigegeben in der AI Center-Cloud, für Datenextraktion ML-Pakete
A new OCR method, UiPath Chinese, Japanese, Korean OCR, is now available and can be applied to new or already created projects from Document Understanding, cloud only.
- Freigabe des öffentlichen Endpunkts von UiPath Document OCR
- Verbesserungen
- Freigabe des öffentlichen Endpunkts von UiPath Document OCR
- Verbesserungen
- UiPath Helix Extractor public endpoints improvements
- Neuigkeiten
- UiPath Helix Extractor public endpoints improvements
- Neuigkeiten
- UiPath Helix Extractor public endpoints improvements
- Neuigkeiten
- Neue Dokumententypen
- Verbesserte Funktionen zur Zeichenerkennung
- Über APIs und Aktivitäten verfügbarer Dokumententyp „Zahlungsbelege Japan“
- Entfernung von einsatzbereiten Modellen älter als 2023.4
- Entfernung von einsatzbereiten Modellen älter als 2023.4
- Freigabe des öffentlichen Endpunkts von UiPath Document OCR
- Verbesserungen
- UiPath Helix Extractor public endpoints release
- Neuer Dokumenttyp
- Public endpoints for Invoices China and Invoices Japan based on UiPath Helix Extractor
- Verbesserungen bei Invoices Japan
- Invoices Japan – öffentliche Endpunkte wurden veröffentlicht
- Verbesserungen
- Neue öffentliche Endpunkte für Invoices Japan verfügbar
- Verbesserungen
- UiPath Extended Languages OCR – allgemeine Verfügbarkeit
- New public endpoints based on UiPath® Helix Extractor
- Improved performance and new model endpoints enrolled on UiPath Helix Extractor
- Modellendpunkt auf die alte Generation umgeleitet
- Vorschaumodell entfernt
- Veraltete UiPath-OCR für Chinesisch, Japanisch und Koreanisch
- Public endpoints for Invoices and Receipts based on UiPath® Helix Extractor
- Public endpoints based on Helix Extractor
- UiPath Extended Languages OCR in der öffentlichen Vorschau
- Frozen Backbone-Training
- Rechnungen Australien veraltet
- ML-Klassifizierungsendpunkt – öffentliche Vorschau
- Release von UiPath-OCR für Chinesisch, Japanisch, Koreanisch
- Endpunkte
- ML-Pakete zur Datenextraktion