- Document Understanding-Versionshinweise
- ML-Pakete und öffentliche Endpunkte – Versionshinweise
- Allgemeine ML-Pakete und öffentliche Endpunkte
- Versionsverlauf bei ML-Paketen und öffentlichen Endpunkten

Document Understanding-Versionshinweise
Versionsverlauf bei ML-Paketen und öffentlichen Endpunkten
linkv25.2.2
linkUiPath Document Understanding OCR
Release-Datum: 6. August 2025
Veröffentlicht in UiPath Document Understanding OCR und Endpunkten | v25.2.2
Fehlerbehebungen
Wir haben ein Problem behoben, bei dem das Modell fälschlicherweise mehrere Textfelder in Bildern mit verrauschten Hintergrund erkannt hat.
Verbesserungen
Wir haben die Handschrifterkennung in bestimmten Formularen für datumsbezogene Felder verbessert, die Tage, Monate und Jahre enthalten. Das vorherige Modell gruppierte diese Felder manchmal in einem einzigen Wort, was die Erkennungsleistung beeinträchtigte.
v25.2.0
linkUiPath Document Understanding OCR
Release-Datum: 11. Februar 2025
Veröffentlicht in UiPath Document Understanding OCR und Endpunkten | v25.2.0
Errata
Hinzugefügt am 20. Februar 2025Verbesserungen
Mit dieser neuen Version können Sie eine Verbesserung der Leistung der Handschrifterkennung in Ihren Dokumenten erwarten.
Die Funktion zur Erkennung von Kontrollkästchen wurde ebenfalls verbessert.
Die Latenz wurde für Datasets aller Größen reduziert.
v24.11.3
linkUiPath Document Understanding OCR
Release-Datum: 27. November 2024
Veröffentlicht in UiPath Document Understanding OCR und Endpunkten | v24.11.3
Verbesserungen
In diesem Release haben wir die Genauigkeit und Leistung für verschiedene Texttypen verbessert. Dazu gehört Text, der auf sehr große oder niedrig aufgelöste Bilder gedruckt wird, sowie handschriftlicher Text.
Die Erkennung von Kontrollkästchen, insbesondere derjenigen, die durch vollständig geschwärzte Quadrate oder Rechtecke dargestellt werden, wurde erheblich verbessert. Darüber hinaus haben wir auch die Signaturerkennung optimiert.
v24.10.3
linkDatenextraktion
Veröffentlichungsdatum: 27. Mai 2025
In Data Extraction ML-Paketen veröffentlicht | v24.10.3
Verbesserungen
- Für einen besseren Umgang mit Zahlen haben wir das Parsing von Zahlen da verbessert, wo Leerzeichen entweder als Dekoratoren oder als Dezimalseparatoren verwendet werden.
- Wir haben die Datumsanalyse verbessert, damit Datumsangaben in malaysischer Sprache unterstützt werden.
Fehlerbehebungen
- Wir haben Probleme behoben, die eine falsche Reihenfolge der Wörter in extrahierten Werten in regulären Feldern verursachten.
- Wir haben ein Problem behoben, aufgrund desser japanischer Text nicht aus Dokumenten in der Querformatausrichtung extrahiert wurde.
v24.9.1
linkUiPath Document Understanding OCR
Release-Datum: 3. Oktober 2024
Veröffentlicht in UiPath Document Understanding OCR und Endpunkten | v24.9.1
Verbesserungen
Diese Version bringt Genauigkeits- und Leistungsverbesserungen für die Handschrifterkennung.
v24.7
linkUiPath Document OCR
Release-Datum: 23. Juli 2024
Veröffentlicht in UiPath Document Understanding OCR und Endpunkten (einschließlich UiPath Document Understanding OCR_CPU) | v24.7
Verbesserungen
- Die Genauigkeit für Aserbaidschanisch wurde verbessert, indem die Erkennung für die Zeichen əƏ hinzugefügt wurde.
- Die MIRC-Erkennung und -Erfassung (Magnetic Ink Character Recognition, MIRC) wurde verbessert, was insbesondere bei Schecks zu einer höheren Genauigkeit führt.
- Zuvor wurden Zahlen in einigen Fällen nicht erkannt, wenn ein Leerzeichen als Trennzeichen verwendet wurde. Das wurde verbessert und Zahlen werden jetzt erkannt, wenn Leerzeichen als Trennzeichen verwendet werden.
Fehlerbehebungen
Die Konfidenzbewertung für die UiPath Document Understanding OCR wurde verbessert, insbesondere bei Bildern in niedrigerer Qualität. In Workflows, bei denen die Konfidenzbewertung verwendet wird, um zu entscheiden, ob Dokumente eine menschliche Validierung im Action Center benötigen, kann diese Verbesserung zu einer erhöhten Anzahl von Dokumenten führen, die validiert werden.
v24.4.4
linkDatenextraktion
Release-Datum: 3. Oktober 2024
Veröffentlicht in ML-Paketen für Datenextraktion | v24.4.4
Fehlerbehebungen
- Wir haben ein Problem behoben, das dazu führte, dass AI Center-Trainingspipelines ungenau hohe Punktzahlen für die Feldtypen
ID Number
undPhone Number
meldeten. Dadurch wird sichergestellt, dass die gemeldeten Punktzahlen mit den tatsächlichen Punktzahlen übereinstimmen. - Wir haben ein Problem behoben, das mit dem Analysieren von Werten in japanischen Feldern zusammenhängt, wenn die erweiterte Sprachen-OCR verwendet wurde.
v24.4.3
linkDocumentUnderstanding und Datenextraktion
Release-Datum: 14. August 2024
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v24.4.3
Verbesserungen
Verbesserte Feldtextformatierung für die Sprachen Chinesisch, Japanisch und Koreanisch bei Verwendung von UiPath® Extended Languages OCR im Digitalisierungsschritt.
v24.4.2
linkInvoicesIndia und Endpunkte
Release-Datum: 23. Juli 2024
Veröffentlicht in Endpunkten und ML-Paket „InvoicesIndia“ | v24.4.2
Fehlerbehebungen
Wir haben ein Problem im Zusammenhang mit dem Parsen von Zahlen in indischen Rechnungen behoben.
v24.4.1
linkDocumentUnderstanding, InvoicesJapan und Endpunkte
Release-Datum: 20. Juni 2024
Veröffentlicht in Endpunkten + ML-Paketen für DocumentUnderstanding + InvoicesJapan | v24.4.1
Fehlerbehebungen
Wir haben ein Problem im Zusammenhang mit Datumsangaben in Spaltenfeldern speziell für die japanische Sprache behoben.
v24.4.0
linkDocumentClassifier und Datenextraktion
Release-Datum: 24. Mai 2024
- ML-Pakete DocumentUnderstanding + Datenextraktion | v24.4.0
- DocumentClassifier ML-Pakete | v24.4.0
Neuigkeiten
Verbesserungen
- Die Genauigkeit für das ML-Paket Invoices Japan wurde verbessert. Es gibt auch 11 neue Felder für das Modell Invoices Japan. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.
- Die Leistung für das Payslips-Modell wurde verbessert.
- Für das ML-Paket ID Cards sind neue IDs verfügbar:
- Aadhaar-ID-Karten
- Saudi-Arabische ID-Karten
- PAN-Karten
- Für das ML-Paket UB04 sind neue Felder verfügbar. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.
- Für das ML-Paket Checks sind neue Felder verfügbar. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.
Erratum – Hinzugefügt am 20. Juni 2024: Informationen zu einer Fehlerbehebung im Zusammenhang mit der Analyse japanischer Datumsangaben wurden hinzugefügt.
Erratum – hinzugefügt am 28. Mai 2024: Weitere Informationen zu mehreren Verbesserungen wurden hinzugefügt.
v24.3.2
linkDocumentUnderstandingOCR-Endpunkte
Release-Datum: 13. März 2024
Veröffentlicht in DocumentUnderstandingOCR-Endpunkte | v24.3.2
Eine neue Version für Document Understanding OCR ist jetzt für die allgemeine Verwendung verfügbar.
- Die Genauigkeit für Türkisch (TUR) wurde verbessert. Die Leistung bei diakritischen Zeichen (z. B. Ç, ç, Ğ, ğ, I, ı, İ, i, Ş, ş, Ö, ö, Ü, ü) wurde verbessert.
- Die Genauigkeit für ostarabische Ziffern (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) wurde verbessert.
v24.2.1
linkDocumentUnderstandingOCR-Endpunkte
Release-Datum: 9. Februar 2024
Veröffentlicht in DocumentUnderstandingOCR-Endpunkte | v24.2.1
Wir freuen uns, Ihnen mitteilen zu können, dass die Unterstützung von Arabisch (ARA) in UiPath Document Understanding OCR jetzt in der öffentlichen Vorschau verfügbar ist.
v24.2.0
linkDatenextraktion
Release-Datum: 1. April 2024
Veröffentlicht in ML-Paketen zur Datenextraktion | v24.2.0
- 1040 Anlage C
- 1040 Anlage D
- 1040 Anlage E
- UB04
Document Classifier
Release-Datum: 4. März 2024
Veröffentlicht in DocumentClassifier-ML-Paketen | v24.2.0
- 1040 Anlage C
- 1040 Anlage D
- 1040 Anlage E
- UB04
v23.10.5
linkUiPath Document Understanding OCR
Release-Datum: 15. Oktober 2024
Veröffentlicht in UiPath Document Understanding OCR und Endpunkten | v23.10.5
Verbesserungen
Diese Version bringt Genauigkeits- und Leistungsverbesserungen für die Handschrifterkennung.
Fehlerbehebungen
Wir haben ein Problem behoben, bei dem Anmerkungsfelder horizontal zurückgegeben wurden, obwohl einige Dokumente leicht verzerrt waren, was zu einer Fehlausrichtung in der Anmerkung führte.
v23.10.4
linkDatenextraktion
Release-Datum: 28. März 2024
Veröffentlicht in ML-Paketen zur Datenextraktion | v23.10.4
Eine neue Version für sofort einsatzbereite vortrainierte ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.
- Die Genauigkeit für Türkisch (TUR) wurde verbessert. Die Leistung bei diakritischen Zeichen (z. B. Ç, ç, Ğ, ğ, I, ı, İ, i, Ş, ş, Ö, ö, Ü, ü) wurde verbessert.
- Die Genauigkeit für ostarabische Ziffern (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) wurde verbessert.
- Die Genauigkeit für Datasets, die kleiner als 400 Seiten sind, wurde verbessert.
v23.10.3
linkDocumentUnderstanding, Datenextraktion und Endpunkte
Release-Datum: 12. Februar 2024
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.10.3
Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete von AI Center ist jetzt für die allgemeine Verwendung verfügbar.
Diese neue Version bringt eine Fehlerbehebung im Zusammenhang mit der Extraktion bidirektionaler Textwerte (von links nach rechts und von rechts nach links).
v23.10.2
linkDocumentUnderstanding und Datenextraktion
Release-Datum: 23. Januar 2024
Veröffentlicht in den ML-Paketen DocumentUnderstanding + Datenextraktion | v23.10.2
Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.
Mit diesem Release wird ein Fehler behoben, der gelegentlich dazu führte, dass das Training fehlschlug.
v23.10.0
linkDocumentUnderstanding, Datenextraktion und Endpunkte
Release-Datum: 26. Oktober 2023
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.10.0
Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.
Wir arbeiten ständig daran, Document Understanding für Sie zu verbessern. In diesem Release haben wir kleinere Sicherheits- und Stabilitätsverbesserungen an unserem Produkt vorgenommen.
UiPath Document Understanding OCR
Release-Datum: 2. Oktober 2023
Veröffentlicht in UiPath Document Understanding OCR | v23.10
Wir freuen uns, Ihnen mitteilen zu können, dass Hebräisch (HEB) jetzt von UiPath Document Understanding OCR unterstützt wird.
v23.7.0
linkDocumentUnderstanding und Datenextraktion
Release-Datum: 3. August 2023
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v23.7.0
- In Dokumenten, in denen sich eine Tabelle über viele Seiten erstreckt, wird eine Tabellenzeile (eine Position) auf 2 Seiten aufgeteilt, in einigen Fällen sogar mehr. In den vorherigen Modellversionen wurde davon ausgegangen, dass jeder Seitenumbruch auch ein Zeilenumbruch ist. Dadurch wurden Elemente in mehrere Teile aufgebrochen. Die aktuelle Modellversion behebt dieses Problem. Um von dieser Funktion in einem Workflow zu profitieren, müssen Sie die DocumentUnderstanding.ML.Activities-Paketversion 1.23.0-preview und die Modellversion 23.7.0 im jeweiligen Workflow verwenden.
- Modelle haben jetzt eine schnellere Vorhersagezeit pro Seite und nutzen den RAM effizienter, was die Verarbeitung größerer Dokumente ermöglicht.
v23.6.0
linkDocumentUnderstanding und Endpunkte
Release-Datum: 13. Juni 2023
Veröffentlicht in DocumentUnderstanding + Endpunkten | v23.6.0
Wir haben die Genauigkeit des ML-Pakets für UiPathDocumentOCR verbessert.
v23.4.1
linkDocumentUnderstanding, Datenextraktion und Endpunkte
Release-Datum: 23. Mai 2023
Veröffentlicht in den ML-Paketen DocumentUnderstanding + Datenextraktion | v23.4.1
Wir haben ein Problem behoben, das sich auf das Modelltraining auswirkte.
v23.4.5
linkDocument Understanding
Release-Datum: 21. April 2023
Freigegeben in DocumentUnderstanding | v23.4.5
Wir haben das Modell für allgemein eingegebenen Text verbessert und die Funktion zur Erkennung von Kontrollkästchen erweitert.
v23.4.2
linkDocument Understanding
Release-Datum: 24. März 2023
Veröffentlicht in DocumentUnderstanding | v23.4.2
Der öffentliche Endpunkt von UiPath Document OCR wurde aktualisiert und bietet jetzt Unterstützung für die Handschriftsprache für Deutsch und Französisch sowie Drucksprachenunterstützung für Dänisch, Finnisch, Norwegisch und Schwedisch. Hier ist die vollständige Liste der neuen unterstützten Sprachen: Dänisch, Schwedisch, Norwegisch, Finnisch, Polnisch, Ungarisch, Tschechisch, Slowakisch, Estnisch, Lettisch, Litauisch, Slowenisch, Kroatisch, Serbisch, Türkisch.
v23.4.0
linkDocumentUnderstanding, Datenextraktion und Endpunkte
Release-Datum: 10. Mai 2023
Veröffentlicht in den ML-Paketen DocumentUnderstanding + Datenextraktion | v23.4.0
Die UiPath Document OCR ist jetzt als vorgefertigtes vortrainiertes Paket sowohl für die GPU- als auch für die CPU-Nutzung verfügbar. Auf diese Weise können Kunden, die die Verwendung öffentlicher Endpunkte vermeiden möchten, UiPath Document OCR in ihren eigenen Mandanten in einer isolierten Umgebung bereitstellen.
Eine Liste von sieben neuen vorgefertigten vortrainierten ML-Paketen ist jetzt für die allgemeine Verwendung verfügbar. Hier ist die Liste der sieben neuen Modelle:
- Gründungsurkunde/Unbedenklichkeitsbescheinigung
- Ursprungszeugnis
- Produktzertifikat für Kinder
- CMS1500
- EU-Konformitätserklärung
- Rechnungen Versand
- Gehaltsabrechnungen (Pay slips)
DocumentClassifier und Endpunkte
Release-Datum: 26. April 2023
Veröffentlicht in ML-Paketen für Endpunkte + DocumentClassifier | v23.4.0
Wir haben dem ML-Paket für DocumentClassifier neue Dokumenttypen hinzugefügt, allgemeine Verbesserungen vorgenommen und einige kleine Fehler behoben.
v23.2.0
linkDocumentUnderstanding, Datenextraktion und Endpunkte
Release-Datum: 23. Februar 2023
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.2.0
Neuerungen und Verbesserungen
Eine neue Version der sofort einsetzbaren vortrainierten ML-Pakete (23.1.0) und ihrer öffentlichen Endpunkte wurde veröffentlicht, die jetzt eine hochmoderne Architektur auf LayoutLM Transformer-Basis verwendet, die leistungsstärker ist und die Genauigkeit insgesamt erhöht, insbesondere bei Spaltenfeldern (Tabellen).
Diese Verbesserung hat die sofort einsetzbaren vortrainierten ML-Pakete leistungsfähiger gemacht, was bedeutet, dass möglicherweise eine längere Latenz für Training und Vorhersagen auftritt.
Für alle Situationen, in denen die Latenz kritisch ist (z. B.: Attended-Szenarien), empfehlen wir die Bereitstellung der Modelle als ML-Fähigkeiten mit einer GPU.
We have improved how the scores are calculated after Training/Evaluation/Full pipelines to provide a separate score for each column field. Before this improvement, F1 scores were calculated as a whole, for all column fields taken together.
Die bevorstehende Entfernung der Funktion für Manuelle Bearbeitungen, die in der Modellbewertung verwendet wird, wird angekündigt. Weitere Informationen finden Sie hier.
Bekannte Probleme (Known Issues)
The project import from AI Center is currently disabled. We are actively working on this and expect to have it reenabled by the end of March.
Erratum 8. Mai 2023
Bekanntes Problem
Fatal Python error: Segmentation fault
empfangen. Wir empfehlen die Verwendung der ML-Pakete mit v23.4, bis dieser Fehler behoben ist.
Erratum 20. April 2023
Die Gesamtpunktzahl für alle Pipelines ist jetzt eine Genauigkeit. Zuvor war es ein F1-Ergebnis. Die Auswertungsartefakte im AI Center enthalten weiterhin sowohl die Genauigkeit als auch die F1-Punktzahl, um die Vergleichbarkeit zu erhöhen.
v23.1.0
linkDocumentClassifier und Endpunkte
Release-Datum: 11. Januar 2023
Freigegeben in Endpunkten und DocumentClassifier | v23.1.0
Wir haben die F1-Bewertungen verbessert, die nun auch für Trainings-Pipelines angezeigt werden.
Der Ordner „Artefakte“ enthält eine aktualisierte Liste der Artefakte.
Das DocumentClassifier-Modell sagt jetzt 25 statt 26 Klassen voraus, da die Klasse „Lieferhinweise“ entfernt wurde.
v22.12.2
linkEndpunkte
Release-Datum: 16. Dezember 2022
Freigegeben in Endpunkten | v22.12.2
Der öffentliche Endpunkt von UiPath Document OCR wurde aktualisiert und bietet jetzt Unterstützung für die Handschriftsprache für Deutsch und Französisch sowie Drucksprachenunterstützung für Dänisch, Finnisch, Norwegisch und Schwedisch.
v22.11.0
linkDocumentUnderstanding, Datenextraktion und Endpunkte
Release-Datum: 13. Dezember 2022
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v22.11.0
Dieser Release bringt erhebliche Verbesserungen für die öffentlichen Endpunkte der sofort einsetzbaren vortrainierten ML-Pakete mit sich, d. h. die neueste LayoutLM-basierte Deep-Learning-Architektur wird jetzt verwendet.
Diese Verbesserung bietet eine höhere Genauigkeit bei allen Dokumenttypen, insbesondere für das Invoices-Modell, und steigert auch die Genauigkeit bei Spaltenfeldern und Tabellen.
Wir haben dem Invoices-Modell neue extrahierte Felder hinzugefügt, darunter Versanddatum, E-Mail-Adresse des Lieferanten, Bankname, Kontonummer, IBAN, SWIFT-Code, Bankadresse, Bankleitzahl und Steuersatz. Sie können die Liste der extrahierten Felder überprüfen, indem Sie auf diese Seite zugreifen und auf den Link klicken, der für jedes Modell verfügbar ist.
Modellbewertungen werden jetzt auch von Trainingspipelines zurückgegeben, nicht nur von vollständigen oder Auswertungspipelines.
F1-Ergebnisse sind jetzt für jedes Spaltenfeld verfügbar. Bisher waren F1-Ergebnisse nur für alle Spaltenfelder zusammen verfügbar.
v22.10.2
linkEndpunkte
Release-Datum: 3. Februar 2023
Veröffentlicht in Endpunkten | v22.10.2
Die öffentlichen Endpunkte der sofort einsetzbaren vortrainierten ML-Pakete wurden aktualisiert und verwenden jetzt eine hochmoderne auf LayoutLM Transformers basierende Architektur.
v22.10.0
linkDocumentUnderstanding, Datenextraktion und Endpunkte
Release-Datum: 7. Oktober 2022
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v22.10.0
Neuerungen und Verbesserungen
-Preview
als offiziell aufgeführt: InvoicesAustralia, InvoicesIndia, PurchaseOrders.
Das DeliveryNotes-Modell wurde in BillsOfLading umbenannt.
Zehn neue vortrainierte Modelle sind jetzt verfügbar: Acord25, 1040, Checks, Bank Statements, Financial Statements, Packing Lists, Acord131, Acord126, Acord140, Vehicle Titles.
Fehlerbehebungen
An den oben genannten Paketen wurden mehrere Fehlerbehebungen vorgenommen.
UiPath Document OCR
Release-Datum: 4. Oktober 2022
Veröffentlicht in UiPath Document OCR | v22.10.0 Cloud
Eine neue Funktion ist jetzt für die Erkennung von Barcodes und QR-Codes verfügbar.
Die Genauigkeit wurde bei langen Zeichenfolgen wie E-Mail-Adressen und URLs, bei Schriftarten mit fester Breite sowie bei der Erkennung von Handschrift und Signaturen verbessert.
Die Erkennung der Seitenrotation wurde ebenfalls verbessert.
v22.6.1-preview
linkDocumentUnderstanding, Datenextraktion und Endpunkte
Release-Datum: 10. Oktober 2022
Freigegeben in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | Vorschau v22.6.1
Dieser Release bringt mehrere Fehlerbehebungen für die Pakete und Endpunkte für DocumentUnderstanding und Datenextraktion.
v22.6.0-preview
linkDocumentUnderstanding und Datenextraktion
Release date: 6 September 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v22.6.0-preview
Es sind 18 neue Vorschau-ML-Pakete mit einer fortschrittlicheren Modellarchitektur für unsere DU ML-Pakete im AI Center verfügbar. Sie können sie einfach anhand des Worts Preview (Vorschau) am Ende des Paketnamens erkennen, z. B.: InvoicesPreview,PurchaseOrderPreview,Acord125Preview usw.
Die Liste der öffentlichen Endpunkte wurde mit allen neuen Vorschau-ML-Paketen aktualisiert und kann unter Öffentliche Endpunkte eingesehen werden.
Erwähnenswert ist die Tatsache, dass diese Vorschaumodelle keine DU/AI Units aus Ihrer Lizenzierungsberechtigung verbrauchen.
Ein Fehler bei der Verwendung privater Fähigkeiten wurde behoben. Jetzt kann die private Fähigkeit nur mit einem API-Schlüssel verwendet werden, der derselben Organisation gehört, die die AI Center-Instanz verwendet.
v22.5.2
linkDocumentUnderstanding und Datenextraktion
Release-Datum: 22. Juli 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v22.5.2
Fehlerbehebungen
eol classifier
und line_detection
in einer einzigen Methode kombiniert werden.
Bekanntes Problem
Es gibt ein bekanntes Problem für das Paket Rechnungen, das gelegentlich zu einem Fehler führt, wenn Sie versuchen, eine Schleife mit automatischer Feinabstimmung im AI Center auszuführen.
v22.5.1
linkDocumentUnderstanding, DocumentClassifier und Datenextraktion
Release-Datum: 18. Juli 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion | v22.5.1
Fehlerbehebungen
- Es wurde ein Fehler behoben, der dazu führte, dass die extrahierten Felder auf der falschen Seite der Validation Station angezeigt wurden.
- Es wurde ein Fehler behoben, der dazu führte, dass die letzte Textzeile auf einigen Seiten im Document Manager nicht digitalisiert wurde.
- Es wurde ein Fehler behoben, der die Anzeige einiger F1-Punktzahlelemente aus der
evaluation_F1_invoices.txt
-Datei in vollständigen/Auswertungspipelines im AI Center verhinderte. - Es wurde ein Fehler behoben, der dazu führte, dass die falsche F1-Gesamtpunktzahl in
evaluation_F1_invoices.txt file
in vollständigen/Auswertungspipelines im AI Center berechnet wurde, wenn ein Modell nur Spaltenfelder hatte.
v22.5.0
linkAI Center-Cloud, Datenextraktion
Release-Datum: 16. Juni 2022
Veröffentlicht in den ML-Paketen für AI Center Cloud, Datenextraktion | v22.5.0
Verbesserungen
Die Leistung wurde für alle ML-Pakete zur Datenextraktion verbessert.
v22.4.3
linkDocumentUnderstanding und Datenextraktion
Release-Datum: 21. Juli 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v22.4.3
eol classifier
und line_detection
in einer einzigen Methode kombiniert werden.
v22.4.2
linkDocumentUnderstanding, DocumentClassifier und Datenextraktion
Release-Datum: 14. Juli 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion | v22.4.2
Fehlerbehebungen
- Es wurde ein Fehler behoben, der dazu führte, dass die extrahierten Felder auf der falschen Seite der Validation Station angezeigt wurden.
- Es wurde ein Fehler behoben, der dazu führte, dass die letzte Textzeile auf einigen Seiten im Document Manager nicht digitalisiert wurde.
- Es wurde ein Fehler behoben, der die Anzeige einiger F1-Punktzahlelemente aus der
evaluation_F1_invoices.txt
-Datei in vollständigen/Auswertungspipelines im AI Center verhinderte. - Es wurde ein Fehler behoben, der dazu führte, dass die falsche F1-Gesamtpunktzahl in
evaluation_F1_invoices.txt file
in vollständigen/Auswertungspipelines im AI Center berechnet wurde, wenn ein Modell nur Spaltenfelder hatte.
v22.4.1
linkAI Center-Cloud, Datenextraktion
Release-Datum: 3. Juni 2022
Veröffentlicht in den ML-Paketen für AI Center Cloud, Datenextraktion | v22.4.1
Fehlerbehebungen
line_detection mode
trainiert wurde, auftrat und dazu führte, dass die Vorhersagen anders ausfielen als beim Aufruf über die ML-Fähigkeit.
v22.4.0
linkDocumentUnderstanding, DocumentClassifier und Datenextraktion
Release-Datum: 10. Mai 2022
Veröffentlicht in ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion
| v22.4.0
Neuigkeiten
Handschriftfunktionen sind jetzt für die Pakete „UiPathDocumentOCR“ und „UiPathDocumentOCR_CPU“ verfügbar, indem „HandwritingRecognitionOCR“ integriert wird. Die gleichen Funktionen sind im Studio-Paket „UiPath.OCR.LocalServer“ verfügbar.
Neue Architektur für Extraktions-ML-Pakete mit großen Vorteilen, insbesondere für Modelle, die mit dem ML-Paket DocumentUnderstanding trainiert wurden.
Die ML-Pakete Utility Bills, W9 und Passports sind jetzt allgemein verfügbar.Fünf neue, vorab trainierte ML-Pakete sind jetzt in der Vorschau verfügbar und erleichtern Ihnen die Arbeit.
Fünf neue, vorab trainierte ML-Pakete sind jetzt in der Vorschau verfügbar und erleichtern Ihnen die Arbeit.
Die Dokumentsuche ist eine neue Funktion im Document Manager, die das Beschriften von Dokumenten mit einer großen Anzahl von Seiten erleichtert.
Verbesserungen
Die ML-Pakete für die Dokumentextraktion im AI Center wurden verbessert. Die Excel-Tabelle zur Auswertung hat jetzt neue Kalkulationstabellen, die es Ihnen ermöglichen, die ausgewerteten Daten besser zu organisieren und zu interpretieren.
ML-Pakete in der Offlineinstallation der Automation Suite haben ein neues Offlinepaket erhalten.
Genauigkeit und Leistung wurden für UiPathDocumentOCR verbessert.
Fehlerbehebungen
Mehrere Korrekturen bei der Analyse von Datumsfeldern, einschließlich Datumsangaben in Spaltenfeldern, Daten in türkischen Dokumenten und Datumsangaben weit in der Zukunft
v22.2.3
linkUiPathDocumentUnderstandingOCR
Release-Datum: 7. März 2022
Veröffentlicht in UiPathDocumentOCR | v22.2.3
Optimale Funktion
HandwritingRecognitionOCR wurde in UiPathDocumentOCR integriert. In vielen Fällen gibt es eine Mischung aus Feldern. Durch die Integration der Funktion zum Lesen von Handschriften können wir auf jedes Feld die richtige Erkennung anwenden: Druckschrifterkennung auf Drucktext und Handschrifterkennung auf handschriftlichen Text.
Beachten Sie, dass HandwritingRecognitionOCR zwar jede Handschrift erkennen kann, sie jedoch nur für Englisch trainiert und optimiert ist.
v22.1.6
linkDocumentUnderstanding, DocumentClassifier und Datenextraktion
Release-Datum: 14. März 2022
Veröffentlicht in ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion
| v22.1.6
Fehlerbehebungen
Es wurde ein Fehler behoben, der dazu führte, dass eine Trainingspipeline oder eine vollständige Pipeline im AI Center aufgrund eines ML-Paketproblems bei der Datenvorverarbeitung für eine leere Zeile fehlschlug.
v22.1.4
linkDocumentUnderstanding, DocumentClassifier und Datenextraktion
Release-Datum: 2. März 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion | v22.1.4
Neuigkeiten
Das ML-Paket Utility Bills ist jetzt allgemein verfügbar.
Verbesserungen
Insgesamt verbesserte Leistung und Skalierbarkeit.
Deutliche Verbesserungen bei den Punktzahlen beim Training für die neue Version des ML-Pakets DocumentUnderstanding im Vergleich zu früheren Versionen.
Datumsangaben in Spaltenfeldern werden nun korrekt geparst.
Beim Datums-Parsen werden nun türkische Monatsnamen erkannt.
Änderungen
Das Verhalten für Trainingspipelines und vollständige Pipelines wurde geändert, wenn auf GPU anstatt auf CPU trainiert wurde. Die auf CPUs trainierten 21.10.x-er Modelle waren kleiner, sodass sie schneller trainiert wurden als die vorherigen Versionen, während sie etwas niedrigere Genauigkeit als zuvor hatten.
Dieses Verhalten wurde mit dieser Version rückgängig gemacht, sodass das Modell, das auf der GPU und auf der CPU trainiert wird, genau das gleiche Modell ist und die Trainingsgeschwindigkeit auf den Stand vor 2021.10 zurückgesetzt wurde, was bedeutet, dass das Training auf CPU erneut 10–20-mal langsamer als auf GPU ist.
v21.10.11
linkDatenextraktion
Release-Datum: 23. November 2021
Veröffentlicht in den ML-Paketen für Datenextraktion | v21.10.11
Es wurde ein Fehler behoben, der dazu führte, dass Trainings- und Auswertungspipelines aufgrund der Logik der Datumsnachbearbeitung fehlschlugen.
v21.10.9
linkDatenextraktion
Release-Datum: 24. November 2021
Veröffentlicht in den ML-Paketen für Datenextraktion | v21.10.9
Es wurde ein Fehler behoben, der zur Laufzeit einen Vorhersagefehler ausgelöst hat.
Datenextraktion und Endpunkte
Release-Datum: 22. Oktober 2021
Veröffentlicht in den ML-Paketen und Endpunkten für Datenextraktion | v21.10.9
Neuigkeiten
Das ML-Paket PurchaseOrders ist jetzt Allgemein verfügbar und kann in Ihren Produktionsszenarien verwendet werden.
Die ML-Pakete InvoicesChina, DeliveryNotes, RemittanceAdvices, W2 und W9 befinden sich jetzt in der Öffentlichen Vorschau. Wir empfehlen Ihnen, diese Pakete zu überprüfen und sie für den Typ von Dokumenten zu verwenden, die Sie verarbeiten müssen.
Verbesserungen
Evaluierung auf Dokumentebene implementiert. Dies ist repräsentativ für die Laufzeitleistung in Ihrem RPA-Workflow.
Die Evaluierung kann auch für Datasets mit weniger Feldern als das evaluierte ML-Paket durchgeführt werden. Das erleichtert die Evaluierung von vorgefertigten vorab trainierten ML-Paketen.
eval.redo_ocr
in der AI Center-Evaluierungspipeline auf „true“ gesetzt werden.
Das Training mit der CPU verwendet jetzt ein kleineres Modell, um die Geschwindigkeit um das 5- bis 7-Fache zu erhöhen. Sie sollten jedoch mit einer um 0–5 % niedrigeren Genauigkeit bei Verwendung des CPU rechnen.
Evaluation.xlsx
-Dateien hinzugefügt, die von Evaluierungspipelines produziert werden.
Das UtilityBills-ML-Paket wurde erheblich verbessert.
Verbessertes Parsen von Adressen, die 1–2 Textzeilen überspringen.
Verbesserung beim Extrahieren negativer Werte, sehr großer Werte (11 Stellen oder mehr) oder in ferner Zukunft liegender Daten.
Unterstützung für gedrehte Felder auf Belegen wurde hinzugefügt.
Verkettete Abschnitte verbessert.
Fehlerbehebungen
- Es wurde ein Fehler behoben, bei dem keine Sonderzeichen in String-Feldern zurückgegeben wurden.
- Es wurde ein Fehler beim Passports-ML-Paket behoben, bei dem das als Ordinalzahl geschriebene Datum (1., 2., 3., 4. usw.) nicht korrekt geparst wurde.
Bekannte Probleme (Known Issues)
Das Retraining der InvoicesJapan- und InvoicesChina-ML-Pakete mit Daten aus der Validierungsstation wird derzeit nicht unterstützt. Verwenden Sie als Problemumgehung Google Cloud Vision OCR.
Bevorstehende Verwerfungen
Alle öffentlichen Endpunkte, mit Ausnahme von UiPathDocumentOCR, FormExtractor, IntelligentFormExtractor und IntelligentKeywordClassifier, werden ab dem 1. Dezember 2021 in Regionen außerhalb von Westeuropa als veraltet eingestuft.
v21.10.5
linkUiPathDocumentOCR-Endpunkte
Release-Datum: 13. Dezember 2021
Veröffentlicht in UiPathDocumentOCR-Endpunkten | v21.10.5
Verbesserungen
UiPathDocumentOCR ist jetzt auch in der Region Singapur verfügbar.
v21.10.1
linkDatenextraktion und Endpunkte für UiPathDocumentOCR
Release-Datum: 24. September 2021
Veröffentlicht in Datenextraktion und Endpunkten für UiPathDocumentOCR | v21.10.1
Verbesserungen
Unterstützung für gedrehten Text wurde hinzugefügt, auch wenn die Drehung für jedes Wort in unterschiedlichen Winkeln stattfindet.
Unterstützung für vertikalen Text wurde hinzugefügt. Diese Verbesserung ist derzeit nur für UiPath.IntelligentOCR.Activities verfügbar, einschließlich Validierungsstation. Der Data Manager und der Machine Learning Extractor unterstützen noch keinen vertikalen Text.
Verbesserung der Genauigkeit bei verrauschten Bildern oder Fotos: z. B. Quittungen, Ausweisen oder Pässen.
v21.10
linkEndpunkte für FormExtractor, IntelligentFormExtractor und IntelligentKeywordClassifier
Release-Datum: 13. Dezember 2021
Veröffentlicht in Endpunkten für FormExtractor + IntelligentFormExtractor + IntelligentKeywordClassifier | v21.10
Verbesserungen
Form Extractor, Intelligent Form Extractor und Intelligent Keyword Classifier sind jetzt auch in der Region Singapur verfügbar.
v21.7
linkDatenextraktion und Endpunkte für die Handschrifterkennung
Release-Datum: 11. August 2021
Veröffentlicht in der Datenextraktion und Endpunkten für die Handschrifterkennung | v21.7
Verbesserungen
Möglichkeit, mehrere Threads in einem einzigen Aufruf des Modells zu bearbeiten.
Erneutes Modelltraining und einige andere Änderungen für eine bessere Modellgenauigkeit.
Fehlerbehebungen
Es wurde ein Fehler behoben, der dazu führte, dass die Kapsel neu gestartet wurde, wenn kein Arbeitsspeicher mehr übrig war.v21.6.3
linkUiPathDocumentOCR in Endpunkten
Release-Datum: 9. Juni 2021
Veröffentlicht in Endpunkten für UiPathDocumentOCR | v21.6.3
Verbesserungen
Verbesserte Erkennung von einzelnen Ziffern.
Verbesserte Genauigkeit bei den Zeichen 1, I und l.
Verbesserte Erkennung von nah beieinander stehendem Text.
v21.5.5
linkDatenextraktion und Endpunkte
Release-Datum: 18. Juni 2021
Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.5.5
Es wurde ein Fehler behoben, der Vorhersagedifferenzen zwischen dem Data Manager und der Aktivität Digitize Document verursachte.
v21.5.3
linkDatenextraktion und Endpunkte
Release-Datum: 8. Juni 2021
Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.5.3
Neuigkeiten
Für schwer lesbare Bilder, wie im Falle von ID-Karten und Passports, wurden zwei neue, entsprechend vorab trainierte Out-Of-the-Box-Pakete veröffentlicht.
Verbesserungen
Erneut trainierbare Klassifizierungsfelder wurden in unsere vorab trainierten Out-Of-the-Box-Pakete integriert.
v21.4.7
linkDatenextraktion und Endpunkte
Release-Datum: 20. April 2021
Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.4.7
Verbesserte Datumsanalyse für ML-Pakete zur Datenextraktion.
v21.4.5
linkDatenextraktion und Endpunkte
Release-Datum: 15. April 2021
Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.4.5
Neuigkeiten
Aller öffentlichen Endpunkte in der Region Vereinigte Staaten bereitgestellt.
Öffentliche Endpunkte für Form Extractor, Intelligent Form Extractor und Intelligent Keyword Classifier in den Regionen Kanada und Japan bereitgestellt.
v21.4
linkDatenextraktion und Endpunkte für HandwritingRecognition und DocumentClassifier
Release-Datum: 9. März 2021
Veröffentlicht in ML-Paketen für Datenextraktion und Endpunkten für HandwritingRecognition, DocumentClassifier, + eigenständiger Docker für UiPathDocumentOCR | v21.4
Neuigkeiten
Handschrifterkennung mit verbesserter Erkennung durch das Nutzen von Rechtschreibkorrekturen und durch die Fähigkeit, maschinell gedruckten Text zu lesen, erreicht allgemeine Verfügbarkeit.
DocumentClassifier erreicht ebenfalls die allgemeine Verfügbarkeit.
Verbesserungen an UiPath Document OCR für:
- Optionsfeld-/Kontrollkästchen-Erkennung
- Genauigkeit bei Blasenformularen
- Allgemeine Genauigkeit
v21.1.8
linkDatenextraktion und Endpunkte
Release-Datum: 17. Februar 2021
Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.1.8
Verbesserungen
Verbesserte Genauigkeit.
InvoicesIndia und InvoicesAustralia sind jetzt allgemein verfügbar.
Öffentliche Endpunkte in der Region Australien bereitgestellt.
https://du.uipath.com/ie/invoices
sowohl für den Unternehmens- als auch für den Community-Verkehr.
v20.11.3
linkDatenextraktion
Veröffentlichungsdatum: 18. Dezember 2020
Veröffentlicht in den ML-Paketen für Datenextraktion | v20.11.3
Verbesserungen
Verbesserungen des CPU-Trainings machen es schneller und erfordern weniger Arbeitsspeicher.
Verbesserungen der Datumsanalyse für Nicht-US-Dokumente.
Erkennung von Kontrollkästchen bei UiPathDocumentOCR, einschließlich gedruckter oder handschriftlicher Kontrollkästchen.
v20.10.4
linkDatenextraktion und Endpunkte
Release-Datum: 10. November 2020
Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v20.10.4
Neue Funktionen und Verbesserungen
Ein neues Modell für japanische Rechnungen.
Auswertungspipelines geben nun auch Metriken für Klassifizierungsfelder zurück.
Support für Microsoft Read OCR Version 3.
Verbesserungen der Datumsformatierung/-analyse zur Erkennung der Formate Tag/Monat/Jahr im Vergleich zu Formaten mit Monat/Tag/Jahr.
Verbesserungen bei der Erkennung von Dezimal- und Tausendertrennzeichen für eine korrekte Zahlenanalyse.
Training auf CPU wird von allen Versionen von AI Fabric unterstützt.
id-no
.
Support ausschließlich für Training-Klassifizierungsfelder (nicht für reguläre oder Spaltenfelder).
Erhöhung der maximalen Anzahl erlaubter Felder von 32 auf 40.
Konfidenzniveau-Meldungen für Spaltenfelder.
Bekannte Probleme (Known Issues)
class
, break
, from
, finally
, global
, None
usw. Bitte beachten Sie, dass diese Liste nicht vollständig ist, da der Paketname für class <pkg-name>
und import <pkg-name>
verwendet wird.
- v25.2.2
- UiPath Document Understanding OCR
- v25.2.0
- UiPath Document Understanding OCR
- v24.11.3
- UiPath Document Understanding OCR
- v24.10.3
- Datenextraktion
- v24.9.1
- UiPath Document Understanding OCR
- v24.7
- UiPath Document OCR
- v24.4.4
- Datenextraktion
- v24.4.3
- DocumentUnderstanding und Datenextraktion
- v24.4.2
- InvoicesIndia und Endpunkte
- v24.4.1
- DocumentUnderstanding, InvoicesJapan und Endpunkte
- v24.4.0
- DocumentClassifier und Datenextraktion
- v24.3.2
- DocumentUnderstandingOCR-Endpunkte
- v24.2.1
- DocumentUnderstandingOCR-Endpunkte
- v24.2.0
- Datenextraktion
- Document Classifier
- v23.10.5
- UiPath Document Understanding OCR
- v23.10.4
- Datenextraktion
- v23.10.3
- DocumentUnderstanding, Datenextraktion und Endpunkte
- v23.10.2
- DocumentUnderstanding und Datenextraktion
- v23.10.0
- DocumentUnderstanding, Datenextraktion und Endpunkte
- UiPath Document Understanding OCR
- v23.7.0
- DocumentUnderstanding und Datenextraktion
- v23.6.0
- DocumentUnderstanding und Endpunkte
- v23.4.1
- DocumentUnderstanding, Datenextraktion und Endpunkte
- v23.4.5
- Document Understanding
- v23.4.2
- Document Understanding
- v23.4.0
- DocumentUnderstanding, Datenextraktion und Endpunkte
- DocumentClassifier und Endpunkte
- v23.2.0
- DocumentUnderstanding, Datenextraktion und Endpunkte
- v23.1.0
- DocumentClassifier und Endpunkte
- v22.12.2
- Endpunkte
- v22.11.0
- DocumentUnderstanding, Datenextraktion und Endpunkte
- v22.10.2
- Endpunkte
- v22.10.0
- DocumentUnderstanding, Datenextraktion und Endpunkte
- UiPath Document OCR
- v22.6.1-preview
- DocumentUnderstanding, Datenextraktion und Endpunkte
- v22.6.0-preview
- DocumentUnderstanding und Datenextraktion
- v22.5.2
- DocumentUnderstanding und Datenextraktion
- v22.5.1
- DocumentUnderstanding, DocumentClassifier und Datenextraktion
- v22.5.0
- AI Center-Cloud, Datenextraktion
- v22.4.3
- DocumentUnderstanding und Datenextraktion
- v22.4.2
- DocumentUnderstanding, DocumentClassifier und Datenextraktion
- v22.4.1
- AI Center-Cloud, Datenextraktion
- v22.4.0
- DocumentUnderstanding, DocumentClassifier und Datenextraktion
- v22.2.3
- UiPathDocumentUnderstandingOCR
- v22.1.6
- DocumentUnderstanding, DocumentClassifier und Datenextraktion
- v22.1.4
- DocumentUnderstanding, DocumentClassifier und Datenextraktion
- v21.10.11
- Datenextraktion
- v21.10.9
- Datenextraktion
- Datenextraktion und Endpunkte
- v21.10.5
- UiPathDocumentOCR-Endpunkte
- v21.10.1
- Datenextraktion und Endpunkte für UiPathDocumentOCR
- v21.10
- Endpunkte für FormExtractor, IntelligentFormExtractor und IntelligentKeywordClassifier
- v21.7
- Datenextraktion und Endpunkte für die Handschrifterkennung
- v21.6.3
- UiPathDocumentOCR in Endpunkten
- v21.5.5
- Datenextraktion und Endpunkte
- v21.5.3
- Datenextraktion und Endpunkte
- v21.4.7
- Datenextraktion und Endpunkte
- v21.4.5
- Datenextraktion und Endpunkte
- v21.4
- Datenextraktion und Endpunkte für HandwritingRecognition und DocumentClassifier
- v21.1.8
- Datenextraktion und Endpunkte
- v20.11.3
- Datenextraktion
- v20.10.4
- Datenextraktion und Endpunkte