- Document Understanding-Versionshinweise
- ML-Pakete und öffentliche Endpunkte – Versionshinweise
- Allgemeine ML-Pakete und öffentliche Endpunkte
- Versionsverlauf bei ML-Paketen und öffentlichen Endpunkten
Document Understanding-Versionshinweise
Versionsverlauf bei ML-Paketen und öffentlichen Endpunkten
Release-Datum: 27. November 2024
Veröffentlicht in UiPath Document Understanding OCR und Endpunkten | v24.11.3
Verbesserungen
In diesem Release haben wir die Genauigkeit und Leistung für verschiedene Texttypen verbessert. Dazu gehört Text, der auf sehr große oder niedrig aufgelöste Bilder gedruckt wird, sowie handschriftlicher Text.
Die Erkennung von Kontrollkästchen, insbesondere derjenigen, die durch vollständig geschwärzte Quadrate oder Rechtecke dargestellt werden, wurde erheblich verbessert. Darüber hinaus haben wir auch die Signaturerkennung optimiert.
Release-Datum: 23. Juli 2024
Veröffentlicht in UiPath Document Understanding OCR und Endpunkten (einschließlich UiPath Document Understanding OCR_CPU) | v24.7
Verbesserungen
- Die Genauigkeit für Aserbaidschanisch wurde verbessert, indem die Erkennung für die Zeichen əƏ hinzugefügt wurde.
- Die MIRC-Erkennung und -Erfassung (Magnetic Ink Character Recognition, MIRC) wurde verbessert, was insbesondere bei Schecks zu einer höheren Genauigkeit führt.
- Zuvor wurden Zahlen in einigen Fällen nicht erkannt, wenn ein Leerzeichen als Trennzeichen verwendet wurde. Das wurde verbessert und Zahlen werden jetzt erkannt, wenn Leerzeichen als Trennzeichen verwendet werden.
Fehlerbehebungen
Die Konfidenzbewertung für die UiPath Document Understanding OCR wurde verbessert, insbesondere bei Bildern in niedrigerer Qualität. In Workflows, bei denen die Konfidenzbewertung verwendet wird, um zu entscheiden, ob Dokumente eine menschliche Validierung im Action Center benötigen, kann diese Verbesserung zu einer erhöhten Anzahl von Dokumenten führen, die validiert werden.
Release-Datum: 3. Oktober 2024
Veröffentlicht in ML-Paketen für Datenextraktion | v24.4.4
Fehlerbehebungen
- Wir haben ein Problem behoben, das dazu führte, dass AI Center-Trainingspipelines ungenau hohe Punktzahlen für die Feldtypen
ID Number
undPhone Number
meldeten. Dadurch wird sichergestellt, dass die gemeldeten Punktzahlen mit den tatsächlichen Punktzahlen übereinstimmen. - Wir haben ein Problem behoben, das mit dem Analysieren von Werten in japanischen Feldern zusammenhängt, wenn die erweiterte Sprachen-OCR verwendet wurde.
Release-Datum: 14. August 2024
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v24.4.3
Verbesserungen
Verbesserte Feldtextformatierung für die Sprachen Chinesisch, Japanisch und Koreanisch bei Verwendung von UiPath® Extended Languages OCR im Digitalisierungsschritt.
Release-Datum: 20. Juni 2024
Veröffentlicht in Endpunkten + ML-Paketen für DocumentUnderstanding + InvoicesJapan | v24.4.1
Fehlerbehebungen
Wir haben ein Problem im Zusammenhang mit Datumsangaben in Spaltenfeldern speziell für die japanische Sprache behoben.
Release-Datum: 24. Mai 2024
- ML-Pakete DocumentUnderstanding + Datenextraktion | v24.4.0
- DocumentClassifier ML-Pakete | v24.4.0
Neuigkeiten
Verbesserungen
- Die Genauigkeit für das ML-Paket Invoices Japan wurde verbessert. Es gibt auch 11 neue Felder für das Modell Invoices Japan. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.
- Die Leistung für das Payslips-Modell wurde verbessert.
- Für das ML-Paket ID Cards sind neue IDs verfügbar:
- Aadhaar-ID-Karten
- Saudi-Arabische ID-Karten
- PAN-Karten
- Für das ML-Paket UB04 sind neue Felder verfügbar. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.
- Für das ML-Paket Checks sind neue Felder verfügbar. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.
Erratum – Hinzugefügt am 20. Juni 2024: Informationen zu einer Fehlerbehebung im Zusammenhang mit der Analyse japanischer Datumsangaben wurden hinzugefügt.
Erratum – hinzugefügt am 28. Mai 2024: Weitere Informationen zu mehreren Verbesserungen wurden hinzugefügt.
Release-Datum: 13. März 2024
Veröffentlicht in DocumentUnderstandingOCR-Endpunkte | v24.3.2
Eine neue Version für Document Understanding OCR ist jetzt für die allgemeine Verwendung verfügbar.
- Die Genauigkeit für Türkisch (TUR) wurde verbessert. Die Leistung bei diakritischen Zeichen (z. B. Ç, ç, Ğ, ğ, I, ı, İ, i, Ş, ş, Ö, ö, Ü, ü) wurde verbessert.
- Die Genauigkeit für ostarabische Ziffern (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) wurde verbessert.
Release-Datum: 9. Februar 2024
Veröffentlicht in DocumentUnderstandingOCR-Endpunkte | v24.2.1
Wir freuen uns, Ihnen mitteilen zu können, dass die Unterstützung von Arabisch (ARA) in UiPath Document Understanding OCR jetzt in der öffentlichen Vorschau verfügbar ist.
Release-Datum: 1. April 2024
Veröffentlicht in ML-Paketen zur Datenextraktion | v24.2.0
- 1040 Anlage C
- 1040 Anlage D
- 1040 Anlage E
- UB04
Release-Datum: 15. Oktober 2024
Veröffentlicht in UiPath Document Understanding OCR und Endpunkten | v23.10.5
Verbesserungen
Diese Version bringt Genauigkeits- und Leistungsverbesserungen für die Handschrifterkennung.
Fehlerbehebungen
Wir haben ein Problem behoben, bei dem Anmerkungsfelder horizontal zurückgegeben wurden, obwohl einige Dokumente leicht verzerrt waren, was zu einer Fehlausrichtung in der Anmerkung führte.
Release-Datum: 28. März 2024
Veröffentlicht in ML-Paketen zur Datenextraktion | v23.10.4
Eine neue Version für sofort einsatzbereite vortrainierte ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.
- Die Genauigkeit für Türkisch (TUR) wurde verbessert. Die Leistung bei diakritischen Zeichen (z. B. Ç, ç, Ğ, ğ, I, ı, İ, i, Ş, ş, Ö, ö, Ü, ü) wurde verbessert.
- Die Genauigkeit für ostarabische Ziffern (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) wurde verbessert.
- Die Genauigkeit für Datasets, die kleiner als 400 Seiten sind, wurde verbessert.
Release-Datum: 12. Februar 2024
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.10.3
Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete von AI Center ist jetzt für die allgemeine Verwendung verfügbar.
Diese neue Version bringt eine Fehlerbehebung im Zusammenhang mit der Extraktion bidirektionaler Textwerte (von links nach rechts und von rechts nach links).
Release-Datum: 23. Januar 2024
Veröffentlicht in den ML-Paketen DocumentUnderstanding + Datenextraktion | v23.10.2
Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.
Mit diesem Release wird ein Fehler behoben, der gelegentlich dazu führte, dass das Training fehlschlug.
Release-Datum: 26. Oktober 2023
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.10.0
Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.
Wir arbeiten ständig daran, Document Understanding für Sie zu verbessern. In diesem Release haben wir kleinere Sicherheits- und Stabilitätsverbesserungen an unserem Produkt vorgenommen.
Release-Datum: 3. August 2023
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v23.7.0
- In Dokumenten, in denen sich eine Tabelle über viele Seiten erstreckt, wird eine Tabellenzeile (eine Position) auf 2 Seiten aufgeteilt, in einigen Fällen sogar mehr. In den vorherigen Modellversionen wurde davon ausgegangen, dass jeder Seitenumbruch auch ein Zeilenumbruch ist. Dadurch wurden Elemente in mehrere Teile aufgebrochen. Die aktuelle Modellversion behebt dieses Problem. Um von dieser Funktion in einem Workflow zu profitieren, müssen Sie die DocumentUnderstanding.ML.Activities-Paketversion 1.23.0-preview und die Modellversion 23.7.0 im jeweiligen Workflow verwenden.
- Modelle haben jetzt eine schnellere Vorhersagezeit pro Seite und nutzen den RAM effizienter, was die Verarbeitung größerer Dokumente ermöglicht.
Release-Datum: 24. März 2023
Veröffentlicht in DocumentUnderstanding | v23.4.2
Der öffentliche Endpunkt von UiPath Document OCR wurde aktualisiert und bietet jetzt Unterstützung für die Handschriftsprache für Deutsch und Französisch sowie Drucksprachenunterstützung für Dänisch, Finnisch, Norwegisch und Schwedisch. Hier ist die vollständige Liste der neuen unterstützten Sprachen: Dänisch, Schwedisch, Norwegisch, Finnisch, Polnisch, Ungarisch, Tschechisch, Slowakisch, Estnisch, Lettisch, Litauisch, Slowenisch, Kroatisch, Serbisch, Türkisch.
Release-Datum: 10. Mai 2023
Veröffentlicht in den ML-Paketen DocumentUnderstanding + Datenextraktion | v23.4.0
Die UiPath Document OCR ist jetzt als vorgefertigtes vortrainiertes Paket sowohl für die GPU- als auch für die CPU-Nutzung verfügbar. Auf diese Weise können Kunden, die die Verwendung öffentlicher Endpunkte vermeiden möchten, UiPath Document OCR in ihren eigenen Mandanten in einer isolierten Umgebung bereitstellen.
Eine Liste von sieben neuen vorgefertigten vortrainierten ML-Paketen ist jetzt für die allgemeine Verwendung verfügbar. Hier ist die Liste der sieben neuen Modelle:
- Gründungsurkunde/Unbedenklichkeitsbescheinigung
- Ursprungszeugnis
- Produktzertifikat für Kinder
- CMS1500
- EU-Konformitätserklärung
- Rechnungen Versand
- Gehaltsabrechnungen (Pay slips)
Release-Datum: 23. Februar 2023
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.2.0
Neuerungen und Verbesserungen
Eine neue Version der sofort einsetzbaren vortrainierten ML-Pakete (23.1.0) und ihrer öffentlichen Endpunkte wurde veröffentlicht, die jetzt eine hochmoderne Architektur auf LayoutLM Transformer-Basis verwendet, die leistungsstärker ist und die Genauigkeit insgesamt erhöht, insbesondere bei Spaltenfeldern (Tabellen).
Diese Verbesserung hat die sofort einsetzbaren vortrainierten ML-Pakete leistungsfähiger gemacht, was bedeutet, dass möglicherweise eine längere Latenz für Training und Vorhersagen auftritt.
Für alle Situationen, in denen die Latenz kritisch ist (z. B.: Attended-Szenarien), empfehlen wir die Bereitstellung der Modelle als ML-Fähigkeiten mit einer GPU.
We have improved how the scores are calculated after Training/Evaluation/Full pipelines to provide a separate score for each column field. Before this improvement, F1 scores were calculated as a whole, for all column fields taken together.
Die bevorstehende Entfernung der Funktion für Manuelle Bearbeitungen, die in der Modellbewertung verwendet wird, wird angekündigt. Weitere Informationen finden Sie hier.
Bekannte Probleme (Known Issues)
The project import from AI Center is currently disabled. We are actively working on this and expect to have it reenabled by the end of March.
Erratum 8. Mai 2023
Bekanntes Problem
Fatal Python error: Segmentation fault
empfangen. Wir empfehlen die Verwendung der ML-Pakete mit v23.4, bis dieser Fehler behoben ist.
Erratum 20. April 2023
Die Gesamtpunktzahl für alle Pipelines ist jetzt eine Genauigkeit. Zuvor war es ein F1-Ergebnis. Die Auswertungsartefakte im AI Center enthalten weiterhin sowohl die Genauigkeit als auch die F1-Punktzahl, um die Vergleichbarkeit zu erhöhen.
Release-Datum: 11. Januar 2023
Freigegeben in Endpunkten und DocumentClassifier | v23.1.0
Wir haben die F1-Bewertungen verbessert, die nun auch für Trainings-Pipelines angezeigt werden.
Der Ordner „Artefakte“ enthält eine aktualisierte Liste der Artefakte.
Das DocumentClassifier-Modell sagt jetzt 25 statt 26 Klassen voraus, da die Klasse „Lieferhinweise“ entfernt wurde.
Release-Datum: 16. Dezember 2022
Freigegeben in Endpunkten | v22.12.2
Der öffentliche Endpunkt von UiPath Document OCR wurde aktualisiert und bietet jetzt Unterstützung für die Handschriftsprache für Deutsch und Französisch sowie Drucksprachenunterstützung für Dänisch, Finnisch, Norwegisch und Schwedisch.
Release-Datum: 13. Dezember 2022
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v22.11.0
Dieser Release bringt erhebliche Verbesserungen für die öffentlichen Endpunkte der sofort einsetzbaren vortrainierten ML-Pakete mit sich, d. h. die neueste LayoutLM-basierte Deep-Learning-Architektur wird jetzt verwendet.
Diese Verbesserung bietet eine höhere Genauigkeit bei allen Dokumenttypen, insbesondere für das Invoices-Modell, und steigert auch die Genauigkeit bei Spaltenfeldern und Tabellen.
Wir haben dem Invoices-Modell neue extrahierte Felder hinzugefügt, darunter Versanddatum, E-Mail-Adresse des Lieferanten, Bankname, Kontonummer, IBAN, SWIFT-Code, Bankadresse, Bankleitzahl und Steuersatz. Sie können die Liste der extrahierten Felder überprüfen, indem Sie auf diese Seite zugreifen und auf den Link klicken, der für jedes Modell verfügbar ist.
Modellbewertungen werden jetzt auch von Trainingspipelines zurückgegeben, nicht nur von vollständigen oder Auswertungspipelines.
F1-Ergebnisse sind jetzt für jedes Spaltenfeld verfügbar. Bisher waren F1-Ergebnisse nur für alle Spaltenfelder zusammen verfügbar.
Release-Datum: 7. Oktober 2022
Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v22.10.0
Neuerungen und Verbesserungen
-Preview
als offiziell aufgeführt: InvoicesAustralia, InvoicesIndia, PurchaseOrders.
Das DeliveryNotes-Modell wurde in BillsOfLading umbenannt.
Zehn neue vortrainierte Modelle sind jetzt verfügbar: Acord25, 1040, Checks, Bank Statements, Financial Statements, Packing Lists, Acord131, Acord126, Acord140, Vehicle Titles.
Fehlerbehebungen
An den oben genannten Paketen wurden mehrere Fehlerbehebungen vorgenommen.
Release-Datum: 4. Oktober 2022
Veröffentlicht in UiPath Document OCR | v22.10.0 Cloud
Eine neue Funktion ist jetzt für die Erkennung von Barcodes und QR-Codes verfügbar.
Die Genauigkeit wurde bei langen Zeichenfolgen wie E-Mail-Adressen und URLs, bei Schriftarten mit fester Breite sowie bei der Erkennung von Handschrift und Signaturen verbessert.
Die Erkennung der Seitenrotation wurde ebenfalls verbessert.
Release-Datum: 10. Oktober 2022
Freigegeben in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | Vorschau v22.6.1
Dieser Release bringt mehrere Fehlerbehebungen für die Pakete und Endpunkte für DocumentUnderstanding und Datenextraktion.
Release date: 6 September 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v22.6.0-preview
Es sind 18 neue Vorschau-ML-Pakete mit einer fortschrittlicheren Modellarchitektur für unsere DU ML-Pakete im AI Center verfügbar. Sie können sie einfach anhand des Worts Preview (Vorschau) am Ende des Paketnamens erkennen, z. B.: InvoicesPreview,PurchaseOrderPreview,Acord125Preview usw.
Die Liste der öffentlichen Endpunkte wurde mit allen neuen Vorschau-ML-Paketen aktualisiert und kann unter Öffentliche Endpunkte eingesehen werden.
Erwähnenswert ist die Tatsache, dass diese Vorschaumodelle keine DU/AI Units aus Ihrer Lizenzierungsberechtigung verbrauchen.
Ein Fehler bei der Verwendung privater Fähigkeiten wurde behoben. Jetzt kann die private Fähigkeit nur mit einem API-Schlüssel verwendet werden, der derselben Organisation gehört, die die AI Center-Instanz verwendet.
Release-Datum: 22. Juli 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v22.5.2
Fehlerbehebungen
eol classifier
und line_detection
in einer einzigen Methode kombiniert werden.
Bekanntes Problem
Es gibt ein bekanntes Problem für das Paket Rechnungen, das gelegentlich zu einem Fehler führt, wenn Sie versuchen, eine Schleife mit automatischer Feinabstimmung im AI Center auszuführen.
Release-Datum: 18. Juli 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion | v22.5.1
Fehlerbehebungen
- Es wurde ein Fehler behoben, der dazu führte, dass die extrahierten Felder auf der falschen Seite der Validation Station angezeigt wurden.
- Es wurde ein Fehler behoben, der dazu führte, dass die letzte Textzeile auf einigen Seiten im Document Manager nicht digitalisiert wurde.
- Es wurde ein Fehler behoben, der die Anzeige einiger F1-Punktzahlelemente aus der
evaluation_F1_invoices.txt
-Datei in vollständigen/Auswertungspipelines im AI Center verhinderte. - Es wurde ein Fehler behoben, der dazu führte, dass die falsche F1-Gesamtpunktzahl in
evaluation_F1_invoices.txt file
in vollständigen/Auswertungspipelines im AI Center berechnet wurde, wenn ein Modell nur Spaltenfelder hatte.
Release-Datum: 21. Juli 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v22.4.3
eol classifier
und line_detection
in einer einzigen Methode kombiniert werden.
Release-Datum: 14. Juli 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion | v22.4.2
Fehlerbehebungen
- Es wurde ein Fehler behoben, der dazu führte, dass die extrahierten Felder auf der falschen Seite der Validation Station angezeigt wurden.
- Es wurde ein Fehler behoben, der dazu führte, dass die letzte Textzeile auf einigen Seiten im Document Manager nicht digitalisiert wurde.
- Es wurde ein Fehler behoben, der die Anzeige einiger F1-Punktzahlelemente aus der
evaluation_F1_invoices.txt
-Datei in vollständigen/Auswertungspipelines im AI Center verhinderte. - Es wurde ein Fehler behoben, der dazu führte, dass die falsche F1-Gesamtpunktzahl in
evaluation_F1_invoices.txt file
in vollständigen/Auswertungspipelines im AI Center berechnet wurde, wenn ein Modell nur Spaltenfelder hatte.
Release-Datum: 3. Juni 2022
Veröffentlicht in den ML-Paketen für AI Center Cloud, Datenextraktion | v22.4.1
Fehlerbehebungen
line_detection mode
trainiert wurde, auftrat und dazu führte, dass die Vorhersagen anders ausfielen als beim Aufruf über die ML-Fähigkeit.
Release-Datum: 10. Mai 2022
Veröffentlicht in ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion
| v22.4.0
Neuigkeiten
Handschriftfunktionen sind jetzt für die Pakete „UiPathDocumentOCR“ und „UiPathDocumentOCR_CPU“ verfügbar, indem „HandwritingRecognitionOCR“ integriert wird. Die gleichen Funktionen sind im Studio-Paket „UiPath.OCR.LocalServer“ verfügbar.
Neue Architektur für Extraktions-ML-Pakete mit großen Vorteilen, insbesondere für Modelle, die mit dem ML-Paket DocumentUnderstanding trainiert wurden.
Die ML-Pakete Utility Bills, W9 und Passports sind jetzt allgemein verfügbar.Fünf neue, vorab trainierte ML-Pakete sind jetzt in der Vorschau verfügbar und erleichtern Ihnen die Arbeit.
Fünf neue, vorab trainierte ML-Pakete sind jetzt in der Vorschau verfügbar und erleichtern Ihnen die Arbeit.
Die Dokumentsuche ist eine neue Funktion im Document Manager, die das Beschriften von Dokumenten mit einer großen Anzahl von Seiten erleichtert.
Verbesserungen
Die ML-Pakete für die Dokumentextraktion im AI Center wurden verbessert. Die Excel-Tabelle zur Auswertung hat jetzt neue Kalkulationstabellen, die es Ihnen ermöglichen, die ausgewerteten Daten besser zu organisieren und zu interpretieren.
ML-Pakete in der Offlineinstallation der Automation Suite haben ein neues Offlinepaket erhalten.
Genauigkeit und Leistung wurden für UiPathDocumentOCR verbessert.
Fehlerbehebungen
Mehrere Korrekturen bei der Analyse von Datumsfeldern, einschließlich Datumsangaben in Spaltenfeldern, Daten in türkischen Dokumenten und Datumsangaben weit in der Zukunft
Release-Datum: 7. März 2022
Veröffentlicht in UiPathDocumentOCR | v22.2.3
Optimale Funktion
HandwritingRecognitionOCR wurde in UiPathDocumentOCR integriert. In vielen Fällen gibt es eine Mischung aus Feldern. Durch die Integration der Funktion zum Lesen von Handschriften können wir auf jedes Feld die richtige Erkennung anwenden: Druckschrifterkennung auf Drucktext und Handschrifterkennung auf handschriftlichen Text.
Beachten Sie, dass HandwritingRecognitionOCR zwar jede Handschrift erkennen kann, sie jedoch nur für Englisch trainiert und optimiert ist.
Release-Datum: 14. März 2022
Veröffentlicht in ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion
| v22.1.6
Fehlerbehebungen
Es wurde ein Fehler behoben, der dazu führte, dass eine Trainingspipeline oder eine vollständige Pipeline im AI Center aufgrund eines ML-Paketproblems bei der Datenvorverarbeitung für eine leere Zeile fehlschlug.
Release-Datum: 2. März 2022
Veröffentlicht in den ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion | v22.1.4
Neuigkeiten
Das ML-Paket Utility Bills ist jetzt allgemein verfügbar.
Verbesserungen
Insgesamt verbesserte Leistung und Skalierbarkeit.
Deutliche Verbesserungen bei den Punktzahlen beim Training für die neue Version des ML-Pakets DocumentUnderstanding im Vergleich zu früheren Versionen.
Datumsangaben in Spaltenfeldern werden nun korrekt geparst.
Beim Datums-Parsen werden nun türkische Monatsnamen erkannt.
Änderungen
Das Verhalten für Trainingspipelines und vollständige Pipelines wurde geändert, wenn auf GPU anstatt auf CPU trainiert wurde. Die auf CPUs trainierten 21.10.x-er Modelle waren kleiner, sodass sie schneller trainiert wurden als die vorherigen Versionen, während sie etwas niedrigere Genauigkeit als zuvor hatten.
Dieses Verhalten wurde mit dieser Version rückgängig gemacht, sodass das Modell, das auf der GPU und auf der CPU trainiert wird, genau das gleiche Modell ist und die Trainingsgeschwindigkeit auf den Stand vor 2021.10 zurückgesetzt wurde, was bedeutet, dass das Training auf CPU erneut 10–20-mal langsamer als auf GPU ist.
Release-Datum: 24. November 2021
Veröffentlicht in den ML-Paketen für Datenextraktion | v21.10.9
Es wurde ein Fehler behoben, der zur Laufzeit einen Vorhersagefehler ausgelöst hat.
Release-Datum: 22. Oktober 2021
Veröffentlicht in den ML-Paketen und Endpunkten für Datenextraktion | v21.10.9
Neuigkeiten
Das ML-Paket PurchaseOrders ist jetzt Allgemein verfügbar und kann in Ihren Produktionsszenarien verwendet werden.
Die ML-Pakete InvoicesChina, DeliveryNotes, RemittanceAdvices, W2 und W9 befinden sich jetzt in der Öffentlichen Vorschau. Wir empfehlen Ihnen, diese Pakete zu überprüfen und sie für den Typ von Dokumenten zu verwenden, die Sie verarbeiten müssen.
Verbesserungen
Evaluierung auf Dokumentebene implementiert. Dies ist repräsentativ für die Laufzeitleistung in Ihrem RPA-Workflow.
Die Evaluierung kann auch für Datasets mit weniger Feldern als das evaluierte ML-Paket durchgeführt werden. Das erleichtert die Evaluierung von vorgefertigten vorab trainierten ML-Paketen.
eval.redo_ocr
in der AI Center-Evaluierungspipeline auf „true“ gesetzt werden.
Das Training mit der CPU verwendet jetzt ein kleineres Modell, um die Geschwindigkeit um das 5- bis 7-Fache zu erhöhen. Sie sollten jedoch mit einer um 0–5 % niedrigeren Genauigkeit bei Verwendung des CPU rechnen.
Evaluation.xlsx
-Dateien hinzugefügt, die von Evaluierungspipelines produziert werden.
Das UtilityBills-ML-Paket wurde erheblich verbessert.
Verbessertes Parsen von Adressen, die 1–2 Textzeilen überspringen.
Verbesserung beim Extrahieren negativer Werte, sehr großer Werte (11 Stellen oder mehr) oder in ferner Zukunft liegender Daten.
Unterstützung für gedrehte Felder auf Belegen wurde hinzugefügt.
Verkettete Abschnitte verbessert.
Fehlerbehebungen
- Es wurde ein Fehler behoben, bei dem keine Sonderzeichen in String-Feldern zurückgegeben wurden.
- Es wurde ein Fehler beim Passports-ML-Paket behoben, bei dem das als Ordinalzahl geschriebene Datum (1., 2., 3., 4. usw.) nicht korrekt geparst wurde.
Bekannte Probleme (Known Issues)
Das Retraining der InvoicesJapan- und InvoicesChina-ML-Pakete mit Daten aus der Validierungsstation wird derzeit nicht unterstützt. Verwenden Sie als Problemumgehung Google Cloud Vision OCR.
Bevorstehende Verwerfungen
Alle öffentlichen Endpunkte, mit Ausnahme von UiPathDocumentOCR, FormExtractor, IntelligentFormExtractor und IntelligentKeywordClassifier, werden ab dem 1. Dezember 2021 in Regionen außerhalb von Westeuropa als veraltet eingestuft.
Release-Datum: 13. Dezember 2021
Veröffentlicht in UiPathDocumentOCR-Endpunkten | v21.10.5
Verbesserungen
UiPathDocumentOCR ist jetzt auch in der Region Singapur verfügbar.
Release-Datum: 24. September 2021
Veröffentlicht in Datenextraktion und Endpunkten für UiPathDocumentOCR | v21.10.1
Verbesserungen
Unterstützung für gedrehten Text wurde hinzugefügt, auch wenn die Drehung für jedes Wort in unterschiedlichen Winkeln stattfindet.
Unterstützung für vertikalen Text wurde hinzugefügt. Diese Verbesserung ist derzeit nur für UiPath.IntelligentOCR.Activities verfügbar, einschließlich Validierungsstation. Der Data Manager und der Machine Learning Extractor unterstützen noch keinen vertikalen Text.
Verbesserung der Genauigkeit bei verrauschten Bildern oder Fotos: z. B. Quittungen, Ausweisen oder Pässen.
Release-Datum: 13. Dezember 2021
Veröffentlicht in Endpunkten für FormExtractor + IntelligentFormExtractor + IntelligentKeywordClassifier | v21.10
Verbesserungen
Form Extractor, Intelligent Form Extractor und Intelligent Keyword Classifier sind jetzt auch in der Region Singapur verfügbar.
Release-Datum: 11. August 2021
Veröffentlicht in der Datenextraktion und Endpunkten für die Handschrifterkennung | v21.7
Verbesserungen
Möglichkeit, mehrere Threads in einem einzigen Aufruf des Modells zu bearbeiten.
Erneutes Modelltraining und einige andere Änderungen für eine bessere Modellgenauigkeit.
Fehlerbehebungen
Es wurde ein Fehler behoben, der dazu führte, dass die Kapsel neu gestartet wurde, wenn kein Arbeitsspeicher mehr übrig war.Release-Datum: 8. Juni 2021
Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.5.3
Neuigkeiten
Für schwer lesbare Bilder, wie im Falle von ID-Karten und Passports, wurden zwei neue, entsprechend vorab trainierte Out-Of-the-Box-Pakete veröffentlicht.
Verbesserungen
Erneut trainierbare Klassifizierungsfelder wurden in unsere vorab trainierten Out-Of-the-Box-Pakete integriert.
Release-Datum: 15. April 2021
Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.4.5
Neuigkeiten
Aller öffentlichen Endpunkte in der Region Vereinigte Staaten bereitgestellt.
Öffentliche Endpunkte für Form Extractor, Intelligent Form Extractor und Intelligent Keyword Classifier in den Regionen Kanada und Japan bereitgestellt.
Release-Datum: 9. März 2021
Veröffentlicht in ML-Paketen für Datenextraktion und Endpunkten für HandwritingRecognition, DocumentClassifier, + eigenständiger Docker für UiPathDocumentOCR | v21.4
Neuigkeiten
Handschrifterkennung mit verbesserter Erkennung durch das Nutzen von Rechtschreibkorrekturen und durch die Fähigkeit, maschinell gedruckten Text zu lesen, erreicht allgemeine Verfügbarkeit.
DocumentClassifier erreicht ebenfalls die allgemeine Verfügbarkeit.
Verbesserungen an UiPath Document OCR für:
- Optionsfeld-/Kontrollkästchen-Erkennung
- Genauigkeit bei Blasenformularen
- Allgemeine Genauigkeit
Release-Datum: 17. Februar 2021
Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.1.8
Verbesserungen
Verbesserte Genauigkeit.
InvoicesIndia und InvoicesAustralia sind jetzt allgemein verfügbar.
Öffentliche Endpunkte in der Region Australien bereitgestellt.
https://du.uipath.com/ie/invoices
sowohl für den Unternehmens- als auch für den Community-Verkehr.
Veröffentlichungsdatum: 18. Dezember 2020
Veröffentlicht in den ML-Paketen für Datenextraktion | v20.11.3
Verbesserungen
Verbesserungen des CPU-Trainings machen es schneller und erfordern weniger Arbeitsspeicher.
Verbesserungen der Datumsanalyse für Nicht-US-Dokumente.
Erkennung von Kontrollkästchen bei UiPathDocumentOCR, einschließlich gedruckter oder handschriftlicher Kontrollkästchen.
Release-Datum: 10. November 2020
Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v20.10.4
Neue Funktionen und Verbesserungen
Ein neues Modell für japanische Rechnungen.
Auswertungspipelines geben nun auch Metriken für Klassifizierungsfelder zurück.
Support für Microsoft Read OCR Version 3.
Verbesserungen der Datumsformatierung/-analyse zur Erkennung der Formate Tag/Monat/Jahr im Vergleich zu Formaten mit Monat/Tag/Jahr.
Verbesserungen bei der Erkennung von Dezimal- und Tausendertrennzeichen für eine korrekte Zahlenanalyse.
Training auf CPU wird von allen Versionen von AI Fabric unterstützt.
id-no
.
Support ausschließlich für Training-Klassifizierungsfelder (nicht für reguläre oder Spaltenfelder).
Erhöhung der maximalen Anzahl erlaubter Felder von 32 auf 40.
Konfidenzniveau-Meldungen für Spaltenfelder.
Bekannte Probleme (Known Issues)
class
, break
, from
, finally
, global
, None
usw. Bitte beachten Sie, dass diese Liste nicht vollständig ist, da der Paketname für class <pkg-name>
und import <pkg-name>
verwendet wird.
- v24.11.3
- UiPath Document Understanding OCR
- v24.9.1
- UiPath Document Understanding OCR
- v24.7
- UiPath Document OCR
- v24.4.4
- Datenextraktion
- v24.4.3
- DocumentUnderstanding und Datenextraktion
- v24.4.2
- InvoicesIndia und Endpunkte
- v24.4.1
- DocumentUnderstanding, InvoicesJapan und Endpunkte
- v24.4.0
- DocumentClassifier und Datenextraktion
- v24.3.2
- DocumentUnderstandingOCR-Endpunkte
- v24.2.1
- DocumentUnderstandingOCR-Endpunkte
- v24.2.0
- Datenextraktion
- Document Classifier
- v23.10.5
- UiPath Document Understanding OCR
- v23.10.4
- Datenextraktion
- v23.10.3
- DocumentUnderstanding, Datenextraktion und Endpunkte
- v23.10.2
- DocumentUnderstanding und Datenextraktion
- v23.10.0
- DocumentUnderstanding, Datenextraktion und Endpunkte
- UiPath Document Understanding OCR
- v23.7.0
- DocumentUnderstanding und Datenextraktion
- v23.6.0
- DocumentUnderstanding und Endpunkte
- v23.4.1
- DocumentUnderstanding, Datenextraktion und Endpunkte
- v23.4.5
- Document Understanding
- v23.4.2
- Document Understanding
- v23.4.0
- DocumentUnderstanding, Datenextraktion und Endpunkte
- DocumentClassifier und Endpunkte
- v23.2.0
- DocumentUnderstanding, Datenextraktion und Endpunkte
- v23.1.0
- DocumentClassifier und Endpunkte
- v22.12.2
- Endpunkte
- v22.11.0
- DocumentUnderstanding, Datenextraktion und Endpunkte
- v22.10.2
- Endpunkte
- v22.10.0
- DocumentUnderstanding, Datenextraktion und Endpunkte
- UiPath Document OCR
- v22.6.1-preview
- DocumentUnderstanding, Datenextraktion und Endpunkte
- v22.6.0-preview
- DocumentUnderstanding und Datenextraktion
- v22.5.2
- DocumentUnderstanding und Datenextraktion
- v22.5.1
- DocumentUnderstanding, DocumentClassifier und Datenextraktion
- v22.5.0
- AI Center-Cloud, Datenextraktion
- v22.4.3
- DocumentUnderstanding und Datenextraktion
- v22.4.2
- DocumentUnderstanding, DocumentClassifier und Datenextraktion
- v22.4.1
- AI Center-Cloud, Datenextraktion
- v22.4.0
- DocumentUnderstanding, DocumentClassifier und Datenextraktion
- v22.2.3
- UiPathDocumentUnderstandingOCR
- v22.1.6
- DocumentUnderstanding, DocumentClassifier und Datenextraktion
- v22.1.4
- DocumentUnderstanding, DocumentClassifier und Datenextraktion
- v21.10.11
- Datenextraktion
- v21.10.9
- Datenextraktion
- Datenextraktion und Endpunkte
- v21.10.5
- UiPathDocumentOCR-Endpunkte
- v21.10.1
- Datenextraktion und Endpunkte für UiPathDocumentOCR
- v21.10
- Endpunkte für FormExtractor, IntelligentFormExtractor und IntelligentKeywordClassifier
- v21.7
- Datenextraktion und Endpunkte für die Handschrifterkennung
- v21.6.3
- UiPathDocumentOCR in Endpunkten
- v21.5.5
- Datenextraktion und Endpunkte
- v21.5.3
- Datenextraktion und Endpunkte
- v21.4.7
- Datenextraktion und Endpunkte
- v21.4.5
- Datenextraktion und Endpunkte
- v21.4
- Datenextraktion und Endpunkte für HandwritingRecognition und DocumentClassifier
- v21.1.8
- Datenextraktion und Endpunkte
- v20.11.3
- Datenextraktion
- v20.10.4
- Datenextraktion und Endpunkte