
Document Understanding-Versionshinweise
Release-Datum: 11. November 2024
Document Understanding™ 2024.10 LTS-Release
UiPath OCR für erweiterte Sprachen
Mit Freude dürfen wir Ihnen mitteilen, dass unser neuestes OCR-Modul UiPath Extended Languages OCR jetzt allgemein verfügbar ist. Die neue OCR kann Dokumente in über 200 Sprachen digitalisieren, was eine erhebliche Verbesserung gegenüber ihrem Vorgänger darstellt, insbesondere bezüglich Chinesisch, Japanisch und Koreanisch. Zudem kann sie Dokumente in Thailändisch, Vietnamesisch, allen wichtigen Sprachen aus Indien, Sprachen mit kyrillischem Alphabet und Griechisch verarbeiten.
ML-Pakete zur Datenextraktion
Wir haben unseren Prozess zur Digitalisierung von Dokumenten erheblich verbessert. Wenn Sie jetzt „UiPath Extended Languages OCR“ verwenden, erfolgt die Ausgabe in regulären Wortfeldern anstelle einzelner Zeichen.
UiPath Document Understanding OCR
- Diese Version bringt Genauigkeits- und Leistungsverbesserungen für die Handschrifterkennung.
- Die MIRC-Erkennung und -Erfassung (Magnetic Ink Character Recognition, MIRC) wurde verbessert, was insbesondere bei Schecks zu einer höheren Genauigkeit führt.
- Zuvor wurden Zahlen in einigen Fällen nicht erkannt, wenn ein Leerzeichen als Trennzeichen verwendet wurde. Zahlen werden jetzt erkannt, wenn Leerzeichen als Trennzeichen verwendet werden.
- Die Konfidenzbewertung für die UiPath Document Understanding OCR wurde verbessert, insbesondere bei Verwendung für Bilder von niedrigerer Qualität. In Workflows, bei denen die Konfidenzbewertung verwendet wird, um zu entscheiden, ob Dokumente eine menschliche Validierung im Action Center benötigen, kann dies dazu führen, dass eine erhöhte Anzahl von Dokumenten validiert wird.
UiPath Document Understanding OCR
Wir haben ein Problem behoben, bei dem Anmerkungsfelder horizontal zurückgegeben wurden, obwohl einige Dokumente leicht verzerrt waren, was zu einer Fehlausrichtung in der Anmerkung führte.
ML-Pakete zur Datenextraktion
Wir haben ein Problem im Zusammenhang mit japanischem Text bei der Verwendung von Extended Languages OCR behoben. Dieses Problem führte dazu, dass in bestimmten Situationen aufgrund einzelner Zeichenfelder mehrere zusätzliche Leerzeichen angezeigt wurden.