Document Understanding
Neuestes
False
  • Document Understanding-Versionshinweise
  • ML Packages Release Notes
    • Allgemeine Aktualisierungen von ML-Paketen
    • Versionsverlauf von ML-Paketen
Document Understanding-Versionshinweise
Last updated 2. Juli 2024

Versionsverlauf von ML-Paketen

v24.4.1

DocumentUnderstanding, InvoicesJapan und Endpunkte

Release-Datum: 20. Juni 2024

Veröffentlicht im ML-Paket „Endpunkte + DocumentUnderstanding + InvoicesJapan“ | v24.4.1

Fehlerbehebungen

Wir haben ein Problem im Zusammenhang mit Datumsangaben in Spaltenfeldern speziell für die japanische Sprache behoben.

v24.4.0

DocumentClassifier und Datenextraktion

Release-Datum: 24. Mai 2024

Freigegeben in:
  • ML-Pakete DocumentUnderstanding + Datenextraktion | v24.4.0
  • DocumentClassifier ML-Pakete | v24.4.0

Neuigkeiten

Die folgenden neuen ML-Pakete befinden sich jetzt in der öffentlichen Vorschau:

Verbesserungen

Dieses Release bringt auch Verbesserungen für mehrere andere ML-Pakete:
  • Die Genauigkeit für das ML-Paket Invoices Japan wurde verbessert. Es gibt auch 11 neue Felder für das Modell Invoices Japan. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.
  • Die Leistung für das Payslips-Modell wurde verbessert.
  • Für das ML-Paket ID Cards sind neue IDs verfügbar:
    • Aadhaar-ID-Karten
    • Saudi-Arabische ID-Karten
    • PAN-Karten
  • Für das ML-Paket UB04 sind neue Felder verfügbar. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.
  • Für das ML-Paket Checks sind neue Felder verfügbar. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.

Erratum – hinzugefügt am 20. Juni 2024: Informationen zu einer Fehlerbehebung im Zusammenhang mit der Analyse japanischer Datumsangaben wurden hinzugefügt.

Erratum – hinzugefügt am 28. Mai 2024: Weitere Informationen zu mehreren Verbesserungen wurden hinzugefügt.

v24.3.2

DocumentUnderstandingOCR endpoints

Release-Datum: 13. März 2024

Veröffentlicht in DocumentUnderstandingOCR-Endpunkte | v24.3.2

Eine neue Version für Document Understanding OCR ist jetzt für die allgemeine Verwendung verfügbar.

Dieses Release bringt die folgenden Verbesserungen:
  • Die Genauigkeit für Türkisch (TUR) wurde verbessert. Die Leistung bei diakritischen Zeichen (z. B. Ç, ç, Ğ, ğ, I, ı, İ, i, Ş, ş, Ö, ö, Ü, ü) wurde verbessert.
  • Die Genauigkeit für ostarabische Ziffern (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) wurde verbessert.

v24.2.1

DocumentUnderstandingOCR endpoints

Release date: 9 February 2024

Veröffentlicht in DocumentUnderstandingOCR-Endpunkte | v24.2.1

Wir freuen uns, Ihnen mitteilen zu können, dass die Unterstützung von Arabisch (ARA) in UiPath Document Understanding OCR jetzt in der öffentlichen Vorschau verfügbar ist.

v24.2.0

Datenextraktion

Release date: 1 April 2024

Veröffentlicht in ML-Paketen zur Datenextraktion | v24.2.0

Diese Version bietet Unterstützung für die neuen Modelle, die in der öffentlichen Vorschau verfügbar sind:
  • 1040 Anlage C
  • 1040 Anlage D
  • 1040 Anlage E
  • UB04

Document Classifier

Release date: 4 March 2024

Veröffentlicht in DocumentClassifier-ML-Paketen | v24.2.0

Diese Version bietet Unterstützung für die neuen Modelle, die in der öffentlichen Vorschau verfügbar sind:
  • 1040 Anlage C
  • 1040 Anlage D
  • 1040 Anlage E
  • UB04

v23.10.4

Datenextraktion

Release-Datum: 28. März 2024

Veröffentlicht in ML-Paketen zur Datenextraktion | v23.10.4

Eine neue Version für sofort einsatzbereite vortrainierte ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.

Dieses Release bringt die folgenden Verbesserungen:
  • Die Genauigkeit für Türkisch (TUR) wurde verbessert. Die Leistung bei diakritischen Zeichen (z. B. Ç, ç, Ğ, ğ, I, ı, İ, i, Ş, ş, Ö, ö, Ü, ü) wurde verbessert.
  • Die Genauigkeit für ostarabische Ziffern (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) wurde verbessert.
  • Die Genauigkeit für Datasets, die kleiner als 400 Seiten sind, wurde verbessert.

v23.10.3

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 12 February 2024

Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.10.3

Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete von AI Center ist jetzt für die allgemeine Verwendung verfügbar.

Diese neue Version bringt eine Fehlerbehebung im Zusammenhang mit der Extraktion bidirektionaler Textwerte (von links nach rechts und von rechts nach links).

Hinweis: Derzeit ist unsere Plattform nicht für Sprachen lokalisiert, die von rechts nach links geschrieben werden (wie Hebräisch oder Arabisch). In Kombination mit Interpunktionszeichen oder Sonderzeichen wird deshalb Text in diesen Sprachen auf der Anmerkungsoberfläche (Document Manager) oder Validierungsoberfläche (Validation Station in Action Center) nicht korrekt angezeigt. Wenn die Werte der Zeichenfolgen jedoch in eine Anwendung eingegeben werden, bei der der Lesemodus von rechts nach links aktiviert ist, sollte der Text korrekt angezeigt werden. Ein typisches Beispiel ist der Editor, bei dem die Lesereihenfolge von rechts nach links aktiviert ist.

v23.10.2

DocumentUnderstanding und Datenextraktion

Release date: 23 January 2024

Veröffentlicht in den ML-Paketen DocumentUnderstanding + Datenextraktion | v23.10.2

Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.

Mit diesem Release wird ein Fehler behoben, der gelegentlich dazu führte, dass das Training fehlschlug.

v23.10.0

DocumentUnderstanding, Data Extraction, and endpoints

Release-Datum: 26. Oktober 2023

Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.10.0

Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.

Wir arbeiten ständig daran, Document Understanding für Sie zu verbessern. In diesem Release haben wir kleinere Sicherheits- und Stabilitätsverbesserungen an unserem Produkt vorgenommen.

UiPath Document Understanding OCR

Release-Datum: 2. Oktober 2023

Veröffentlicht in UiPath Document Understanding OCR | v23.10

Wir freuen uns, Ihnen mitteilen zu können, dass Hebräisch (HEB) jetzt von UiPath Document Understanding OCR unterstützt wird.

v23.7.0

DocumentUnderstanding und Datenextraktion

Release-Datum: 3. August 2023

Released in DocumentUnderstanding + Data Extraction ML packages | v23.7.0

  • In Dokumenten, in denen sich eine Tabelle über viele Seiten erstreckt, wird eine Tabellenzeile (eine Position) auf 2 Seiten aufgeteilt, in einigen Fällen sogar mehr. In den vorherigen Modellversionen wurde davon ausgegangen, dass jeder Seitenumbruch auch ein Zeilenumbruch ist. Dadurch wurden Elemente in mehrere Teile aufgebrochen. Die aktuelle Modellversion behebt dieses Problem. Um von dieser Funktion in einem Workflow zu profitieren, müssen Sie die DocumentUnderstanding.ML.Activities-Paketversion 1.23.0-preview und die Modellversion 23.7.0 im jeweiligen Workflow verwenden.
  • Modelle haben jetzt eine schnellere Vorhersagezeit pro Seite und nutzen den RAM effizienter, was die Verarbeitung größerer Dokumente ermöglicht.

v23.6.0

DocumentUnderstanding and endpoints

Release-Datum: 13. Juni 2023

Veröffentlicht in DocumentUnderstanding + Endpunkten | v23.6.0

Wir haben die Genauigkeit des ML-Pakets UiPathDocumentOCR verbessert.

v23.4.1

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 23 May 2023

Veröffentlicht in den ML-Paketen DocumentUnderstanding + Datenextraktion | v23.4.1

Wir haben ein Problem behoben, das sich auf das Modelltraining auswirkte.

v23.4.5

Document Understanding

Release date: 21 April 2023

Freigegeben in DocumentUnderstanding | v23.4.5

Wir haben das Modell für allgemein eingegebenen Text verbessert und die Funktion zur Erkennung von Kontrollkästchen erweitert.

v23.4.2

Document Understanding

Release date: 24 March 2023

Released in DocumentUnderstanding | v23.4.2

Der öffentliche Endpunkt von UiPath Document OCR wurde aktualisiert und bietet jetzt Unterstützung für die Handschriftsprache für Deutsch und Französisch sowie Drucksprachenunterstützung für Dänisch, Finnisch, Norwegisch und Schwedisch. Hier ist die vollständige Liste der neuen unterstützten Sprachen: Dänisch, Schwedisch, Norwegisch, Finnisch, Polnisch, Ungarisch, Tschechisch, Slowakisch, Estnisch, Lettisch, Litauisch, Slowenisch, Kroatisch, Serbisch, Türkisch.

v23.4.0

DocumentUnderstanding, Data Extraction, and endpoints

Release-Datum: 10. Mai 2023

Veröffentlicht in den ML-Paketen DocumentUnderstanding + Datenextraktion | v23.4.0

The UiPath Document OCR is now available as an out-of-the-box pre-trained package, and it is available for both GPU and CPU usage. This enables customers who prefer to avoid using public endpoints to deploy UiPath Document OCR in their own tenants, in an isolated environment.

Eine Liste von sieben neuen vorgefertigten vortrainierten ML-Paketen ist jetzt für die allgemeine Verwendung verfügbar. Hier ist die Liste der sieben neuen Modelle:

  • Gründungsurkunde/Unbedenklichkeitsbescheinigung
  • Ursprungszeugnis
  • Produktzertifikat für Kinder
  • CMS1500
  • EU-Konformitätserklärung
  • Rechnungen Versand
  • Gehaltsabrechnungen (Pay slips)

DocumentClassifier und Endpunkte

Release-Datum: 26. April 2023

Veröffentlicht in ML-Paketen für Endpunkte + DocumentClassifier | v23.4.0

Wir haben dem DocumentClassifier-ML-Paket neue Dokumenttypen hinzugefügt, allgemeine Verbesserungen vorgenommen und einige kleine Fehler behoben.

v23.2.0

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 23 February 2023

Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.2.0

Neuerungen und Verbesserungen

Eine neue Version der sofort einsatzbereiten vortrainierten ML-Pakete (23.1.0) und deren öffentliche Endpunkte wurde veröffentlicht, die jetzt eine hochmoderne Architektur auf LayoutLM Transformer-Basis verwendet, die leistungsstärker ist und die Genauigkeit insgesamt erhöht, insbesondere bei Spaltenfeldern (Tabellen).

Diese Verbesserung hat die sofort einsatzbereiten vortrainierten ML-Pakete leistungsfähiger gemacht, was bedeutet, dass Sie möglicherweise eine längere Latenz für Training und Vorhersagen haben.

Für alle Situationen, in denen die Latenz kritisch ist (z. B.: Attended-Szenarien), empfehlen wir die Bereitstellung der Modelle als ML-Fähigkeiten mit einer GPU.

We have improved how the scores are calculated after Training/Evaluation/Full pipelines to provide a separate score for each column field. Before this improvement, F1 scores were calculated as a whole, for all column fields taken together.

Die bevorstehende Entfernung der Funktion für Manuelle Bearbeitungen, die in der Modellbewertung verwendet wird, wird angekündigt. Weitere Informationen finden Sie hier.

Bekannte Probleme (Known Issues)

The project import from AI Center is currently disabled. We are actively working on this and expect to have it reenabled by the end of March.

Erratum 8. Mai 2023

Bekanntes Problem

Beim Ausführen einer vollständigen oder einer Trainingspipeline wird eine Fatal Python error: Segmentation fault empfangen. Wir empfehlen die Verwendung der ML-Pakete mit v23.4, bis dieser Fehler behoben ist.

Erratum 20. April 2023

Die Gesamtpunktzahl für alle Pipelines ist jetzt eine Genauigkeit. Zuvor war es ein F1-Ergebnis. Die Auswertungsartefakte im AI Center enthalten weiterhin sowohl die Genauigkeit als auch die F1-Punktzahl, um die Vergleichbarkeit zu erhöhen.

v23.1.0

DocumentClassifier und Endpunkte

Release date: 11 January 2023

Freigegeben in Endpunkten und DocumentClassifier | v23.1.0

Wir haben die F1-Bewertungen verbessert, die nun auch für Trainings-Pipelines angezeigt werden.

Der Ordner „Artefakte“ enthält eine aktualisierte Liste der Artefakte.

Das DocumentClassifier-Modell sagt jetzt 25 statt 26 Klassen voraus, da die Klasse „Lieferhinweise“ entfernt wurde.

v22.12.2

Endpunkte

Release date: 16 December 2022

Freigegeben in Endpunkten | v22.12.2

Der öffentliche Endpunkt von UiPath Document OCR wurde aktualisiert und bietet jetzt Unterstützung für die Handschriftsprache für Deutsch und Französisch sowie Drucksprachenunterstützung für Dänisch, Finnisch, Norwegisch und Schwedisch.

v22.11.0

Document Understanding, Data Extraction, and endpoints

Release-Datum: 13. Dezember 2022

Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v22.11.0

Diese Version bringt erhebliche Verbesserungen für die öffentlichen Endpunkte der vorab trainierten ML-Pakete mit sich, d. h., wir verwenden jetzt die neueste LayoutLM-basierte Deep Learning-Architektur.

Diese Verbesserung bietet eine höhere Genauigkeit bei allen Dokumenttypen, insbesondere für das Invoices-Modell, und steigert auch die Genauigkeit bei Spaltenfeldern und Tabellen.

Wir haben dem Invoices-Modell neue extrahierte Felder hinzugefügt, darunter Versanddatum, E-Mail-Adresse des Lieferanten, Bankname, Kontonummer, IBAN, SWIFT-Code, Bankadresse, Bankleitzahl und Steuersatz. Sie können die Liste der extrahierten Felder überprüfen, indem Sie auf diese Seite zugreifen und auf den Link klicken, der für jedes Modell verfügbar ist.

Modellbewertungen werden jetzt auch von Trainingspipelines zurückgegeben, nicht nur von vollständigen oder Auswertungspipelines.

F1-Ergebnisse sind jetzt für jedes Spaltenfeld verfügbar. Bisher waren F1-Ergebnisse nur für alle Spaltenfelder zusammen verfügbar.

v22.10.2

Endpunkte

Release date: 3 February 2023

Released in endpoints | v22.10.2

Wir haben die öffentlichen Endpunkte der vorab trainierten ML-Pakete aktualisiert und verwenden jetzt eine hochmoderne Architektur, die auf LayoutLM-Transformatoren basiert.

v22.10.0

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 7 October 2022

Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v22.10.0

Neuerungen und Verbesserungen

Die folgenden vortrainierten Modelle werden jetzt ohne das Tag -Preview als offiziell aufgeführt: InvoicesAustralia, InvoicesIndia, PurchaseOrders.

The DeliveryNotes model has been renamed as BillsOfLading.

Zehn neue vortrainierte Modelle sind jetzt verfügbar: Acord25, 1040, Checks, Bank Statements, Financial Statements, Packing Lists, Acord131, Acord126, Acord140, Vehicle Titles.

Fehlerbehebungen

An den oben genannten Paketen wurden mehrere Fehlerbehebungen vorgenommen.

UiPath Document OCR

Release date: 4 October 2022

Freigegeben in UiPath Document OCR | v22.10.0 Cloud

Eine neue Funktion ist jetzt für die Erkennung von Barcodes und QR-Codes verfügbar.

Die Genauigkeit wurde bei langen Zeichenfolgen wie E-Mail-Adressen und URLs, bei Schriftarten mit fester Breite sowie bei der Erkennung von Handschrift und Signaturen verbessert.

Die Erkennung der Seitenrotation wurde ebenfalls verbessert.

v22.6.1-preview

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 10 October 2022

Freigegeben in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | Vorschau v22.6.1

Diese Version bringt mehrere Fehlerbehebungen für die DocumentUnderstanding- und Data Extraction-Pakete und -Endpunkte mit sich.

v22.6.0-preview

DocumentUnderstanding und Datenextraktion

Release date: 6 September 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.6.0-preview

Es sind 18 neue Vorschau-ML-Pakete mit einer fortschrittlicheren Modellarchitektur für unsere DU ML-Pakete im AI Center verfügbar. Sie können sie einfach anhand des Worts Preview (Vorschau) am Ende des Paketnamens erkennen, z. B.: InvoicesPreview,PurchaseOrderPreview,Acord125Preview usw.

Die Liste der öffentlichen Endpunkte wurde mit allen neuen Vorschau-ML-Paketen aktualisiert und kann unter Öffentliche Endpunkte eingesehen werden.

Erwähnenswert ist die Tatsache, dass diese Vorschaumodelle keine DU/AI Units aus Ihrer Lizenzierungsberechtigung verbrauchen.

Ein Fehler bei der Verwendung privater Fähigkeiten wurde behoben. Jetzt kann die private Fähigkeit nur mit einem API-Schlüssel verwendet werden, der derselben Organisation gehört, die die AI Center-Instanz verwendet.

v22.5.2

DocumentUnderstanding und Datenextraktion

Release date: 22 July 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.5.2

Fehlerbehebungen

Dieser Hotfix stabilisiert die Aufteilung der Elemente, indem die Methoden eol classifier und line_detection in einer einzigen Methode kombiniert werden.

Bekanntes Problem

There is a known issue for the Invoices package that ocassionally leads to an error when trying to run an auto-fine-tunning loop in AI Center.

v22.5.1

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 18 July 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.5.1

Fehlerbehebungen

  • Es wurde ein Fehler behoben, der dazu führte, dass die extrahierten Felder auf der falschen Seite der Validation Station angezeigt wurden.
  • Es wurde ein Fehler behoben, der dazu führte, dass die letzte Textzeile auf einigen Seiten im Document Manager nicht digitalisiert wurde.
  • Es wurde ein Fehler behoben, der die Anzeige einiger F1-Punktzahlelemente aus der evaluation_F1_invoices.txt-Datei in vollständigen/Auswertungspipelines im AI Center verhinderte.
  • Es wurde ein Fehler behoben, der dazu führte, dass die falsche F1-Gesamtpunktzahl in evaluation_F1_invoices.txt file in vollständigen/Auswertungspipelines im AI Center berechnet wurde, wenn ein Modell nur Spaltenfelder hatte.

v22.5.0

AI Center-Cloud, Datenextraktion

Release date: 16 June 2022

Released in AI Center Cloud, Data Extraction ML packages | v22.5.0

Verbesserungen

Die Leistung wurde für alle ML-Pakete zur Datenextraktion verbessert.

v22.4.3

DocumentUnderstanding und Datenextraktion

Release date: 21 July 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.4.3

Dieser Hotfix stabilisiert die Aufteilung der Elemente, indem die Methoden eol classifier und line_detection in einer einzigen Methode kombiniert werden.

v22.4.2

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 14 July 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.4.2

Fehlerbehebungen

  • Es wurde ein Fehler behoben, der dazu führte, dass die extrahierten Felder auf der falschen Seite der Validation Station angezeigt wurden.
  • Es wurde ein Fehler behoben, der dazu führte, dass die letzte Textzeile auf einigen Seiten im Document Manager nicht digitalisiert wurde.
  • Es wurde ein Fehler behoben, der die Anzeige einiger F1-Punktzahlelemente aus der evaluation_F1_invoices.txt-Datei in vollständigen/Auswertungspipelines im AI Center verhinderte.
  • Es wurde ein Fehler behoben, der dazu führte, dass die falsche F1-Gesamtpunktzahl in evaluation_F1_invoices.txt file in vollständigen/Auswertungspipelines im AI Center berechnet wurde, wenn ein Modell nur Spaltenfelder hatte.

v22.4.1

AI Center-Cloud, Datenextraktion

Release date: 3 June 2022

Release date in AI Center Cloud, Data Extraction ML packages | v22.4.1

Fehlerbehebungen

Es wurde ein Fehler behoben, der beim Ausführen einer Auswertungspipelines für ein Modell, das mit dem speziellen line_detection mode trainiert wurde, auftrat und dazu führte, dass die Vorhersagen anders ausfielen als beim Aufruf über die ML-Fähigkeit.

v22.4.0

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 10 May 2022

Veröffentlicht in ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion

| v22.4.0

Neuigkeiten

Handschriftfunktionen sind jetzt für die Pakete „UiPathDocumentOCR“ und „UiPathDocumentOCR_CPU“ verfügbar, indem „HandwritingRecognitionOCR“ integriert wird. Die gleichen Funktionen sind im Studio-Paket „UiPath.OCR.LocalServer“ verfügbar.

Neue Architektur für Extraktions-ML-Pakete mit großen Vorteilen, insbesondere für Modelle, die mit dem ML-Paket DocumentUnderstanding trainiert wurden.

Die ML-Pakete Utility Bills, W9 und Passports sind jetzt allgemein verfügbar.Fünf neue, vorab trainierte ML-Pakete sind jetzt in der Vorschau verfügbar und erleichtern Ihnen die Arbeit.

Fünf neue, vorab trainierte ML-Pakete sind jetzt in der Vorschau verfügbar und erleichtern Ihnen die Arbeit.

Die Dokumentsuche ist eine neue Funktion im Document Manager, die das Beschriften von Dokumenten mit einer großen Anzahl von Seiten erleichtert.

Verbesserungen

Die ML-Pakete für die Dokumentextraktion im AI Center wurden verbessert. Die Excel-Tabelle zur Auswertung hat jetzt neue Kalkulationstabellen, die es Ihnen ermöglichen, die ausgewerteten Daten besser zu organisieren und zu interpretieren.

ML-Pakete in der Offlineinstallation der Automation Suite haben ein neues Offlinepaket erhalten.

Genauigkeit und Leistung wurden für UiPathDocumentOCR verbessert.

Fehlerbehebungen

Mehrere Korrekturen bei der Analyse von Datumsfeldern, einschließlich Datumsangaben in Spaltenfeldern, Daten in türkischen Dokumenten und Datumsangaben weit in der Zukunft

v22.2.3

UiPath Document Understanding OCR

Release date: 7 March 2022

Released in UiPathDocumentOCR | v22.2.3

Optimale Funktion

HandwritingRecognitionOCR wurde in UiPathDocumentOCR integriert. In vielen Fällen gibt es eine Mischung aus Feldern. Durch die Integration der Funktion zum Lesen von Handschriften können wir auf jedes Feld die richtige Erkennung anwenden: Druckschrifterkennung auf Drucktext und Handschrifterkennung auf handschriftlichen Text.

Beachten Sie, dass HandwritingRecognitionOCR zwar jede Handschrift erkennen kann, sie jedoch nur für Englisch trainiert und optimiert ist.

v22.1.6

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 14 March 2022

Veröffentlicht in ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion

| v22.1.6

Fehlerbehebungen

Es wurde ein Fehler behoben, der dazu führte, dass eine Trainingspipeline oder eine vollständige Pipeline im AI Center aufgrund eines ML-Paketproblems bei der Datenvorverarbeitung für eine leere Zeile fehlschlug.

v22.1.4

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 2 March 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.1.4

Neuigkeiten

Das ML-Paket Utility Bills ist jetzt allgemein verfügbar.

Verbesserungen

Insgesamt verbesserte Leistung und Skalierbarkeit.

Deutliche Verbesserungen bei den Punktzahlen beim Training für die neue Version des ML-Pakets DocumentUnderstanding im Vergleich zu früheren Versionen.

Datumsangaben in Spaltenfeldern werden nun korrekt geparst.

Beim Datums-Parsen werden nun türkische Monatsnamen erkannt.

Änderungen

Das Verhalten für Trainingspipelines und vollständige Pipelines wurde geändert, wenn auf GPU anstatt auf CPU trainiert wurde. Die auf CPUs trainierten 21.10.x-er Modelle waren kleiner, sodass sie schneller trainiert wurden als die vorherigen Versionen, während sie etwas niedrigere Genauigkeit als zuvor hatten.

Dieses Verhalten wurde mit dieser Version rückgängig gemacht, sodass das Modell, das auf der GPU und auf der CPU trainiert wird, genau das gleiche Modell ist und die Trainingsgeschwindigkeit auf den Stand vor 2021.10 zurückgesetzt wurde, was bedeutet, dass das Training auf CPU erneut 10–20-mal langsamer als auf GPU ist.

v21.10.11

Datenextraktion

Release date: 23 November 2021

Released in Data Extraction ML packages | v21.10.11

Es wurde ein Fehler behoben, der dazu führte, dass Trainings- und Auswertungspipelines aufgrund der Logik der Datumsnachbearbeitung fehlschlugen.

v21.10.9

Datenextraktion

Release date: 24 November 2021

Released in Data Extraction ML packages | v21.10.9

Es wurde ein Fehler behoben, der zur Laufzeit einen Vorhersagefehler ausgelöst hat.

Datenextraktion und Endpunkte

Release date: 22 October 2021

Released in Data Extraction ML packages and endpoints | v21.10.9

Neuigkeiten

Das ML-Paket PurchaseOrders ist jetzt Allgemein verfügbar und kann in Ihren Produktionsszenarien verwendet werden.

Die ML-Pakete InvoicesChina, DeliveryNotes, RemittanceAdvices, W2 und W9 befinden sich jetzt in der Öffentlichen Vorschau. Wir empfehlen Ihnen, diese Pakete zu überprüfen und sie für den Typ von Dokumenten zu verwenden, die Sie verarbeiten müssen.

Verbesserungen

Evaluierung auf Dokumentebene implementiert. Dies ist repräsentativ für die Laufzeitleistung in Ihrem RPA-Workflow.

Die Evaluierung kann auch für Datasets mit weniger Feldern als das evaluierte ML-Paket durchgeführt werden. Das erleichtert die Evaluierung von vorgefertigten vorab trainierten ML-Paketen.

Um die Auswirkungen von OCR auf die Extraktionsgenauigkeit zu bewerten, können Sie sie jetzt erneut in einer Evaluierungspipeline ausführen. Dazu muss OCR beim Erstellen eines ML-Pakets konfiguriert und die Umgebungsvariable eval.redo_ocr in der AI Center-Evaluierungspipeline auf „true“ gesetzt werden.

Das Training mit der CPU verwendet jetzt ein kleineres Modell, um die Geschwindigkeit um das 5- bis 7-Fache zu erhöhen. Sie sollten jedoch mit einer um 0–5 % niedrigeren Genauigkeit bei Verwendung des CPU rechnen.

Die Spalten „Mindestkonfidenz“ und „Direkte Bearbeitungsrate“ wurden zu den Evaluation.xlsx-Dateien hinzugefügt, die von Evaluierungspipelines produziert werden.

Das UtilityBills-ML-Paket wurde erheblich verbessert.

Verbessertes Parsen von Adressen, die 1–2 Textzeilen überspringen.

Verbesserung beim Extrahieren negativer Werte, sehr großer Werte (11 Stellen oder mehr) oder in ferner Zukunft liegender Daten.

Unterstützung für gedrehte Felder auf Belegen wurde hinzugefügt.

Verkettete Abschnitte verbessert.

Fehlerbehebungen

  • Es wurde ein Fehler behoben, bei dem keine Sonderzeichen in String-Feldern zurückgegeben wurden.
  • Es wurde ein Fehler beim Passports-ML-Paket behoben, bei dem das als Ordinalzahl geschriebene Datum (1., 2., 3., 4. usw.) nicht korrekt geparst wurde.

Bekannte Probleme (Known Issues)

Das Retraining der InvoicesJapan- und InvoicesChina-ML-Pakete mit Daten aus der Validierungsstation wird derzeit nicht unterstützt. Verwenden Sie als Problemumgehung Google Cloud Vision OCR.

Bevorstehende Verwerfungen

Alle öffentlichen Endpunkte, mit Ausnahme von UiPathDocumentOCR, FormExtractor, IntelligentFormExtractor und IntelligentKeywordClassifier, werden ab dem 1. Dezember 2021 in Regionen außerhalb von Westeuropa als veraltet eingestuft.

v21.10.5

UiPathDocumentOCR-Endpunkte

Release date: 13 December 2021

Freigegeben in UiPathDocumentOCR-Endpunkten | v21.10.5

Verbesserungen

UiPathDocumentOCR ist jetzt auch in der Region Singapur verfügbar.

v21.10.1

Datenextraktion und Endpunkte für UiPath Document OCR

Release date: 24 September 2021

Freigegeben in der Datenextraktion und in Endpunkten für UiPathDocumentOCR | v21.10.1

Verbesserungen

Unterstützung für gedrehten Text wurde hinzugefügt, auch wenn die Drehung für jedes Wort in unterschiedlichen Winkeln stattfindet.

Unterstützung für vertikalen Text wurde hinzugefügt. Diese Verbesserung ist derzeit nur für UiPath.IntelligentOCR.Activities verfügbar, einschließlich Validierungsstation. Der Data Manager und der Machine Learning Extractor unterstützen noch keinen vertikalen Text.

Verbesserung der Genauigkeit bei verrauschten Bildern oder Fotos: z. B. Quittungen, Ausweisen oder Pässen.

v21.10

FormExtractor, IntelligentFormExtractor, and IntelligentKeywordClassifier endpoints

Release date: 13 December 2021

Released FormExtractor + IntelligentFormExtractor + IntelligentKeywordClassifier in Endpoints | v21.10

Verbesserungen

Form Extractor, Intelligent Form Extractor und Intelligent Keyword Classifier sind jetzt auch in der Region Singapur verfügbar.

v21.7

Datenextraktion und Endpunkte für die Handschrifterkennung

Release date: 11 August 2021

Freigegeben in der Datenextraktion und in Endpunkten für die Handschrifterkennung | v21.7

Verbesserungen

Möglichkeit, mehrere Threads in einem einzigen Aufruf des Modells zu bearbeiten.

Erneutes Modelltraining und einige andere Änderungen für eine bessere Modellgenauigkeit.

Fehlerbehebungen

Es wurde ein Fehler behoben, der dazu führte, dass die Kapsel neu gestartet wurde, wenn kein Arbeitsspeicher mehr übrig war.

v21.6.3

UiPathDocumentOCR in endpoints

Release-Datum: 9. Juni 2021

Freigegeben in Endpunkten für UiPathDocumentOCR | v21.6.3

Verbesserungen

Verbesserte Erkennung von einzelnen Ziffern.

Verbesserte Genauigkeit bei den Zeichen 1, I und l.

Verbesserte Erkennung von nah beieinander stehendem Text.

v21.5.5

Datenextraktion und Endpunkte

Release date: 18 June 2021

Veröffentlicht in Endpunkten und ML-Paketen zur Datenextraktion | v21.5.5

Es wurde ein Fehler behoben, der Vorhersagedifferenzen zwischen dem Data Manager und der Aktivität Digitize Document verursachte.

v21.5.3

Datenextraktion und Endpunkte

Release date: 8 June 2021

Released in endpoints and Data Extraction ML packages | v21.5.3

Neuigkeiten

Für schwer lesbare Bilder, wie im Falle von ID-Karten und Passports, wurden zwei neue, entsprechend vorab trainierte Out-Of-the-Box-Pakete veröffentlicht.

Verbesserungen

Erneut trainierbare Klassifizierungsfelder wurden in unsere vorab trainierten Out-Of-the-Box-Pakete integriert.

v21.4.7

Datenextraktion und Endpunkte

Release-Datum: 20. April 2021

Released in endpoints and Data Extraction ML packages | v21.4.7

Verbesserte Datumsanalyse für ML-Pakete zur Datenextraktion.

v21.4.5

Datenextraktion und Endpunkte

Release-Datum: 15. April 2021

Released in endpoints and Data Extraction ML packages | v21.4.5

Neuigkeiten

Aller öffentlichen Endpunkte in der Region Vereinigte Staaten bereitgestellt.

Öffentliche Endpunkte für Form Extractor, Intelligent Form Extractor und Intelligent Keyword Classifier in den Regionen Kanada und Japan bereitgestellt.

v21.4

Datenextraktion und Endpunkte für HandwritingRecognition und DocumentClassifier

Release-Datum: 9. März 2021

Veröffentlicht in Datenextraktions-ML-Paketen und Endpunkten für HandwritingRecognition, DocumentClassifier, + eigenständiger Docker für UiPathDocumentOCR | v21.4

Neuigkeiten

HandwritingRecognition with improved recognition using spelling corrections and ability to read machine-printed text reaches general availability.

DocumentClassifier ist ebenfalls allgemein verfügbar.

Verbesserungen an UiPath Document OCR für:

  • Optionsfeld-/Kontrollkästchen-Erkennung
  • Genauigkeit bei Blasenformularen
  • Allgemeine Genauigkeit

v21.1.8

Datenextraktion und Endpunkte

Release-Datum: 17. Februar 2021

Released in endpoints and Data Extraction ML packages | v21.1.8

Verbesserungen

Verbesserte Genauigkeit.

InvoicesIndia und InvoicesAustralia sind jetzt allgemein verfügbar.

Öffentliche Endpunkte in der Region Australien bereitgestellt.

Edition-Argument in Endpunkt-URLs nicht mehr erforderlich. Beispielsweise funktioniert https://du.uipath.com/ie/invoices sowohl für den Unternehmens- als auch für den Community-Verkehr.

v20.11.3

Datenextraktion

Veröffentlichungsdatum: 18. Dezember 2020

Released in Data Extraction ML packages | v20.11.3

Verbesserungen

Verbesserungen des CPU-Trainings machen es schneller und erfordern weniger Arbeitsspeicher.

Verbesserungen der Datumsanalyse für Nicht-US-Dokumente.

Erkennung von Kontrollkästchen bei UiPathDocumentOCR, einschließlich gedruckter oder handschriftlicher Kontrollkästchen.

v20.10.4

Datenextraktion und Endpunkte

Release-Datum: 10. November 2020

Released in endpoints and Data Extraction ML packages | v20.10.4

Neue Funktionen und Verbesserungen

Ein neues Modell für japanische Rechnungen.

Auswertungspipelines geben nun auch Metriken für Klassifizierungsfelder zurück.

Support für Microsoft Read OCR Version 3.

Verbesserungen der Datumsformatierung/-analyse zur Erkennung der Formate Tag/Monat/Jahr im Vergleich zu Formaten mit Monat/Tag/Jahr.

Verbesserungen bei der Erkennung von Dezimal- und Tausendertrennzeichen für eine korrekte Zahlenanalyse.

Training auf CPU wird von allen Versionen von AI Fabric unterstützt.

Verbesserte Analyse von Feldern mit Inhalt des Typs id-no.

Support ausschließlich für Training-Klassifizierungsfelder (nicht für reguläre oder Spaltenfelder).

Erhöhung der maximalen Anzahl erlaubter Felder von 32 auf 40.

Konfidenzniveau-Meldungen für Spaltenfelder.

Bekannte Probleme (Known Issues)

Beim Erstellen eines UiPath.DocumentUnderstanding.ML.Activities-Pakets im AI Center darf der Paketname kein reserviertes Python-Schlüsselwort sein, wie class , break, from, finally, global, None usw. Bitte beachten Sie, dass diese Liste nicht vollständig ist, da der Paketname für class <pkg-name> und import <pkg-name> verwendet wird.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
UiPath Logo weiß
Vertrauen und Sicherheit
© 2005-2024 UiPath. All rights reserved.