document-understanding
LATEST
false
  • Document Understanding-Versionshinweise
  • ML-Pakete und öffentliche Endpunkte – Versionshinweise
    • Allgemeine ML-Pakete und öffentliche Endpunkte
    • Versionsverlauf bei ML-Paketen und öffentlichen Endpunkten
UiPath logo, featuring letters U and I in white

Document Understanding-Versionshinweise

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Letzte Aktualisierung 12. Dez. 2024

Versionsverlauf bei ML-Paketen und öffentlichen Endpunkten

v24.11.3

UiPath Document Understanding OCR

Release-Datum: 27. November 2024

Veröffentlicht in UiPath Document Understanding OCR und Endpunkten | v24.11.3

Verbesserungen

In diesem Release haben wir die Genauigkeit und Leistung für verschiedene Texttypen verbessert. Dazu gehört Text, der auf sehr große oder niedrig aufgelöste Bilder gedruckt wird, sowie handschriftlicher Text.

Die Erkennung von Kontrollkästchen, insbesondere derjenigen, die durch vollständig geschwärzte Quadrate oder Rechtecke dargestellt werden, wurde erheblich verbessert. Darüber hinaus haben wir auch die Signaturerkennung optimiert.

v24.9.1

UiPath Document Understanding OCR

Release-Datum: 3. Oktober 2024

Veröffentlicht in UiPath Document Understanding OCR und Endpunkten | v24.9.1

Verbesserungen

Diese Version bringt Genauigkeits- und Leistungsverbesserungen für die Handschrifterkennung.

v24.7

UiPath Document OCR

Release-Datum: 23. Juli 2024

Veröffentlicht in UiPath Document Understanding OCR und Endpunkten (einschließlich UiPath Document Understanding OCR_CPU) | v24.7

Verbesserungen

  • Die Genauigkeit für Aserbaidschanisch wurde verbessert, indem die Erkennung für die Zeichen əƏ hinzugefügt wurde.
  • Die MIRC-Erkennung und -Erfassung (Magnetic Ink Character Recognition, MIRC) wurde verbessert, was insbesondere bei Schecks zu einer höheren Genauigkeit führt.
  • Zuvor wurden Zahlen in einigen Fällen nicht erkannt, wenn ein Leerzeichen als Trennzeichen verwendet wurde. Das wurde verbessert und Zahlen werden jetzt erkannt, wenn Leerzeichen als Trennzeichen verwendet werden.

Fehlerbehebungen

Die Konfidenzbewertung für die UiPath Document Understanding OCR wurde verbessert, insbesondere bei Bildern in niedrigerer Qualität. In Workflows, bei denen die Konfidenzbewertung verwendet wird, um zu entscheiden, ob Dokumente eine menschliche Validierung im Action Center benötigen, kann diese Verbesserung zu einer erhöhten Anzahl von Dokumenten führen, die validiert werden.

v24.4.4

Datenextraktion

Release-Datum: 3. Oktober 2024

Veröffentlicht in ML-Paketen für Datenextraktion | v24.4.4

Fehlerbehebungen

  • Wir haben ein Problem behoben, das dazu führte, dass AI Center-Trainingspipelines ungenau hohe Punktzahlen für die Feldtypen ID Number und Phone Number meldeten. Dadurch wird sichergestellt, dass die gemeldeten Punktzahlen mit den tatsächlichen Punktzahlen übereinstimmen.
  • Wir haben ein Problem behoben, das mit dem Analysieren von Werten in japanischen Feldern zusammenhängt, wenn die erweiterte Sprachen-OCR verwendet wurde.

v24.4.3

DocumentUnderstanding und Datenextraktion

Release-Datum: 14. August 2024

Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v24.4.3

Verbesserungen

Verbesserte Feldtextformatierung für die Sprachen Chinesisch, Japanisch und Koreanisch bei Verwendung von UiPath® Extended Languages OCR im Digitalisierungsschritt.

v24.4.2

InvoicesIndia und Endpunkte

Release-Datum: 23. Juli 2024

Veröffentlicht in Endpunkten und ML-Paket „InvoicesIndia“ | v24.4.2

Fehlerbehebungen

Wir haben ein Problem im Zusammenhang mit dem Parsen von Zahlen in indischen Rechnungen behoben.

v24.4.1

DocumentUnderstanding, InvoicesJapan und Endpunkte

Release-Datum: 20. Juni 2024

Veröffentlicht in Endpunkten + ML-Paketen für DocumentUnderstanding + InvoicesJapan | v24.4.1

Fehlerbehebungen

Wir haben ein Problem im Zusammenhang mit Datumsangaben in Spaltenfeldern speziell für die japanische Sprache behoben.

v24.4.0

DocumentClassifier und Datenextraktion

Release-Datum: 24. Mai 2024

Freigegeben in:
  • ML-Pakete DocumentUnderstanding + Datenextraktion | v24.4.0
  • DocumentClassifier ML-Pakete | v24.4.0

Neuigkeiten

Die folgenden neuen ML-Pakete befinden sich jetzt in der öffentlichen Vorschau:

Verbesserungen

Dieses Release bringt auch Verbesserungen für mehrere andere ML-Pakete:
  • Die Genauigkeit für das ML-Paket Invoices Japan wurde verbessert. Es gibt auch 11 neue Felder für das Modell Invoices Japan. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.
  • Die Leistung für das Payslips-Modell wurde verbessert.
  • Für das ML-Paket ID Cards sind neue IDs verfügbar:
    • Aadhaar-ID-Karten
    • Saudi-Arabische ID-Karten
    • PAN-Karten
  • Für das ML-Paket UB04 sind neue Felder verfügbar. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.
  • Für das ML-Paket Checks sind neue Felder verfügbar. Die vollständige Liste der extrahierten Felder finden Sie in der Datei Details zu vorgefertigten Modellen.

Erratum – Hinzugefügt am 20. Juni 2024: Informationen zu einer Fehlerbehebung im Zusammenhang mit der Analyse japanischer Datumsangaben wurden hinzugefügt.

Erratum – hinzugefügt am 28. Mai 2024: Weitere Informationen zu mehreren Verbesserungen wurden hinzugefügt.

v24.3.2

DocumentUnderstandingOCR-Endpunkte

Release-Datum: 13. März 2024

Veröffentlicht in DocumentUnderstandingOCR-Endpunkte | v24.3.2

Eine neue Version für Document Understanding OCR ist jetzt für die allgemeine Verwendung verfügbar.

Dieses Release bringt die folgenden Verbesserungen:
  • Die Genauigkeit für Türkisch (TUR) wurde verbessert. Die Leistung bei diakritischen Zeichen (z. B. Ç, ç, Ğ, ğ, I, ı, İ, i, Ş, ş, Ö, ö, Ü, ü) wurde verbessert.
  • Die Genauigkeit für ostarabische Ziffern (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) wurde verbessert.

v24.2.1

DocumentUnderstandingOCR-Endpunkte

Release-Datum: 9. Februar 2024

Veröffentlicht in DocumentUnderstandingOCR-Endpunkte | v24.2.1

Wir freuen uns, Ihnen mitteilen zu können, dass die Unterstützung von Arabisch (ARA) in UiPath Document Understanding OCR jetzt in der öffentlichen Vorschau verfügbar ist.

v24.2.0

Datenextraktion

Release-Datum: 1. April 2024

Veröffentlicht in ML-Paketen zur Datenextraktion | v24.2.0

Diese Version bietet Unterstützung für die neuen Modelle, die in der öffentlichen Vorschau verfügbar sind:
  • 1040 Anlage C
  • 1040 Anlage D
  • 1040 Anlage E
  • UB04

Document Classifier

Release-Datum: 4. März 2024

Veröffentlicht in DocumentClassifier-ML-Paketen | v24.2.0

Diese Version bietet Unterstützung für die neuen Modelle, die in der öffentlichen Vorschau verfügbar sind:
  • 1040 Anlage C
  • 1040 Anlage D
  • 1040 Anlage E
  • UB04

v23.10.5

UiPath Document Understanding OCR

Release-Datum: 15. Oktober 2024

Veröffentlicht in UiPath Document Understanding OCR und Endpunkten | v23.10.5

Verbesserungen

Diese Version bringt Genauigkeits- und Leistungsverbesserungen für die Handschrifterkennung.

Fehlerbehebungen

Wir haben ein Problem behoben, bei dem Anmerkungsfelder horizontal zurückgegeben wurden, obwohl einige Dokumente leicht verzerrt waren, was zu einer Fehlausrichtung in der Anmerkung führte.

v23.10.4

Datenextraktion

Release-Datum: 28. März 2024

Veröffentlicht in ML-Paketen zur Datenextraktion | v23.10.4

Eine neue Version für sofort einsatzbereite vortrainierte ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.

Dieses Release bringt die folgenden Verbesserungen:
  • Die Genauigkeit für Türkisch (TUR) wurde verbessert. Die Leistung bei diakritischen Zeichen (z. B. Ç, ç, Ğ, ğ, I, ı, İ, i, Ş, ş, Ö, ö, Ü, ü) wurde verbessert.
  • Die Genauigkeit für ostarabische Ziffern (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) wurde verbessert.
  • Die Genauigkeit für Datasets, die kleiner als 400 Seiten sind, wurde verbessert.

v23.10.3

DocumentUnderstanding, Datenextraktion und Endpunkte

Release-Datum: 12. Februar 2024

Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.10.3

Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete von AI Center ist jetzt für die allgemeine Verwendung verfügbar.

Diese neue Version bringt eine Fehlerbehebung im Zusammenhang mit der Extraktion bidirektionaler Textwerte (von links nach rechts und von rechts nach links).

Hinweis: Derzeit ist unsere Plattform nicht für Sprachen lokalisiert, die von rechts nach links geschrieben werden (wie Hebräisch oder Arabisch). In Kombination mit Interpunktionszeichen oder Sonderzeichen wird deshalb Text in diesen Sprachen auf der Anmerkungsoberfläche (Document Manager) oder Validierungsoberfläche (Validation Station in Action Center) nicht korrekt angezeigt. Wenn die Werte der Zeichenfolgen jedoch in eine Anwendung eingegeben werden, bei der der Lesemodus von rechts nach links aktiviert ist, sollte der Text korrekt angezeigt werden. Ein typisches Beispiel ist der Editor, bei dem die Lesereihenfolge von rechts nach links aktiviert ist.

v23.10.2

DocumentUnderstanding und Datenextraktion

Release-Datum: 23. Januar 2024

Veröffentlicht in den ML-Paketen DocumentUnderstanding + Datenextraktion | v23.10.2

Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.

Mit diesem Release wird ein Fehler behoben, der gelegentlich dazu führte, dass das Training fehlschlug.

v23.10.0

DocumentUnderstanding, Datenextraktion und Endpunkte

Release-Datum: 26. Oktober 2023

Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.10.0

Eine neue Version für alle sofort einsatzbereiten vortrainierten ML-Pakete ist jetzt für die allgemeine Verwendung verfügbar.

Wir arbeiten ständig daran, Document Understanding für Sie zu verbessern. In diesem Release haben wir kleinere Sicherheits- und Stabilitätsverbesserungen an unserem Produkt vorgenommen.

UiPath Document Understanding OCR

Release-Datum: 2. Oktober 2023

Veröffentlicht in UiPath Document Understanding OCR | v23.10

Wir freuen uns, Ihnen mitteilen zu können, dass Hebräisch (HEB) jetzt von UiPath Document Understanding OCR unterstützt wird.

v23.7.0

DocumentUnderstanding und Datenextraktion

Release-Datum: 3. August 2023

Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v23.7.0

  • In Dokumenten, in denen sich eine Tabelle über viele Seiten erstreckt, wird eine Tabellenzeile (eine Position) auf 2 Seiten aufgeteilt, in einigen Fällen sogar mehr. In den vorherigen Modellversionen wurde davon ausgegangen, dass jeder Seitenumbruch auch ein Zeilenumbruch ist. Dadurch wurden Elemente in mehrere Teile aufgebrochen. Die aktuelle Modellversion behebt dieses Problem. Um von dieser Funktion in einem Workflow zu profitieren, müssen Sie die DocumentUnderstanding.ML.Activities-Paketversion 1.23.0-preview und die Modellversion 23.7.0 im jeweiligen Workflow verwenden.
  • Modelle haben jetzt eine schnellere Vorhersagezeit pro Seite und nutzen den RAM effizienter, was die Verarbeitung größerer Dokumente ermöglicht.

v23.6.0

DocumentUnderstanding und Endpunkte

Release-Datum: 13. Juni 2023

Veröffentlicht in DocumentUnderstanding + Endpunkten | v23.6.0

Wir haben die Genauigkeit des ML-Pakets für UiPathDocumentOCR verbessert.

v23.4.1

DocumentUnderstanding, Datenextraktion und Endpunkte

Release-Datum: 23. Mai 2023

Veröffentlicht in den ML-Paketen DocumentUnderstanding + Datenextraktion | v23.4.1

Wir haben ein Problem behoben, das sich auf das Modelltraining auswirkte.

v23.4.5

Document Understanding

Release-Datum: 21. April 2023

Freigegeben in DocumentUnderstanding | v23.4.5

Wir haben das Modell für allgemein eingegebenen Text verbessert und die Funktion zur Erkennung von Kontrollkästchen erweitert.

v23.4.2

Document Understanding

Release-Datum: 24. März 2023

Veröffentlicht in DocumentUnderstanding | v23.4.2

Der öffentliche Endpunkt von UiPath Document OCR wurde aktualisiert und bietet jetzt Unterstützung für die Handschriftsprache für Deutsch und Französisch sowie Drucksprachenunterstützung für Dänisch, Finnisch, Norwegisch und Schwedisch. Hier ist die vollständige Liste der neuen unterstützten Sprachen: Dänisch, Schwedisch, Norwegisch, Finnisch, Polnisch, Ungarisch, Tschechisch, Slowakisch, Estnisch, Lettisch, Litauisch, Slowenisch, Kroatisch, Serbisch, Türkisch.

v23.4.0

DocumentUnderstanding, Datenextraktion und Endpunkte

Release-Datum: 10. Mai 2023

Veröffentlicht in den ML-Paketen DocumentUnderstanding + Datenextraktion | v23.4.0

Die UiPath Document OCR ist jetzt als vorgefertigtes vortrainiertes Paket sowohl für die GPU- als auch für die CPU-Nutzung verfügbar. Auf diese Weise können Kunden, die die Verwendung öffentlicher Endpunkte vermeiden möchten, UiPath Document OCR in ihren eigenen Mandanten in einer isolierten Umgebung bereitstellen.

Eine Liste von sieben neuen vorgefertigten vortrainierten ML-Paketen ist jetzt für die allgemeine Verwendung verfügbar. Hier ist die Liste der sieben neuen Modelle:

  • Gründungsurkunde/Unbedenklichkeitsbescheinigung
  • Ursprungszeugnis
  • Produktzertifikat für Kinder
  • CMS1500
  • EU-Konformitätserklärung
  • Rechnungen Versand
  • Gehaltsabrechnungen (Pay slips)

DocumentClassifier und Endpunkte

Release-Datum: 26. April 2023

Veröffentlicht in ML-Paketen für Endpunkte + DocumentClassifier | v23.4.0

Wir haben dem ML-Paket für DocumentClassifier neue Dokumenttypen hinzugefügt, allgemeine Verbesserungen vorgenommen und einige kleine Fehler behoben.

v23.2.0

DocumentUnderstanding, Datenextraktion und Endpunkte

Release-Datum: 23. Februar 2023

Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v23.2.0

Neuerungen und Verbesserungen

Eine neue Version der sofort einsetzbaren vortrainierten ML-Pakete (23.1.0) und ihrer öffentlichen Endpunkte wurde veröffentlicht, die jetzt eine hochmoderne Architektur auf LayoutLM Transformer-Basis verwendet, die leistungsstärker ist und die Genauigkeit insgesamt erhöht, insbesondere bei Spaltenfeldern (Tabellen).

Diese Verbesserung hat die sofort einsetzbaren vortrainierten ML-Pakete leistungsfähiger gemacht, was bedeutet, dass möglicherweise eine längere Latenz für Training und Vorhersagen auftritt.

Für alle Situationen, in denen die Latenz kritisch ist (z. B.: Attended-Szenarien), empfehlen wir die Bereitstellung der Modelle als ML-Fähigkeiten mit einer GPU.

We have improved how the scores are calculated after Training/Evaluation/Full pipelines to provide a separate score for each column field. Before this improvement, F1 scores were calculated as a whole, for all column fields taken together.

Die bevorstehende Entfernung der Funktion für Manuelle Bearbeitungen, die in der Modellbewertung verwendet wird, wird angekündigt. Weitere Informationen finden Sie hier.

Bekannte Probleme (Known Issues)

The project import from AI Center is currently disabled. We are actively working on this and expect to have it reenabled by the end of March.

Erratum 8. Mai 2023

Bekanntes Problem

Beim Ausführen einer vollständigen oder einer Trainingspipeline wird eine Fatal Python error: Segmentation fault empfangen. Wir empfehlen die Verwendung der ML-Pakete mit v23.4, bis dieser Fehler behoben ist.

Erratum 20. April 2023

Die Gesamtpunktzahl für alle Pipelines ist jetzt eine Genauigkeit. Zuvor war es ein F1-Ergebnis. Die Auswertungsartefakte im AI Center enthalten weiterhin sowohl die Genauigkeit als auch die F1-Punktzahl, um die Vergleichbarkeit zu erhöhen.

v23.1.0

DocumentClassifier und Endpunkte

Release-Datum: 11. Januar 2023

Freigegeben in Endpunkten und DocumentClassifier | v23.1.0

Wir haben die F1-Bewertungen verbessert, die nun auch für Trainings-Pipelines angezeigt werden.

Der Ordner „Artefakte“ enthält eine aktualisierte Liste der Artefakte.

Das DocumentClassifier-Modell sagt jetzt 25 statt 26 Klassen voraus, da die Klasse „Lieferhinweise“ entfernt wurde.

v22.12.2

Endpunkte

Release-Datum: 16. Dezember 2022

Freigegeben in Endpunkten | v22.12.2

Der öffentliche Endpunkt von UiPath Document OCR wurde aktualisiert und bietet jetzt Unterstützung für die Handschriftsprache für Deutsch und Französisch sowie Drucksprachenunterstützung für Dänisch, Finnisch, Norwegisch und Schwedisch.

v22.11.0

DocumentUnderstanding, Datenextraktion und Endpunkte

Release-Datum: 13. Dezember 2022

Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v22.11.0

Dieser Release bringt erhebliche Verbesserungen für die öffentlichen Endpunkte der sofort einsetzbaren vortrainierten ML-Pakete mit sich, d. h. die neueste LayoutLM-basierte Deep-Learning-Architektur wird jetzt verwendet.

Diese Verbesserung bietet eine höhere Genauigkeit bei allen Dokumenttypen, insbesondere für das Invoices-Modell, und steigert auch die Genauigkeit bei Spaltenfeldern und Tabellen.

Wir haben dem Invoices-Modell neue extrahierte Felder hinzugefügt, darunter Versanddatum, E-Mail-Adresse des Lieferanten, Bankname, Kontonummer, IBAN, SWIFT-Code, Bankadresse, Bankleitzahl und Steuersatz. Sie können die Liste der extrahierten Felder überprüfen, indem Sie auf diese Seite zugreifen und auf den Link klicken, der für jedes Modell verfügbar ist.

Modellbewertungen werden jetzt auch von Trainingspipelines zurückgegeben, nicht nur von vollständigen oder Auswertungspipelines.

F1-Ergebnisse sind jetzt für jedes Spaltenfeld verfügbar. Bisher waren F1-Ergebnisse nur für alle Spaltenfelder zusammen verfügbar.

v22.10.2

Endpunkte

Release-Datum: 3. Februar 2023

Veröffentlicht in Endpunkten | v22.10.2

Die öffentlichen Endpunkte der sofort einsetzbaren vortrainierten ML-Pakete wurden aktualisiert und verwenden jetzt eine hochmoderne auf LayoutLM Transformers basierende Architektur.

v22.10.0

DocumentUnderstanding, Datenextraktion und Endpunkte

Release-Datum: 7. Oktober 2022

Veröffentlicht in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | v22.10.0

Neuerungen und Verbesserungen

Die folgenden vortrainierten Modelle werden jetzt ohne das Tag -Preview als offiziell aufgeführt: InvoicesAustralia, InvoicesIndia, PurchaseOrders.

Das DeliveryNotes-Modell wurde in BillsOfLading umbenannt.

Zehn neue vortrainierte Modelle sind jetzt verfügbar: Acord25, 1040, Checks, Bank Statements, Financial Statements, Packing Lists, Acord131, Acord126, Acord140, Vehicle Titles.

Fehlerbehebungen

An den oben genannten Paketen wurden mehrere Fehlerbehebungen vorgenommen.

UiPath Document OCR

Release-Datum: 4. Oktober 2022

Veröffentlicht in UiPath Document OCR | v22.10.0 Cloud

Eine neue Funktion ist jetzt für die Erkennung von Barcodes und QR-Codes verfügbar.

Die Genauigkeit wurde bei langen Zeichenfolgen wie E-Mail-Adressen und URLs, bei Schriftarten mit fester Breite sowie bei der Erkennung von Handschrift und Signaturen verbessert.

Die Erkennung der Seitenrotation wurde ebenfalls verbessert.

v22.6.1-preview

DocumentUnderstanding, Datenextraktion und Endpunkte

Release-Datum: 10. Oktober 2022

Freigegeben in ML-Paketen für Endpunkte + DocumentUnderstanding + Datenextraktion | Vorschau v22.6.1

Dieser Release bringt mehrere Fehlerbehebungen für die Pakete und Endpunkte für DocumentUnderstanding und Datenextraktion.

v22.6.0-preview

DocumentUnderstanding und Datenextraktion

Release date: 6 September 2022

Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v22.6.0-preview

Es sind 18 neue Vorschau-ML-Pakete mit einer fortschrittlicheren Modellarchitektur für unsere DU ML-Pakete im AI Center verfügbar. Sie können sie einfach anhand des Worts Preview (Vorschau) am Ende des Paketnamens erkennen, z. B.: InvoicesPreview,PurchaseOrderPreview,Acord125Preview usw.

Die Liste der öffentlichen Endpunkte wurde mit allen neuen Vorschau-ML-Paketen aktualisiert und kann unter Öffentliche Endpunkte eingesehen werden.

Erwähnenswert ist die Tatsache, dass diese Vorschaumodelle keine DU/AI Units aus Ihrer Lizenzierungsberechtigung verbrauchen.

Ein Fehler bei der Verwendung privater Fähigkeiten wurde behoben. Jetzt kann die private Fähigkeit nur mit einem API-Schlüssel verwendet werden, der derselben Organisation gehört, die die AI Center-Instanz verwendet.

v22.5.2

DocumentUnderstanding und Datenextraktion

Release-Datum: 22. Juli 2022

Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v22.5.2

Fehlerbehebungen

Dieser Hotfix stabilisiert die Aufteilung der Elemente, indem die Methoden eol classifier und line_detection in einer einzigen Methode kombiniert werden.

Bekanntes Problem

Es gibt ein bekanntes Problem für das Paket Rechnungen, das gelegentlich zu einem Fehler führt, wenn Sie versuchen, eine Schleife mit automatischer Feinabstimmung im AI Center auszuführen.

v22.5.1

DocumentUnderstanding, DocumentClassifier und Datenextraktion

Release-Datum: 18. Juli 2022

Veröffentlicht in den ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion | v22.5.1

Fehlerbehebungen

  • Es wurde ein Fehler behoben, der dazu führte, dass die extrahierten Felder auf der falschen Seite der Validation Station angezeigt wurden.
  • Es wurde ein Fehler behoben, der dazu führte, dass die letzte Textzeile auf einigen Seiten im Document Manager nicht digitalisiert wurde.
  • Es wurde ein Fehler behoben, der die Anzeige einiger F1-Punktzahlelemente aus der evaluation_F1_invoices.txt-Datei in vollständigen/Auswertungspipelines im AI Center verhinderte.
  • Es wurde ein Fehler behoben, der dazu führte, dass die falsche F1-Gesamtpunktzahl in evaluation_F1_invoices.txt file in vollständigen/Auswertungspipelines im AI Center berechnet wurde, wenn ein Modell nur Spaltenfelder hatte.

v22.5.0

AI Center-Cloud, Datenextraktion

Release-Datum: 16. Juni 2022

Veröffentlicht in den ML-Paketen für AI Center Cloud, Datenextraktion | v22.5.0

Verbesserungen

Die Leistung wurde für alle ML-Pakete zur Datenextraktion verbessert.

v22.4.3

DocumentUnderstanding und Datenextraktion

Release-Datum: 21. Juli 2022

Veröffentlicht in den ML-Paketen für DocumentUnderstanding + Datenextraktion | v22.4.3

Dieser Hotfix stabilisiert die Aufteilung der Elemente, indem die Methoden eol classifier und line_detection in einer einzigen Methode kombiniert werden.

v22.4.2

DocumentUnderstanding, DocumentClassifier und Datenextraktion

Release-Datum: 14. Juli 2022

Veröffentlicht in den ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion | v22.4.2

Fehlerbehebungen

  • Es wurde ein Fehler behoben, der dazu führte, dass die extrahierten Felder auf der falschen Seite der Validation Station angezeigt wurden.
  • Es wurde ein Fehler behoben, der dazu führte, dass die letzte Textzeile auf einigen Seiten im Document Manager nicht digitalisiert wurde.
  • Es wurde ein Fehler behoben, der die Anzeige einiger F1-Punktzahlelemente aus der evaluation_F1_invoices.txt-Datei in vollständigen/Auswertungspipelines im AI Center verhinderte.
  • Es wurde ein Fehler behoben, der dazu führte, dass die falsche F1-Gesamtpunktzahl in evaluation_F1_invoices.txt file in vollständigen/Auswertungspipelines im AI Center berechnet wurde, wenn ein Modell nur Spaltenfelder hatte.

v22.4.1

AI Center-Cloud, Datenextraktion

Release-Datum: 3. Juni 2022

Veröffentlicht in den ML-Paketen für AI Center Cloud, Datenextraktion | v22.4.1

Fehlerbehebungen

Es wurde ein Fehler behoben, der beim Ausführen einer Auswertungspipelines für ein Modell, das mit dem speziellen line_detection mode trainiert wurde, auftrat und dazu führte, dass die Vorhersagen anders ausfielen als beim Aufruf über die ML-Fähigkeit.

v22.4.0

DocumentUnderstanding, DocumentClassifier und Datenextraktion

Release-Datum: 10. Mai 2022

Veröffentlicht in ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion

| v22.4.0

Neuigkeiten

Handschriftfunktionen sind jetzt für die Pakete „UiPathDocumentOCR“ und „UiPathDocumentOCR_CPU“ verfügbar, indem „HandwritingRecognitionOCR“ integriert wird. Die gleichen Funktionen sind im Studio-Paket „UiPath.OCR.LocalServer“ verfügbar.

Neue Architektur für Extraktions-ML-Pakete mit großen Vorteilen, insbesondere für Modelle, die mit dem ML-Paket DocumentUnderstanding trainiert wurden.

Die ML-Pakete Utility Bills, W9 und Passports sind jetzt allgemein verfügbar.Fünf neue, vorab trainierte ML-Pakete sind jetzt in der Vorschau verfügbar und erleichtern Ihnen die Arbeit.

Fünf neue, vorab trainierte ML-Pakete sind jetzt in der Vorschau verfügbar und erleichtern Ihnen die Arbeit.

Die Dokumentsuche ist eine neue Funktion im Document Manager, die das Beschriften von Dokumenten mit einer großen Anzahl von Seiten erleichtert.

Verbesserungen

Die ML-Pakete für die Dokumentextraktion im AI Center wurden verbessert. Die Excel-Tabelle zur Auswertung hat jetzt neue Kalkulationstabellen, die es Ihnen ermöglichen, die ausgewerteten Daten besser zu organisieren und zu interpretieren.

ML-Pakete in der Offlineinstallation der Automation Suite haben ein neues Offlinepaket erhalten.

Genauigkeit und Leistung wurden für UiPathDocumentOCR verbessert.

Fehlerbehebungen

Mehrere Korrekturen bei der Analyse von Datumsfeldern, einschließlich Datumsangaben in Spaltenfeldern, Daten in türkischen Dokumenten und Datumsangaben weit in der Zukunft

v22.2.3

UiPathDocumentUnderstandingOCR

Release-Datum: 7. März 2022

Veröffentlicht in UiPathDocumentOCR | v22.2.3

Optimale Funktion

HandwritingRecognitionOCR wurde in UiPathDocumentOCR integriert. In vielen Fällen gibt es eine Mischung aus Feldern. Durch die Integration der Funktion zum Lesen von Handschriften können wir auf jedes Feld die richtige Erkennung anwenden: Druckschrifterkennung auf Drucktext und Handschrifterkennung auf handschriftlichen Text.

Beachten Sie, dass HandwritingRecognitionOCR zwar jede Handschrift erkennen kann, sie jedoch nur für Englisch trainiert und optimiert ist.

v22.1.6

DocumentUnderstanding, DocumentClassifier und Datenextraktion

Release-Datum: 14. März 2022

Veröffentlicht in ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion

| v22.1.6

Fehlerbehebungen

Es wurde ein Fehler behoben, der dazu führte, dass eine Trainingspipeline oder eine vollständige Pipeline im AI Center aufgrund eines ML-Paketproblems bei der Datenvorverarbeitung für eine leere Zeile fehlschlug.

v22.1.4

DocumentUnderstanding, DocumentClassifier und Datenextraktion

Release-Datum: 2. März 2022

Veröffentlicht in den ML-Paketen für DocumentUnderstanding + DocumentClassifier + Datenextraktion | v22.1.4

Neuigkeiten

Das ML-Paket Utility Bills ist jetzt allgemein verfügbar.

Verbesserungen

Insgesamt verbesserte Leistung und Skalierbarkeit.

Deutliche Verbesserungen bei den Punktzahlen beim Training für die neue Version des ML-Pakets DocumentUnderstanding im Vergleich zu früheren Versionen.

Datumsangaben in Spaltenfeldern werden nun korrekt geparst.

Beim Datums-Parsen werden nun türkische Monatsnamen erkannt.

Änderungen

Das Verhalten für Trainingspipelines und vollständige Pipelines wurde geändert, wenn auf GPU anstatt auf CPU trainiert wurde. Die auf CPUs trainierten 21.10.x-er Modelle waren kleiner, sodass sie schneller trainiert wurden als die vorherigen Versionen, während sie etwas niedrigere Genauigkeit als zuvor hatten.

Dieses Verhalten wurde mit dieser Version rückgängig gemacht, sodass das Modell, das auf der GPU und auf der CPU trainiert wird, genau das gleiche Modell ist und die Trainingsgeschwindigkeit auf den Stand vor 2021.10 zurückgesetzt wurde, was bedeutet, dass das Training auf CPU erneut 10–20-mal langsamer als auf GPU ist.

v21.10.11

Datenextraktion

Release-Datum: 23. November 2021

Veröffentlicht in den ML-Paketen für Datenextraktion | v21.10.11

Es wurde ein Fehler behoben, der dazu führte, dass Trainings- und Auswertungspipelines aufgrund der Logik der Datumsnachbearbeitung fehlschlugen.

v21.10.9

Datenextraktion

Release-Datum: 24. November 2021

Veröffentlicht in den ML-Paketen für Datenextraktion | v21.10.9

Es wurde ein Fehler behoben, der zur Laufzeit einen Vorhersagefehler ausgelöst hat.

Datenextraktion und Endpunkte

Release-Datum: 22. Oktober 2021

Veröffentlicht in den ML-Paketen und Endpunkten für Datenextraktion | v21.10.9

Neuigkeiten

Das ML-Paket PurchaseOrders ist jetzt Allgemein verfügbar und kann in Ihren Produktionsszenarien verwendet werden.

Die ML-Pakete InvoicesChina, DeliveryNotes, RemittanceAdvices, W2 und W9 befinden sich jetzt in der Öffentlichen Vorschau. Wir empfehlen Ihnen, diese Pakete zu überprüfen und sie für den Typ von Dokumenten zu verwenden, die Sie verarbeiten müssen.

Verbesserungen

Evaluierung auf Dokumentebene implementiert. Dies ist repräsentativ für die Laufzeitleistung in Ihrem RPA-Workflow.

Die Evaluierung kann auch für Datasets mit weniger Feldern als das evaluierte ML-Paket durchgeführt werden. Das erleichtert die Evaluierung von vorgefertigten vorab trainierten ML-Paketen.

Um die Auswirkungen von OCR auf die Extraktionsgenauigkeit zu bewerten, können Sie sie jetzt erneut in einer Evaluierungspipeline ausführen. Dazu muss OCR beim Erstellen eines ML-Pakets konfiguriert und die Umgebungsvariable eval.redo_ocr in der AI Center-Evaluierungspipeline auf „true“ gesetzt werden.

Das Training mit der CPU verwendet jetzt ein kleineres Modell, um die Geschwindigkeit um das 5- bis 7-Fache zu erhöhen. Sie sollten jedoch mit einer um 0–5 % niedrigeren Genauigkeit bei Verwendung des CPU rechnen.

Die Spalten „Mindestkonfidenz“ und „Direkte Bearbeitungsrate“ wurden zu den Evaluation.xlsx-Dateien hinzugefügt, die von Evaluierungspipelines produziert werden.

Das UtilityBills-ML-Paket wurde erheblich verbessert.

Verbessertes Parsen von Adressen, die 1–2 Textzeilen überspringen.

Verbesserung beim Extrahieren negativer Werte, sehr großer Werte (11 Stellen oder mehr) oder in ferner Zukunft liegender Daten.

Unterstützung für gedrehte Felder auf Belegen wurde hinzugefügt.

Verkettete Abschnitte verbessert.

Fehlerbehebungen

  • Es wurde ein Fehler behoben, bei dem keine Sonderzeichen in String-Feldern zurückgegeben wurden.
  • Es wurde ein Fehler beim Passports-ML-Paket behoben, bei dem das als Ordinalzahl geschriebene Datum (1., 2., 3., 4. usw.) nicht korrekt geparst wurde.

Bekannte Probleme (Known Issues)

Das Retraining der InvoicesJapan- und InvoicesChina-ML-Pakete mit Daten aus der Validierungsstation wird derzeit nicht unterstützt. Verwenden Sie als Problemumgehung Google Cloud Vision OCR.

Bevorstehende Verwerfungen

Alle öffentlichen Endpunkte, mit Ausnahme von UiPathDocumentOCR, FormExtractor, IntelligentFormExtractor und IntelligentKeywordClassifier, werden ab dem 1. Dezember 2021 in Regionen außerhalb von Westeuropa als veraltet eingestuft.

v21.10.5

UiPathDocumentOCR-Endpunkte

Release-Datum: 13. Dezember 2021

Veröffentlicht in UiPathDocumentOCR-Endpunkten | v21.10.5

Verbesserungen

UiPathDocumentOCR ist jetzt auch in der Region Singapur verfügbar.

v21.10.1

Datenextraktion und Endpunkte für UiPathDocumentOCR

Release-Datum: 24. September 2021

Veröffentlicht in Datenextraktion und Endpunkten für UiPathDocumentOCR | v21.10.1

Verbesserungen

Unterstützung für gedrehten Text wurde hinzugefügt, auch wenn die Drehung für jedes Wort in unterschiedlichen Winkeln stattfindet.

Unterstützung für vertikalen Text wurde hinzugefügt. Diese Verbesserung ist derzeit nur für UiPath.IntelligentOCR.Activities verfügbar, einschließlich Validierungsstation. Der Data Manager und der Machine Learning Extractor unterstützen noch keinen vertikalen Text.

Verbesserung der Genauigkeit bei verrauschten Bildern oder Fotos: z. B. Quittungen, Ausweisen oder Pässen.

v21.10

Endpunkte für FormExtractor, IntelligentFormExtractor und IntelligentKeywordClassifier

Release-Datum: 13. Dezember 2021

Veröffentlicht in Endpunkten für FormExtractor + IntelligentFormExtractor + IntelligentKeywordClassifier | v21.10

Verbesserungen

Form Extractor, Intelligent Form Extractor und Intelligent Keyword Classifier sind jetzt auch in der Region Singapur verfügbar.

v21.7

Datenextraktion und Endpunkte für die Handschrifterkennung

Release-Datum: 11. August 2021

Veröffentlicht in der Datenextraktion und Endpunkten für die Handschrifterkennung | v21.7

Verbesserungen

Möglichkeit, mehrere Threads in einem einzigen Aufruf des Modells zu bearbeiten.

Erneutes Modelltraining und einige andere Änderungen für eine bessere Modellgenauigkeit.

Fehlerbehebungen

Es wurde ein Fehler behoben, der dazu führte, dass die Kapsel neu gestartet wurde, wenn kein Arbeitsspeicher mehr übrig war.

v21.6.3

UiPathDocumentOCR in Endpunkten

Release-Datum: 9. Juni 2021

Veröffentlicht in Endpunkten für UiPathDocumentOCR | v21.6.3

Verbesserungen

Verbesserte Erkennung von einzelnen Ziffern.

Verbesserte Genauigkeit bei den Zeichen 1, I und l.

Verbesserte Erkennung von nah beieinander stehendem Text.

v21.5.5

Datenextraktion und Endpunkte

Release-Datum: 18. Juni 2021

Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.5.5

Es wurde ein Fehler behoben, der Vorhersagedifferenzen zwischen dem Data Manager und der Aktivität Digitize Document verursachte.

v21.5.3

Datenextraktion und Endpunkte

Release-Datum: 8. Juni 2021

Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.5.3

Neuigkeiten

Für schwer lesbare Bilder, wie im Falle von ID-Karten und Passports, wurden zwei neue, entsprechend vorab trainierte Out-Of-the-Box-Pakete veröffentlicht.

Verbesserungen

Erneut trainierbare Klassifizierungsfelder wurden in unsere vorab trainierten Out-Of-the-Box-Pakete integriert.

v21.4.7

Datenextraktion und Endpunkte

Release-Datum: 20. April 2021

Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.4.7

Verbesserte Datumsanalyse für ML-Pakete zur Datenextraktion.

v21.4.5

Datenextraktion und Endpunkte

Release-Datum: 15. April 2021

Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.4.5

Neuigkeiten

Aller öffentlichen Endpunkte in der Region Vereinigte Staaten bereitgestellt.

Öffentliche Endpunkte für Form Extractor, Intelligent Form Extractor und Intelligent Keyword Classifier in den Regionen Kanada und Japan bereitgestellt.

v21.4

Datenextraktion und Endpunkte für HandwritingRecognition und DocumentClassifier

Release-Datum: 9. März 2021

Veröffentlicht in ML-Paketen für Datenextraktion und Endpunkten für HandwritingRecognition, DocumentClassifier, + eigenständiger Docker für UiPathDocumentOCR | v21.4

Neuigkeiten

Handschrifterkennung mit verbesserter Erkennung durch das Nutzen von Rechtschreibkorrekturen und durch die Fähigkeit, maschinell gedruckten Text zu lesen, erreicht allgemeine Verfügbarkeit.

DocumentClassifier erreicht ebenfalls die allgemeine Verfügbarkeit.

Verbesserungen an UiPath Document OCR für:

  • Optionsfeld-/Kontrollkästchen-Erkennung
  • Genauigkeit bei Blasenformularen
  • Allgemeine Genauigkeit

v21.1.8

Datenextraktion und Endpunkte

Release-Datum: 17. Februar 2021

Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v21.1.8

Verbesserungen

Verbesserte Genauigkeit.

InvoicesIndia und InvoicesAustralia sind jetzt allgemein verfügbar.

Öffentliche Endpunkte in der Region Australien bereitgestellt.

Edition-Argument in Endpunkt-URLs nicht mehr erforderlich. Beispielsweise funktioniert https://du.uipath.com/ie/invoices sowohl für den Unternehmens- als auch für den Community-Verkehr.

v20.11.3

Datenextraktion

Veröffentlichungsdatum: 18. Dezember 2020

Veröffentlicht in den ML-Paketen für Datenextraktion | v20.11.3

Verbesserungen

Verbesserungen des CPU-Trainings machen es schneller und erfordern weniger Arbeitsspeicher.

Verbesserungen der Datumsanalyse für Nicht-US-Dokumente.

Erkennung von Kontrollkästchen bei UiPathDocumentOCR, einschließlich gedruckter oder handschriftlicher Kontrollkästchen.

v20.10.4

Datenextraktion und Endpunkte

Release-Datum: 10. November 2020

Veröffentlicht in Endpunkten und ML-Paketen für Datenextraktion | v20.10.4

Neue Funktionen und Verbesserungen

Ein neues Modell für japanische Rechnungen.

Auswertungspipelines geben nun auch Metriken für Klassifizierungsfelder zurück.

Support für Microsoft Read OCR Version 3.

Verbesserungen der Datumsformatierung/-analyse zur Erkennung der Formate Tag/Monat/Jahr im Vergleich zu Formaten mit Monat/Tag/Jahr.

Verbesserungen bei der Erkennung von Dezimal- und Tausendertrennzeichen für eine korrekte Zahlenanalyse.

Training auf CPU wird von allen Versionen von AI Fabric unterstützt.

Verbesserte Analyse von Feldern mit Inhalt des Typs id-no.

Support ausschließlich für Training-Klassifizierungsfelder (nicht für reguläre oder Spaltenfelder).

Erhöhung der maximalen Anzahl erlaubter Felder von 32 auf 40.

Konfidenzniveau-Meldungen für Spaltenfelder.

Bekannte Probleme (Known Issues)

Beim Erstellen eines UiPath.DocumentUnderstanding.ML.Activities-Pakets im AI Center darf der Paketname kein reserviertes Python-Schlüsselwort sein, wie class , break, from, finally, global, None usw. Bitte beachten Sie, dass diese Liste nicht vollständig ist, da der Paketname für class <pkg-name> und import <pkg-name> verwendet wird.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten