Document Understanding-Versionshinweise
2022.4.0
Release-Datum für Document Manager (lokal): 23. Mai 2022
Bleiben Sie auf dem Laufenden mit allen Neuigkeiten zum Document Manager, indem Sie die nächste Liste der Änderungen durchgehen, die seit dem letzten LTS-Release implementiert wurden.
Data Manager ändert seinen Namen in Document Manager.
Es ist eine neue Option verfügbar, mit der Sie einzelne Dateien endgültig löschen können. Die Option finden Sie in der Dropdownliste, die auch die Downloadoption enthält.
Sie haben jetzt die Möglichkeit, zuvor erstellte Felder umzubenennen.
Die Suche innerhalb eines Dokuments ist jetzt möglich, sodass Sie nach Wörtern in Ihrem aktuellen Dokument suchen können.
Daten, die beim Importieren eines Datasets gesammelt werden, werden jetzt in die JSON-Dateien des Subset-Felds integriert. Wenn Sie die Datei manuell ändern oder vollständig aus dem Dataset löschen, hat dies keine Auswirkungen auf das Training des Modells.
deleted
.
Die Dokumentansicht hat neue Tipps für die ersten Schritte erhalten.
EXEC sp_fulltext_service 'restart_all_fdhosts'
von einem DBA mit den entsprechenden Berechtigungen auf dem Server erfolgen.
Wenn Sie die Vorhersage-Funktion zusammen mit dem Document Manager verwenden, werden mit Tags versehene Daten, die vom Benutzer nicht manuell bearbeitet wurden, durch die vom Modell empfangenen Werte ersetzt.
Für die Dokumenttypen Training, Validierung und Auswertung gibt es jetzt aussagekräftigere Tooltips.
Das Dialogfeld zum Bearbeiten von Feldern für Spaltenfelder und reguläre Felder wurde neu strukturiert. Die Punkte Nachverarbeitung, Mehrseitig, Auswertung und Farbe sind jetzt auf der Registerkarte Erweitert. Die restlichen Optionen finden Sie auf der Registerkarte Allgemein.
Verbesserung der Geschwindigkeit beim Import für Dokument-Duplikate.
Klassifizierungsfelder werden jetzt in der Reihenfolge angezeigt, in der sie erstellt werden.
- Es wurde ein bekanntes Problem behoben, das dazu führte, dass die Suche oder das Herunterladen eines Dokuments als unzulässige Abfrage fehlschlug, wenn es im Dateinamen Zeichen enthielt, die eine URL-Codierung erfordern (
&
,,
,+
,#
,'
). - Es wurde ein Fehler behoben, der dazu führte, dass die Funktion Vorhersage bei Dokumenten mit sehr dichtem Text fehlschlug.
- Das Importlimit von 2000 Dokumenten pro Sitzung wurde entfernt. Jetzt können Sie mehr als 2000 Dokumente in einer Sitzung haben, wenn Sie das Limit von 2000 Seiten pro Import berücksichtigen.
- Es wurde ein Fehler behoben, durch den Sie beim Drücken von
ctrl
odershift
nicht mehr als 3 Kästchen auswählen konnten. - Es wurde ein Fehler behoben, der dazu führte, dass sich ein Import in der Verarbeitung aufhing und eine Zeitüberschreitung entstand, nachdem der Pods neu gestartet worden war. Der Auftrag wurde dabei nicht fortgesetzt.
- Es wurde ein Fehler behoben, der die Funktion Vorhersage daran hinderte, Daten aus dem gesamten Dokument zu extrahieren. Beachten Sie, dass das Seitenlimit von 10 bei Verwendung der Funktion zusammen mit öffentlichen Endpunkten immer noch gilt.
- Es wurde ein Fehler für Microsoft Read OCR behoben, bei dem Endpunkte, die den
*.cognitiveservices.azure.com
-Unterdomänen entsprechen, den FehlerOCR endpoint is not valid
(OCR-Endpunkt nicht gültig) ausgelöst haben. - Es wurde ein Fehler behoben, der dazu führte, dass der Dataset-Import des Document Managers bei Dokumenten mit mehr als 10 Seiten die Seiten verwechselte.
- Es wurde ein Fehler behoben, der dazu führte, dass ein leeres Dataset oder nur eine kleine Teilmenge des vollständigen Datasets heruntergeladen oder exportiert wurde, wenn die Option Alle beschriftet ausgewählt wurde.
- Die maximale Importgröße wurde von 2 GB oder 2000 Seiten auf 1 GB oder 2000 Seiten verringert.
- Das Suchen oder Herunterladen eines Dokuments mit Zeichen, die eine URL-Codierung im Dateinamen erfordern (
&
,,
,+
,#
,'
) schlägt mit dem Fehlerinvalid query
(ungültige Abfrage) fehl.
Weitere Informationen zu allen Änderungen im Document Manager finden Sie in den vorherigen Versionshinweisen.
- Einige PDF-Dateien, die Type3-Schriftarten enthalten, können zu einer hohen Speicherauslastung für den Digitalisierungsdienst führen. In diesem Fall werden Importvorgänge aus dem Document Manager herabgestuft. Die Abhilfe besteht darin, die Kubernetes-Pods mit hoher Speicherauslastung (ständig über 70 %) manuell zu löschen.