Document Understanding

document-understanding

2022.4

true

Document Understanding-Versionshinweise

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

2022.4.0

Release-Datum für Document Manager (lokal): 23. Mai 2022

Bleiben Sie auf dem Laufenden mit allen Neuigkeiten zum Document Manager, indem Sie die nächste Liste der Änderungen durchgehen, die seit dem letzten LTS-Release implementiert wurden.

Neuigkeiten

Data Manager ändert seinen Namen in Document Manager.

Es ist eine neue Option verfügbar, mit der Sie einzelne Dateien endgültig löschen können. Die Option finden Sie in der Dropdownliste, die auch die Downloadoption enthält.

Sie haben jetzt die Möglichkeit, zuvor erstellte Felder umzubenennen.

Die Suche innerhalb eines Dokuments ist jetzt möglich, sodass Sie nach Wörtern in Ihrem aktuellen Dokument suchen können.

Daten, die beim Importieren eines Datasets gesammelt werden, werden jetzt in die JSON-Dateien des Subset-Felds integriert. Wenn Sie die Datei manuell ändern oder vollständig aus dem Dataset löschen, hat dies keine Auswirkungen auf das Training des Modells.

Gelöschte Dokumente werden jetzt von der Deduplizierung ausgeschlossen, d. h. Sie können dasselbe Dokument jetzt zweimal importieren. Gelöschte Dokumente werden auch von der Suche oder Filterung ausgeschlossen, sodass nur die nicht gelöschten Dokumente durchsucht werden, außer Sie verwenden das Schlüsselwort deleted.

Die Dokumentansicht hat neue Tipps für die ersten Schritte erhalten.

Verbesserungen

Eine lokale Bereitstellung, die eine SQL Server-Installation mit deaktivierter Option zur Volltextsuche verwendet, erfordert zum Zeitpunkt der Installation einen Neustart des Diensts der Volltextsuche, um ihn zu aktivieren. Dies kann durch Ausführen des Befehls EXEC sp_fulltext_service 'restart_all_fdhosts' von einem DBA mit den entsprechenden Berechtigungen auf dem Server erfolgen.

Wenn Sie die Vorhersage-Funktion zusammen mit dem Document Manager verwenden, werden mit Tags versehene Daten, die vom Benutzer nicht manuell bearbeitet wurden, durch die vom Modell empfangenen Werte ersetzt.

Für die Dokumenttypen Training, Validierung und Auswertung gibt es jetzt aussagekräftigere Tooltips.

Das Dialogfeld zum Bearbeiten von Feldern für Spaltenfelder und reguläre Felder wurde neu strukturiert. Die Punkte Nachverarbeitung, Mehrseitig, Auswertung und Farbe sind jetzt auf der Registerkarte Erweitert. Die restlichen Optionen finden Sie auf der Registerkarte Allgemein.

Verbesserung der Geschwindigkeit beim Import für Dokument-Duplikate.

Klassifizierungsfelder werden jetzt in der Reihenfolge angezeigt, in der sie erstellt werden.

Fehlerkorrekturen (Bug Fixes)

Es wurde ein bekanntes Problem behoben, das dazu führte, dass die Suche oder das Herunterladen eines Dokuments als unzulässige Abfrage fehlschlug, wenn es im Dateinamen Zeichen enthielt, die eine URL-Codierung erfordern (&, ,, +, #, ').
Es wurde ein Fehler behoben, der dazu führte, dass die Funktion Vorhersage bei Dokumenten mit sehr dichtem Text fehlschlug.
Das Importlimit von 2000 Dokumenten pro Sitzung wurde entfernt. Jetzt können Sie mehr als 2000 Dokumente in einer Sitzung haben, wenn Sie das Limit von 2000 Seiten pro Import berücksichtigen.
Es wurde ein Fehler behoben, durch den Sie beim Drücken von ctrl oder shift nicht mehr als 3 Kästchen auswählen konnten.
Es wurde ein Fehler behoben, der dazu führte, dass sich ein Import in der Verarbeitung aufhing und eine Zeitüberschreitung entstand, nachdem der Pods neu gestartet worden war. Der Auftrag wurde dabei nicht fortgesetzt.
Es wurde ein Fehler behoben, der die Funktion Vorhersage daran hinderte, Daten aus dem gesamten Dokument zu extrahieren. Beachten Sie, dass das Seitenlimit von 10 bei Verwendung der Funktion zusammen mit öffentlichen Endpunkten immer noch gilt.
Es wurde ein Fehler für Microsoft Read OCR behoben, bei dem Endpunkte, die den *.cognitiveservices.azure.com-Unterdomänen entsprechen, den Fehler OCR endpoint is not valid (OCR-Endpunkt nicht gültig) ausgelöst haben.
Es wurde ein Fehler behoben, der dazu führte, dass der Dataset-Import des Document Managers bei Dokumenten mit mehr als 10 Seiten die Seiten verwechselte.
Es wurde ein Fehler behoben, der dazu führte, dass ein leeres Dataset oder nur eine kleine Teilmenge des vollständigen Datasets heruntergeladen oder exportiert wurde, wenn die Option Alle beschriftet ausgewählt wurde.

Bekannte Probleme (Known Issues)

Die maximale Importgröße wurde von 2 GB oder 2000 Seiten auf 1 GB oder 2000 Seiten verringert.
Das Suchen oder Herunterladen eines Dokuments mit Zeichen, die eine URL-Codierung im Dateinamen erfordern (&, ,, +, #, ') schlägt mit dem Fehler invalid query (ungültige Abfrage) fehl.

Weitere Informationen zu allen Änderungen im Document Manager finden Sie in den vorherigen Versionshinweisen.

3. Juni 2022

Bekannte Probleme (Known Issues)

Einige PDF-Dateien, die Type3-Schriftarten enthalten, können zu einer hohen Speicherauslastung für den Digitalisierungsdienst führen. In diesem Fall werden Importvorgänge aus dem Document Manager herabgestuft. Die Abhilfe besteht darin, die Kubernetes-Pods mit hoher Speicherauslastung (ständig über 70 %) manuell zu löschen.

Auf dieser Seite

Neuigkeiten
Verbesserungen
Fehlerkorrekturen (Bug Fixes)
Bekannte Probleme (Known Issues)
3. Juni 2022
Bekannte Probleme (Known Issues)

War diese Seite hilfreich?

Vorherige (previous)2022.4.1