Document Understanding – Grundlegende Funktionen

document-understanding

latest

false

Document Understanding-Benutzerhandbuch.

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Grundlegende Funktionen

Vier grundlegende Funktionen, die zur Automatisierung der Dokumentverarbeitung in Document Understanding erforderlich sind: Digitalisierung, Klassifizierung, Extraktion und Validierung.

Um die Dokumentverarbeitung zu automatisieren, sind vier grundlegende Funktionen erforderlich: Digitalisierung, Klassifizierung, Extraktion und Validierung.

Abbildung 1. Grundlegende Funktionen

Digitalisierung

Bei der Digitalisierung wird ein physisches Dokument in maschinenlesbaren Text umgewandelt, der dann digital verarbeitet werden kann. Obwohl Optical Character Recognition (OCR) ein wichtiger Bestandteil der Digitalisierung ist, ist der Digitalisierungsprozess komplexer und umfasst verschiedene Schritte, einschließlich OCR.

Bei PDF-Dokumenten kann der Digitalisierungsalgorithmus beispielsweise zwischen gescannten und nativen PDF-Dokumenten oder hybriden PDF-Dokumenten unterscheiden, die gescannte Bilder und nativen Text enthalten. Der größte Teil des Texts kann direkt aus einem nativen PDF-Dokument extrahiert werden, aber in einigen Fällen müssen einige Logos möglicherweise mit OCR gelesen werden. Der Digitalisierungsprozess kann alle diese Situationen bewältigen, um maximale Genauigkeit bei der Texterkennung sicherzustellen und gleichzeitig schnell und effizient zu arbeiten.

Sie können die in Ihrem Projekt verwendete OCR in den Projekteinstellungen ändern. Weitere Informationen finden Sie auf der Seite Konfigurieren der Projekteinstellungen. Sie können die verfügbaren OCR-Module und die unterstützten Sprachen im Abschnitt Unterstützte Sprachen des Benutzerhandbuchs überprüfen.

Weitere Informationen zu den unterstützten Dateien, Bildgrößenbeschränkungen und weiteren Spezifikationen finden Sie auf der Seite Bekannte Einschränkungen.

Klassifizierung und Aufteilung

Hinweis:

Die Verfügbarkeit von Funktionen hängt von der Cloud-Plattform ab, die Sie verwenden. Weitere Informationen finden Sie auf der Seite Auswählen des Bereitstellungstyps.

In den meisten Anwendungsfällen müssen Dokumente in logische Kategorien sortiert werden, damit unterschiedliche Verarbeitungsmethoden auf sie angewendet werden können. Das Sortieren von Dokumenten umfasst zwei Aufgaben:

Aufteilung
Klassifizierung

Je nach Komplexität des Problems müssen Sie möglicherweise Dokumente aufteilen, klassifizieren oder beides.

Hinweis:

Dokumentaufteilung ist nur bei Verwendung mit IntelligentOCR verfügbar.

Das Ziel der Aufteilung besteht darin, die fortlaufenden Seiten eines Dokuments zu scannen und sie in logische Unterdokumente aufzuteilen. Ein Algorithmus zur Dokumentaufteilung kann Dokumenttyp-agnostisch sein, d. h. er kann jedes Dokument aufteilen, unabhängig davon, ob es sich um eine Rechnung, einen Vertrag oder ein Antragsformular handelt.

Abbildung 2. Dokumentaufteilung

Das Ziel einer Klassifizierung ist es, ein Dokument zu scannen und zu entscheiden, zu welchem Dokumenttyp es gehört. Es ist wichtig, den Dokumenttyp zu kennen, da unterschiedliche Dokumenttypen unterschiedliche Verarbeitungstechniken erfordern. Beispielsweise muss eine Rechnung von einem Rechnungsextraktionsmodell verarbeitet werden, um sicherzustellen, dass alle relevanten Felder extrahiert werden.

Abbildung 3. Dokumentklassifizierer

Extraktion

Bei der Datenextraktion werden nur die relevanten Informationen aus einem Dokument ausgewählt und abgerufen. Das Extrahieren bestimmter Daten aus einem langen Dokument mithilfe der String-Manipulation kann schwierig sein. Document Understanding^TM bietet jedoch verschiedene Extraktionsmethoden für unterschiedliche Dokumenttypen und -formate. Beispielsweise möchten wir nur die Felder „Anbietername“, „Abrechnungsname“, „Fälligkeitsdatum“ und „Gesamtbetrag“ aus einer Rechnung extrahieren.

Abbildung 4. Datenextraktion

Validierung

Bei der Klassifizierung und Extraktion verwenden Softwareroboter das Konzept der Konfidenz, die den Grad der Sicherheit misst, dass eine bestimmte Aufgabe gut ausgeführt wurde. Die Aufgabe kann entweder das Erkennen eines Dokumenttyps, das Identifizieren eines Felds oder das Lesen der darin enthaltenen Daten sein. In diesen Fällen können Sie mit dem Document Understanding-Framework einen menschlichen Benutzer damit beauftragen, die Roboterausgabe zu überprüfen und zu validieren. Im besten Fall wird die menschliche Eingabe verwendet, um die Genauigkeit des Roboters durch Machine Learning zu trainieren.

Auf dieser Seite

Digitalisierung
Klassifizierung und Aufteilung
Extraktion
Validierung

War diese Seite hilfreich?

Vorherige (previous)Dokumenttypen

WeiterSchlüsselkonzepte

Digitalisierung​

Klassifizierung und Aufteilung​

Extraktion​

Validierung​

War diese Seite hilfreich?

Digitalisierung

Klassifizierung und Aufteilung

Extraktion

Validierung