document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white
Document Understanding Modern Projects User Guide
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 11. Nov. 2024

Schlüsselkonzepte

Familiarize yourself with the core concepts around UiPath® Document UnderstandingTM.

Aktives Lernen

Active learning is our modern approach to creating models for Document UnderstandingTM.

Aktives Lernen bietet eine interaktive Erfahrung, bei der der Lernalgorithmus den Benutzer abfragen kann, um Daten mit dem gewünschten Output zu beschriften. Dieser Prozess hilft, den Zeit- und Datenaufwand für das Training eines Machine-Learning-Modells um bis zu 80 % zu reduzieren. KI wird verwendet, um den Prozess zu steuern, einschließlich der automatischen Anmerkung, die in der Regel die zeitaufwändigste Aufgabe ist. Das Modell enthält auch Expertenempfehlungen zur Verbesserung der Genauigkeit mithilfe der informativen Datasets.

Abbildung 1. Funktionsweise von aktivem Lernen

Mit aktivem Lernen können Sie Ihre Automatisierungen auch durch analytische Funktionen überwachen.

Dokumenttypen

Ein Dokumenttyp bezieht sich auf die Klassifizierung oder Kategorisierung eines Dokuments basierend auf seinem Inhalt, Format, Zweck oder anderen Unterscheidungsmerkmalen. Einige Beispiele können Rechnungen, Belege, Verträge, Berichte, Gesundheitsakten, Rechtsdokumente usw. sein.

Einige Dokumenttypen haben einen stark strukturierten Inhalt, während andere hauptsächlich aus freiem Text bestehen. Auf dieser Grundlage werden Dokumente in drei Hauptformate unterteilt:
  • Strukturiert: Dokumente zum Sammeln von Informationen in einem bestimmten Format. Beispiele sind Umfragen, Steuerformulare, Pässe oder Lizenzen.
  • Halbstrukturiert: Dokumente, die keinem strikten Format folgen und nicht an bestimmte Datenfelder gebunden sind. Zu den halbstrukturierten Dokumenten gehören Rechnungen, Belege, Betriebskostenabrechnungen, Kontoauszüge und andere.
  • Unstrukturiert: Dokumente, die keinem bestimmten oder organisierten Modell folgen. Beispiele sind Verträge, Mietverträge oder Nachrichtenartikel.

Weitere Informationen zu Dokumenttypen finden Sie im Abschnitt Dokumenttypen.

ML-Modelle

ML-Modelle sind wie virtuelle Assistenten, die darauf trainiert wurden, aus Daten zu lernen und Vorhersagen oder Entscheidungen zu treffen. Bei diesen Modellen handelt es sich im Wesentlichen um Algorithmen, die lernen, Muster basierend auf historischen Daten zu erkennen. Je mehr Daten ihnen zur Verfügung stehen, desto besser können sie ihre Vorhersagen oder Entscheidungen im Laufe der Zeit verbessern.

You can find several out of the box ML models in Document UnderstandingTM. These models help you classify and extract any commonly occurring data points from semi-structured or unstructured documents, with no setup required.

Die vollständige Liste der vortrainierten Modelle und deren Felder finden Sie auf der Seite Vorgefertigte Modelle.

ML-Modelle können in einer Vielzahl von Sprachen trainiert werden, sofern die OCR das Dokument und den Text mit hoher Zuverlässigkeit erkennt.

Optical Character Recognition (OCR)

Optical Character Recognition (OCR) ist eine spezielle Technologie, die verwendet wird, um verschiedene Arten von Dokumenten, z. B. gescannte Papierdokumente, PDF-Dateien oder von einer Digitalkamera aufgenommene Bilder, in bearbeitbare und durchsuchbare Daten umzuwandeln.

Die Genauigkeit einer OCR-Engine hängt meistens von der Qualität des Originaldokuments ab. Klarer, gut formatierter Text in einer lesbaren Schriftart führt in der Regel zu der besten Ausgabe.

For more information on the languages supported by the OCR engines options provided by UiPath®, check the OCR Supported Languages page.

  • Aktives Lernen
  • Dokumenttypen
  • ML-Modelle
  • Optical Character Recognition (OCR)

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten