- Überblick
- Erste Schritte
- Erstellen von Modellen
- Verbrauchen von Modellen
- Modelldetails
- Public endpoints for Automation Cloud and Test Cloud
- Public endpoints for Automation Cloud and Test Cloud Public Sector
- 1040 – Dokumententyp
- 1040 Formular C – Dokumententyp
- 1040 Formular D – Dokumententyp
- 1040 Formular E – Dokumententyp
- 1040x – Dokumententyp
- 3949a – Dokumententyp
- 4506T – Dokumententyp
- 709 – Dokumententyp
- 941x – Dokumententyp
- 9465 – Dokumententyp
- ACORD125 – Dokumententyp
- ACORD126 – Dokumententyp
- ACORD131 – Dokumententyp
- ACORD140 – Dokumententyp
- ACORD25 – Dokumententyp
- Kontoauszüge – Dokumententyp
- Frachtbrief – Dokumententyp
- Gründungsurkunde – Dokumententyp
- Ursprungszeugnis – Dokumententyp
- Überprüfungen – Dokumententyp
- Children Product Certificate – Dokumententyp
- CMS 1500 – Dokumententyp
- EU-Konformitätserklärung – Dokumententyp
- Finanzberichte – Dokumententyp
- FM1003 – Dokumententyp
- I9 – Dokumententyp
- Ausweise – Dokumententyp
- Rechnungen – Dokumententyp
- Rechnungen2 – Dokumententyp
- Rechnungen Australien – Dokumententyp
- Rechnungen China – Dokumententyp
- Rechnungen Hebräisch – Dokumententyp
- Rechnungen Indien – Dokumententyp
- Rechnungen Japan – Dokumententyp
- Rechnungen Versand – Dokumententyp
- Packlisten – Dokumententyp
- Gehaltsabrechnungen – Dokumententyp
- Reisepässe – Dokumententyp
- Bestellungen – Dokumententyp
- Zahlungsbelege – Dokumententyp
- Belege2 – Dokumententyp
- Zahlungsbelege Japan – Dokumententyp
- Zahlungsavis – Dokumententyp
- UB04 – Dokumententyp
- Angaben zum Abschluss von Hypotheken in den USA – Dokumententyp
- Betriebskostenabrechnungen – Dokumententyp
- Fahrzeugbrief – Dokumententyp
- W2 – Dokumententyp
- W9 – Dokumententyp
- Unterstützte Sprachen
- Insights-Dashboards
- Daten und Sicherheit
- Protokollierung
- Lizenzierung
- Anleitungen zu …
- Fehlersuche und ‑behebung

Document Understanding-Benutzerhandbuch.
Schlüsselkonzepte
Familiarize yourself with the core concepts around UiPath® Document UnderstandingTM.
Aktives Lernen
Active learning is our modern approach to creating models for Document UnderstandingTM.
Aktives Lernen bietet eine interaktive Erfahrung, bei der der Lernalgorithmus den Benutzer abfragen kann, um Daten mit dem gewünschten Output zu beschriften. Dieser Prozess hilft, den Zeit- und Datenaufwand für das Training eines Machine-Learning-Modells um bis zu 80 % zu reduzieren. KI wird verwendet, um den Prozess zu steuern, einschließlich der automatischen Anmerkung, die in der Regel die zeitaufwändigste Aufgabe ist. Das Modell enthält auch Expertenempfehlungen zur Verbesserung der Genauigkeit mithilfe der informativen Datasets.
Figure 1. How does Active Learning work 
Mit aktivem Lernen können Sie Ihre Automatisierungen auch durch analytische Funktionen überwachen.
Dokumenttypen
Ein Dokumenttyp bezieht sich auf die Klassifizierung oder Kategorisierung eines Dokuments basierend auf seinem Inhalt, Format, Zweck oder anderen Unterscheidungsmerkmalen. Einige Beispiele können Rechnungen, Belege, Verträge, Berichte, Gesundheitsakten, Rechtsdokumente usw. sein.
Einige Dokumenttypen haben einen stark strukturierten Inhalt, während andere hauptsächlich aus freiem Text bestehen. Auf dieser Grundlage werden Dokumente in drei Hauptformate unterteilt:
- Structured: documents designed to collect information in a specific format. For example, surveys, tax forms, passports, or licenses are all structured documents.
- Semi-structured: documents that do not follow a strict format and are not bound to specified data fields. Semi-structured documents include invoices, receipts, uility bills, bank statements, and others.
- Unstructured: documents that do not follow a specific or organized model. For example, contracts, leases, or news articles are all unstructured documents.
To learn more about document types, check the Document types section.
Generative KI
Feature availability depends on the cloud platform that you use. For details, refer to the Choosing the deployment type page.
Generative KI ist eine Form der KI-Technologie, die Machine-Learning-Modelle (ML) nutzt, um neue Inhalte, Daten oder Informationen zu erstellen und zu generieren.
Ausschlaggebend für die meisten generativen KI-Aufgaben sind Large Language Models (LLMs). Dabei handelt es sich um ML-Modelle, die mit einer großen Menge von Textdaten trainiert werden, um Text zu generieren, der klingt, als wäre er von einem Menschen verfasst worden. LLMs können auch Eingabeaufforderungen verstehen und darauf reagieren, indem sie Sätze oder Absätze auf eine menschliche Art vervollständigen.
In the context of Document UnderstandingTM, generative AI helps with:
- Information extraction: generative AI models can be used to extract specific information from unstructured or semi-structured documents. For example, it can go through an invoice to retrieve details like date, billed amount, and company name.
- Document classification: ML models are used to auto-categorize documents based on their content. These algorithms 'read' the document, understand its context, and can classify it into predefined categories.
- Data validation: generative AI can check the output of the ML model whenever the confidence score is too low. If both the ML models (generative and specialized) have the same output, a human can skip validating that document. This can improve time spending validating documents, as well as improving the performing of your models by checking the output with the help of a second generative model.
ML-Modelle
ML-Modelle sind wie virtuelle Assistenten, die darauf trainiert wurden, aus Daten zu lernen und Vorhersagen oder Entscheidungen zu treffen. Bei diesen Modellen handelt es sich im Wesentlichen um Algorithmen, die lernen, Muster basierend auf historischen Daten zu erkennen. Je mehr Daten ihnen zur Verfügung stehen, desto besser können sie ihre Vorhersagen oder Entscheidungen im Laufe der Zeit verbessern.
You can find several out of the box ML models in Document UnderstandingTM. These models help you classify and extract any commonly occurring data points from semi-structured or unstructured documents, with no setup required.
Check the Pre-trained document types page for the full list of pre-trained models and their fields.
ML-Modelle können in einer Vielzahl von Sprachen trainiert werden, sofern die OCR das Dokument und den Text mit hoher Zuverlässigkeit erkennt.
Optical Character Recognition (OCR)
Optical Character Recognition (OCR) ist eine spezielle Technologie, die verwendet wird, um verschiedene Arten von Dokumenten, z. B. gescannte Papierdokumente, PDF-Dateien oder von einer Digitalkamera aufgenommene Bilder, in bearbeitbare und durchsuchbare Daten umzuwandeln.
Die Genauigkeit einer OCR-Engine hängt meistens von der Qualität des Originaldokuments ab. Klarer, gut formatierter Text in einer lesbaren Schriftart führt in der Regel zu der besten Ausgabe.
For more information on the languages supported by the OCR engines options provided by UiPath®, check the OCR Supported Languages page.