document-understanding
latest
false
Wichtig :
Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.
UiPath logo, featuring letters U and I in white

Document Understanding-Benutzerhandbuch für moderne Projekte

Letzte Aktualisierung 4. Apr. 2025

Generative Funktionen

Generative KI ist eine Form der KI-Technologie, die Machine-Learning-Modelle (ML) nutzt, um neue Inhalte, Daten oder Informationen zu erstellen und zu generieren.

Ausschlaggebend für die meisten generativen KI-Aufgaben sind Large Language Models (LLMs). Dabei handelt es sich um ML-Modelle, die mit einer großen Menge von Textdaten trainiert werden, um Text zu generieren, der klingt, als wäre er von einem Menschen verfasst worden. LLMs können auch Eingabeaufforderungen verstehen und darauf reagieren, indem sie Sätze oder Absätze auf eine menschliche Art vervollständigen.

Generative Anmerkung

Diese generativen Modelle werden hauptsächlich während des automatischen Anmerkungsprozesses von Dokumenten im Schritt Erstellen angewendet, beschleunigen das Taxonomiedesign und helfen dabei, Modelle effizient zu trainieren.

Die Vorbemerkung in Document Understanding erfolgt mithilfe einer Kombination aus generativen und spezialisierten Modellen, die auf dem Schema des Dokumenttyps basieren. Das Schema definiert eindeutig die Felder, die Sie aus einem bestimmten Dokumenttyp extrahieren möchten.

Um ein tieferes Verständnis dafür zu erhalten, wie generative Anmerkung funktioniert und wie Sie sie effizient in Ihren Projekten einsetzen können, sehen Sie sich die Seite Hinzufügen von Anmerkungen zu Dokumenten an.

Generative Extraktion

Die generative Extraktion ist eine entscheidende Funktion in Document UnderstandingTM, die das Potenzial von generativen KI-Modellen nutzt. Diese Modelle werden mithilfe von Aktivitäten konfiguriert und hauptsächlich zur Laufzeit für die Datenextraktion verwendet.

Die generative Extraktion kann bestimmte Informationen aus unstrukturierten oder halbstrukturierten Dokumenten entschlüsseln und extrahieren. Sie kann beispielsweise eine Rechnung überprüfen und Details wie Datum, Rechnungsbetrag und Firmenname genau abrufen. Dies ermöglicht eine schnelle, effiziente und exakte Erfassung von Informationen aus verschiedenen Dokumenttypen.

Zugehörige Aktivitäten

Tipp: Weitere Informationen zur effizienteren Nutzung von Aktivitäten der generativen Extraktion finden Sie auf der Seite Generativer Extraktor – Bewährte Vorgehensweisen.
Es gibt mehrere Aktivitäten, die Ihnen helfen, von den generativen Extraktionsfunktionen zu profitieren:

Sie können auch Document Understanding-APIs verwenden, um generative Extraktionsfunktionen zu nutzen.

Unterstützte Modelle

The generative extractors available under the Generative Predefined project can be used for the documents described in the following table:
Note: Long Document Complex Layout and Short Document Complex Layout extractors are not currently available in Automation CloudTM for Public Sector environments (FedRamp).
Table 1. Supported scenarios for generative extractors
ExtraktorRecommended scenarioAnbieterRegion availabilityMulti-modal support1
Extraktor für langes Dokument – einfaches LayoutRecommended for long form documents with mostly text and headings. For example, you can use the Long Document Simple Layout Extractor on documents such as lease agreements, master service agreements, or other similar documents. Azure OpenAIUnited Kingdom, Australia, India, CanadaNicht verfügbar
Extraktor für komplexes Layout für lange DokumenteRecommended for long-form documents with complex layouts, such as images, handwritten text, form elements, or distinctive layouts such as floating callout boxes. You can use this extractor on long-form documents like insurance policies, which usually have complex layouts. Azure OpenAIUnited States, European Union, Japan, Singaporeavailable
Extraktor für komplexes Layout für kurzes DokumentRecommended for shorter documents (of maximum 20 pages) featuring images, handwritten text, form elements, or complex layouts, such as floating callout boxes. You can use this extractor on documents like government IDs or healthcare intake forms that typically have shorter but more complex layouts. Azure OpenAIUnited States, European Union, Japan, Singaporeavailable

1 Multi-modal support refers to the ability to extract different types of data inputs, such as text, images, handwritten text, etc.

Generative Klassifizierung

Die generative Klassifizierung verwendet KI-Modelle, um Dokumente sofort nach dem Hochladen automatisch zu klassifizieren.

Dieser automatische Klassifizierungsprozess nutzt ML-Modelle, um den Inhalt eines Dokuments zu „lesen“, seinen Kontext zu verstehen und es anschließend in vordefinierte Kategorien zu klassifizieren. Auf diese Weise kann das System mehrere Dokumenttypen effizient verarbeiten und organisieren.

Durch die genaue Klassifizierung von unstrukturierten oder halbstrukturierten Dokumenten verbessert die Generative Klassifizierung den Workflow bei der Dokumentverarbeitung, spart Zeit und verbessert die gesamte Dokumentenverwaltung.

Zugehörige Aktivitäten

Tipp: Weitere Informationen zur effizienteren Nutzung von Aktivitäten der generativen Klassifizierung finden Sie auf der Seite Generativer Klassifizierer – Bewährte Vorgehensweisen.
Es gibt mehrere Aktivitäten, die Ihnen helfen, von den generativen Klassifizierungsfunktionen zu profitieren:

Sie können auch Document Understanding-APIs verwenden, um generative Klassifizierungsfunktionen zu nutzen.

Generative Validierung

Die generative Validierung ist eine Besonderheit in Document Understanding, die während des Validierungsprozesses eine wichtige Rolle spielt. Diese Funktion wird hauptsächlich nach dem Extraktionsschritt verwendet, um die Konfidenzbewertung für die Extraktion mit speziellen Modellen zu validieren.

Wenn der Konfidenzwert eines ML-Modells für eine Dokumentextraktion niedrig ist, wird die generative Validierung verwendet, um die Ausgabe zu überprüfen. Bei diesem Validierungsprozess arbeiten sowohl das spezialisierte als auch das generative ML-Modell zusammen, um die Genauigkeit sicherzustellen.

Wenn beide Modelle die gleiche Ausgabe liefern, kann die menschliche Validierung umgangen werden, was zu einer erheblichen Verbesserung der Zeiteffizienz der Validierung führt. Dieser Prozess spart nicht nur wertvolle Zeit bei der Dokumentvalidierung, sondern verbessert auch die Leistung Ihrer Modelle, indem ein sekundäres generatives Modell verwendet wird, um die Ausgabe zu verifizieren, wodurch eine höhere Genauigkeit gewährleistet wird.

Zugehörige Aktivitäten

Es gibt mehrere Aktivitäten, die Ihnen helfen, von den generativen Validierungsfunktionen zu profitieren:
  • Document Understanding-Aktivitätspaket:
  • IntelligentOCR-Aktivitätspaket:
    • Data Extraction Scope, Parameter AutomatischeValidierungAnwenden und KonfidenzschwellenwertFürAutomatischeValidierung

Sie können auch Document Understanding-APIs verwenden, um generative Validierungsfunktionen zu nutzen.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White