- Überblick
- Erste Schritte
- Erstellen von Modellen
- Verbrauchen von Modellen
- ML-Pakete
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- Receipts Japan – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Öffentliche Endpunkte
- Unterstützte Sprachen
- Insights-Dashboards
- Daten und Sicherheit
- Lizenzierung
- Anleitungen zu …
Document Understanding-Benutzerhandbuch für moderne Projekte
Generative Funktionen
Generative KI ist eine Form der KI-Technologie, die Machine-Learning-Modelle (ML) nutzt, um neue Inhalte, Daten oder Informationen zu erstellen und zu generieren.
Ausschlaggebend für die meisten generativen KI-Aufgaben sind Large Language Models (LLMs). Dabei handelt es sich um ML-Modelle, die mit einer großen Menge von Textdaten trainiert werden, um Text zu generieren, der klingt, als wäre er von einem Menschen verfasst worden. LLMs können auch Eingabeaufforderungen verstehen und darauf reagieren, indem sie Sätze oder Absätze auf eine menschliche Art vervollständigen.
Diese generativen Modelle werden hauptsächlich während des automatischen Anmerkungsprozesses von Dokumenten im Schritt Erstellen angewendet, beschleunigen das Taxonomiedesign und helfen dabei, Modelle effizient zu trainieren.
Die Vorbemerkung in Document Understanding erfolgt mithilfe einer Kombination aus generativen und spezialisierten Modellen, die auf dem Schema des Dokumenttyps basieren. Das Schema definiert eindeutig die Felder, die Sie aus einem bestimmten Dokumenttyp extrahieren möchten.
Um ein tieferes Verständnis dafür zu erhalten, wie generative Anmerkung funktioniert und wie Sie sie effizient in Ihren Projekten einsetzen können, sehen Sie sich die Seite Hinzufügen von Anmerkungen zu Dokumenten an.
Die generative Extraktion ist eine entscheidende Funktion in Document UnderstandingTM, die das Potenzial von generativen KI-Modellen nutzt. Diese Modelle werden mithilfe von Aktivitäten konfiguriert und hauptsächlich zur Laufzeit für die Datenextraktion verwendet.
Die generative Extraktion kann bestimmte Informationen aus unstrukturierten oder halbstrukturierten Dokumenten entschlüsseln und extrahieren. Sie kann beispielsweise eine Rechnung überprüfen und Details wie Datum, Rechnungsbetrag und Firmenname genau abrufen. Dies ermöglicht eine schnelle, effiziente und exakte Erfassung von Informationen aus verschiedenen Dokumenttypen.
- Document Understanding-Aktivitätspaket:
- Extract Document Data, Parameter Aufforderung nach Auswahl des generativen Extraktors.
- Document Understanding ML-Aktivitätspaket:
- IntelligentOCR-Aktivitätspaket:
- Data Extraction Scope, Parameter AutomatischeValidierungAnwenden.
Sie können auch Document Understanding-APIs verwenden, um generative Extraktionsfunktionen zu nutzen.
Die generative Klassifizierung verwendet KI-Modelle, um Dokumente sofort nach dem Hochladen automatisch zu klassifizieren.
Dieser automatische Klassifizierungsprozess nutzt ML-Modelle, um den Inhalt eines Dokuments zu „lesen“, seinen Kontext zu verstehen und es anschließend in vordefinierte Kategorien zu klassifizieren. Auf diese Weise kann das System mehrere Dokumenttypen effizient verarbeiten und organisieren.
Durch die genaue Klassifizierung von unstrukturierten oder halbstrukturierten Dokumenten verbessert die Generative Klassifizierung den Workflow bei der Dokumentverarbeitung, spart Zeit und verbessert die gesamte Dokumentenverwaltung.
- Document Understanding-Aktivitätspaket:
- Document Understanding ML-Aktivitätspaket:
Sie können auch Document Understanding-APIs verwenden, um generative Klassifizierungsfunktionen zu nutzen.
Die generative Validierung ist eine Besonderheit in Document Understanding, die während des Validierungsprozesses eine wichtige Rolle spielt. Diese Funktion wird hauptsächlich nach dem Extraktionsschritt verwendet, um die Konfidenzbewertung für die Extraktion mit speziellen Modellen zu validieren.
Wenn der Konfidenzwert eines ML-Modells für eine Dokumentextraktion niedrig ist, wird die generative Validierung verwendet, um die Ausgabe zu überprüfen. Bei diesem Validierungsprozess arbeiten sowohl das spezialisierte als auch das generative ML-Modell zusammen, um die Genauigkeit sicherzustellen.
Wenn beide Modelle die gleiche Ausgabe liefern, kann die menschliche Validierung umgangen werden, was zu einer erheblichen Verbesserung der Zeiteffizienz der Validierung führt. Dieser Prozess spart nicht nur wertvolle Zeit bei der Dokumentvalidierung, sondern verbessert auch die Leistung Ihrer Modelle, indem ein sekundäres generatives Modell verwendet wird, um die Ausgabe zu verifizieren, wodurch eine höhere Genauigkeit gewährleistet wird.
- Document Understanding-Aktivitätspaket:
- Extract Document Data, Parameter Automatische Validierung
- IntelligentOCR-Aktivitätspaket:
- Data Extraction Scope, Parameter AutomatischeValidierungAnwenden und KonfidenzschwellenwertFürAutomatischeValidierung
Sie können auch Document Understanding-APIs verwenden, um generative Validierungsfunktionen zu nutzen.