- Überblick
- Erstellen von Modellen
- Verbrauchen von Modellen
- ML-Pakete
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 9465 – ML-Paket
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Öffentliche Endpunkte
- Unterstützte Sprachen
- Daten und Sicherheit
- Lizenzierungs- und Gebührenlogik
- Anleitungen zu …
Document Understanding-Benutzerhandbuch.
Schlüsselkonzepte
Machen Sie sich mit den Kernkonzepten rund um UiPath® Document UnderstandingTM vertraut.
Aktives Lernen ist unser moderner Ansatz zum Erstellen von Modellen für Document UnderstandingTM.
Aktives Lernen bietet eine interaktive Erfahrung, bei der der Lernalgorithmus den Benutzer abfragen kann, um Daten mit dem gewünschten Output zu beschriften. Dieser Prozess hilft, den Zeit- und Datenaufwand für das Training eines Machine-Learning-Modells um bis zu 80 % zu reduzieren. KI wird verwendet, um den Prozess zu steuern, einschließlich der automatischen Anmerkung, die in der Regel die zeitaufwändigste Aufgabe ist. Das Modell enthält auch Expertenempfehlungen zur Verbesserung der Genauigkeit mithilfe der informativen Datasets.
Mit aktivem Lernen können Sie Ihre Automatisierungen auch durch analytische Funktionen überwachen.
Ein Dokumenttyp bezieht sich auf die Klassifizierung oder Kategorisierung eines Dokuments basierend auf seinem Inhalt, Format, Zweck oder anderen Unterscheidungsmerkmalen. Einige Beispiele können Rechnungen, Belege, Verträge, Berichte, Gesundheitsakten, Rechtsdokumente usw. sein.
- Strukturiert: Dokumente zum Sammeln von Informationen in einem bestimmten Format. Beispiele sind Umfragen, Steuerformulare, Pässe oder Lizenzen.
- Halbstrukturiert: Dokumente, die keinem strikten Format folgen und nicht an bestimmte Datenfelder gebunden sind. Zu den halbstrukturierten Dokumenten gehören Rechnungen, Belege, Betriebskostenabrechnungen, Kontoauszüge und andere.
- Unstrukturiert: Dokumente, die keinem bestimmten oder organisierten Modell folgen. Beispiele sind Verträge, Mietverträge oder Nachrichtenartikel.
Weitere Informationen zu Dokumenttypen finden Sie im Abschnitt Dokumenttypen.
Diese Funktion ist derzeit Teil eines Prüfungsprozesses und gilt erst nach Abschluss der Überprüfung als Teil der FedRAMP-Autorisierung. Hier finden Sie die vollständige Liste der Funktionen, die derzeit überprüft werden.
Generative KI ist eine Form der KI-Technologie, die Machine-Learning-Modelle (ML) nutzt, um neue Inhalte, Daten oder Informationen zu erstellen und zu generieren.
Ausschlaggebend für die meisten generativen KI-Aufgaben sind Large Language Models (LLMs). Dabei handelt es sich um ML-Modelle, die mit einer großen Menge von Textdaten trainiert werden, um Text zu generieren, der klingt, als wäre er von einem Menschen verfasst worden. LLMs können auch Eingabeaufforderungen verstehen und darauf reagieren, indem sie Sätze oder Absätze auf eine menschliche Art vervollständigen.
- Informationsextraktion: Generative KI-Modelle können verwendet werden, um bestimmte Informationen aus unstrukturierten oder halbstrukturierten Dokumenten zu extrahieren. Beispielsweise können sie Informationen wie Datum, Rechnungsbetrag und Firmenname aus einer Rechnung extrahieren.
- Dokumentklassifizierung: ML-Modelle werden verwendet, um Dokumente basierend auf ihrem Inhalt automatisch zu kategorisieren. Diese Algorithmen „lesen“ das Dokument, verstehen seinen Kontext und können es in vordefinierte Kategorien klassifizieren.
- Datenvalidierung: Generative KI kann die Ausgabe des ML-Modells überprüfen, wenn der Konfidenzwert zu niedrig ist. Wenn beide ML-Modelle (generativ und spezialisiert) die gleiche Ausgabe haben, kann ein Mensch die Validierung dieses Dokuments überspringen. Dadurch kann der Zeitaufwand für die Validierung von Dokumenten verringert werden. Außerdem kann die Leistung Ihrer Modelle verbessert werden, indem die Ausgabe mithilfe eines zweiten generativen Modells überprüft wird.
ML-Modelle sind wie virtuelle Assistenten, die darauf trainiert wurden, aus Daten zu lernen und Vorhersagen oder Entscheidungen zu treffen. Bei diesen Modellen handelt es sich im Wesentlichen um Algorithmen, die lernen, Muster basierend auf historischen Daten zu erkennen. Je mehr Daten ihnen zur Verfügung stehen, desto besser können sie ihre Vorhersagen oder Entscheidungen im Laufe der Zeit verbessern.
Mehrere vorgefertigte ML-Modelle finden Sie in Document UnderstandingTM. Diese Modelle helfen Ihnen, alle häufig vorkommenden Datenpunkte aus halbstrukturierten oder unstrukturierten Dokumenten zu klassifizieren und zu extrahieren, ohne dass eine Einrichtung erforderlich ist.
Die vollständige Liste der vortrainierten Modelle und deren Felder finden Sie auf der Seite Vorgefertigte Modelle.
ML-Modelle können in einer Vielzahl von Sprachen trainiert werden, sofern die OCR das Dokument und den Text mit hoher Zuverlässigkeit erkennt.
Optical Character Recognition (OCR) ist eine spezielle Technologie, die verwendet wird, um verschiedene Arten von Dokumenten, z. B. gescannte Papierdokumente, PDF-Dateien oder von einer Digitalkamera aufgenommene Bilder, in bearbeitbare und durchsuchbare Daten umzuwandeln.
Die Genauigkeit einer OCR-Engine hängt meistens von der Qualität des Originaldokuments ab. Klarer, gut formatierter Text in einer lesbaren Schriftart führt in der Regel zu der besten Ausgabe.
Weitere Informationen zu den Sprachen, die von den von UiPath® bereitgestellten OCR-Engines unterstützt werden, finden Sie auf der Seite Unterstützte OCR-Sprachen.