- Überblick
- Erste Schritte
- Aktivitäten
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
- Insights-Dashboards
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Einschränkungen für den Datenverkehr
- OCR-Konfiguration
- Pipelines
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Lizenzierung
Dokumente durchsuchen
Insgesamt stehen drei Suchfunktionen zur Verfügung, zwei sind in der Verwaltungsleiste oben auf der Seite zu finden, und eine verwendet die Symbol unten links auf der Seite.
Die Suchfunktion in der Verwaltungsleiste umfasst:
- Mit den integrierten Filtern suchen: Filtert die Dokumente basierend auf den für Batches/Kategorien verfügbaren Optionen im Dropdownmenü.
Achtung:
Durch die Auswahl weiterer Optionen lässt sich die Suche präzisieren. Wenn Sie beispielsweise Batch-Import1 und Gelöscht auswählen, werden nur die Dokumente angezeigt, die im Batch-Import1 importiert und gelöscht wurden.
Beachten Sie Kombinationen, die immer eine leere Liste zurückgeben: Wenn Sie Batch-Import1 und Batch-Import2 auswählen, wird nie ein Dokument zurückgegeben, da die Auswahl restriktiv ist und kein Dokument gleichzeitig in zwei Batches sein kann.
- In allen Dokumenten im Dataset mithilfe von Schlüsselwörtern suchen: Diese Sucheingabe filtert die Informationen basierend auf der Texteingabe. Sie müssen das/die Schlüsselwort(e) als freien Text in das Suchfeld eingeben. Die Suche erfolgt nach dem/den Schlüsselwort(en) im Inhalt eines Dokuments oder im Dokumentnamen. Die Mehrwortsuche gibt Ergebnisse zurück, bei denen die Wörter nebeneinander liegen, ohne dass dazwischen liegende Satzzeichen vorhanden sind.
- Innerhalb des aktuell angezeigten Dokuments suchen: Ermöglicht es Ihnen, nach Textinstanzen ausschließlich in Ihrem aktuellen Dokument zu suchen. Die Suchleiste, finden Sie unten links auf dem Bildschirm.
Jeder Filter zeigt in Klammern die Anzahl der Dokumente an, die die Kriterien erfüllen.
Es gibt sieben vordefinierte Schlüsselwörter, nämlich:
- Trainings- und Validierungssatz (Training and validation set)
- Trainingssatz
- Auswertungssatz (Evaluation set)
- Validierungssatz (Validation set)
- Deleted (Gelöscht)
- beschriftet
- unbeschriftet
Hinweis: Bitte beachten Sie, dass für Forms AI nur die folgenden integrierten Filter verfügbar sind: Gelöscht (Deleted), Beschriftet (Labelled), Unbeschriftet (Unlabelled).
Neben diesen vordefinierten Schlüsselwörtern können Sie auch basierend auf benannten Batches filtern, abhängig davon, wie viele Batches Sie in den Document Manager importiert haben:
- Batch <batch_name_1>
- Batch <batch_name_2>
- Batch <batch_name_3>
- usw.
Sie müssen das/die Schlüsselwort(e) als freien Text in das Suchfeld eingeben. Die Suche erfolgt nach dem/den Schlüsselwort(en) im Inhalt eines Dokuments oder im Dokumentnamen.
Sie können mit einem Mehrworttext suchen: Nur die Dokumente, die diese spezifischen Wörter nacheinander enthalten, werden angezeigt.
Bei der Suche wird die Groß-/Kleinschreibung nicht berücksichtigt.
Sie können mit einem Schlüsselwort filtern: Wenn Sie zum Beispiel Beschriftet (Labelled) auswählen, werden nur die beschrifteten Dokumente angezeigt.
Sie können mit mehr als einem Schlüsselwort filtern: Wenn Sie z. B. Beschriftet (Labelled) und Trainingssatz (Training set) auswählen, werden nur die beschrifteten Dokumente angezeigt, die als trainiert markiert sind. Die Reihenfolge, in der die Schlüsselwörter erscheinen, spielt keine Rolle.
Starten Sie eine Suche im aktuellen Dokument, indem Sie auf das Symbol unten links klicken, den Suchbegriff eingeben und die Eingabetaste drücken.
Alle Instanzen des mit der Suche übereinstimmenden Texts werden gelb hervorgehoben. Die Dokumentanzeige wird automatisch zur ersten Position gescrollt. Um von einer Textinstanz zur anderen zu navigieren, drücken Sie entweder Enter oder Bild Ab und Bild Auf.
Die Suchoption verfügt über ein Dropdownmenü, das beim Öffnen die folgenden Filter anzeigt:
- Trainingssatz (Training set) – Gibt die Anzahl der Dokumente an, die zum Trainieren des Modells verwendet werden sollen. Automatisierte Aktion.
- Validierungssatz (Validation set) – Gibt die Anzahl der Dokumente an, die zum Validieren des Modells nach Abschluss des Trainings verwendet werden sollen. Die Aufteilung zwischen Trainings- und Validierungssatz soll 80 %–20 % betragen. Automatisierte Aktion.
- Trainings- und Validierungssatz (Training and validation set) – Gibt die Anzahl der Dokumente an, die sowohl im Filter Trainingssatz (train-set) als auch im Filter Validierungssatz (validate-set) gefunden wurden. Automatisierte Aktion.
- Auswertungssatz (Evaluation set) – Gibt die Anzahl der Dokumente an, bei denen während des Imports das Kontrollkästchen für den Evaluierungssatz aktiviert wurde und die für die Evaluierung des Modells in der Phase der Trainingspipeline verwendet werden sollen. Weitere Informationen finden Sie hier. Manuelle Aktion.
- deleted – Gibt die Anzahl der gelöschten Dokumente an. Weitere Informationen finden Sie hier.
- labelled – Gibt die Anzahl der Dokumente an, die Beschriftungen haben. Eine Beschriftung wird durch mindestens ein mit Tags versehenes/manuell bearbeitetes Feld pro Dokument definiert.
- unlabelled – Gibt die Anzahl der Dokumente an, die keine Beschriftungen haben.
- Batchname – Gibt die Dokumente an, die im selben Importvorgang enthalten sind.
Die Zuweisung eines Dokuments zu den Trainings- oder Validierungssätzen erfolgt durch die Anwendung zum Zeitpunkt des Imports.
Die importierten Dokumente landen im Auswertungssatz, wenn das Kontrollkästchen „Auswertungssatz“ während des Imports aktiviert ist.