- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Versionshinweise
- Über das Document Understanding ML-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren der Authentifizierung
- Generativer Extraktor – Best Practices
- Generativer Klassifizierer – Bewährte Methoden
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren der Authentifizierung
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Document Understanding-Aktivitäten
Generativer Klassifizierer – Bewährte Methoden
Mit dem generativen Klassifizierer können Sie Dokumente mithilfe von generativen Modellen klassifizieren. Auf dieser Seite finden Sie Tipps und Tricks zur optimalen Nutzung Ihrer Workflows mit dem generativen Klassifizierer.
Bedenken Sie, dass Sie eine große Anzahl von Verträgen haben, die Sie in verschiedene Kategorien sortieren müssen. Um diesen Prozess mit dem generativen Klassifizierer zu optimieren, befolgen Sie die auf dieser Seite beschriebenen bewährten Methoden.
Um Ihre Eingabeaufforderungen zu optimieren, geben Sie so viel Kontext wie möglich an. Geben Sie eine detaillierte Beschreibung jedes Dokumenttyps an. Beispielsweise kann der folgende Text beim Klassifizieren einer Rechnung berücksichtigt werden: „Eine Rechnung ist ein Dokument, das von einem Verkäufer an einen Käufer ausgestellt wird, in dem die bereitgestellten Produkte oder Dienstleistungen, deren Mengen und Preise aufgeführt sind. Sie enthält die Angaben des Verkäufers und des Käufers, die Rechnungsnummer, das Datum, den fälligen Gesamtbetrag und die Zahlungsbedingungen. „Rechnungen werden für die Anforderung von Zahlungen und die Aufzeichnung in Geschäftstransaktionen“ verwendet.
Damit das generative Modell effektiv funktioniert, ist es notwendig, einen umfangreichen Kontext anstelle von kurzen und vagem Dokumentbeschreibungen bereitzustellen, die zu offensichtlichen Fehlern führen können.
Um Ihren Workflow zu optimieren, erstellen Sie zunächst einen Ordner zum Verschieben klassifizierter Dateien, um redundante Klassifizierungen zu vermeiden.
Erstellen Sie einen Beispielsatz von Dokumenten, bevor Sie einen größeren Datensatz automatisieren. Dieser Beispielsatz sollte beschädigte und kennwortgeschützte PDF-Dateien enthalten, um den Workflow zu testen. Es empfiehlt sich, eine Try Catch -Aktivität in den Workflow aufzunehmen, um Fehler zu vermeiden, die aufgrund beschädigter oder kennwortgeschützter PDF-Dateien auftreten können. Sobald die Aktivität Abfangen versuchen (Try Catch) eingerichtet ist, kann der Workflow anhand des Beispielsatzes getestet werden, um seine Effektivität sicherzustellen.
Zwischenspeichern Sie die Digitalisierungsergebnisse (Dokumenttext und Dokumentobjektmodell) im Workflow, um Zeit zu sparen, wenn Sie mehrmals mit derselben Datei testen.