- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- FieldValueDetails Class
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- BasicDataPoint-Klasse – Vorschau
- ExtractionResultHandler-Klasse – Vorschau
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren einer externen Verbindung
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Create Document Validation Artifacts
- Artefakte der Dokumentvalidierung abrufen
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Dokument zensieren
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Generativer Klassifizierer
- Generativer Extraktor
- Konfigurieren der Authentifizierung
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- Versionshinweise
- Über das PDF-Aktivitätspaket
- Projektkompatibilität
- Get PDF Page Count
- PDF-Text lesen (Read PDF Text)
- PDF über OCR lesen (Read PDF With OCR)
- XPS-Text lesen (Read XPS Text)
- XPS über OCR lesen (Read XPS With OCR)
- Exportieren einer PDF-Seite als Bild
- Bilder aus PDF exportieren
- Extract Attachments from PDF
- PDF-Seitenbereich extrahieren
- PDF-Dateien zusammenfügen
- Verwalten des PDF-Passworts
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Document Understanding-Aktivitäten
UiPath.IntelligentOCR.Activities.DocumentClassification.KeywordBasedClassifier
Beschreibung
Die Funktionen dieser Aktivität sind wie folgt:
- Enthält einen schlüsselwortbasierten Algorithmus zur Dokumentklassifizierung, der auf die Klassifizierung von Dateien mit wiederholbaren Titeln abzielt.
- Klassifiziert ein Dokument basierend auf einem bestimmten Trainingssatz, der sich in einer angegebenen Datei befindet, wenn es innerhalb der Aktivität Classify Document Scope verwendet wird.
Diese Aktivität kann nur zusammen mit den Aktivitäten Classify Document Scope und Train Classifiers Scope verwendet werden.
Projektkompatibilität
Windows-Legacy | Windows
Konfiguration
Designer-Panel
-
LearningFilePath - The full path to the file containing the classifier data. This field supports only strings and
Stringvariables.Hinweis:Only one of the above parameters can be set at a time. You can use either the LearningData string or the LearningFilePath string.
The LearningFilePath specifies the locations from where to retrieve the classifier data.
The LearningData contains the actual information of that classifier.
Eigenschaften-Panel
Allgemein
- AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Eingabe
-
LearningData - The string containing the serialized classifier data. This field supports only strings and
Stringvariables. -
LearningFilePath - The full path to the file containing the classifier data. This field supports only strings and
Stringvariables.Hinweis:Only one of the above parameters can be set at a time. You can use either the LearningData string or the LearningFilePath string.
The LearningFilePath specifies the locations from where to retrieve the classifier data.
The LearningData contains the actual information of that classifier.
-
Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Hinweis:Die bewährte Methode besteht darin, eine leere
.json-Datei an diesem Speicherort zu erstellen und dann ihren Namen im Feld LernDateiPfad zu verwenden.
Verwenden des Assistenten zum Verwalten von Lerninhalten
Sie können den Keyword Based Classifier zur Entwurfszeit konfigurieren, indem Sie einfach auf den Assistenten Lernfunktion verwalten der Aktivität zugreifen. Der gleiche Assistent kann zum Überprüfen von Daten verwendet werden, die während der Trainingsphase für die Dokumentklassifizierung gesammelt wurden, indem der gleiche Assistent mit einem aktualisierten Lerndateipfad geöffnet wird.
This wizard allows you to configure and manage the keywords used by this activity for identifying the document type. It was created to suit the need for editing a file path. If a Learning Data parameter with a variable is used instead, then you are asked if you either want to edit a specific file path or to abort this operation.
Der Assistent Lernfunktion des schlüsselwortbasierten Klassifizierers verwalten kann nur zum Bearbeiten und Konfigurieren eines Dateipfads verwendet werden.
-
Fügen Sie Ihrem Workflow eine Aktivität vom Typ Keyword Based Classifier oder Keyword Based Classifier Trainer hinzu.
-
Konfigurieren Sie Ihre Aktivität Keyword Based Classifier , indem Sie den Pfad einer
.json-Datei hinzufügen. Berücksichtigen Sie beim Konfigurieren des Klassifizierers die folgenden Informationen:- Wenn kein Pfad angegeben ist und die Option Lernfunktion verwalten ausgewählt wird, wird ein Popup angezeigt, in dem nach einer Eingabe des Lerndateipfads gefragt wird. Sobald der Pfad angegeben ist, wird der Assistent geöffnet.
- Eine Variable kann anstelle einer
.json-Datei hinzugefügt werden, aber da der Assistent das Lernmuster nicht auf eine LearningData-Variable anwenden kann, wird nach einem bestimmten Dateipfad gefragt, der bearbeitet werden kann.
-
Wählen Sie Lernfunktion verwalten aus.
Der Assistent Lernfunktion des schlüsselwortbasierten Klassifizierers verwalten wird geöffnet.
Abbildung 1. Übersicht zum Assistenten „Lernfunktion des schlüsselwortbasierten Klassifizierers verwalten“
-
Wenn kein Pfad angegeben ist und die Option Lernfunktion verwalten ausgewählt wird, wird ein Popup angezeigt, in dem nach einem LernDateiPfad gefragt wird. Sobald der Pfad angegeben ist, wird der Assistent geöffnet.
Abbildung 2. Der Warnhinweis wird angezeigt, wenn kein Pfad bereitgestellt wurde und die Option Lernfunktion verwalten ausgewählt wird
Hinweis:Auch wenn keine Datei vom Typ
.jsonverfügbar ist, können Sie den Namen einer neuen.json-Datei direkt in die Aktivität einfügen. Die.json-Datei wird dann automatisch im angegebenen Ordner erstellt.
Hinzufügen von Schlüsselwörtern für den Dokumenttyp
Der Assistent verfügt über so viele Dokumenttypkategorien, wie Sie in Ihrer Taxonomie definiert haben. Sie können für jeden Dokumenttyp einzelne oder mehrere Schlüsselwörter hinzufügen. Die Aktivität lernt die Schlüsselwörter eines bestimmten Dokuments und kann das Dokument später basierend auf diesen Regeln in einem bestimmten Typ identifizieren und klassifizieren.
Alle Einträge müssen als Zeichenfolgen zwischen "" (Anführungszeichen) eingegeben werden. Sie können einzelne oder mehrere Werte hinzufügen. Um Schlüsselwörter hinzuzufügen oder zu entfernen, führen Sie die folgenden Schritte im Assistenten aus:
- Wählen Sie Neue Schlüsselwortgruppe hinzufügen aus, um dieser Kategorie ein zusätzliches Feld hinzuzufügen.
- Wählen Sie das
Entfernensymbol aus, um das Feld und seine Schlüsselwörter zu entfernen. - Wählen Sie Speichern aus, um Ihre Assistentenkonfiguration zu speichern. Alle hinzugefügten Werte finden Sie in der
.json-Datei des Projekts.Hinweis:Doppelte Anführungszeichen, die als Teil eines Schlüsselworts im Assistenten Schlüsselwörter verwalten eingegeben wurden, werden immer gemäß der Visual Basic-Konvention escaped (doppelte doppelte Anführungszeichen), auch in einem Projekt mit C#.
Document Understanding-Integration
Die Aktivität Keyword Based Classifier ist Teil der Document Understanding Lösungen. Weitere Informationen finden Sie im Document Understanding-Leitfaden .