- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren der Authentifizierung
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Intelligenter Schlüsselwortklassifizierer
UiPath.IntelligentOCR.Activities.DocumentClassification.IntelligentKeywordClassifier
Diese Aktivität ermöglicht es jedem Benutzer, Dokumentpakete zu klassifizieren und in einzelne Dokumenttypen aufzuteilen. Sie können es nur zusammen mit der Aktivität Classify Document Scope verwenden.
Designer-Panel
- Lerndateipfad (LearningFilePath) - Der vollständige Pfad der Datei, welche die Classifier-Daten enthält. Dieses Feld unterstützt nur Strings und
String
-Variablen.Hinweis:Es kann jeweils nur einer der oben genannten Parameter festgelegt werden. Sie können entweder die LearningData -Zeichenfolge oder die LearningFilePath -Zeichenfolge verwenden.
Der LearningFilePath gibt die Speicherorte an, von denen die Klassifiziererdaten abgerufen werden sollen.
Die LearningData enthalten die tatsächlichen Informationen dieses Klassifizierers.
- Endpoint - The URL to UiPath® server. By default, the endpoint is
https://du.uipath.com/svc/intelligentkeywords
. For more information about endpoints, visit Document Understanding Public Endpoints. - ApiKey – Gibt den API-Schlüssel des Kontos an. Das Feld API-Schlüssel wird automatisch vorab ausgefüllt, wenn es in den lokalen Projekteinstellungen oder im Document Understanding-Framework definiert ist.
Eigenschaften-Panel
Allgemein
- AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Eingabe
- ApiKey – Gibt den API-Schlüssel des Kontos an. Das Feld API-Schlüssel wird automatisch vorab ausgefüllt, wenn es in den lokalen Projekteinstellungen oder im Document Understanding-Framework definiert ist.
- Endpoint - The URL to UiPath® server. By default, the endpoint is
https://du.uipath.com/svc/intelligentkeywords
. For more information about endpoints, visit Document Understanding Public Endpoints. - Lerndateipfad (LearningFilePath) - Der vollständige Pfad der Datei, welche die Classifier-Daten enthält. Dieses Feld unterstützt nur Strings und
String
-Variablen. - Lerndateipfad (LearningFilePath) - Der vollständige Pfad der Datei, welche die Classifier-Daten enthält. Dieses Feld unterstützt nur Strings und
String
-Variablen.Hinweis:Es kann jeweils nur einer der oben genannten Parameter festgelegt werden. Sie können entweder die LearningData -Zeichenfolge oder die LearningFilePath -Zeichenfolge verwenden.
Der LearningFilePath gibt die Speicherorte an, von denen die Klassifiziererdaten abgerufen werden sollen.
Die LearningData enthalten die tatsächlichen Informationen dieses Klassifizierers.
- Dokumente senden – Wenn diese Option aktiviert ist, kann UiPath® das referenzierte Dokument speichern, um die Algorithmusleistung zu verbessern. Wenn Sie diese Funktion deaktivieren, kann UiPath® die Dokumente nicht speichern. Unabhängig von dieser Einstellung bleibt die Funktion des Algorithmus unverändert.
Sonstiges
- Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Hinweis: Die bewährte Methode besteht darin, eine leere
.json
-Datei an diesem Speicherort zu erstellen und dann ihren Namen im Feld LearningFilePath zu verwenden.
Aufteilung
- PerformDocumentSplitting – Wenn diese Option nicht aktiviert ist, führt das Modell keine Aufteilung der Dokumente durch, sondern nur eine Klassifizierung.
- UsePageNumbers – Wenn diese Option aktiviert ist, verwendet der Modus die Seitenzahlfunktion, um zu entscheiden, wo Dokumente geteilt werden sollen. Verwenden Sie diese Option, wenn die Seitenzahlen das Aufteilungsergebnis verbessern könnten.
Greifen Sie auf den Assistenten zum Verwalten von Lernen zu, um die Aktivität Intelligent Keyword Classifier zu konfigurieren. Derselbe Assistent kann zum Überprüfen von Daten verwendet werden, die während der Dokumentklassifizierungs-Trainingsphase gesammelt wurden, indem derselbe Assistent mit einem aktualisierten Lerndateipfad geöffnet wird.
Mit diesem Assistenten können Sie die Trainingsdaten konfigurieren und verwalten, die von der Aktivität Intelligent Keyword Classifier zum Identifizieren des Dokumenttyps und zum Klassifizieren der Dokumente verwendet werden. Er wurde für die Bearbeitung eines Dateipfads entwickelt. Wenn stattdessen eine Lerndaten-Option mit einer Variablen verwendet wird, werden Sie gefragt, ob Sie entweder einen bestimmten Dateipfad bearbeiten oder diesen Vorgang abbrechen möchten.
- Add an Intelligent Keyword Classifier or Intelligent Keyword Classifier Trainer activity to your workflow.
- Configure your Intelligent Keyword Classifier activity by adding the path of a
.json
file. Take the following information into consideration, when configuring the classifier:- If no path is provided and the Manage Learning option is selected, then a pop-up is displayed, asking for a Learning File Path input. Once the path is provided, the wizard opens.
- Eine Variable kann anstelle einer
.json
-Datei hinzugefügt werden, aber da der Assistent das Lernmuster nicht auf eine LearningData-Variable anwenden kann, wird nach einem bestimmten Dateipfad gefragt, der bearbeitet werden kann.
- Wählen Sie Lernfunktion verwalten aus.
Das Fenster Intelligent Keyword Classifier- Assistent wird geöffnet.Abbildung 1. Übersicht über den Abschnitt Lernfunktion verwalten des Intelligent Keyword Classifier-Assistenten
- If no path is provided and the Manage Learning option is selected, then a pop-up is displayed, asking for a LearningFilePath. Once the path is provided, the wizard opens.
Abbildung 2. Das Popup-Fenster „Warnung“ wird angezeigt, wenn kein Pfad angegeben ist und die Option „Lernfunktion verwalten“ ausgewählt ist
Hinweis: Auch wenn keine.json
-Datei verfügbar ist, können Sie den Namen einer neuen.json
-Datei direkt in die Aktivität einfügen. Die.json
-Datei wird dann automatisch im angegebenen Ordner erstellt.
Im Assistenten Lernfunktion verwalten können Sie anhand der folgenden daneben angezeigten Beschriftungen sehen, ob ein Dokumenttyp trainiert wurde oder nicht: Auf X-Dateien trainiert oder Training starten. Der folgende Screenshot zeigt einen Dokumenttyp, der trainiert wurde, einen, der nicht trainiert wurde, und einen, der trainiert und ausgewählt wurde, damit er angezeigt oder gelöscht werden kann.
For document types that have not been trained yet, design-time training can be performed using the Start Training option. For document types that already have some training, you can either delete it to start over, by using the remove option, or perform extra training (cumulative to the already existing one) using the edit option.
Once a new training has been initiated, a new screen is displayed asking for the training files and the OCR engine that should be used. The default OCR engine is UiPath® Document OCR. Each OCR engine comes with its own set of custom options.
Die folgenden OCR-Module unterstützen keine gedrehten Dokumente und sollten nicht zum Verarbeiten solcher Dokumente verwendet werden:
- Microsoft OCR
- Tesseract OCR
- True: If set to True, the OCR is applied to all PDF pages of the document.
- False: If set to False, only digitally typed text is extracted.
- Auto: The default value is Auto, determining if the document requires to apply the OCR algorithm depending on the input document.
- ForceApplyOCR = True is replaced by ApplyOcrOnPDF = Yes
- ForceApplyOCR = False is replaced by ApplyOcrOnPDF = Auto
- ForceApplyOCR = empty is replaced by ApplyOcrOnPDF = Auto
- ForceApplyOCR = Your defined variable is replaced by ApplyOcrOnPDF = Auto
Nur Trainingsdaten von trainierten Dokumenttypen dürfen exportiert werden. Dokumenttypen, die nicht trainiert wurden, können nicht ausgewählt werden.
Sie können Trainingsdaten wie folgt exportieren:
- Wählen Sie trainierte Dokumenttypen aus.
- Wählen Sie Exportieren aus.
Wenn Sie nicht gespeicherte Änderungen haben, wird die folgende Meldung angezeigt: „Sie können nicht exportieren, während ungespeicherte Änderungen vorhanden sind. Möchten Sie vor dem Anzeigen automatisch speichern?“. Wählen Sie Ja aus, um den Exportprozess fortzusetzen.Abbildung 6. Die Meldung Änderungen speichern, die anzeigt, ob Sie vor dem Exportieren der Trainingsdaten ungespeicherte Änderungen haben
- Speichern Sie das Trainingsdatenarchiv mit dem gewünschten Namen.
Es wird eine Meldung angezeigt, die angibt, wie viele Dokumenttypt-Trainingsdatensätze exportiert wurden. Beispiel: „4 Wortvektor(en) exportiert“.Abbildung 7. Beispiel für die Meldung, die anzeigt, wie viele Dokumenttypt-Trainingsdatensätze exportiert wurden
- Select OK to return to the main screen of the wizard.
Sie können Trainingsdaten wie folgt importieren:
- Wählen Sie Importieren aus.
- Select the training data archive and then select Open.
- Wählen Sie die gewünschten Dokumenttypen aus.
Abbildung 8. Ausgewählte Dokumenttypen im Abschnitt Wortvektoren importieren
- Wählen Sie Importieren aus.
Die Trainingsdaten werden importiert.Abbildung 9. Die zuvor ausgewählten Dokumenttypen für den Import werden im Abschnitt Lernfunktion verwalten angezeigt
Die folgende Tabelle zeigt die Meldungen, die beim Importieren von Trainingsdaten angezeigt werden, basierend auf dem Importtyp:
Import Type |
Angezeigte Meldung |
---|---|
Neuer Dokumenttyp und Wortvektoren |
This document type will be added to the taxonomy. |
Neuer Wortvektor (zuvor war keiner definiert) |
Es wird keine Nachricht angezeigt. |
Identischer Dokumenttyp und Wortvektor |
The word vector for this document type will be overwritten. |
Die Aktivität Intelligent Keyword Classifier ist Teil der Document Understanding-Lösungen. Weitere Informationen finden Sie im Document Understanding-Leitfaden.