- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- FlexiCapture Classifier
- Machine Learning Classifier
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- ML-Pakete
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Deep Learning
- Lizenzierung
- Referenzen
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Document Understanding-Benutzerhandbuch.
Machine Learning Extractor
Der Machine Learning Extractor ist ein Datenextraktionstool, das Machine-Learning-Modelle verwendet, um Daten zu identifizieren und zu melden, die extrahiert werden sollen.
Diese Aktivität ist der Begleiter von UiPath Document Understanding-Modellen als Mittel zur Verwendung solcher Modelle in Ihren Workflows.
Der ML-Ansatz wird für strukturierte oder halbstrukturierte Dokumente dringend empfohlen, bei denen die Layouts verschiedener Dokumentanbieter stark variieren. Aufgrund seines Machine-Learning-Ansatzes verwendet der Extraktor ein trainiertes Machine-Learning-Modell, das lernt und dann Werte für die Zielfelder inferieren kann, auch von Dokumenten und Layouts, zu denen er noch keinen Kontakt hatte. Also wenn Dokumente keinem Text- oder Layoutmuster folgen, kann der Machine Learning Extractor eine gute Option für Ihren Anwendungsfall sein.
Das Machine-Learning-Modell kann auf mehrere Arten verwendet werden:
- Mit einem der öffentlichen Document Understanding-Endpunkte von UiPath, wenn Sie generische Modelle verwenden möchten, die auf bestimmte Dokumenttypen abzielen; oder
- Mit benutzerdefinierten trainierten Machine-Learning-Modellen beginnend bei den verfügbaren UiPath Document Understanding-Modellen.
Dieser Extraktor kann trainiert/erneut trainiert werden. Weitere Informationen finden Sie im Abschnitt Wie trainiert wird.
Sie müssen verwenden:
- Einen der öffentlichen Document Understanding-Endpunkte von UiPath für die Datenextraktion oder
- Machine-Learning-Modelle, die im AI Center in Automation Cloud gehostet werden, oder
- Machine-Learning-Modelle, die im lokalen AI Center gehostet werden, aber über Automation Cloud lizenziert sind, Sie müssen Ihren Automation Cloud Document Understanding API-Schlüssel verwenden.
Um den Machine Learning Extractor mit lokaler Lizenzierung zu verwenden, müssen Sie Ihre Document Understanding-Modelle in Ihrer lokalen AI Center-Instanz (Air-Gap-Installation) hosten.
Wenn der von Ihnen verwendende Endpunkt über Automation Cloud lizenziert ist, müssen Sie den Document Understanding API-Schlüssel der Cloud angeben.
Wenn Sie den Machine Learning Extractor mit einem öffentlichen UiPath Document Understanding-Endpunkt oder mit einer öffentlichen ML-Fähigkeit im AI Center verwenden, müssen Sie das Endpunkt-Argument der Aktivität mit der entsprechenden URL konfigurieren.
Wenn Sie den Machine Learning Extractor mit einer bereitgestellten ML-Fähigkeit verwenden, müssen Sie das ML-Fähigkeit-Argument der Aktivität mit der richtigen Auswahl von der AI Center-gehosteten ML-Fähigkeitenliste konfigurieren.
Wenn Sie versuchen, beide Optionen festzulegen, wird ein Fehler angezeigt – entweder im Konfigurationsassistenten oder direkt im Workflow:
Weitere Informationen zum Machine Learning Extractor finden Sie auf dieser Seite.