- Versionshinweise
- Bevor Sie beginnen
- Erste Schritte
- Projekte
- Datasets
- ML-Pakete
- Pipelines
- ML-Skills
- ML-Protokolle
- Document Understanding im AI Center
- Lizenzierung
- Anleitungen zu …
- Verwenden von benutzerdefinierter NER mit kontinuierlichem Lernen
- Grundlegende Anleitung zur Fehlerbehebung
AI Center – Benutzerhandbuch
Verwenden von benutzerdefinierter NER mit kontinuierlichem Lernen
Dieses Beispiel wird dazu verwendet, um Chemikalien nach der Kategorie zu extrahieren, die in der Forschungsarbeit erwähnt wird. Mit dem folgenden Verfahren extrahieren Sie die Chemikalien und kategorisieren sie als ABKÜRZUNG, FAMILIE, FORMEL, IDENTIFIZIERER, MEHRFACH, SYSTEMATISCH, TRIVIAL und NO_CLASS.
Dieses Verfahren verwendet das Paket Custom Named Entity Recognition. Weitere Informationen darüber, wie dieses Paket funktioniert und wofür es verwendet werden kann, finden Sie unter Custom Named Entity Recognition.
Für dieses Verfahren haben wir Beispieldateien wie folgt bereitgestellt:
- Vorbeschriftetes Trainings-Dataset im CoNLL-Format. Sie können es hier herunterladen.
- Vorbeschriftetes Test-Dataset. Sie können es hier herunterladen.
- Beispielworkflow zum Extrahieren von Kategorien von Chemikalien, die in der Forschungsarbeit erwähnt wurden. Sie können ihn hier herunterladen.
Hinweis: Stellen Sie sicher, dass die folgenden Variablen in der Beispieldatei ausgefüllt sind:
in_emailAdress
– die E-Mail-Adresse, der die Action Center-Aufgabe zugewiesen wirdin_MLSkillEndpoint
– Öffentlicher Endpunkt der ML-Fähigkeitin_MLSkillAPIKey
– API-Schlüssel der ML-Fähigkeitin_labelStudioEndpoint
– Optional, um kontinuierliche Beschriftung zu aktivieren: Import-URL eines Label-Studio-Projekts angeben
Gehen Sie wie folgt vor, um Chemikalien nach ihrer Kategorie aus Forschungsarbeiten zu extrahieren.
- Importieren Sie das Beispiel-Dataset ins AI Center. Wechseln Sie dazu zum Menü Datasets und laden Sie den Trainings- und Testordner aus dem Beispiel hoch.
- Wählen Sie das gewünschte benutzerdefinierte NER-Paket unter ML-Pakete > Sofort einsetzbare Pakete > UiPath Sprachanalyse aus und erstellen Sie es.
- Wechseln Sie zum Menü Pipelines und erstellen Sie eine neue, vollständige Pipelineausführung für das Paket, das im vorherigen Schritt erstellt wurde. Verweisen Sie auf das Trainings- und das Test-Dataset, die in der Beispieldatei zur Verfügung gestellt werden.
- Erstellen Sie eine neue ML-Fähigkeit mithilfe des Pakets, das von der Pipelineausführung aus dem vorherigen Schritt generiert wurde, und stellen Sie sie bereit.
- Sobald die Fähigkeit bereitgestellt wurde, nutzen Sie sie im in UiPath Studio bereitgestellten Workflow. Um die Erfassung von Daten mit schwachen Vorhersagen zu ermöglichen, stellen Sie eine Label Studio-Instanz bereit und geben Sie die Instanz-URL und den API-Schlüssel in der Label Studio-Aktivität im Workflow an.
Befolgen Sie die Anweisungen unten, um mit Label Studio zu beginnen und Daten zum AI Center zu exportieren.
- Installieren Sie Label Studio auf Ihrer lokalen Maschine oder Cloud-Instanz. Folgen Sie dazu den Anweisungen hier.
- Erstellen Sie ein neues Projekt aus der benannten Entitätserkennungsvorlage und definieren Sie Ihre Labelnamen.
- Stellen Sie sicher, dass die Labelnamen keine Sonderzeichen oder Leerzeichen enthalten. Verwenden Sie beispielsweise anstelle von
Set Date
SetDate
. - Stellen Sie sicher, dass der Wert des
<Text>
-Tags"$text"
ist. - Laden Sie die Daten mithilfe der API von hier hoch.
Beispiel für eine cURL-Anforderung:
curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]'
curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]' - Erstellen Sie Anmerkungen zu Ihren Daten.
- Exportieren Sie die Daten im CoNLL 2003-Format und laden Sie sie im AI Center hoch.
- Die Label Studio-Instanz-URL und der API-Schlüssel wurden im bereitgestellten Beispielworkflow zur Verfügung gestellt, um falsche Vorhersagen und Vorhersagen mit geringer Konfidenz zu erfassen.