ai-center
latest
false
- Versionshinweise
- Erste Schritte
- Benachrichtigungen
- Projekte
- Datasets
- Data Labeling
- ML-Pakete
- Sofort einsetzbare Pakete
- Pipelines
- ML-Skills
- ML-Protokolle
- Document UnderstandingTM im AI Center
- AI Center-API
- Lizenzierung
- Vorlagen für AI Solutions
- Anleitungen zu …
- Verwenden von benutzerdefinierter NER mit kontinuierlichem Lernen
- Grundlegende Anleitung zur Fehlerbehebung
Verwenden von benutzerdefinierter NER mit kontinuierlichem Lernen
Wichtig :
Bitte beachten Sie, dass dieser Inhalt teilweise mithilfe von maschineller Übersetzung lokalisiert wurde.
Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

AI Center
Letzte Aktualisierung 11. Apr. 2025
Verwenden von benutzerdefinierter NER mit kontinuierlichem Lernen
Dieses Beispiel wird dazu verwendet, um Chemikalien nach der Kategorie zu extrahieren, die in der Forschungsarbeit erwähnt wird. Mit diesem Verfahren extrahieren Sie die Chemikalien und kategorisieren sie als ABKÜRZUNG, FAMILIE, FORMEL, IDENTIFIZIERER, MEHRFACH, SYSTEMATISCH, TRIVIAL und NO_CLASS.
Dieses Verfahren verwendet das Paket Custom Named Entity Recognition . Weitere Informationen darüber, wie dieses Paket funktioniert und wofür es verwendet werden kann, finden Sie auf der Seite Erkennung benutzerdefinierter benannter Entitäten (Custom Named Entity Recognition) .
Für dieses Verfahren haben wir Beispieldateien wie folgt bereitgestellt:
- Vorbeschriftetes Trainings-Dataset im CoNLL-Format. Sie können das Trainings-Dataset unter dem folgenden Link herunterladen: Trainings-Dataset.
- Vorbeschriftetes Test-Dataset. Sie können das Test-Dataset unter dem folgenden Link herunterladen: Test-Dataset.
- Beispiel-Workflow zum Extrahieren von Kategorien von Chemikalien, die in der Forschungsarbeit erwähnt wurden. Sie können ihn unter dem folgenden Link herunterladen: Beispielworkflow.
Hinweis: Stellen Sie sicher, dass die folgenden Variablen in der Beispieldatei ausgefüllt sind:
in_emailAdress
– die E-Mail-Adresse, der die Action Center-Aufgabe zugewiesen wirdin_MLSkillEndpoint
– Öffentlicher Endpunkt der ML-Fähigkeitin_MLSkillAPIKey
– API-Schlüssel der ML-Fähigkeitin_labelStudioEndpoint
– Optional, um kontinuierliche Beschriftung zu aktivieren: Import-URL eines Label-Studio-Projekts angeben
Verwenden Sie die folgenden Schritte, um Chemikalien nach ihrer Kategorie aus Forschungsarbeiten zu extrahieren.
- Installieren Sie Label Studio auf Ihrer lokalen Maschine oder Cloud-Instanz. Folgen Sie dazu den Anweisungen auf der Seite Label Studio .
- Erstellen Sie ein neues Projekt aus der benannten Entitätserkennungsvorlage und definieren Sie Ihre Labelnamen.
- Stellen Sie sicher, dass die Labelnamen keine Sonderzeichen oder Leerzeichen enthalten. Verwenden Sie beispielsweise anstelle von
Set Date
SetDate
. - Stellen Sie sicher, dass der Wert des
<Text>
-Tags"$text"
ist. - Laden Sie die Daten mithilfe der API von der API-Seite von Label Studio hoch.
Beispiel für eine cURL-Anforderung:
curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]'
curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]' - Erstellen Sie Anmerkungen zu Ihren Daten.
- Exportieren Sie die Daten im CoNLL 2003-Format und laden Sie sie im AI Center hoch.
- Die Label Studio-Instanz-URL und der API-Schlüssel wurden im bereitgestellten Beispielworkflow zur Verfügung gestellt, um falsche Vorhersagen und Vorhersagen mit geringer Konfidenz zu erfassen.