communications-mining

latest

false

Wichtig :

Dieser Inhalt wurde maschinell übersetzt. Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Communications Mining-Benutzerhandbuch

Letzte Aktualisierung 10. Feb. 2025

Der Status des Datasets

Verstehen des Status Ihres Datasets

Jedes Mal, wenn Sie Beschriftungen anwenden oder allgemeine Felder in Ihrem Dataset überprüfen, wird Ihr Modell erneut trainiert und eine neue Modellversion erstellt. Weitere Informationen zur Verwendung verschiedener Modellversionen finden Sie hier.

Wenn das Modell erneut trainiert wird, nimmt es die neuesten Informationen, die es erhalten hat, und berechnet alle seine Vorhersagen im gesamten Dataset neu. Dieser Prozess beginnt, wenn Sie mit dem Training beginnen, und oft, wenn Communications Mining die Anwendung der Vorhersagen für eine Modellversion abschließt, werden die Vorhersagen bereits für eine neuere Modellversion neu berechnet. Wenn Sie das Training nach einer Weile beenden, wird Communications Mining in Kürze aufholen und die Vorhersagen anwenden, die das allerneueste Training widerspiegeln, das im Dataset abgeschlossen wurde.

Dieser Prozess kann je nach Umfang des abgeschlossenen Trainings, der Größe des Datasets und der Anzahl der Beschriftungen in der Taxonomie einige Zeit in Anspruch nehmen. Communications Mining verfügt über eine hilfreiche Statusfunktion, die Benutzern hilft zu verstehen, wann ihr Modell auf dem neuesten Stand ist oder ob es ein erneutes Training ist und wie lange das voraussichtlich dauern wird.

Wenn Sie sich in einem Dataset befinden, zeigt eines dieser beiden Symbole oben auf der Seite den aktuellen Status an:

	Dieses Symbol gibt an, dass das Dataset auf dem neuesten Stand ist und die Vorhersagen aus der neuesten Modellversion angewendet wurden.
	Dies weist darauf hin, dass das Modell erneut trainiert wird und die Vorhersagen möglicherweise nicht auf dem neuesten Stand sind.

Wenn Sie mit der Maus über das Symbol fahren, werden weitere Details zum Status angezeigt, wie unten gezeigt:

Modales Element Status des Datasets

Hinweis: Manchmal stellen Sie fest, dass Communications Mining neu trainiert wird, auch wenn Sie keine Beschriftungen angewendet oder allgemeine Felder überprüft haben. Dies kann darauf zurückzuführen sein, dass unser Team Verbesserungen an unserer Plattform und unseren Modellen bereitstellt, für die die Modelle möglicherweise Verbesserungen vornehmen erneut trainieren. Alle Automatisierungen, die auf einer bestimmten Modellversionsnummer basieren, sind davon nicht betroffen.

Fehlerbehebung für langsames Modelltraining

Warum wird mein Modell langsam trainiert?

Zunächst ist es wichtig, zwischen zwei verschiedenen Prozessen zu unterscheiden, die oft verwechselt werden:

Modelltraining
Bei diesem Prozess wird die aktuelle Modellversion erneut trainiert, um eine neue zu erstellen, wobei alle aktuellen Änderungen wie Taxonomieaktualisierungen oder Datenanmerkungen berücksichtigt werden. Das Modelltraining ist im Allgemeinen schnell, wobei die Dauer von mehreren Faktoren abhängig sein kann
Anwenden von Vorhersagen
Dieser Prozess findet nach dem Modelltraining statt, bei dem die Plattform Vorhersagen aus der trainierten Modellversion abruft und auf jede Nachricht anwendet. Das Anwenden von Vorhersagen ist in der Regel langsamer und die Dauer wird hauptsächlich von der Größe und Komplexität des Datasets beeinflusst.

Mehrere Faktoren können dazu beitragen, dass eine bestimmte Modellversion für ein Dataset länger als erwartet dauert, um Vorhersagen zu trainieren oder anzuwenden. Dazu gehören:

Komplexität der Taxonomie von Beschriftungen und Feldern
Auswirkung: Je mehr Beschriftungen und Felder in Ihrem Dataset vorhanden sind, desto länger dauert es, das Modell zu trainieren und Vorhersagen auf Nachrichten hinweg anzuwenden.
Verwendung der generativen Extraktion
Auswirkungen: Generative Extraktion erfordert das Verständnis der komplexen Beziehungen zwischen Beschriftungen und Feldern, was ein größeres und leistungsstärkeres Modell erfordert, das das Training verlangsamen kann.
Größe Ihres Datasets (Daten mit und ohne Anmerkungen)
Auswirkungen: Hohe Mengen an Nachrichten mit Anmerkungen erhöhen die Datenpunkte, die das Modell während des Trainings berücksichtigen muss, und verlängern den Prozess. Ebenso können große Mengen an Nachrichten ohne Anmerkungen die Zeit verlängern, die für das Anwenden von Vorhersagen erforderlich ist.

Hinweis: Vorhersagen werden angezeigt, sobald sie verfügbar sind, sodass Sie nicht warten müssen, bis die Anwendung mit Anmerkungen abgeschlossen ist. Die Plattform wechselt zum Anwenden von Vorhersagen aus der neuesten trainierten Modellversion, wenn sie trainiert wird, bevor die Vorhersagen der vorherigen Version vollständig sind.
Anzahl der Datasets, die gleichzeitig trainiert werden
Auswirkungen: Wenn mehrere Modelle gleichzeitig in Ihrer Communications Mining-Umgebung trainiert werden, kann dies zu vorübergehenden Verlangsamungen führen, da die Plattformlast die erforderlichen Dienste ausbalanciert.
Wann Sie sich an den Support wenden können
- Training: Wenn keiner der oben genannten Gründe das langsame Training erklärt und es länger als 4 Stunden läuft, wenden Sie sich bitte an den Support.
- Anwenden von Vorhersagen: Bei großen und komplexen Datasets wird das Anwenden von Vorhersagen viel Zeit in Anspruch nehmen. Wenden Sie sich nur dann an den Support, wenn dieser Prozess für eine einzelne Modellversion länger als 24 Stunden läuft.
Hinweis: Dadurch sollten Datenanmerkungen nicht blockiert werden, da Sie immer von neuen Vorhersagen profitieren, sobald diese verfügbar werden

Warum scheint mein Modell überhaupt nicht zu trainieren?

Wenn Ihr Modell nicht innerhalb einer Stunde nach Abschluss einer Aktion, die das Training auslösen soll (z. B. das Hinzufügen von Nachrichten mit Beschriftungen oder Feldern mit Anmerkungen), mit dem Training beginnt, wenden Sie sich bitte an den Support.

Überprüfen des Trainingsstatus: Sie können überprüfen, ob Ihr Modell trainiert wird, indem Sie den Dataset-Status in der oberen rechten Ecke einer beliebigen Seite innerhalb eines Datasets überprüfen

Auf dieser Seite