ixp
latest
false
UiPath logo, featuring letters U and I in white

Communications Mining-Benutzerhandbuch

Letzte Aktualisierung 20. Okt. 2025

Grundlegendes zu Datenanforderungen

Überblick

Dieser Abschnitt enthält Richtlinien für die Kommunikationsdatenmengen, die erforderlich sind, um die Trainingserfahrung zu optimieren und den Wert von Analysen und Automatisierung zu maximieren.

Bei der Entscheidung der Datenmenge für Ihren Anwendungsfall sollten Sie die folgenden Faktoren berücksichtigen:

  • Rendite (ROI)
  • Komplexität
  • Technische Grenzen

Wichtig: Die in diesem Abschnitt empfohlenen Datenmengen sind nicht die erwarteten Datenmengen, die Sie mit Anmerkungen versehen müssen, um die Leistung für Ihren Anwendungsfall sicherzustellen. Stattdessen stellen diese Volumen die historischen Daten dar, die erforderlich sind, um ausreichend und vielfältige Trainingsbeispiele zu ermitteln. In der Regel muss nur ein kleiner Teil des gesamten Nachrichtenvolumens zur Feinabstimmung und Validierung mit Anmerkungen versehen werden.

Rendite

Um das Beste aus Ihrer Communications Mining™-Implementierung herauszuholen, empfehlen wir, mit Anwendungsfällen mit hohem Volumen zu beginnen. Diese Fälle profitieren von der Fähigkeit von Communications Mining, große Mengen an Nachrichtendaten effizient zu verarbeiten, sowohl für historische Analysen und Live-Überwachung als auch für Automatisierungen.

Der Aufwand für die Bereitstellung eines Anwendungsfalls nimmt mit höheren Nachrichtenmengen nicht wesentlich zu. Daher bieten Anwendungsfälle mit hohem Volumen in der Regel eine bessere Rendite in Bezug auf den Implementierungsaufwand als Anwendungsfälle mit geringerem Volumen. Dies ist wichtig für Organisationen mit begrenzten Ressourcen oder für Organisationen, die externe Unterstützung für die Implementierung benötigen.

Wenn Sie jedoch Szenarien mit geringerem Volumen mit hohem Geschäftswert haben, sollten Sie auch diese Anwendungsfälle in Betracht ziehen. Viele Anwendungsfälle mit geringem Volumen sind technisch erreichbar und sollten nicht verworfen werden.

Komplexität

Viele Anwendungsfälle haben einen Komplexitätsgrad in Bezug auf die Anzahl und Komplexität der zu extrahierenden Beschriftungen und Felder, der für sehr geringe Nachrichtenmengen nicht gut geeignet ist. Dies liegt daran, dass im Dataset mit unterschiedlichen und komplexen Konzepten oder Feldern möglicherweise nicht genügend Beispiele vorhanden sind, um die spezialisierten Modelle von Communications Mining™ effektiv zu optimieren und zu validieren. Dies gilt sowohl für das automatisierte Training, das durch generative Anmerkungen bereitgestellt wird, als auch für weitere Beispiele, die von Modelltrainern mit Anmerkungen versehen werden.

Während einige Anwendungsfälle technisch durchführbar sein können und es ausreichend Beispiele gibt, können geringere Volumen manchmal zu einer schlechteren Anmerkungserfahrung für Modelltrainer führen. Ein größerer Datenpool erleichtert den aktiven Lernmodi von Communications Mining, nützliche Beispiele für die Anmerkungen zu identifizieren und zu finden. Ein kleiner Datenpool kann zu weniger qualitativen Beispielen in der Taxonomie führen. Weniger hochwertige Beispiele führen dazu, dass Benutzer nicht nachvollziehbare oder komplexere Beispiele mit Anmerkungen versehen.

Technische Grenzen

Bevor Sie mit der Qualifizierung und Implementierung eines Anwendungsfalls auf Grundlage von Überlegungen zu Komplexität und ROI fortfahren, sollten Sie die technischen Einschränkungen von Communications Mining™ berücksichtigen.

Zum Generieren von Clustern benötigt Communications Mining mindestens 2048 Nachrichten in einem Dataset, das aus mehreren ähnlichen Quellen bestehen kann. Mit Datasets, die kleiner als 2048 Nachrichten sind, können Sie alle Communications Mining-Funktionen neben Clustern und generierten Beschriftungsvorschlägen für Cluster verwenden.

Anwendungsfälle mit weniger als 2048 Nachrichten sollten in Bezug auf die Anzahl und Komplexität von Beschriftungen oder Feldern sehr einfach sein. Sie sollten auch davon ausgehen, dass Sie im Vergleich zu Anwendungsfällen mit höherem Volumen einen viel höheren Anteil der gesamten Nachrichten für Feinabstimmungs- und Validierungszwecke mit Anmerkungen versehen werden. Es ist wahrscheinlich, dass für einige Beschriftungen oder Felder oder beides nicht genügend Beispiele für Anmerkungen vorhanden sind, wenn sie nicht häufig vorkommen.

Um aussagekräftige Validierungsdaten sicherzustellen, erwartet Communications Mining außerdem mindestens 25 Beispiele mit Anmerkungen pro Beschriftung und Feld. Stellen Sie daher sicher, dass Sie mindestens diese Anzahl von Beispielen aus den verfügbaren Daten entnehmen können.

Empfehlungen für geringere Datenmengen

Die folgenden Empfehlungen beziehen sich auf Anwendungsfälle mit geringerem Datenvolumen, aber hohem Wert bzw. geringer Komplexität oder beides.

Im Allgemeinen sollten Anwendungsfälle wie erwartet funktionieren, wenn ihre Komplexität mit dem Volumen der Nachrichtendaten übereinstimmt. Anwendungsfälle mit sehr geringem Volumen sollten sehr einfach sein, während Anwendungsfälle mit hohem Volumen komplexer sein können.

In einigen Fällen kann die Synchronisierung von mehr als einem Jahr historischer Daten dazu beitragen, Beispiele von ausreichender Qualität für das Training zu erhalten. Dies bietet auch den Vorteil einer besseren Analyse von Trends und Warnungen.

Anwendungsfälle mit weniger als 20.000 Nachrichten in Bezug auf historische Volumen oder jährliche Durchsatzwerte sollten sorgfältig im Hinblick auf Komplexität, ROI und den erforderlichen Aufwand zur Unterstützung und Aktivierung des Anwendungsfalls geprüft werden. Auch wenn die Möglichkeit besteht, dass solche Anwendungsfälle aufgrund dieser Überlegungen unqualifiziert werden, können dennoch ausreichend Geschäftswert bieten, um fortzufahren.

Richtlinien für die Komplexität von Anwendungsfällen

Jeder Anwendungsfall ist einzigartig, daher gibt es keine einzige Richtlinie, die für alle Komplexitätsszenarien geeignet ist. Die Beschriftungen und Felder selbst können in Bezug auf das Verständnis und die Extraktion von sehr einfach bis komplex reichen.

In der folgenden Tabelle sind grobe Richtlinien für die Komplexität von Anwendungsfällen aufgeführt.

KomplexitätBeschriftungenExtraktionsfelderAllgemeine Felder
Sehr niedrigungefähr 2–5Keine Angabe1-2
Niedrigungefähr 5–151–2 für einige Beschriftungen1–3
Mittelzwischen 15 und 501–5 für mehrere Beschriftungen1–5*
Hochmehr als 501–8 oder mehr für einen hohen Anteil an Beschriftungen1–5*

* Anwendungsfälle mit Extraktionsfeldern sollten auf diesen anstelle von allgemeinen Feldern basieren. Wenn Sie keine Extraktionsfelder verwenden, können Sie allgemeinere Felder erwarten, die aber möglicherweise keinen entsprechenden Wert hinzufügen.

Zusammenfassung

In folgender Übersichtstabelle sind einige Richtlinien für Low-Data-Anwendungsfälle aufgeführt:
Tabelle 1.
Die Anzahl der Nachrichten *EinschränkungenEmpfehlung
Weniger als 2048
  • Keine Cluster und Beschriftungsvorschläge.
  • Unzureichende Daten, um bestimmte Analysen sinnvoll zu machen.
  • Wahrscheinlich minimaler ROI.
Sollte nur sein:
  • Tests
2048 – 20.000
  • Der Wert von aktivem Lernen ist aufgrund geringerer Volumen wahrscheinlich begrenzt.
  • Wahrscheinlich nicht genügend Daten, um komplexe Anwendungsfälle zu unterstützen.
  • Eher geringer ROI.

Sollte in erster Linie sein:

  • POCs
  • Anwendungsfälle mit geringer Komplexität
  • Anwendungsfälle für die AI Center-Migration
20.000–50.000
  • Möglicherweise unzureichende Daten für sehr komplexe Anwendungsfälle, zumindest für einige komplexe Felder oder Beschriftungen.
  • Potenziell niedrigerer ROI je nach Komplexität.

Sollte in erster Linie sein:

  • Anwendungsfälle mit niedriger bis mittlerer Komplexität
  • Einige Anwendungsfälle mit hoher Komplexität
  • Anwendungsfälle für die AI Center-Migration

* Bei historischen Datenmengen, aus denen Trainingsbeispiele stammen, ist in der Regel nur ein kleiner Teil der Gesamtvolumen mit Anmerkungen versehen. Dieser Anteil ist in der Regel bei Anwendungsfällen mit geringerem Volumen und höherer Komplexität höher.

  • Überblick
  • Rendite
  • Komplexität
  • Technische Grenzen
  • Empfehlungen für geringere Datenmengen
  • Richtlinien für die Komplexität von Anwendungsfällen
  • Zusammenfassung

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo
Vertrauen und Sicherheit
© 2005–2025 UiPath. Alle Rechte vorbehalten