- Einleitung
- Einrichten Ihres Kontos
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder
- Beschriftungen (Vorhersagen, Konfidenzniveaus, Beschriftungshierarchie und Beschriftungsstimmung)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Nachrichten mit und ohne Anmerkungen
- Extraktionsfelder
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Zugriffssteuerung und Administration
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen oder Löschen einer Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Vorbereiten von Daten für den CSV-Upload
- Ein Dataset wird erstellt
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern der Dataset-Einstellungen
- Löschen einer Nachricht
- Löschen eines Datasets
- Exportieren eines Datasets
- Verwenden von Exchange-Integrationen
- Modelltraining und -wartung
- Grundlegendes zu Beschriftungen, allgemeinen Feldern und Metadaten
- Beschriftungshierarchie und Best Practices
- Vergleichen von Anwendungsfällen für Analyse und Automatisierung
- Konvertieren Ihrer Ziele in Bezeichnungen
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung
- Der Status des Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Training von Chat- und Anrufdaten
- Grundlegendes zu Datenanforderungen
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- So funktioniert die Validierung
- Verstehen und Verbessern der Modellleistung
- Gründe für die geringe durchschnittliche Beschriftungsgenauigkeit
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automations and Communications Mining™
- Entwickler (Developer)
- Verwenden der API
- API-Tutorial
- Quellen
- Datasets
- Anmerkungen
- Anhänge (Attachments)
- Vorhersagen
- Erstellen Sie einen Stream
- Aktualisieren Sie einen Stream
- Rufen Sie einen Stream nach Namen ab
- Rufen Sie alle Streams ab
- Löschen Sie einen Stream
- Ergebnisse aus Stream abrufen
- Kommentare aus einem Stream abrufen (Legacy)
- Bringen Sie einen Stream vor
- Einen Stream zurücksetzen
- Kennzeichnen Sie eine Ausnahme
- Entfernen Sie das Tag einer Ausnahme
- Prüfungsereignisse
- Alle Benutzer abrufen
- Hochladen von Daten
- Herunterladen von Daten
- Exchange Integration mit einem Azure-Dienstbenutzer
- Exchange-Integration mit der Azure-Anwendungsauthentifizierung
- Exchange-Integration mit Azure Application Authentication und Graph
- Abrufen von Daten für Tableau mit Python
- Elasticsearch-Integration
- Allgemeine Feldextraktion
- Selbst gehostete Exchange-Integration
- UiPath® Automatisierungs-Framework
- Offizielle UiPath®-Aktivitäten
- Wie Maschinen lernen, Wörter zu verstehen: eine Anleitung zu Einbettungen in NLP
- Eingabeaufforderungsbasiertes Lernen mit Transformers
- Ef Robots II: Wissensdegesterration und Feinabstimmung
- Effiziente Transformer I: Warnmechanismen
- Tief hierarchische, nicht überwachte Absichtsmodellierung: Nutzen ohne Trainingsdaten
- Beheben von Anmerkungsverzerrungen mit Communications Mining™
- Aktives Lernen: Bessere ML-Modelle in weniger Zeit
- Auf Zahlen kommt es an – Bewertung der Modellleistung mit Metriken
- Darum ist Modellvalidierung wichtig
- Vergleich von Communications Mining™ und Google AutoML für Conversation Data Intelligence
- Lizenzierung
- Häufige Fragen und mehr

Communications Mining-Benutzerhandbuch
Eine Anleitung zum Einrichten und Trainieren von allgemeinen Feldern in der Plattform.
Es ist wichtig, die wichtigsten Datenpunkte zu definieren (d. h Felder), die Sie aus Ihren Communications Mining™-Daten extrahieren möchten. Diese erleichtern in der Regel die nachgelagerte Automatisierung, können aber auch für die Analyse nützlich sein – insbesondere bei der Bewertung der potenziellen Erfolgsquote und des Nutzens von Automatisierungsmöglichkeiten.
- Allgemeine Felder sind Felder, die Sie möglicherweise extrahieren möchten und die in mehreren verschiedenen Themen/Beschriftungen in einem Dataset zu finden sind.
- Extraktionsfelder sind die Felder, die auf einer bestimmten Beschriftung bedingt und erstellt werden. Mit anderen Worten, sie ist an eine bestimmte Beschriftung gebunden, die Sie automatisieren möchten.
Sehen Sie sich die offizielle Dokumentation an, um mehr über die Felder Generative Extraktion und Allgemein vs. Extraktion zu erfahren. Wenn die Generative Extraktion in Ihrer Region nicht verfügbar ist, verwenden Sie weiterhin allgemeine Felder wie gewohnt. Der Rest dieses Abschnitts enthält eine Anleitung zur Verwendung von allgemeinen Feldern.
Letztendlich können Vorhersagen für allgemeine Felder in Kombination mit Beschriftungen die Automatisierung erleichtern, indem sie die strukturierten Datenpunkte bereitstellen, die für die Durchführung einer bestimmten Aufgabe oder eines bestimmten Prozesses erforderlich sind. Es ist viel zeiteffizienter, allgemeine Felder in Ihrem Dataset in Verbindung mit Beschriftungen zu trainieren, als sich auf die einen und dann auf die anderen zu konzentrieren (d. h. allgemeine Felder werden nach dem Training einer vollständigen Taxonomie von Beschriftungen trainiert).
Weitere Informationen finden Sie unter Generative Extraktion und Allgemeine Felder und Extraktionsfelder. Wenn die generative Extraktion in Ihrer Region nicht verfügbar ist, können Sie weiterhin allgemeine Felder wie gewohnt verwenden. Der Rest dieses Abschnitts enthält eine Anleitung zur Verwendung von allgemeinen Feldern.
Allgemeine Felder sind zusätzliche Elemente strukturierter Daten, die innerhalb der Nachrichten in Ihrem Dataset extrahiert werden können. Allgemeine Felder enthalten Datenpunkte wie Geldmengen, Datumsangaben, Währungscodes, E-Mail-Adressen, URLs sowie viele andere branchenspezifische Kategorien.
Die Plattform kann die meisten allgemeinen Felder vorhersagen, sobald sie aktiviert sind, sobald sie aktiviert sind. Da sie sie basierend auf ihrem typischen oder in einigen Fällen sehr spezifischen Format und einem Trainingssatz ähnlicher allgemeiner Felder identifizieren kann.
Ähnlich wie bei Beschriftungen können Sie allgemeine Felder akzeptieren oder ablehnen, die korrekt oder falsch vorhergesagt wurden, wodurch die Fähigkeit des Modells verbessert wird, sie in Zukunft zu identifizieren.
Typen von allgemeinen Feldern
Folgende Typen kommen für allgemeine Felder in Frage:
- Vortrainierte allgemeine Felder, die auf einem Satz von Standard- oder benutzerdefinierten Regeln basieren, z. B. Geldmenge, URL und Datum.
- Von Grund auf trainierte allgemeine Felder, die auf Machine Learning basieren. Sie können diese Felder trainieren, wie Sie Beschriftungen trainieren würden.
Trainierbare und nicht trainierbare allgemeine Felder
Trainierbare allgemeine Felder
- können von Natur aus trainierbar sein, wenn sie von Grund auf trainiert werden.
- können trainiert werden, wenn sie aktiviert sind. Das sind alle anderen Arten von allgemeinen Feldern.
Trainierbare allgemeine Felder sind solche, die basierend auf von Benutzern bereitgestellten Schulungen live in der Plattform aktualisiert werden. Weitere Informationen zum Training von allgemeinen Feldern finden Sie unterÜberprüfen und Anwenden von allgemeinen Feldern.
Wenn Sie das Training für ein vortrainiertes allgemeines Feld aktivieren, das auf einem Satz von Standard- oder benutzerdefinierten Regeln basiert, können Sie das Verständnis der Plattform dieses allgemeinen Felds innerhalb der Parameter dieser Regeln verfeinern. Im Wesentlichen wird das weitere Training den Umfang dessen, was die Plattform als allgemeines Feld berücksichtigen kann, verringern, aber nicht erweitern.
Dies liegt daran, dass viele dieser allgemeinen Felder, wie z. B. Datumsangaben, z. B. morgen, und Geldmengen, wie z. B. 20 £, in ein strukturiertes Datenformat für nachgelagerte Systeme normalisiert werden müssen. Auch für allgemeine Felder, wie z. B. IINs oder CUSIPs, müssen diese ein festgelegtes Format haben, sodass die Plattform nicht lernen sollte, alles vorherzusagen, was nicht ihren definierten Formaten entspricht.
Wenn trainierbare allgemeine Felder zugewiesen werden, betrachtet die Plattform sowohl den Text des allgemeinen Felds als auch den Kontext des allgemeinen Felds innerhalb der Rest der Kommunikation, d. h., was vor und nach dem Wert des allgemeinen Felds in geschieht demselben Absatz und dem ihn umgeben. Sie lernt, das allgemeine Feld basierend auf den Werten selbst besser vorherzusagen und zu erfahren, wie der Wert im Kontext der Kommunikation erscheint.
Nicht trainierbare allgemeine Felder
Wenn ein vortrainiertes allgemeines Feld nicht als trainierbar festgelegt ist, können Sie die Vorhersagen für allgemeine Felder, die Sie in Ihrem Dataset identifizieren, weiterhin akzeptieren oder ablehnen. Diese werden offline mithilfe dieses plattforminternen Benutzerfeedbacks aktualisiert und verfeinert.
Es ist für Sie hilfreich, diese allgemeinen Felder bei der Überprüfung von Nachrichten zu akzeptieren oder abzulehnen.
Weitere Informationen zum Aktivieren von allgemeinen Feldern in einem Dataset finden Sie auf der Seite Aktivieren, Deaktivieren, Aktualisieren und Erstellen von allgemeinen Feldern .
Standardvorlagenfeldtypen für allgemeine Felder
Beim Konfigurieren von allgemeinen Feldtypen können Sie über die Vorlagenoption bei der Auswahl des Datentyps für den Feldtyp aus einer der folgenden vorgefertigten Optionen auswählen:
Typ des allgemeinen Felds | Beschreibung |
---|---|
Eine E-Mail-Adresse. | |
Währung | Ein Währungscode, wie z. B Wechselzahlung, Wechselal bitte Rechnung oder USD. |
URL | Ein Uniform Resource Locator, d. h. eine Web-Adresse. |
SEDOL | Eine Finanzsicherheitskennung, kurz für Tägliche offizielle Liste der Exchange, die 7 Zeichen lang ist. |
BIC-Code | Ein Business Identifier Code (BIC) ist ein globaler Standard unter ISO 9362 für die Weiterleitung von Geschäftstransaktionen und die Identifizierung von Geschäftsparteien. Der BIC-Code ist 8 oder 11 Zeichen lang. |
LEI | Ein Legitimation Identifier (Lei) ist eine eindeutige globale Kennung von Rechtsträgern, die an Finanztransaktionen beteiligt sind. Lei ist als 20-stelliger alphanumerischer Code formatiert. |
ist in | Eine internationalen Wertschriftenidentifikationsnummer (ISIN) identifiziert ein Finanzsicherheit eindeutig. ISON ist ein 12-stelliger alphanumerischer Code. |
Mark-to-Market (MTM oder M2M) | Mark-to-Market bezieht sich auf den beizulegenden Zeitwert eines Anlagewerts oder einer Fälligkeit. Die Marktbewertung basiert auf dem aktuellen Marktpreis, dem Preis ähnlicher Anlagen und Lasten oder einem anderen objektiv ermittelten beizulegenden Zeitwert. |
CUSIP | Ein CUSIP ist eine 9-stellige Zahl oder ein 9-stelliger alphanumerischer Code, der eine US-amerikanische Finanzsicherheit identifiziert, um das Clearing und die Abrechnung von Transaktionen zu erleichtern. |
- You must have assigned the IXP Viewer or IXP Analyst, and IXP Project Admin roles as an Automation Cloud user, or the View sources and Modify Datasets, or Datasets Admin, permissions as a legacy user.
- Sie haben ein Standardkontingent von 25 allgemeinen Feldern pro Dataset. Wenn Sie mehr als 25 allgemeine Felder benötigen, fordern Sie über das Kontoteam eine Kontingenterhöhung an.
Aktivieren allgemeiner Felder in einem neuen Dataset
Um allgemeine Felder in einem neuen Dataset zu aktivieren, das Sie erstellen möchten, wählen Sie sie während des Einrichtungsvorgangs aus.
+
im unten angezeigten Feld aus. Ihnen wird ein Dropdownmenü mit allen allgemeinen Feldern angezeigt, die Sie für dieses Dataset aktivieren können. Wählen Sie alle allgemeinen Felder aus, die Sie aktivieren möchten, bevor Sie das Dataset erstellen. Wenn Sie einen Fehler hinzufügen, können Sie das X-Symbol neben dem Namen des allgemeinen Felds auswählen, um ihn zu entfernen.
Weitere Informationen zum Erstellen eines neuen Datasets finden Sie unter Ein neues Dataset erstellen.
Aktivieren, Aktualisieren und Deaktivieren allgemeiner Felder in einem vorhandenen Dataset
Wenn Sie allgemeine Felder für ein vorhandenes Dataset aktivieren, aktualisieren oder deaktivieren möchten, können Sie dies über die Registerkarte „ Einstellungen “ in der oberen Navigationsleiste tun und dann die Registerkarte Beschriftungen und Extraktionsfelder auswählen.
Aktivieren von allgemeinen Feldern
Um vorhandene allgemeine Felder zu aktivieren, wählen Sie im Feld Allgemeine Felder aus und wählen Sie die allgemeinen Felder, die Sie aktivieren möchten, im Dropdownmenü aus. Wenn Sie mit Ihrer Auswahl zufrieden sind, wählen Sie Allgemeine Felder aktualisieren aus (wie unten gezeigt).
Die Einstellungen dieser allgemeinen Felder werden für Sie vorab ausgewählt. Sie können sie dann aktualisieren und sie trainierbar machen, wie unten gezeigt.
Aktualisieren von allgemeinen Feldern
Um ein aktiviertes allgemeines Feld zu aktualisieren, wählen Sie das allgemeine Feld im Feld für das allgemeine Feld aus, wie in den vorherigen Bildern gezeigt. Das Modal Allgemeines Feld bearbeiten wird wie in der folgenden Abbildung gezeigt angezeigt.
Hier können Sie das allgemeine Basisfeld, den Titel des allgemeinen Felds und den API-Namen aktualisieren (diese Konzepte werden unten im Detail beschrieben) sowie das allgemeine Feld als „trainierbar“ festlegen.
Wenn Sie zuvor allgemeine Felder für eine allgemeine Feldart überprüft haben, die nicht auf „trainierbar“ festgelegt war, werden diese Informationen dennoch gespeichert.
Deaktivieren von allgemeinen Feldern
Um ausgewählte allgemeine Felder zu entfernen, wählen Sie einfach das Symbol „X“ neben dem Namen des allgemeinen Felds aus und dann Allgemeine Felder aktualisieren.
Wenn Sie ein allgemeines Feld entfernen und Allgemeine Felder aktualisieren auswählen, werden auch die Trainingsdaten für dieses allgemeine Feld für dieses Dataset entfernt. Wenn Sie das allgemeine Feld erneut aktivieren, müssen Sie es erneut trainieren.
Wenn Sie beim Aktualisieren der allgemeinen Felder einen Fehler machen , wählen Sie „Zurücksetzen“ aus, bevor Sie „Allgemeine Felder aktualisieren“ auswählen, und Ihre Änderungen werden nicht angewendet.
Erstellen neuer allgemeiner Felder
In den vorherigen Abschnitten wurde behandelt, wie vorhandene vortrainierte allgemeine Felder für neue sowie vorhandene Datasets aktiviert und aktualisiert werden können. In jeder Instanz können Sie für ein neues oder vorhandenes Dataset auch neue allgemeine Felder erstellen.
Neu erstellte allgemeine Felder können auf einem vorhandenen vortrainierten allgemeinen Feld basieren oder wie eine neue Beschriftung von Grund auf trainiert werden.
+
im Feld für das allgemeine Feld auswählen, entweder im Flow „Dataset erstellen“ oder auf der Seite „Dataset-Einstellungen“, wie zuvor gezeigt.
Dadurch wird das modale Element Neues allgemeines Feld hinzufügen angezeigt, wie unten gezeigt.
Hier können Sie die Feldtypen, den Titel und den API-Namen festlegen und auswählen, ob das allgemeine Feld trainierbar ist oder nicht. Diese können später, wie zuvor gezeigt, aktualisiert werden.
Wenn Sie eines der Felder ausgefüllt haben (unten erläutert), wählen Sie einfach „ Erstellen“ aus.
Field types
- Dies dient als Ausgangszustand für Ihr neues allgemeines Feld und die Dropdownliste enthält eine Liste aller vortrainierten allgemeinen Felder, die Ihnen zur Verfügung stehen
- Wenn Sie z. B. „Datum“ als allgemeines Basisfeld auswählen, sind alle allgemeinen Felder, die für diese Art vorhergesagt werden, Datumsangaben. Sie können dann die Plattform so trainieren, dass nur bestimmte Datumsangaben erkannt werden
-
Wenn Sie ein allgemeines Feld vollständig von Grund auf neu trainieren möchten, können Sie „Keine – Von Grund auf trainieren“ auswählen, dann beginnen Sie im Wesentlichen mit einer leeren Arbeitsfläche, wenn Sie das allgemeine Feld trainieren. Die Vorhersagen der Plattform für dieses allgemeine Feld basieren vollständig auf den Trainingsbeispielen, die Sie angeben
Allgemeiner Feldtitel
- Der Titel des allgemeinen Felds ist der Name des allgemeinen Felds, der auf der Benutzeroberfläche der Plattform angezeigt wird
ApiName
- Der API-Name des allgemeinen Felds wird über die API zurückgegeben, wenn es Vorhersagen für Nachrichten bereitstellt
- Der API-Name darf keine Leerzeichen oder Interpunktion enthalten, außer Bindestrich (-) und Unterstrich (_).
========================================= ===================
Aktivieren allgemeiner Felder in einem neuen Dataset
Um allgemeine Felder in einem neuen Dataset zu aktivieren, das Sie erstellen möchten, wählen Sie sie während des Einrichtungsvorgangs aus.
+
im unten angezeigten Feld aus. Ihnen wird ein Dropdownmenü mit allen allgemeinen Feldern angezeigt, die Sie für dieses Dataset aktivieren können. Wählen Sie alle allgemeinen Felder aus, die Sie aktivieren möchten, bevor Sie das Dataset erstellen. Wenn Sie einen Fehler hinzufügen, können Sie das X-Symbol neben dem Namen des allgemeinen Felds auswählen, um ihn zu entfernen.
Weitere Informationen zum Erstellen eines neuen Datasets finden Sie unter Erstellen eines neuen Datasets.
Verwalten von allgemeinen Feldern in einem vorhandenen Dataset
- Öffnen Sie das vorhandene Dataset.
- Wählen Sie die Registerkarte Einstellungen aus.
- Wählen Sie Taxonomie und dann Beschriftungen und Extraktionsfelder aus.
Ähnlich wie bei Beschriftungen können Sie Nachrichten sowohl in Explore als auch in Berichte danach filtern, ob allgemeine Felder vorhergesagt oder zugewiesen wurden.
Sie können eine beliebige Kombination der Filter UND, JEDE ODER und NICHT anwenden, wenn Sie mehr als einen Filter für allgemeine Felder anwenden. Diese Filter können Ihnen viel mehr Flexibilität beim Training und Interpretieren Ihrer Daten bieten und viel tiefere Einblicke in die Vorgänge in Ihren Kommunikationskanälen liefern.
Das können Sie beim Filtern nach Vorhersagen von allgemeinen Feldern tun:
- Wenden Sie mehrere Filter für allgemeine Felder gleichzeitig an, sowohl in Explore als auch in Berichten
- Filtern Sie nach Nachrichten, für die eine der Anzahl der ausgewählten allgemeinen Felder vorhergesagt wurde. Zum Beispiel: BELIEBIGE vom allgemeinen Feld X UND allgemeines Feld Y UND so weiter.
- Filtern Sie nach Nachrichten, für die mehrere unterschiedliche allgemeine Felder vorhergesagt wurden. Zum Beispiel allgemeines Feld X UND allgemeines Feld Y UND so weiter.
- Filtern Sie nach Nachrichten, für die bestimmte allgemeine Felder nicht vorhergesagt wurden. Zum Beispiel: NICHT das allgemeine Feld Y.
- Suchen Sie nach allgemeinen Feldern, die bestimmte Suchbegriffe enthalten, während Filter für allgemeine Felder angewendet werden.
Alle allgemeinen Felder, die Sie in Ihrem Dataset aktiviert haben, werden wie unten in der Filterleiste angezeigt. Ausführliche Informationen zum Zuweisen allgemeiner Felder finden Sie unter Überprüfen und Anwenden von allgemeinen Feldern.
Anwenden von erweiterten Vorhersagefiltern
Es gibt jetzt zwei Möglichkeiten, Filter für allgemeine Felder anzuwenden, und Sie können sie miteinander kombinieren, um den richtigen Abfragetyp zu erstellen.
Der Standardstatus ist der Status, in dem kein Filter angewendet wird und alle Meldungen angezeigt werden, es sei denn, ein anderer Filter wird angewendet.
Um den Filter für allgemeine Felder zu aktualisieren, verwenden Sie die in der folgenden Tabelle erläuterten Schaltflächen, die bei Auswahl auch die Farbe ändern:
Nachrichten anzeigen, die allgemeine Felder mit Anmerkungen enthalten. | |
Nachrichten anzeigen, die voraussichtlich ein allgemeines Feld enthalten |
Wenn Sie nach Nachrichten filtern möchten, die allgemeine Felder mit Anmerkungen haben oder die voraussichtlich ein allgemeines Feld enthalten, verwenden Sie die Schaltflächen oben, wie in der vorherigen Tabelle gezeigt. Wenn Sie nach Nachrichten mit bestimmten allgemeinen Feldern mit Anmerkungen oder vorhergesagten allgemeinen Feldern filtern möchten, zeigen Sie mit dem Mauszeiger auf das jeweilige allgemeine Feld und dieselben beiden Schaltflächen werden rechts angezeigt.
Wenn Sie entweder nach einem zugewiesenen oder einem vorhergesagten allgemeinen Feld filtern möchten, wählen Sie den Namen des allgemeinen Felds aus. Es werden Nachrichten mit einem von ihnen angezeigt.
Um Ihre Auswahl zu entfernen, wählen Sie die Schaltfläche erneut aus, und um mehrere Auswahlmöglichkeiten zu entfernen, wählen Sie Alle. Sie können in der Filterleiste auch Alle löschen auswählen. Dadurch wird jedoch jeder ausgewählte Filter gelöscht, nicht nur Filter für allgemeine Felder.
Die Leiste des allgemeinen Felds
Die Taxonomie der allgemeinen Felder fungiert als normale Filterleiste und ermöglicht es Ihnen, mehrere allgemeine Felder gleichzeitig mit einer einzigen Auswahl für jedes auszuwählen.
Wenn Sie mehrere allgemeine Felder aus der Liste auswählen, wird eine Abfrage vom Typ ANY unter erstellt.
Wenn Sie in der Leiste für allgemeine Felder allgemeines Feld A, allgemeines Feld B und allgemeines Feld C ausgewählt haben, wird eine vorausgesagte Abfrage von Nachrichten mit allgemeinem Feld A, allgemeinem Feld B oder allgemeinem Feld C erstellt.
Beim Filtern nach bestimmten allgemeinen Feldern können Sie mehrere Auswahlen treffen. Sie können z. B. filtern, um Nachrichten anzuzeigen, denen ein allgemeines Feld Adresszeile zugewiesen ODER ein allgemeines Feld für die Stadt vorhergesagt wurde, wie in der folgenden Abbildung gezeigt.
Filter für allgemeine Felder hinzufügen
Die zweite Filteroption ist die Schaltfläche + Filter für allgemeine Felder hinzufügen .
Dadurch wird eine Dropdownleiste für allgemeine Felder aktiviert, mit der Sie komplexere Filter auswählen können, z. B. bestimmte allgemeine Felder von der Berücksichtigung ausschließen.
In dieser Dropdownliste können Sie mehrere allgemeine Felder zum Ein- oder Ausschließen auswählen, indem Sie den Namen des allgemeinen Felds (für zugewiesen und vorhergesagt) oder die einzelnen Schaltflächen ( einschließlich Minus für, wenn dieses allgemeine Feld weder zugewiesen noch vorhergesagt ist) auswählen.
Das Ergebnis sieht aus wie in diesem Beispiel, das Nachrichten zurückgibt, bei denen voraussichtlich das allgemeine Feld Rechnungs-ID, aber nicht das allgemeine Feld Produkt-ID zugewiesen oder vorhergesagt wurde:
Sie können mehrmals + Filter für allgemeine Felder hinzufügen auswählen, um Ihrer Abfrage zusätzliche Ebenen hinzuzufügen. Zwei separate Filter für allgemeine Felder erstellen eine Abfrage vom Typ UND , während mehrere allgemeine Felder, die im selben Filter für allgemeine Felder ausgewählt werden, eine Abfrage vom Typ JEDE ODER erstellen.
Im folgenden Beispiel wurden mehrere allgemeine Feldfilter einzeln angewendet. Dadurch wird ein Filter erstellt, der Nachrichten zurückgibt, die voraussichtlich eines der drei allgemeinen Felder im ersten Filter haben, bei denen aber auch das allgemeine Feld Richtliniennummer vorhergesagt wurde und bei denen das allgemeine Feld Postleitzahl des Vereinigten Königreichs nicht vorhergesagt oder zugewiesen wurde.
Ein hilfreicher Tipp: Durch die Auswahl des & Anmeldens in einem einzelnen Filter mit mehreren allgemeinen Feldern können Sie diese automatisch in einzelne Filter aufteilen. Dadurch würde die Abfrage von ANYOf, d. h. eines dieser vorhergesagten allgemeinen Felder, zu AND geändert, d. h. alle diese allgemeinen Felder werden vorhergesagt.
Kombinieren allgemeiner Feldleistenfilter und hinzugefügter allgemeiner Feldfilter
Sie können Filter sowohl aus der Leiste für allgemeine Felder als auch aus einzeln hinzugefügten Filtern für allgemeine Felder kombinieren. Filter, die in der Leiste für allgemeine Felder angewendet werden, werden als UND- Abfrage mit allen einzeln angewendeten Filtern für allgemeine Felder behandelt.
In der folgenden Abbildung würde diese kombinierte Abfrage beispielsweise alle Nachrichten zurückgeben, für die entweder Order-ID oder PROD-ID vorhergesagt wurde.
Kombinieren Sie den Filter für allgemeine Felder mit der Leiste für allgemeine Felder und individuell hinzugefügte Filter für allgemeine Felder.
Kombinieren allgemeiner Feldfilter und Sortieren nach allgemeinem Feld für das Training
Diese Filter bedeuten auch, dass Sie nun Filter für allgemeine Felder anwenden und nach einem bestimmten allgemeinen Feld für einen Trainingsmodus sortieren können.
Identifizieren allgemeiner Feldvorhersagen
Vorhergesagte allgemeine Felder werden als farblich hervorgehobener Text angezeigt, wie z. B. in der ersten Zeile der Nachricht in der folgenden Abbildung, wobei für jeden unterschiedlichen Typ von allgemeinen Feldern eine andere Farbe erscheint. Sobald Sie ein allgemeines Feld bestätigt haben, indem Sie es entweder manuell anwenden oder eine Vorhersage akzeptieren, wird das allgemeine Feld als hervorgehobener Text mit einer fetten, dunkleren Kontur angezeigt, wie in der folgenden Abbildung gezeigt.
Wenn einem Absatz allgemeine Felder zugewiesen, verworfen oder angewendet wurden, wird er grau hervorgehoben, wie im Textkörper der Nachricht von der folgenden Abbildung gezeigt.
Erstellen von Vorhersagen für allgemeine Felder für trainierbare allgemeine Felder
Bei der Überprüfung trainierbarer allgemeiner Felder lernt die Plattform sowohl von den allgemeinen Feldwerten, die Sie zuweisen, als auch aus dem Kontext, wo sie innerhalb der Kommunikation angezeigt werden, d. h. der anderen Sprache, die für die Werte selbst verwendet wird.
Die Plattform berücksichtigt den Kontext der Sprache im selben Absatz wie der Wert des allgemeinen Felds sowie die einzelnen Absätze, die durch eine neue getrennte Zeile direkt vor und nach dem Absatz gekennzeichnet sind, in dem sich das allgemeine Feld befindet.
Allgemeine Feldkonfidenzbewertungen
Wenn die Plattform vorhersagt, welche allgemeinen Felder für eine Kommunikation gelten, weist sie jeder Vorhersage einen Konfidenzwert (%) zu, um zu zeigen, wie sicher das allgemeine Feld für den hervorgehobenen Textabschnitt gilt. Sie können die Konfidenzbewertung eines allgemeinen Felds anzeigen, indem Sie mit dem Mauszeiger auf das allgemeine Feld zeigen.
Diese Konfidenzpunktzahl wird auch über die API zur Verfügung gestellt, sodass sie in automatisierte Aktionen im nachgelagerten Bereich einfließt.
Akzeptieren und Ablehnen von allgemeinen Feldvorhersagen
Sobald allgemeine Felder aktiviert sind, beginnt die Plattform automatisch, sie in den Nachrichten in Ihrem gesamten Dataset vorherzusagen. Weitere Informationen finden Sie unter Überprüfen und Anwenden von allgemeinen Feldern. Sie können dann die Vorhersagen, die richtig sind, akzeptieren oder sie ablehnen, wenn sie falsch sind. Jede dieser Aktionen sendet Trainings signale, die verwendet werden, um das Verständnis der Plattform dieses allgemeinen Felds zu verbessern.
Für die vortrainierten allgemeinen Felder, die offline trainiert werden, z. B. Geldmenge, URL usw., ist es aus Sicht der Verbesserung wichtiger, falsche Vorhersagen abzulehnen oder zu korrigieren, als korrekte Vorhersagen zu akzeptieren.
Für die allgemeinen Felder, die live in der Plattform trainieren, ist es ebenso wichtig, korrekte Vorhersagen zu akzeptieren sowie falsche Vorhersagen abzulehnen. Sie müssen jedoch nicht weiterhin viele korrekte Beispiele für jedes eindeutige allgemeine Feld für diese Arten akzeptieren, wenn Sie keine falsch vorhergesagten finden. Beispiel: Bank Express, ist ein eindeutiges allgemeines Feld einer Organisation.
Um die Vorhersage eines allgemeinen Felds zu überprüfen, bewegen Sie den Mauszeiger auf die Vorhersage. Das modale Element zur Überprüfung des allgemeinen Felds wird angezeigt, wie im Beispiel der folgenden Abbildung gezeigt. Um sie zu akzeptieren, wählen Sie Bestätigen aus, um sie abzulehnen, wählen Sie Verwerfen aus.
Sie können allgemeine Felder und Beschriftungen unabhängig voneinander trainieren. Das Überprüfen von Beschriftungen für eine Nachricht bedeutet nicht, dass Sie die allgemeinen Felder in derselben Nachricht überprüfen müssen. Es empfiehlt sich jedoch, beides gleichzeitig zu tun, da es die effizienteste Nutzung Ihrer Zeit während des Modelltrainings ist.
Um zu verstehen, wie gut die Plattform jedes aktivierte allgemeine Feld für ein Dataset vorhersagen kann, insbesondere die trainierbaren, sehen Sie unter Validierung für allgemeine Felder.
Anwenden allgemeiner Felder
Um ein allgemeines Feld auf einen Text anzuwenden, bei dem die Plattform es möglicherweise nicht vorhergesagt hat, müssen Benutzer lediglich den Testabschnitt markieren, wie beim Kopieren.
Ein Dropdownmenü wird angezeigt, wie in der folgenden Abbildung gezeigt, das alle allgemeinen Felder enthält, die Sie für Ihr Dataset aktiviert haben. Wählen Sie die richtige aus, um sie anzuwenden, oder drücken Sie die entsprechende Tastenkombination.
Die Standardtastenkombination für jedes allgemeine Feld ist der Buchstabe, mit dem es beginnt. Wenn mehrere allgemeine Felder mit demselben Buchstaben beginnen, wird eines dem anderen zufällig zugewiesen.
Sobald ein allgemeines Feld angewendet wurde, wird es farblich mit einer fetten Kontur hervorgehoben, wie in der folgenden Abbildung gezeigt. Jeder Typ von allgemeinen Feldern hat eine eigene spezifische Farbe.
Best Practices
- Wörter nicht aufteilen.
- Absätze nicht teilweise mit Anmerkungen versehen.
Wörter nicht aufteilen
Stellen Sie sicher, dass Sie Wörter nicht aufteilen, da das hervorgehobene allgemeine Feld das gesamte Wort oder mehrere, nicht nur einen Teil davon abdecken sollte. In den folgenden Bildern finden Sie ein Beispiel für eine falsche und eine korrekte Anwendung.
Absätze nicht teilweise mit Anmerkungen versehen
Wenn ein Benutzer bei der Anmerkung einer Nachricht eine Beschriftung zuweist, sollte er alle Beschriftungen anwenden, die für diese Nachricht gelten könnten. Andernfalls bringen Sie dem Modell bei, dass diese anderen Beschriftungen nicht zutreffen. Für allgemeine Felder gilt das Gleiche, mit Ausnahme der allgemeinen Felder, die auf Absatzebene überprüft oder angewendet werden und nicht auf die gesamte Nachricht.
Absätze in einer Nachricht werden durch neue Zeilen getrennt. Die Betreffzeile einer E-Mail-Nachricht wird als eigener einzelner Absatz betrachtet.
Überprüfen oder wenden Sie alle allgemeinen Felder innerhalb eines Absatzes auf alle Arten von allgemeinen Feldern an, wenn Sie eines davon überprüfen oder anwenden. Das Anwenden, Akzeptieren oder Ablehnen von allgemeinen Feldern in einem Absatz bedeutet, dass der Absatz von der Plattform aus der Perspektive des allgemeinen Felds überprüft wird. Stellen Sie daher sicher, dass Sie alle Vorhersagen in diesem Absatz akzeptieren oder ablehnen.
Das folgende Beispiel zeigt die verschiedenen Absätze, die innerhalb der E-Mail-Nachricht überprüft wurden.
Die in der folgenden Abbildung dargestellte Meldung zeigt dasselbe Beispiel, bei dem der Benutzer nicht alle Vorhersagen des allgemeinen Felds in einem einzelnen Absatz akzeptiert oder abgelehnt hat. Dies ist falsch, da das Modell das allgemeine Feld Geldmenge fälschlicherweise als falsche Vorhersage behandelt.
Einleitung
Die Plattform zeigt Validierungsstatistiken, Warnungen und empfohlene Aktionen für aktivierte allgemeine Felder auf der Seite Validierung an, ähnlich wie für jede Bezeichnung in Ihrer Taxonomie.
Um diese anzuzeigen, navigieren Sie zur Seite Validierung und wählen Sie oben die Registerkarte Allgemeine Felder aus, wie in der Abbildung unten gezeigt.
Funktionsweise der Validierung von allgemeinen Feldern
Der Prozess, bei dem die Plattform ihre Fähigkeit validiert, allgemeine Felder korrekt vorherzusagen, ist sehr ähnlich wie bei Beschriftungen.
Nachrichten werden beim ersten Hinzufügen zum Dataset in einen Trainingssatz und einen Testsatz (zufällig durch die Nachrichten-ID jeder Nachricht bestimmt) aufgeteilt (80:20). Alle allgemeinen Felder, die zugewiesen wurden (akzeptierte oder korrigierte Vorhersagen), fallen in den Trainingssatz oder den Testsatz, basierend auf dem Satz, dem die Nachricht, in dem sie sich befinden, ursprünglich zugewiesen wurde.
Da es manchmal eine sehr große Anzahl allgemeiner Felder in einer Nachricht gibt und es keine Garantie gibt, ob sich eine Nachricht im Trainingssatz oder im Testsatz befindet, sehen Sie möglicherweise einen großen Unterschied zwischen der Anzahl der allgemeinen Felder in jedem Satz.
Es kann auch Fälle geben, in denen alle zugewiesenen allgemeinen Felder in den Trainingssatz fallen. Da im Testsatz mindestens ein Beispiel erforderlich ist, um die Validierungspunktzahlen zu berechnen, würde dieses allgemeine Feld mehr zugewiesene Beispiele erfordern, bis einige im Testsatz vorhanden waren.
Berechnung der Punktzahlen
Die einzelnen Präzisions- und Rückrufstatistiken für jedes allgemeine Feld mit ausreichend Trainingsdaten werden auf sehr ähnliche Weise wie Bezeichnungen berechnet:
Genauigkeit = Anzahl der übereinstimmenden allgemeinen Felder / Anzahl der vorhergesagten allgemeinen Felder
Rückruf = Anzahl der übereinstimmenden allgemeinen Felder / Anzahl der tatsächlichen allgemeinen Felder
Bei einem „übereinstimmenden allgemeinen Feld“ hat die Plattform das allgemeine Feld genau vorhergesagt (d. h keine teilweisen Übereinstimmungen)
Die F1-Punktzahl ist lediglich das harmonierende Mittel für sowohl Präzision als auch Rückruf.
Trainierbare allgemeine Felder
Es ist erwähnenswert, dass die auf dieser Seite angezeigten Genauigkeits- und Rückrufstatistiken am nützlichsten für die allgemeinen Felder sind, die live in der Plattform trainierbar sind, wie in der zweiten Spalte oben angezeigt, da alle allgemeinen Felder, die für diese Arten von allgemeinen Feldern überprüft werden, sich direkt auswirken die Fähigkeit der Plattform, diese allgemeinen Felder vorherzusagen.
Daher sollten nach Möglichkeit korrekte allgemeine Felder akzeptiert und falsche allgemeine Felder korrigiert oder abgelehnt werden.
Vortrainierte allgemeine Felder
Bei allgemeinen Feldern, die über Vorlagenfeldtypen vortrainiert werden, müssten die Benutzer sicherstellen, dass sie eine beträchtliche Anzahl korrekter Vorhersagen akzeptieren und falsche Vorhersagen korrigieren, damit die Validierungsstatistiken die Leistung genau widerspiegeln.
Wenn sie nur falsche Vorhersagen korrigieren sollten, würden die Trainings- und Testsätze nur mit den Instanzen gefüllt sein, in denen die Plattform Schwierigkeiten hat, ein allgemeines Feld vorherzusagen, und nicht mit denen, in denen sie sie besser vorhersagen kann. Da die Korrektur falscher Vorhersagen für diese allgemeinen Felder nicht zu einer Echtzeitaktualisierung dieser allgemeinen Felder führt (sie werden regelmäßig offline aktualisiert), ändern sich die Validierungsstatistiken möglicherweise einige Zeit lang nicht und könnten falsch niedrig ausfallen.
Es ist möglicherweise nicht immer praktisch, viele der richtigen Vorhersagen zu akzeptieren, da diese allgemeinen Felder viel häufiger korrekt vorhergesagt werden. Wenn aber die meisten Vorhersagen für diese allgemeinen Felder korrekt sind, müssen Sie sich wahrscheinlich keine Gedanken über deren Genauigkeit und die Rückrufstatistiken auf der Seite Validierung machen.
Grundlegendes zu den zusammengefassten Statistiken
Die zusammenfassenden Statistiken (durchschnittliche Präzision, durchschnittliche Wiedererkennung und durchschnittliche F1-Punktzahl) sind lediglich Durchschnittswerte jeder der einzelnen allgemeinen Feldpunktzahlen.
Wie bei Beschriftungen sind nur allgemeine Felder mit ausreichenden Trainingsdaten in den Durchschnittspunktzahlen enthalten. Bei Trainingsdaten, die nicht über ausreichende Trainingsdaten verfügen, wird neben ihrem Namen ein Warnsymbol angezeigt.
Metriken
Die SeiteValidierung von allgemeinen Feldern zeigt die durchschnittlichen Leistungsstatistiken für allgemeine Felder sowie ein Diagramm mit der durchschnittlichen F1-Punktzahl jedes allgemeinen Felds im Vergleich zur Trainingssatzgröße. Das Diagramm gekennzeichnet auch allgemeine Felder, die orange oder rote Leistungswarnungen aufweisen.
Die angezeigten allgemeinen Feldleistungsstatistiken sind:
- Durchschnittliche F1-Punktzahl: Durchschnitt der F1-Punktzahl in allen allgemeinen Feldern mit ausreichend Daten, um die Leistung genau zu schätzen. Bei dieser Punktzahl werden Erinnerung und Genauigkeit gleich gewichtet. Ein Modell mit einer hohen F1-Punktzahl erzeugt weniger falsch positive und negative Ergebnisse.
- Durchschnittliche Genauigkeit: Durchschnitt der Genauigkeitspunktzahlen in allen allgemeinen Feldern mit ausreichend Daten, um die Leistung genau zu schätzen. Ein Modell mit hoher Genauigkeit erzeugt weniger falsch positive Ergebnisse.
- Durchschnittliche Rückrufaktion: Durchschnitt der Rückrufbewertungen in allen allgemeinen Feldern mit ausreichend Daten, um die Leistung genau zu schätzen. Ein Modell mit hoher Wiedererkennung erzeugt weniger falsch negative Ergebnisse.
Verstehen der allgemeinen Feldleistung
Das Leistungsdiagramm für allgemeine Felder, das auf der Registerkarte Metriken der Seite Validierung angezeigt wird, gibt sofort einen visuellen Überblick über die Leistung jedes einzelnen allgemeinen Felds. Weitere Informationen finden Sie im vorherigen Abschnitt.
Damit ein allgemeines Feld in diesem Diagramm angezeigt werden kann, muss es mindestens 20 angeheftete Beispiele im Trainingssatz haben, der von der Plattform während der Validierung verwendet wird. Um dies zu gewährleisten, sollten Benutzer mindestens 25 (oft mehr) angeheftete Beispiele pro allgemeinem Feld aus 25 verschiedenen Nachrichten angeben.
Jedes allgemeine Feld wird in einer von drei Farben dargestellt, basierend auf dem Verständnis des Modells von der Leistung des allgemeinen Felds. Im Folgenden erklären wir, was diese bedeuten:
Allgemeine Feldleistungsindikatoren
- Blau – Die allgemeinen Felder, die im Diagramm blau dargestellt sind, haben eine zufriedenstellende Leistung. Dies basiert auf zahlreichen Faktoren, die dazu beitragen, einschließlich der Anzahl und Vielfalt der Beispiele und der durchschnittlichen Genauigkeit für dieses allgemeine Feld
- Gelb – Allgemeine Felder, die als Gelb aufgezeichnet sind, haben eine etwas weniger zufriedenstellende Leistung. Sie können eine relativ geringe durchschnittliche Genauigkeit oder nicht genügend Trainingsbeispiele haben. Diese allgemeinen Felder erfordern ein wenig Training/Korrektur, um ihre Leistung zu verbessern
- Rot – Allgemeine Felder, die rot aufgezeichnet werden, haben eine schlechte Leistung. Möglicherweise haben sie eine sehr geringe durchschnittliche Genauigkeit oder nicht genügend Trainingsbeispiele. Diese allgemeinen Felder können erheblich mehr Training/Korrektur erfordern, um ihre Leistung auf ein zufriedenstellendes Maß zu verbessern
Einzelne allgemeine Feldleistung
Benutzer können einzelne allgemeine Felder in der Filterleiste für allgemeine Felder auswählen (oder das Diagramm des allgemeinen Felds im Diagramm Alle allgemeinen Felder auswählen), um die Leistungsstatistiken des allgemeinen Felds anzuzeigen.
In der spezifischen Ansicht des allgemeinen Felds werden auch alle Leistungswarnungen angezeigt sowie Vorschläge für die nächste beste Aktion empfohlen, um ihre Leistung zu verbessern.
Die Ansicht des allgemeinen Felds zeigt die durchschnittliche F1-Punktzahl für das allgemeine Feld sowie seine Genauigkeit und Wiedererkennung an .
Überblick
Wie Trainingsbezeichnungen bringt ein Benutzer der Plattform bei, welche allgemeinen Felder mithilfe verschiedener Trainingsmodi für eine bestimmte Nachricht gelten.
Wie bei Beschriftungen stehen die Modi Lehren, Überprüfen und Fehlt zur Verfügung, um die Leistung von allgemeinen Feldern zu trainieren und zu verbessern. Sie können entweder 1) auf der Seite Erkunden mit dem Trainings-Dropdownmenü oder 2) durch Befolgen der empfohlenen Aktionen auf erfolgen Registerkarte Allgemeine Felder der Seite Validierung .
Allgemeine empfohlene Aktionen für das Feld
Wenn ein bestimmtes allgemeines Feld eine Leistungswarnung aufweist, empfiehlt die Plattform die nächstbeste Aktion, die ihrer Meinung nach hilft, diese Warnung zu beheben, die in der Reihenfolge der Priorität aufgeführt ist. Dies wird angezeigt, wenn Sie ein bestimmtes allgemeines Feld aus der Taxonomie oder dem Diagramm Alle allgemeinen Felder auswählen.
Die nächsten besten Aktionsvorschläge fungieren als Links, die Sie auswählen können, um direkt zur Trainingsansicht zu gelangen, die die Plattform vorschlägt, um die Leistung des allgemeinen Felds zu verbessern. Die Vorschläge werden intelligent mit der Aktion mit der höchsten Priorität sortiert, um das zuerst aufgeführte allgemeine Feld zu verbessern.
Dies ist das wichtigste Tool, um die Leistung Ihrer allgemeinen Felder zu verstehen. Es sollte regelmäßig als Leitfaden verwendet werden, wenn Sie versuchen, die Leistung der allgemeinen Felder zu verbessern.
Allgemeine Feldtrainingsmodi
Die folgende Tabelle fasst zusammen, wann die Plattform jeden allgemeinen Feldtrainingsmodus empfiehlt:
Allgemeines Feld lehren | Allgemeines Feld prüfen | Allgemeines Feld verpasst |
|
|
|
Verwenden des Felds „Teach Allgemein“.
Die Verwendung von Teach Texter
Die Plattform empfiehlt Allgemeine Felder lehren , wenn:
- Neben einem allgemeinen Feld befindet sich eine Leistungswarnung, wie in der folgenden Abbildung gezeigt. Dies tritt auf, wenn nicht mindestens 25 Beispiele angegeben wurden.
- Die F1-Punktzahl für ein bestimmtes allgemeines Feld ist niedrig.
- Es kann sein, dass der Kontext innerhalb des Texts für ein allgemeines Feld nicht immer offensichtlich ist oder es viele Variationen innerhalb der Werte des allgemeinen Felds für einen bestimmten Typ gibt.
Die folgende Abbildung enthält ein Beispiel für das Training eines allgemeinen Felds im Modus Allgemeine Felder lehren :
Verwenden von „Allgemeine Felder überprüfen“.
Die Verwendung der Überprüfung des allgemeinen Feldes hilft, Inkonsistenzen im überprüften Satz zu identifizieren und gleichzeitig das Verständnis des Modells für das allgemeine Feld zu verbessern, indem sichergestellt wird, dass das Modell über korrekte und konsistente Beispiele für Vorhersagen verfügt. Dadurch wird der Rückruf eines allgemeinen Felds verbessert.
Die Plattform empfiehlt die Überprüfung allgemeiner Felder in folgenden Fällen:
- Es gibt eine geringe Erinnerung, aber eine hohe Genauigkeit.
- Die Vorhersagen der Plattform sind sehr genau, aber in vielen Fällen, in denen das allgemeine Feld angewendet wurde, werden diese Beispiele nicht erfasst.
Weitere Informationen zu Berechnungen für die Validierung von allgemeinen Feldern finden Sie unter Validierung für allgemeine Felder.
Verwenden des fehlenden allgemeinen Felds
Die Verwendung eines fehlenden allgemeinen Felds hilft dabei, Beispiele im überprüften Satz zu finden, die das ausgewählte allgemeine Feld haben sollten, aber nicht. Dies hilft auch bei der Identifizierung teilweise beschrifteter Meldungen, die sich nachteilig auf die Fähigkeit des Modells auswirken können, ein allgemeines Feld vorherzusagen. Dadurch wird die Genauigkeit eines allgemeinen Felds verbessert und sichergestellt, dass das Modell über korrekte und konsistente Beispiele verfügt, aus denen Vorhersagen gemacht werden können.
Die Plattform empfiehlt das Fehlen des allgemeinen Felds, wenn:
- Es gibt eine hohe Erinnerung, aber eine geringe Genauigkeit.
- Sie sagen häufig allgemeine Felder fälschlicherweise vorher, aber wenn Sie sie korrekt vorhersagen, erfassen Sie viele der Beispiele, die vorhanden sein sollten.
Weitere Informationen zu Berechnungen für die Validierung von allgemeinen Feldern finden Sie auf der Seite Validierung für allgemeine Felder .
- You must have assigned the IXP Project Admin role as an Automation Cloud user or the Modify datasets permission as a legacy user.
- You can build custom Regex general fields through the Dataset settings or the Manage general fields option in the Generative Extraction field annotation experience, as explained in detail in the Generative extraction page.
Benutzerdefinierter regulärer Ausdruck
Verwenden Sie benutzerdefinierte allgemeine Regex-Felder, um Textabschnitte mit einer bekannten sich wiederholenden Struktur zu extrahieren und zu formatieren, z. B. IDs oder Referenznummern.
This is a useful option for simple, structured general fields with little variation. In case of general fields with significant variation and where the context has a big influence on predictions, a machine-learning-based general field is the right choice. You can use combinations of the two in any dataset within Communications Mining™.
A broader Regex, that is, a set of rules to define the general field, can also be used as the base of a custom general field. This combines the rules with contextual, machine learning based refinement through training within Communications Mining to create sophisticated, custom general fields. This provides the most optimal performance as well as the necessary restrictions on values extracted for automation.
Benutzerdefinierte Vorlage für reguläre Ausdrücke
Ein allgemeines Feld für benutzerdefinierten Regex besteht aus einem Feldtyp mit dem Datentyp Regex, der wiederum über eine oder mehrere benutzerdefinierte Regex-Vorlagen verfügt. Jede Vorlage drückt eine Möglichkeit zum Extrahieren (und Formatieren) des allgemeinen Felds aus.
In Kombination bieten diese Vorlagen eine flexible und leistungsstarke Möglichkeit, mehrere Darstellungen desselben allgemeinen Feldtyps abzudecken.
Eine Vorlage besteht aus Folgendem:
- Der reguläre Ausdruck (regulärer Ausdruck), der die Einschränkungen beschreibt, die ein Textabschnitt erfüllen muss, um als allgemeines Feld zu extrahieren.
- Die Formatierung, die ausdrückt, wie die extrahierte Zeichenfolge in ein Standardformat normalisiert wird.
Zum Beispiel, wenn Ihre Kunden-IDs entweder aus dem ID -Wort gefolgt von 7 Ziffern oder aus einer alphanumerischen Zeichenfolge mit 9 Zeichen bestehen. Die folgende Abbildung zeigt, wie Ihre beiden Vorlagen aussehen würden:
Type-Ahead-Validierung
Regex ID\d{}
will display a message that you should fix any issues with your template to view general field extractions:
Extraktionsvorschau
Die benutzerdefinierte Regex-Vorlage kann am Text getestet werden, um sicherzustellen, dass er sich wie erwartet verhält. Jedes allgemeine Feld, das mit der Vorlage extrahiert würde, wird in einer Liste mit seinem Wert sowie der Position der Start- und Endzeichen angezeigt.
\d{4}
und die Formatierung ID-{$}
ist, zeigt die folgende Testzeichenfolge eine Extraktion an:
Regulärer Ausdruck
Der reguläre Ausdruck ist das Muster, das zum Extrahieren von allgemeinen Feldern im Text verwendet wird. Überprüfen Sie die Syntaxdokumentation.
Benannte Erfassungsgruppen können verwendet werden, um einen bestimmten Abschnitt der extrahierten Zeichenfolge für die nachfolgende Formatierung zu identifizieren. Die Namen der Erfassungsgruppen müssen in allen Vorlagen eindeutig sein und dürfen nur Kleinbuchstaben oder Ziffern enthalten.
Formatting
Die Formatierung kann bereitgestellt werden, um das extrahierte allgemeine Feld nachzuverarbeiten.
Standardmäßig wird keine Formatierung angewendet und die von der Plattform zurückgegebene Zeichenfolge wird die durch den regulären Ausdruck extrahierte Zeichenfolge sein. Bei Bedarf können jedoch komplexere Transformationen mithilfe der folgenden Regeln definiert werden.
Variablen
$
verwendet werden. Beachten Sie, dass das $
-Symbol selbst die vollständige Regex-Übereinstimmung darstellt.
{
und }
geschweiften Klammern umgeben sein.
ID-
zurückgeben möchten, lauten der reguläre Ausdruck und die Formatierung wie folgt:
ID-1234567
String-Operationen
&
-Symbol verkettet werden.
Regulärer Ausdruck | (?P<id1>\b\d{3}\b)|(?P<id2>\b\d{4}\b) |
Formatting | {$id1 & "-" & $id2} |
Text | Die erste ID ist 123 und die zweite ist 4567 |
Allgemeines Feld, das von der Plattform zurückgegeben wird | 123-4567 |
Funktionen
Einige Funktionen können auch in der Formatierung verwendet werden, um die extrahierte Zeichenfolge zu transformieren. Die Namen der Funktionen und ihre Signaturen sind von Excel beeinflusst.
Oberkörper
Konvertiert alle Zeichen im extrahierten Abschnitt in Großbuchstaben:
Regulärer Ausdruck | \w{3} |
Formatting | {upper($)} |
Text | abc |
Allgemeines Feld, das von der Plattform zurückgegeben wird | ABC |
Niedriger
Konvertiert alle Zeichen im extrahierten Abschnitt in Kleinbuchstaben:
Regulärer Ausdruck | \w{3} |
Formatting | {lower($)} |
Text | AbC |
Allgemeines Feld, das von der Plattform zurückgegeben wird | abc |
Richtig
Das extrahierte Abschnitt wird großgeschrieben:
Regulärer Ausdruck | \w+\s\w+ |
Formatting | {proper($)} |
Text | ALBERT EINSTEIN |
Allgemeines Feld, das von der Plattform zurückgegeben wird | Attended Einstein |
Klicken Sie auf die Schaltfläche
Füllt den extrahierten Bereich bis zu einer bestimmten Größe mit einem bestimmten Zeichen aus.
Funktionsargumente:
- Der Text, der die aufzufüllenden Zeichen enthält
- Größe der aufgefüllten Zeichenfolge
- Zeichen, das für den Abstand verwendet werden soll
Regulärer Ausdruck | \d{2,5} |
Formatting | {pad($, 5, "0")} |
Text | 123 |
Allgemeines Feld, das von der Plattform zurückgegeben wird | 00123 |
Ersatz
Ersetzt Zeichen durch andere Zeichen.
Funktionsargumente:
- Der Text, der die zu ersetzenden Zeichen enthält
- Die zu ersetzenden Zeichen
- Wodurch die alten Zeichen ersetzt werden sollen
Regulärer Ausdruck | ab |
Formatting | {substitute($, "a", "12")} |
Text | ab |
Allgemeines Feld, das von der Plattform zurückgegeben wird | 12b |
Links
Gibt die ersten n Zeichen aus dem Abschnitt zurück.
Funktionsargumente:
- Der Text, der die zu extrahierenden Zeichen enthält
- Die Anzahl der zurückzugebenden Zeichen
Regulärer Ausdruck | \w{4} |
Formatting | {left($, 2)} |
Text | ABCD |
Allgemeines Feld, das von der Plattform zurückgegeben wird | AB |
Rechts
Gibt die letzten n Zeichen aus dem Abschnitt zurück.
Funktionsargumente:
- Der Text, der die zu extrahierenden Zeichen enthält
- Die Anzahl der zurückzugebenden Zeichen
Regulärer Ausdruck | \w{4} |
Formatting | {right($, 2)} |
Text | ABCD |
Allgemeines Feld, das von der Plattform zurückgegeben wird | CD |
Mitte
Gibt n Zeichen nach der angegebenen Position aus dem Abschnitt zurück.
Funktionsargumente:
- Der Text, der die zu extrahierenden Zeichen enthält
- Die Position des ersten zurückzugebenden Zeichens
- Die Anzahl der zurückzugebenden Zeichen
Regulärer Ausdruck | \w{5} |
Formatting | {mid($, 2, 3)} |
Text | ABCDE |
Allgemeines Feld, das von der Plattform zurückgegeben wird | BCD |
- Definieren und Einrichten Ihrer Felder
- Grundlegendes zu allgemeinen Feldern
- Typen von allgemeinen Feldern
- Trainierbare und nicht trainierbare allgemeine Felder
- Vorgefertigte Vorlagen für allgemeine Felder
- Standardvorlagenfeldtypen für allgemeine Felder
- Verwalten von allgemeinen Feldern
- Aktivieren allgemeiner Felder in einem neuen Dataset
- Aktivieren, Aktualisieren und Deaktivieren allgemeiner Felder in einem vorhandenen Dataset
- Aktivieren von allgemeinen Feldern
- Aktualisieren von allgemeinen Feldern
- Deaktivieren von allgemeinen Feldern
- Erstellen neuer allgemeiner Felder
- Field types
- Allgemeiner Feldtitel
- Aktivieren allgemeiner Felder in einem neuen Dataset
- Verwalten von allgemeinen Feldern in einem vorhandenen Dataset
- Allgemeine Feldfilterung
- Anwenden von erweiterten Vorhersagefiltern
- Die Leiste des allgemeinen Felds
- Filter für allgemeine Felder hinzufügen
- Kombinieren allgemeiner Feldleistenfilter und hinzugefügter allgemeiner Feldfilter
- Kombinieren allgemeiner Feldfilter und Sortieren nach allgemeinem Feld für das Training
- Überprüfen und Anwenden allgemeiner Felder
- Identifizieren allgemeiner Feldvorhersagen
- Erstellen von Vorhersagen für allgemeine Felder für trainierbare allgemeine Felder
- Allgemeine Feldkonfidenzbewertungen
- Akzeptieren und Ablehnen von allgemeinen Feldvorhersagen
- Anwenden allgemeiner Felder
- Best Practices
- Validierung für allgemeine Felder
- Einleitung
- Funktionsweise der Validierung von allgemeinen Feldern
- Berechnung der Punktzahlen
- Trainierbare allgemeine Felder
- Vortrainierte allgemeine Felder
- Grundlegendes zu den zusammengefassten Statistiken
- Metriken
- Verstehen der allgemeinen Feldleistung
- Einzelne allgemeine Feldleistung
- Verbesserung der allgemeinen Feldleistung
- Überblick
- Allgemeine empfohlene Aktionen für das Feld
- Allgemeine Feldtrainingsmodi
- Verwenden des Felds „Teach Allgemein“.
- Verwenden von „Allgemeine Felder überprüfen“.
- Verwenden des fehlenden allgemeinen Felds
- Erstellen von benutzerdefinierten allgemeinen Regex-Feldern
- Benutzerdefinierter regulärer Ausdruck
- Benutzerdefinierte Vorlage für reguläre Ausdrücke
- Type-Ahead-Validierung
- Extraktionsvorschau
- Regulärer Ausdruck
- Formatting
- Variablen
- String-Operationen
- Funktionen
- Oberkörper
- Niedriger
- Richtig
- Klicken Sie auf die Schaltfläche
- Ersatz
- Links
- Rechts
- Mitte