Communications Mining
Neuestes
False
Bannerhintergrundbild
Communications Mining-Benutzerhandbuch
Letzte Aktualisierung 18. Apr. 2024

Mehrsprachige Quellen und Datasets

Communications Mining unterstützt jetzt mehrsprachige Quellen und Datasets. Das bedeutet, dass die Modelle Quellen verstehen können, die mehrere verschiedene unterstützte Sprachen enthalten, ohne sie tatsächlich übersetzen zu müssen.

Die Sprachen, die derzeit in mehrsprachigen Quellen und Datasets „Allgemein verfügbar“ sind, sind: Englisch, Französisch, Deutsch, Spanisch, Italienisch, Portugiesisch und Niederländisch (wir werden diese Liste im Laufe der Zeit erweitern!).

In der Praxis bedeutet dies, dass Benutzer, wenn sie in mehreren Sprachen arbeiten und Aufträge abwickeln, die von der Plattform unterstützt werden, mit Nachrichten in diesen Sprachen trainieren können, anstatt alles in eine einzige Sprache übersetzen zu müssen.

Eine umfangreiche Liste zusätzlicher Sprachen wird in der Vorschau unterstützt (enthalten am unteren Rand dieser Seite), d. h., wir werden daran arbeiten, sie im Laufe der Zeit zu optimieren, wenn unsere Kunden und Partner mit der Verwendung beginnen. Ein großer Teil dieser Sprachen ist sehr erfolgreich und erfordert nur wenig bis gar keine Feinabstimmung durch unsere Teams, um eine hohe Leistung zu erzielen.

Wichtige Hinweise bei der Verwendung von mehrsprachigen Quellen und Datasets:

  • Wenn ein Dataset mehrsprachig ist, können Benutzer keine Übersetzungen von Nachrichten sehen (wie für übersetzte Datasets vorgesehen), daher müssen sie in der Lage sein, alle Sprachen im Dataset zu verstehen, um ihr Modell effektiv zu trainieren
  • Das Verstehen mehrerer Sprachen ist ein komplexeres Problem des Machine Learning als das Verstehen einer einzelnen Sprache, sodass diese Datasets im Vergleich zu Datasets in einer einzelnen Sprache möglicherweise einen leichten Leistungsverlust erfahren
  • Die Plattform kann nur eine der oben aufgeführten unterstützten Sprachen verstehen. Wenn das Dataset noch andere Sprachen enthält, ist das Taggen dieser Nachrichten mit Beschriftungen, die für Nachrichten in unterstützten Sprachen verwendet werden, für die Plattform verwirrend. Es ist besser, sie als eigene spezifische Bezeichnungen zu beschriften, die die Sprache als Bezeichnung erfassen, aber die Plattform kann die Besonderheiten der nicht unterstützten Sprache nicht interpretieren

Wie erstellen Sie mehrsprachige Quellen und Datasets?

Sowohl für Datenquellen- als auch für Datasets wird die Sprachfamilie bei der Erstellung ausgewähltund kann nach der Erstellung nicht mehr geändert werden.

Wählen Sie einfach „mehrsprachig“ aus der Dropdownliste der Sprachfamilie im modalen Element „Quelle erstellen“ oder „Dataset erstellen“ aus (dies ist in der Regel die letzte Einstellung, die ausgewählt werden muss).

Hinweis: Mehrsprachige Datasets können Quellen aus jeder Sprachfamilie enthalten, die von der Plattform unterstützt wird.

Weitere Informationen zum Erstellen einer Quelle in der UI finden Sie auf der Seite Erstellen einer Datenquelle in der GUI .

Weitere Informationen zum Erstellen eines Datasets finden Sie auf der Seite Erstellen eines neuen Datasets .

Sprachen mit allgemeiner Verfügbarkeit

  • Englisch
  • Niederländisch
  • Französisch
  • Deutsch
  • Italienisch
  • Portugiesisch
  • Spanisch

Unterstützte Sprachen „In der Vorschau“

  • Afrikaans
  • Albanisch
  • Amharisch
  • Arabisch
  • Armenisch
  • Assamesisch
  • Aserbaidschanisch
  • Baskisch
  • Weißrussisch
  • Bengali
  • bengalisch (schriftart)
  • Bosnisch
  • Bretonisch
  • Bulgarisch
  • Birmanisch
  • Birmanisch
  • Katalanisch
  • Chinesisch (vereinfacht)
  • Chinesisch (traditionell)
  • Kroatisch
  • Tschechisch
  • Dänisch
  • Esperanto
  • Estnisch
  • Philippinisch
  • Finnisch
  • Galizisch
  • Georgisch
  • Griechisch
  • Gujarati
  • Hausa
  • Hebräisch
  • Hindi
  • Hindi (romanisiert)
  • Ungarisch
  • Isländisch
  • Indonesisch
  • Irisch
  • Japanisch
  • Javanisch
  • Kannada
  • Kasachisch
  • Xanten
  • Koreanisch
  • Kurdisch (Kurmandschi)
  • Kirgisisch
  • Laos
  • Latein
  • Lettisch
  • Litauisch
  • Mazedonisch
  • Madagassisch
  • Malaiisch
  • Malaiisch
  • Marathi
  • Mongolisch
  • Nepali
  • Norwegisch
  • Oria
  • OroMo
  • Paschtu
  • Persisch
  • Polnisch
  • Punjabi
  • Rumänisch
  • Russisch
  • Los
  • schottisch-gälisch
  • Serbisch
  • Sindhi
  • Singapurisch
  • Slowakisch
  • Slowenisch
  • Somalisch
  • Sundanesisch
  • Swahili
  • Schwedisch
  • Schweifes Deutsch
  • Tamil
  • HTML (germanisiert)
  • Telugu
  • Telugu (romanisiert)
  • Thai
  • Türkisch
  • Ukrainisch
  • Urdu
  • Urdu (romanisiert)
  • Uigur
  • Usbekisch
  • Vietnamesisch
  • Walisisch
  • Westfriesisch
  • Xhosa
  • Jiddisch
  • Unterstützte Sprachen „In der Vorschau“

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
UiPath Logo weiß
Vertrauen und Sicherheit
© 2005-2024 UiPath. All rights reserved.