Communications Mining
Más reciente
False
Imagen de fondo del banner
Guía de usuario de Communications Mining
Última actualización 18 de abr. de 2024

Fuentes y conjuntos de datos multilingües

Communications Mining ahora admite fuentes y conjuntos de datos multilingües. Esto significa que los modelos pueden comprender fuentes que contienen varios idiomas compatibles diferentes, sin tener que traducirlos.

Los idiomas que actualmente tienen "Disponibilidad general" dentro de las fuentes y conjuntos de datos multilingües son: inglés, francés, alemán, español, italiano, portugués y holandés (¡ampliaremos esta lista con el tiempo!).

Lo que esto significa en la práctica es que si los usuarios trabajan y hacen negocios en varios idiomas compatibles con la plataforma, pueden entrenarse con mensajes en esos idiomas, en lugar de traducir todo a un solo idioma.

En la vista previa se admite una gran lista de idiomas adicionales (incluidos en la parte inferior de esta página), lo que significa que trabajaremos para ajustarlos con el tiempo a medida que nuestros clientes y socios comiencen a utilizarlos. Una gran proporción de estos lenguajes tendrá un rendimiento muy alto y requerirá poco o ningún ajuste por parte de nuestros equipos para lograr un alto rendimiento.

Consideraciones importantes a la hora de utilizar fuentes y conjuntos de datos multilingües:

  • Si un conjunto de datos es multilingüe, los usuarios no podrán ver las traducciones de ningún mensaje (como se proporciona para los conjuntos de datos traducidos), por lo que deberán poder entender todos los idiomas del conjunto de datos para entrenar eficazmente su modelo
  • Comprender varios idiomas es un problema de aprendizaje automático más complejo que entender un solo idioma, por lo que estos conjuntos de datos pueden experimentar una ligera caída en el rendimiento en comparación con los conjuntos de datos en un solo idioma
  • La plataforma solo podrá entender el idioma de uno de los idiomas admitidos enumerados anteriormente. Si hay otros idiomas presentes en el conjunto de datos, etiquetar estos mensajes con etiquetas utilizadas en mensajes en idiomas compatibles será confuso para la plataforma. Es mejor etiquetarlos como sus propias etiquetas específicas que capturan el idioma como una etiqueta, pero la plataforma no podrá interpretar los detalles del idioma no compatible

¿Cómo se crean fuentes y conjuntos de datos multilingües?

Tanto para el origen de datos como para los conjuntos de datos, la familia de idiomas se selecciona cuando se crean, y no se puede cambiar una vez que se crean.

Solo tienes que seleccionar 'multilingüe' en el menú desplegable de la familia de idiomas en el modal Crear fuente o Crear conjunto de datos (normalmente es la última configuración a seleccionar).

Nota: Los conjuntos de datos multilingües pueden contener fuentes de cualquier familia de idiomas que admita la plataforma.

Para obtener más información sobre la creación de un origen en la IU, consulta la página Crear un origen de datos en la GUI .

Para obtener más información sobre la creación de un conjunto de datos, consulta la página Crear un nuevo conjunto de datos .

Idiomas de disponibilidad general

  • English
  • Holandés
  • Francés
  • Alemán
  • Italiano
  • Portugués
  • Español

Idiomas admitidos 'En vista previa'

  • Afrikáans
  • Albanés
  • Amárico
  • Árabe
  • Armenio
  • Asamés
  • Azerbaiyano
  • Vasco
  • Bielorruso
  • Bengalí
  • Bengalí (romanizado)
  • Bosnio
  • Bretón
  • Búlgaro
  • Birmano
  • Birmano
  • Catalán
  • Chino (simplificado)
  • Chino (Tradicional)
  • Croata
  • Checo
  • Danés
  • Esperanto
  • Estonio
  • Filipino
  • Finlandés
  • Gallego
  • Georgiano
  • Griego
  • Gujaratí
  • Hausa
  • Hebreo
  • Hindi
  • Hindi (romanizado)
  • Húngaro
  • Islandés
  • Indonesio
  • Irlandés
  • Japonés
  • Javanés
  • Canarés
  • Kazajo
  • Jemer
  • Koreano
  • Kurdo (Kurmanji)
  • Kirguistán
  • Laosiano
  • Latín
  • Letón
  • Lituano
  • Macedonio
  • Malgache
  • Malayo
  • Malayo
  • Maratí
  • Mongol
  • Nepalí
  • Noruego
  • Oriya
  • Oromo
  • Pastún
  • Persa
  • Polaco
  • Punyabí
  • Rumano
  • Ruso
  • Sánscrito
  • Gaélico escocés
  • Serbio
  • Sindhi
  • Cingalés
  • Eslovaco
  • Esloveno
  • Somalí
  • Sundanés
  • Suajili
  • Sueco
  • Alemán de Suiza
  • Tamil
  • Tamil (romanizado)
  • Telugu
  • Telugu (romanizado)
  • Tailandés
  • Turco
  • Ucraniano
  • Urdu
  • Urdu (romanizado)
  • Uigur
  • Uzbeko
  • Vietnamita
  • Galés
  • Frisón occidental
  • Xhosa
  • Yidis
  • Idiomas admitidos 'En vista previa'

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.