Communications Mining
Mais recente
falso
Imagem de fundo do banner
Guia do usuário do Communications Mining
Última atualização 18 de abr de 2024

Origens e conjuntos de dados multilíngues

O Communications Mining agora é compatível com origens e conjuntos de dados multilíngues . Isso significa que os modelos podem entender fontes que contêm vários idiomas suportados diferentes, sem ter que efetivamente traduzi-las.

Os idiomas que estão atualmente com "Disponibilidade geral" dentro de origens e conjuntos de dados multilíngues são: inglês, francês, alemão, espanhol, italiano, português e holandês (vamos expandir essa lista ao longo do tempo!).

Na prática, isso significa que se os usuários trabalham e fazem negócios em vários idiomas suportados pela plataforma, eles podem treinar com mensagens nesses idiomas, em vez de traduzir tudo para um único idioma.

Uma grande lista de idiomas adicionais é suportada em Pré -visualização (incluídos na parte inferior desta página), o que significa que trabalharemos para ajustá-los ao longo do tempo à medida que nossos clientes e parceiros começarem a usá-los. Uma grande proporção desses idiomas terá um ótimo desempenho e exigirá pouco ou nenhum ajuste fino por nossas equipes para alcançar um alto desempenho.

Considerações importantes ao procurar usar origens e conjuntos de dados multilíngues:

  • Se um conjunto de dados for multilíngue, os usuários não poderão ver as traduções de nenhuma mensagem (como fornecido para conjuntos de dados traduzidos), portanto, eles precisarão entender todos os idiomas no conjunto de dados para treinar efetivamente seu modelo
  • Compreender vários idiomas é um problema de aprendizado de máquina mais complexo do que entender um único idioma, portanto, esses conjuntos de dados podem sofrer uma pequena queda no desempenho em comparação com conjuntos de dados em um único idioma
  • A plataforma só será capaz de entender o idioma de um dos idiomas compatíveis listados acima. Se houver outros idiomas presentes no conjunto de dados, marcar essas mensagens com rótulos usados em mensagens em idiomas compatíveis vai confundir a plataforma. É melhor rotulá-los como seus próprios rótulos específicos que capturam o idioma como um rótulo, mas a plataforma não será capaz de interpretar as especificidades do idioma não suportado

Como criar origens e conjuntos de dados multilíngue?

Para origem de dados e conjuntos de dados, a família de idiomas é selecionada quando são criadose não pode ser alterada depois de serem.

Basta selecionar "multilíngue" no menu suspenso da família de idiomas na origem de criação ou ao criar modal de dados (é normalmente a última configuração a selecionar).

Observação: conjuntos de dados multilíngues podem conter fontes de qualquer família de idiomas suportada pela plataforma.

Para obter mais detalhes sobre como criar uma origem na interface gráfica, consulte a página Criar uma origem de dados no GUI .

Para obter mais detalhes sobre como criar um conjunto de dados, consulte a página Criar um novo conjunto de dados .

Idiomas de disponibilidade geral

  • English
  • Holandês
  • Francês
  • Alemão
  • Italiano
  • Português
  • Espanhol

Idiomas compatíveis 'Em visualização'

  • Africâner
  • Albanês
  • Amálico
  • Árabe
  • Armênio
  • Assamês
  • Azeri
  • Basco
  • Bielorrusso
  • Bengalês
  • Bengalês (romanizado)
  • Bósnio
  • Bretão
  • Búlgaro
  • Birmanês
  • Birmanês
  • Catalão
  • Chinês (Simplificado)
  • Chinês (Tradicional)
  • Croata
  • Checo
  • Dinamarquês
  • esperanto
  • Estoniano
  • Filipino
  • Finlandês
  • Galego
  • Georgiano
  • Grego
  • Gujarati
  • Hauçá
  • Hebraico
  • Hindi
  • Hindi (romanizado)
  • Húngaro
  • Islandês
  • Indonésio
  • Irlandês
  • Japonês
  • Javanês
  • Canarês
  • Cazaque
  • Action Center
  • Coreano
  • Curdo (Kurmanji)
  • Quirguiz
  • Laos
  • Latim
  • Letão
  • Lituano
  • Macedônio
  • Malgaxe
  • Malaio
  • Malaiala
  • Marata
  • Mongol
  • Nepalês
  • Norueguês
  • Oriá
  • Oromo
  • Pashto
  • Persa
  • Polonês
  • Punjabi
  • Romeno
  • Russo
  • Sânscrito
  • Gaélico Escocês
  • Sérvio
  • Sindi
  • Sinhala
  • Eslovaco
  • Esloveno
  • somali
  • Sundanês
  • Suaíli
  • Sueco
  • Alemão Suíço
  • Tamil
  • Tâmil (romanizado)
  • Telugu
  • Télugo (romanizado)
  • Tailandês
  • Turco
  • Ucraniano
  • Urdu
  • Urdu (romanizado)
  • Uigure
  • Usbeque
  • Vietnamita
  • Galês
  • Frísico ocidental
  • xhosa
  • iídiche
  • Idiomas compatíveis 'Em visualização'

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.