- Introdução
- Notificações
- Projetos
- Conjuntos de dados
- Rotulagem de Dados
- Pacotes de ML
- Pacotes para uso imediato
- Pipelines
- Habilidades de ML
- Logs de ML
- Document UnderstandingTM no AI Center
- API do AI Center
- Licenciamento
- Modelos de soluções de IA
- Como fazer
- Uso da NER personalizada com o aprendizado contínuo
- Guia básico de solução de problemas
Guia do usuário do AI Center
Informações em segundo plano
Esse exemplo é usado para extrair produtos químicos pela categoria mencionada em artigos de pesquisa. Ao seguir esse procedimento, você extrairá os produtos químicos e os categorizará como ABBEVIAÇÃO, FAMÍLIA, FÓRMULA, IDENTIFICADOR, MULTIPLO, SISTEMÁTICO, TRIVIAL e NO_CLASS.
Pré-requisitos
Esse procedimento usa o pacote de Reconhecimento da entidade nomeada personalizada . Para obter mais informações sobre como esse pacote funciona e para que ele pode ser usado, consulte a página Reconhecimento da entidade nomeada personalizada .
Para esse procedimento, fornecemos arquivos de amostra da seguinte forma:
- Conjunto de dados de treinamento pré-rotulados no formato CoNLL. Você pode baixar o conjunto de dados de treinamento a partir do seguinte link: conjunto de dados de treinamento.
- Conjunto de dados de teste pré-rotulados. Você pode baixar o conjunto de dados de teste a partir do seguinte link: conjunto de dados de teste.
- Fluxo de trabalho de amostra para extrair categorias de produtos químicos mencionados em artigos de pesquisa. Você pode baixá-lo do seguinte link: fluxo de trabalho de amostra.
Observação:
Certifique-se de que as seguintes variáveis estejam preenchidas no arquivo de amostra:
in_emailAdress- o endereço de e-mail ao qual a tarefa do Action Center será atribuídain_MLSkillEndpoint- endpoint público da Habilidade de MLin_MLSkillAPIKey- chave da API da Habilidade de MLin_labelStudioEndpoint- opcional, para habilitar a rotulagem contínua: forneça a URL de importação de um projeto do Label Studio
Procedimento
Use as seguintes etapas para extrair produtos químicos por sua categoria a partir de artigos de pesquisa.
- Importe o conjunto de dados amostral para o UiPath® AI Center. Para fazer isso, vá para o menu Conjuntos de dados e faça o upload das pastas
trainetestda amostra. - Selecione o pacote de NER personalizado desejado de Pacotes de ML > Pacotes prontos para uso > UiPath Language Analysis e crie-o.
- Acesse o menu Pipelines e crie uma nova execução do pipeline completo para o pacote criado na etapa anterior. Aponte para o treinamento e o conjunto de dados de teste fornecido no arquivo de amostra. Após ter sido concluído, os resultados do pipeline estarão disponíveis em Artefatos É possível baixar o relatório de classificação para avaliar os resultados do teste.
- Crie uma nova Habilidade de ML usando o pacote gerado pelo pipeline que é executado na etapa anterior e o implante.
- Depois que a habilidade for implantada, aproveite-a no fluxo de trabalho do UiPath® Studio fornecido. Para habilitar a captura de dados com previsões fracas, implante uma instância do Label Studio e forneça a URL da instância e a chave da API na atividade do Label Studio no fluxo de trabalho.
Primeiros passos com o Label Studio
-
Instale o Label Studio em sua máquina local ou instância de nuvem. Para fazê-lo, siga as instruções da página Label Studio .
-
Crie um novo projeto a partir do Modelo de reconhecimento de entidade nomeada e defina seus nomes de rótulos.
-
Certifique-se de que os nomes de rótulos não tenham caracteres especiais ou espaços. Por exemplo, em vez de
Set Date, useSetDate. -
Certifique-se de que o valor da
<Text>tag seja"$text". -
Carregue os dados usando a API da página da API do Label Studio . Exemplo de solicitação cURL:
curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]'curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]' -
Anote seus dados.
-
Exporte os dados no formato CoNLL 2003 e carregue-os no AI Center.
-
Forneça a URL da instância do Label Studio e a chave da API no fluxo de trabalho de amostra fornecido, a fim de capturar previsões incorretas e de baixa confiança.