ai-center
2022.10
false
- Notas de Versão
- Antes de começar
- Introdução
- Instalação do AI Center
- Migração e atualização
- Projetos
- Conjuntos de dados
- Rotulagem de Dados
- Pacotes de ML
- Pacotes para uso imediato
- Pipelines
- Habilidades de ML
- Logs de ML
- Document UnderstandingTM no AI Center
- Como fazer
- Gerenciamento do agendamento de nós
- Uso da NER personalizada com o aprendizado contínuo
- Licenciamento
- Guia básico de solução de problemas
Uso da NER personalizada com o aprendizado contínuo
Guia do usuário do AI Center
Last updated 17 de out de 2024
Uso da NER personalizada com o aprendizado contínuo
Esse exemplo é usado para extrair produtos químicos pela categoria mencionada em artigos de pesquisa. Ao seguir o procedimento abaixo, você extrairá os produtos químicos e os categorizará como ABBEVIAÇÃO, FAMÍLIA, FÓRMULA, IDENTIFICADOR, MULTIPLO, SISTEMÁTICO, TRIVIAL e NO_CLASS.
Esse procedimento usa o pacote de Reconhecimento da entidade nomeada personalizada. Para obter mais informações sobre como esse pacote funciona e para que ele pode ser usado, veja Reconhecimento da entidade nomeada personalizada.
Para esse procedimento, fornecemos arquivos de amostra da seguinte forma:
- Conjunto de dados de treinamento pré-rotulados no formato CoNLL. É possível baixá-los daqui.
- Conjunto de dados de teste pré-rotulados. É possível baixá-los daqui.
- Fluxo de trabalho de amostra para extrair categorias de produtos químicos mencionados em artigos de pesquisa. É possível baixá-los daqui.
Observação: certifique-se de que as seguintes variáveis estejam preenchidas no arquivo de amostra:
in_emailAdress
- o endereço de e-mail ao qual a tarefa do Action Center será atribuídain_MLSkillEndpoint
- endpoint público da Habilidade de MLin_MLSkillAPIKey
- chave da API da Habilidade de MLin_labelStudioEndpoint
- opcional, para habilitar a rotulagem contínua: forneça a URL de importação de um projeto do Label Studio
Siga o procedimento abaixo para extrair produtos químicos por sua categoria de artigos de pesquisa.
Para começar com o Label Studio e exportar dados para o AI Center, siga as instruções abaixo.
- Instale o Label Studio em sua máquina local ou instância de nuvem. Para fazer isso, siga as instruções daqui.
- Crie um novo projeto a partir do Modelo de reconhecimento de entidade nomeada e defina seus nomes de rótulos.
- Certifique-se de que os nomes de rótulos não tenham caracteres especiais ou espaços. Por exemplo, em vez de
Set Date
, useSetDate
. - Certifique-se de que o valor da
<Text>
tag seja"$text"
. - Carregue os dados usando a API daqui.
Exemplo de solicitação cURL:
curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]'
curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]' - Anote seus dados.
- Exporte os dados no formato CoNLL 2003 e carregue-os no AI Center.
- Forneça a URL da instância do Label Studio e a chave da API no fluxo de trabalho de amostra fornecido, a fim de capturar previsões incorretas e de baixa confiança.