- Documentos da API
- CLI
- Guias de integração
- Blog
- Como as máquinas aprendem a entender as palavras: um guia para incorporações ao NLP
- Aprendizado baseado em solicitação com Transformers
- Efficient Transformers II: extração de conhecimento e ajustes finos
- Transformers eficientes I: mecanismos de atenção
- Modelagem de intenção hierárquica profunda não supervisionada: obtenção de valor sem dados de treinamento
- Corrigindo viés de anotação com Communications Mining
- Aprendizado ativo: melhores modelos de ML em menos tempo
- Está tudo nos números - avaliando o desempenho do modelo com métricas
- Por que a validação de modelos é importante
- Comparação do Communications Mining e do Google AutoML para inteligência de dados conversacional
Download em lote
A CLI permite que você baixe comentários e previsões em lote. Isso é mais útil para importar o script para ferramentas de análise que não exigem uma conexão ao vivo.
O comando abaixo baixará todos os comentários e previsões na origem e no conjunto de dados especificados. Observe que o nome do conjunto de dados e o nome da origem devem ter como prefixo o nome do projeto ao qual estão. Se o conjunto de dados contiver várias fontes, você precisa emitir esse comando para que cada fonte baixe todos os comentários no conjunto de dados.
re get comments project/source-name --dataset project/dataset-name --predictions=true -f output.jsonl
re get comments project/source-name --dataset project/dataset-name --predictions=true -f output.jsonl
Qual versão do modelo a CLI usa para obter previsões?
A CLI baixará as últimas previsões computadas disponíveis. Essas são as mesmas previsões exibidas na interface gráfica.
Se você precisar de previsões de uma versão do modelo específico, considere usar a ou as rotas de API de previsão .
A CLI retorna dados no formato JSONL (também chamado de JSON delimitado por novas linhas), onde cada linha é um valor JSON. Muitas ferramentas serão capazes de processar arquivos JSONL prontos para uso. Entre em contato com o suporte se tiver alguma dúvida.
Cada linha do arquivo JSONL terá o seguinte formato:
{
"comment": {...},
"annotating": {
"assigned": [...]
"predicted": [...]
},
"entities": {
"assigned": [...]
"predicted": [...]
}
}
{
"comment": {...},
"annotating": {
"assigned": [...]
"predicted": [...]
},
"entities": {
"assigned": [...]
"predicted": [...]
}
}
Nome do Campo | Descrição |
---|---|
comment | Objeto Comment no formato descrito aqui. |
annotating.assigned | Lista de rótulos atribuídos, no formato descrito aqui. |
entities.assigned | Lista de entidades atribuídas, no formato descrito aqui. |
annotating.predicted | Lista de rótulos previstos, no formato descrito aqui. |
entities.predicted | Lista de entidades prevista, no formato descrito aqui. |
annotating
ou entities
podem estar ausentes completamente se o comentário não tiver rótulos ou entidades atribuídos nem previstos.
Abaixo está um exemplo de comentário com previsões baixadas de um conjunto de dados da vida real.
{
"comment": {
"id": "1234abcd",
"uid": "5678ef.1234abdc",
"timestamp": "2021-02-01T00:00:00Z",
"messages": [
{
"body": {
"text": "The hot chocolate biscuit on arrival raised my expectations"
}
}
],
"user_properties": {
"string:Question": "What did you like about your stay",
"number:Reviewer Score": 5.4,
"number:Average Score": 8.4,
"number:Reviewer Total Number Of Reviews": 1,
"string:Hotel Name": "DoubleTree by Hilton London Victoria"
},
"created_at": "2021-02-01T00:00:00Z"
},
"annotating": {
"predicted": [
{
"name": "Refreshments",
"sentiment": 0.3598046874571062,
"probability": 0.54764723591506481
},
{
"name": "Property",
"sentiment": 0.6684685489411859,
"probability": 0.417815982922911644
}
]
}
}
{
"comment": {
"id": "1234abcd",
"uid": "5678ef.1234abdc",
"timestamp": "2021-02-01T00:00:00Z",
"messages": [
{
"body": {
"text": "The hot chocolate biscuit on arrival raised my expectations"
}
}
],
"user_properties": {
"string:Question": "What did you like about your stay",
"number:Reviewer Score": 5.4,
"number:Average Score": 8.4,
"number:Reviewer Total Number Of Reviews": 1,
"string:Hotel Name": "DoubleTree by Hilton London Victoria"
},
"created_at": "2021-02-01T00:00:00Z"
},
"annotating": {
"predicted": [
{
"name": "Refreshments",
"sentiment": 0.3598046874571062,
"probability": 0.54764723591506481
},
{
"name": "Property",
"sentiment": 0.6684685489411859,
"probability": 0.417815982922911644
}
]
}
}