AI Center - Detecção de objetos

ai-center

latest

false

Guia do usuário do AI Center

Introdução
Notificações
- Minhas notificações
Projetos
- Sobre projetos
- Gerenciando projetos
Conjuntos de dados
- Sobre conjuntos de dados
- Gerenciar conjuntos de dados
Rotulagem de Dados
Pacotes de ML
Pacotes para uso imediato
Pipelines
Habilidades de ML
- Sobre as Habilidades de ML
- Gerenciar habilidades de ML
Logs de ML
- Sobre os logs de ML
Document UnderstandingTM no AI Center
- Document Manager
- Serviços de OCR
API do AI Center
- Visão geral
- Lista de APIs
Licenciamento
Modelos de soluções de IA
- Sobre os modelos de soluções de IA
  - IA de e-mail
Como fazer
- Pacotes de ML
  - Uso da NER personalizada com o aprendizado contínuo
- Habilidades de ML
Guia básico de solução de problemas

Importante :

A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Detecção de objetos

Observação:

Os pacotes de ML prontos para uso estão obsoletos. Para obter mais informações, consulte a página Linha do tempo de descontinuação no guia Visão geral .

Pacotes do SO > Análise de imagens > ObjectDetection

Esse é um modelo de aprendizado profundo genérico retreinável para realizar a detecção de objetos. Esse pacote de ML é pré-treinado no Conjunto de dados do COCO, para que você possa criar diretamente uma Habilidade de ML que possa ser usada para identificar 80 classes de conjuntos de dados do COCO.

Bem, você também pode treiná-lo em seus próprios dados e criar uma Habilidade de ML e usá-la para realizar a detecção de objetos, que agora operará em seus dados.

Esse modelo de aprendizagem profunda usa "Você apenas olha uma vez" (YOLO), que é um algoritmo de ponta e um dos algoritmos de detecção de objetos mais eficazes, abrangendo também muitas das ideias mais inovadoras que evoluem da área de visão computacional.

Importante:

Observe que esse modelo não é suportado na GPU (tanto para o pipeline quanto para a Habilidade de ML) hoje.

Detalhes do modelo

Tipo de Entrada

de transações

Descrição da entrada

Caminho completo do arquivo de imagem na qual você deseja detectar os objetos.

Descrição da saída

JSON com a representação de matriz de bytes da classe do objeto identificado (permite ver a caixa em torno de objetos), classe do objeto identificado: nome, pontuação (entre 0 e 1)

Exemplo:

{
  "Predicted ByteArray":
    "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
  "Predicted Class":
     "[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}
{
  "Predicted ByteArray":
    "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
  "Predicted Class":
     "[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}

Pipelines

Esse pacote só é compatível com execuções de pipeline completas.

Formato do conjunto de dados

Arquivo da Imagem

Por padrão, esse modelo lerá imagens de formato .jpg, .jpeg. Verifique os seguintes pontos de considerações para as imagens de entrada:

Ter todas as imagens do mesmo formato
Ter todas as imagens do mesmo tamanho, de preferência 800x600
Ter pelo menos 100 imagens para cada categoria de objeto

Arquivo de anotação XML

Para cada imagem carregada, deve haver um arquivo .XML de anotação correspondente que contém os detalhes da caixa delimitadora da imagem. O formato de arquivo exigido para o arquivo .XML é o Pascal VOC.

Para criar anotações nas imagens, você pode usar uma ferramenta de código aberto como o Label Studio ou qualquer outra que você prefira.

A seguir estão alguns pontos a serem considerados ao criar os arquivos.xml:

É preferível ter uma única classe no arquivo arquivo .png.
Dando um nome significativo à classe.
Evitando quaisquer alterações no arquivo . Verifique o seguinte exemplo de uma pasta de conjunto de dados:

No exemplo anterior, observamos que há cinco classes (gato, cão, girafa, cavalo e zebra), e elas têm imagens e xml correspondentes na pasta do conjunto de dados. É claro que sua pasta do conjuntos de dados terá mais imagens e xml, e esse é apenas um exemplo para entender a estrutura da pasta.

Variáveis de Ambiente

learning_rate: altere esse valor para ajustar a taxa de aprendizado; a taxa de aprendizado padrão é 0,0001

Artefatos

Avaliar a função produz um artefato: aqui o desempenho do modelo é avaliado no valor do mapa

result.txt - Um relatório que contém informações resumidas sobre como o modelo executado pelo mapa de compartilhamento (precisão média) de cada classe e o valor total do mapa

Fluxo de trabalho amostral

É possível usar essa amostra de fluxo de trabalho para experimentar esse modelo. Certifique-se de primeiro implantar o modelo em seu tenant e, em seguida, usar esse fluxo de trabalho com qualquer uma de sua imagens, para enviar a imagem para o fluxo de trabalho e identificar automaticamente objetos nessa imagem.

Dependências

UiPath.MLServices.Activities v1.1.3
UiPath.Web.Activities v1.4.5

Papel

YOLOv3: An Incremental Improvement, de Joseph Redmon, Ali Farhadi

Esta página foi útil?

AnteriorClassificação de textos em japonês

AvançarClassificação de textos

Detalhes do modelo​

Tipo de Entrada​

Descrição da entrada​

Descrição da saída​

Pipelines​

Formato do conjunto de dados​

Arquivo da Imagem​

Arquivo de anotação XML​

Variáveis de Ambiente​

Artefatos​

Fluxo de trabalho amostral​

Dependências​

Papel​