AI Center - detección de objetos

ai-center

latest

false

Guía del usuario de AI Center

Primeros pasos
Notificaciones
- Mis notificaciones
Proyectos
- Acerca de los proyectos
- Gestionar proyectos
Conjuntos de datos
- Acerca de los conjuntos de datos
- Gestión de conjuntos de datos
Etiquetado de datos
Paquetes ML
Paquetes listos para usar
Procesos
Habilidades ML
- Acerca de las habilidades ML
- Gestión de habilidades ML
Logs de ML
- Acerca de los registros ML
Document UnderstandingTM en AI Center
- Administrador de documentos
- Servicios de OCR
API de AI Center
- Información general
- Lista de API
Licencia
Plantillas de soluciones de AI
- Acerca de las plantillas de soluciones de AI
  - Enviar un correo electrónico a AI
Tutorial
- Paquetes ML
  - Utilizar NER personalizado con aprendizaje continuo
- Habilidades ML
Guía básica de resolución de problemas

Importante :

Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Detección de objetos

Paquete ML de código abierto ObjectDetection en AI Center, un modelo reentrenable para detectar y localizar objetos en imágenes.

Nota:

Los paquetes ML listos para usar están obsoletos. Para obtener más información, consulta la página Línea de tiempo de obsolescencia en la guía Información general .

Paquetes del SO > Análisis de imagen > ObjectDetection

Este es un modelo de aprendizaje profundo genérico y reentrenable para llevar a cabo la detección de objetos. Este paquete ML está preentrenado en el conjunto de datos COCO, para que puedas crear directamente una habilidad ML que pueda utilizarse para identificar 80 clases del conjunto de datos COCO.

Bueno, también puedes entrenarlo en tus propios datos y crear una habilidad ML para usarla y realizar la detección de objetos, y así funcionará en tus datos.

Este modelo de aprendizaje profundo utiliza el algoritmo "You Only Look Once" (YOLO), que es uno de los algoritmos vanguardistas de detección de objetos más eficaces que también abarca muchas de las ideas más innovadoras que evolucionan desde el campo de la visión artificial.

Importante:

Ten en cuenta que este modelo no es compatible con GPU (tanto para el proceso como para la habilidad ML) hoy en día.

Detalles del modelo

Tipo de entrada

Archivo

Descripción de entrada

Ruta completa del archivo de imagen en el que quieres detectar los objetos.

Descripción de salida

JSON con la representación de la matriz de bytes de la clase del objeto identificado (te permite ver el cuadro alrededor de los objetos); clase del objeto identificado: nombre, puntuación (entre 0-1).

Ejemplo:

{
  "Predicted ByteArray":
    "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
  "Predicted Class":
     "[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}
{
  "Predicted ByteArray":
    "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
  "Predicted Class":
     "[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}

Procesos

Este paquete solo admite ejecuciones de procesos completos.

Formato del conjunto de datos

ArchivoDeImagen

De forma predeterminada, este modelo leerá imágenes de formato.jpg,.jpeg. Comprueba los siguientes puntos de consideración para las imágenes de entrada:

Ten todas las imágenes del mismo formato.
Tener todas las imágenes del mismo tamaño, preferiblemente 800x600
Ten al menos 100 imágenes o más de cada categoría de objeto.

Archivo de anotación XML

Para cada imagen cargada, debe haber un archivo .XML de anotación correspondiente que contenga los detalles de la casilla asociada a la imagen. El formato de archivo requerido para el archivo .XML es Pascal VOC.

Para anotar las imágenes, puedes utilizar una herramienta de anotación de código abierto como Label Studio o cualquier otra herramienta de tu preferencia.

Los siguientes son algunos puntos a tener en cuenta al crear los archivos .xml:

Es preferible tener una sola clase en el archivo .zip.
Dar un nombre significativo a la clase.
Evitar cualquier alteración en .xml archivo. Consulta el siguiente ejemplo de una carpeta de conjunto de datos:

En el ejemplo anterior, notamos que hay cinco clases: gato, perro, jirafa, caballo, cebra y tienen imágenes y xml correspondientes en la carpeta del conjunto de datos. Por supuesto, tu carpeta de conjunto de datos tendrá más imágenes y xml. Este es solo un ejemplo para entender la estructura de carpetas.

Variables de entorno

learning_rate: cambia este valor para ajustar la tasa de aprendizaje; la tasa de aprendizaje predeterminada es 0,0001.

Artefactos

La función de evaluación produce un artefacto: aquí el rendimiento del modelo se evalúa en el valor del mapa.

result.txt: un informe que contiene información resumida de cómo el modelo se comportó al compartir el valor del mapa (precisión de media aritmética) de cada clase y el valor total del mapa.

Flujo de trabajo de muestra

Puedes usar este flujo de trabajo de muestra para probar este modelo. Asegúrate de que primero implementas el modelo en tu propio tenant y luego utiliza este flujo de trabajo con cualquiera de tus imágenes para enviar la imagen al flujo de trabajo e identificar automáticamente los objetos en esa imagen.

Dependencias

UiPath.MLServices.Activities v1.1.3
UiPath.Web.Activities v1.4.5

Papel

YOLOv3: An Incremental Improvement, de Joseph Redmon, Ali Farhadi.

¿Te ha resultado útil esta página?

AnteriorClasificación de texto en japonés

Sig.Clasificación de texto

Detalles del modelo​

Tipo de entrada​

Descripción de entrada​

Descripción de salida​

Procesos​

Formato del conjunto de datos​

ArchivoDeImagen​

Archivo de anotación XML​

Variables de entorno​

Artefactos​

Flujo de trabajo de muestra​

Dependencias​

Papel​