AI Center
最新
バナーの背景画像
AI Center
最終更新日 2024年4月18日

Object Detection (オブジェクト検出)

[Open-Source Packages] > [Image Analysis] > [ObjectDetection]

ObjectDetection は、オブジェクト検出を実行するための、汎用的で再トレーニング可能なディープ ラーニング モデルです。この ML パッケージは COCO のデータセットで事前にトレーニングされており、COCO のデータセットの 80 個のクラスを識別するために使用できる ML スキルを直接作成できます。

独自のデータでトレーニングして ML スキルを作成し、それら独自のデータに基づくオブジェクト検出の実行に使用することもできます。

このディープ ラーニング モデルでは You Only Look Once (YOLO) を使用しています。YOLO は、最先端の、極めて効果的なオブジェクト検出アルゴリズムであり、コンピューター ビジョン分野から発展した数多くの非常に革新的なアイデアも採用されています。

重要: このモデルは現在、GPU (パイプラインと ML スキルの両方) ではサポートされていません。

詳細

入力の種類

FILE

入力の説明

オブジェクトを検出する画像ファイルのフル パスです。

出力の説明

識別されたオブジェクトのクラス バイト配列表現 (オブジェクトの周囲のボックスを表示できます)、識別されたオブジェクトのクラス - 名前、スコア (0 から 1 の間) を含む JSON です。

例:

{
  "Predicted ByteArray":
    "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
  "Predicted Class":
     "[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}{
  "Predicted ByteArray":
    "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
  "Predicted Class":
     "[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}

パイプライン

このパッケージでは、フル パイプラインの実行のみがサポートされます。

データセットの形式

画像ファイル

既定では、このモデルは .jpg 形式と .jpeg 形式の画像を読み取ります。以下に、入力画像に関する考慮事項をいくつか示します。

  • 同じ形式のすべての画像を含めます。
  • 同じサイズ (推奨サイズ 800*600) のすべての画像を含めます。
  • オブジェクトの各カテゴリについて、100 以上の画像を含めます。

XML 注釈ファイル

アップロードされる画像ごとに、画像の境界ボックスの詳細が記述された注釈の .XML ファイルが必要です。この .XML ファイルは Pascal VOC 形式である必要があります。

画像に注釈を付けるために、Label Studio などのオープンソースの注釈ツールまたはその他の任意のツールを使用できます。

以下に、.xml ファイルの作成時に考慮すべきことをいくつか示します。

  • .xml ファイルのクラスは 1 つにすることを推奨します。
  • クラスには、(上記のような) わかりやすい名前を付けてください。
  • .xml ファイルが変更されないようにしてください。

    データセット フォルダーは次のようになります。



上記の画像には 5 つのクラス (cat、dog、giraffe、horse、zebra) があり、それぞれに対応する画像と xml がデータセット フォルダーに含まれています。もちろん、データセット フォルダーにはさらに多くの画像と xml が存在しており、これはフォルダー構造を理解するための一例に過ぎません。

環境変数

  • learning_rate: この値を変更して学習率を調整します。既定の学習率は 0.0001 です。

成果物

関数を評価すると、1 つの成果物が生成されます。ここでは、モデルのパフォーマンスはマップの値で評価されます。

  • result.txt – 各クラスの共有マップ (平均精度) 値および合計マップ値によってモデルがどのように実行されたかについての概要情報を示すレポートです。

サンプル ワークフロー

このサンプル ワークフローを使用して、このモデルを試すことができます。まずモデルを自分のテナントにデプロイします。次に、このワークフローを任意の画像とともに使用して、画像をワークフローに送信し、その画像内のオブジェクトを自動的に識別します。

依存関係

  • UiPath.MLServices.Activities v1.1.3
  • UiPath.Web.Activities v1.4.5

Paper

YOLOv3: An Incremental Improvement (YOLOv3: 段階的な改善)」Joseph Redmon、Ali Farhadi

Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.