- リリース ノート
- 基本情報
- 通知
- プロジェクト
- データセット
- データのラベル付け
- ML パッケージ
- すぐに使えるパッケージ
- 概要
- English Text Classification (英語テキスト分類)
- French Text Classification (フランス語テキスト分類)
- Japanese Text Classification (日本語テキスト分類)
- Object Detection (オブジェクト検出)
- Text Classification (テキスト分類)
- TPOT AutoML Classification (TPOT AutoML分類)
- TPOT AutoML Regression (TPOT AutoML 回帰)
- TPOT XGBoost Classification (TPOT XGBoost 分類)
- TPOT XGBoost Regression (TPOT XGBoost 回帰)
- AI Computer Vision
- Communications Mining
- UiPath Document Understanding
- パイプライン
- ML スキル
- ML ログ
- AI Center の Document UnderstandingTM
- AI Center API
- ライセンス
- AI ソリューション テンプレート
- 使い方
- 基本的なトラブルシューティング ガイド
Object Detection (オブジェクト検出)
[Open-Source Packages] > [Image Analysis] > [ObjectDetection]
ObjectDetection は、オブジェクト検出を実行するための、汎用的で再トレーニング可能なディープ ラーニング モデルです。この ML パッケージは COCO のデータセットで事前にトレーニングされており、COCO のデータセットの 80 個のクラスを識別するために使用できる ML スキルを直接作成できます。
独自のデータでトレーニングして ML スキルを作成し、それら独自のデータに基づくオブジェクト検出の実行に使用することもできます。
このディープ ラーニング モデルでは You Only Look Once (YOLO) を使用しています。YOLO は、最先端の、極めて効果的なオブジェクト検出アルゴリズムであり、コンピューター ビジョン分野から発展した数多くの非常に革新的なアイデアも採用されています。
識別されたオブジェクトのクラス バイト配列表現 (オブジェクトの周囲のボックスを表示できます)、識別されたオブジェクトのクラス - 名前、スコア (0 から 1 の間) を含む JSON です。
例:
{
"Predicted ByteArray":
"/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
"Predicted Class":
"[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}
{
"Predicted ByteArray":
"/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
"Predicted Class":
"[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}
このパッケージでは、フル パイプラインの実行のみがサポートされます。
画像ファイル
既定では、このモデルは .jpg 形式と .jpeg 形式の画像を読み取ります。以下に、入力画像に関する考慮事項をいくつか示します。
- 同じ形式のすべての画像を含めます。
- 同じサイズ (推奨サイズ 800*600) のすべての画像を含めます。
- オブジェクトの各カテゴリについて、100 以上の画像を含めます。
XML 注釈ファイル
アップロードされる画像ごとに、画像の境界ボックスの詳細が記述された注釈の .XML ファイルが必要です。この .XML ファイルは Pascal VOC 形式である必要があります。
画像に注釈を付けるために、Label Studio などのオープンソースの注釈ツールまたはその他の任意のツールを使用できます。
以下に、.xml ファイルの作成時に考慮すべきことをいくつか示します。
- .xml ファイルのクラスは 1 つにすることを推奨します。
- クラスには、(上記のような) わかりやすい名前を付けてください。
-
.xml ファイルが変更されないようにしてください。
データセット フォルダーは次のようになります。
上記の画像には 5 つのクラス (cat、dog、giraffe、horse、zebra) があり、それぞれに対応する画像と xml がデータセット フォルダーに含まれています。もちろん、データセット フォルダーにはさらに多くの画像と xml が存在しており、これはフォルダー構造を理解するための一例に過ぎません。
このサンプル ワークフローを使用して、このモデルを試すことができます。まずモデルを自分のテナントにデプロイします。次に、このワークフローを任意の画像とともに使用して、画像をワークフローに送信し、その画像内のオブジェクトを自動的に識別します。
「YOLOv3: An Incremental Improvement (YOLOv3: 段階的な改善)」Joseph Redmon、Ali Farhadi