AI Center - Object Detection (オブジェクト検出)

ai-center

latest

false

AI Center ガイド

基本情報
通知
- 自分への通知
プロジェクト
- プロジェクトについて
- プロジェクトを管理する
データセット
- データセットについて
- データセットを管理する
データのラベル付け
ML パッケージ
すぐに使えるパッケージ
パイプライン
ML スキル
- ML スキルについて
- ML スキルを管理する
ML ログ
- ML ログについて
AI Center の Document UnderstandingTM
- Document Manager
- OCR サービス
AI Center API
- 概要
- API リスト
ライセンス
AI ソリューションテンプレート
- AI ソリューションテンプレートについて
  - メール AI
使い方
- ML パッケージ
  - 継続学習するカスタム NER を使用する
- ML スキル
基本的なトラブルシューティングガイド

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

Object Detection (オブジェクト検出)

ObjectDetection - AI Center のオープンソース ML パッケージです。画像内のオブジェクトを検出して位置を特定するための再トレーニング可能なモデルです。

注:

すぐに使える ML パッケージは非推奨になりました。詳しくは、『概要ガイド』の「非推奨化のタイムライン」のページをご覧ください。

[Open-Source Packages] > [Image Analysis] > [ObjectDetection]

ObjectDetection は、オブジェクト検出を実行するための、汎用的で再トレーニング可能なディープラーニングモデルです。この ML パッケージは COCO のデータセットで事前にトレーニングされており、COCO のデータセットの 80 個のクラスを識別するために使用できる ML スキルを直接作成できます。

独自のデータでトレーニングして ML スキルを作成し、それら独自のデータに基づくオブジェクト検出の実行に使用することもできます。

このディープラーニングモデルでは You Only Look Once (YOLO) を使用しています。YOLO は、最先端の、極めて効果的なオブジェクト検出アルゴリズムであり、コンピュータービジョン分野から発展した数多くの非常に革新的なアイデアも採用されています。

重要:

このモデルは現在、GPU (パイプラインと ML スキルの両方) ではサポートされていません。

モデルの詳細

入力の種類

FILE

入力の説明

オブジェクトを検出する画像ファイルのフルパスです。

出力の説明

識別されたオブジェクトのクラスバイト配列表現 (オブジェクトの周囲のボックスを表示できます)、識別されたオブジェクトのクラス - 名前、スコア (0 から 1 の間) を含む JSON です。

例：

{
  "Predicted ByteArray":
    "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
  "Predicted Class":
     "[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}
{
  "Predicted ByteArray":
    "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
  "Predicted Class":
     "[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}

パイプライン

このパッケージでは、フルパイプラインの実行のみがサポートされます。

データセットの形式

画像ファイル

既定では、このモデルは format.jpg,.jpeg の画像を読み取ります。入力画像について、以下の考慮事項を確認してください。

同じ形式のすべての画像を含めます。
すべての画像が同じサイズで、800x600 が望ましい
オブジェクトの各カテゴリについて、100 以上の画像を含めます。

XML 注釈ファイル

アップロードされる画像ごとに、画像の境界ボックスの詳細が記述された注釈の .XML ファイルが必要です。この .XML ファイルは Pascal VOC 形式である必要があります。

画像に注釈を付けるために、Label Studio などのオープンソースの注釈ツールまたはその他の任意のツールを使用できます。

the.xml ファイルを作成する際に考慮する必要がある点を次に示します。

.xmlに 1 つのクラスを含めることをお勧めしますファイル。
クラスに意味のある名前を付けます。
.xmlの変更の回避ファイル。データセットフォルダーの例を次に示します。

前の例では、cat、dog、giraffe、horse、zebra の 5 つのクラスがあり、対応する画像と xml が dataset フォルダーにあることがわかります。もちろん、データセットフォルダーにはさらに多くの画像や XML が含まれます。これはフォルダー構造を理解するための一例に過ぎません。

環境変数

learning_rate: この値を変更して学習率を調整します。既定の学習率は 0.0001 です。

成果物

関数を評価すると、1 つの成果物が生成されます。ここでは、モデルのパフォーマンスはマップの値で評価されます。

result.txt – 各クラスの共有マップ (平均精度) 値および合計マップ値によってモデルがどのように実行されたかについての概要情報を示すレポートです。

サンプルワークフロー

このサンプルワークフローを使用して、このモデルを試すことができます。まずモデルを自分のテナントにデプロイします。次に、このワークフローを任意の画像とともに使用して、画像をワークフローに送信し、その画像内のオブジェクトを自動的に識別します。

依存関係

UiPath.MLServices.Activities v1.1.3
UiPath.Web.Activities v1.4.5

Paper

「YOLOv3: An Incremental Improvement (YOLOv3: 段階的な改善)」Joseph Redmon、Ali Farhadi

このページは役に立ちましたか?

前へJapanese Text Classification (日本語テキスト分類)

次へText Classification (テキスト分類)

モデルの詳細​

入力の種類​

入力の説明​

出力の説明​

パイプライン​

データセットの形式​

画像ファイル​

XML 注釈ファイル​

環境変数​

成果物​

サンプル ワークフロー​

依存関係​

Paper​