- リリース ノート
- 基本情報
- 通知
- プロジェクト
- データセット
- データのラベル付け
- ML パッケージ
- すぐに使えるパッケージ
- 概要
- English Text Classification (英語テキスト分類)
- French Text Classification (フランス語テキスト分類)
- Japanese Text Classification (日本語テキスト分類)
- Object Detection (オブジェクト検出)
- Text Classification (テキスト分類)
- TPOT AutoML Classification (TPOT AutoML分類)
- TPOT AutoML Regression (TPOT AutoML 回帰)
- TPOT XGBoost Classification (TPOT XGBoost 分類)
- TPOT XGBoost Regression (TPOT XGBoost 回帰)
- AI Computer Vision
- Communications Mining
- UiPath Document Understanding
- パイプライン
- ML スキル
- ML ログ
- AI Center の Document UnderstandingTM
- AI Center API
- ライセンス
- AI ソリューション テンプレート
- 使い方
- 基本的なトラブルシューティング ガイド

AI Center
[Open-Source Packages] > [Image Analysis] > [ObjectDetection]
ObjectDetection は、オブジェクト検出を実行するための、汎用的で再トレーニング可能なディープ ラーニング モデルです。この ML パッケージは COCO のデータセットで事前にトレーニングされており、COCO のデータセットの 80 個のクラスを識別するために使用できる ML スキルを直接作成できます。
独自のデータでトレーニングして ML スキルを作成し、それら独自のデータに基づくオブジェクト検出の実行に使用することもできます。
このディープ ラーニング モデルでは You Only Look Once (YOLO) を使用しています。YOLO は、最先端の、極めて効果的なオブジェクト検出アルゴリズムであり、コンピューター ビジョン分野から発展した数多くの非常に革新的なアイデアも採用されています。
入力の種類
FILE
入力の説明
オブジェクトを検出する画像ファイルのフル パスです。
出力の説明
識別されたオブジェクトのクラス バイト配列表現 (オブジェクトの周囲のボックスを表示できます)、識別されたオブジェクトのクラス - 名前、スコア (0 から 1 の間) を含む JSON です。
例:
{
"Predicted ByteArray":
"/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
"Predicted Class":
"[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}
{
"Predicted ByteArray":
"/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAIBAQEBAQIBAQECAgICAgQDAgI…TD",
"Predicted Class":
"[{'class': 'book', 'score': ' 0.31'}, {'class': 'dog', 'score': ' 0.53'}, {'class': 'chair', 'score': ' 0.79'}]"
}
このパッケージでは、フル パイプラインの実行のみがサポートされます。
データセットの形式
画像ファイル
既定では、このモデルは 形式の画像を読み取り.jpg、.jpeg。入力画像に関する次の考慮事項を確認してください。
- 同じ形式のすべての画像を含めます。
- すべての画像が同じサイズで、800x600 が望ましい
- オブジェクトの各カテゴリについて、100 以上の画像を含めます。
XML 注釈ファイル
アップロードされる画像ごとに、画像の境界ボックスの詳細が記述された注釈の .XML ファイルが必要です。この .XML ファイルは Pascal VOC 形式である必要があります。
画像に注釈を付けるために、Label Studio などのオープンソースの注釈ツールまたはその他の任意のツールを使用できます。
.xmlを作成する際の注意点は次のとおりですファイル:
- .xmlに 1 つのクラスを含めることをお勧めしますファイル。
- クラスに意味のある名前を付けます。
- .xml への変更の回避ファイル。
データセット フォルダーの次の例をご覧ください。
前の例では、cat、dog、giraffe、horse、zebra の 5 つのクラスがあり、対応する画像と xml が dataset フォルダーにあることがわかります。もちろん、データセット フォルダーにはさらに多くの画像や XML が含まれます。これはフォルダー構造を理解するための一例に過ぎません。
環境変数
- learning_rate: この値を変更して学習率を調整します。既定の学習率は 0.0001 です。
成果物
関数を評価すると、1 つの成果物が生成されます。ここでは、モデルのパフォーマンスはマップの値で評価されます。
- result.txt – 各クラスの共有マップ (平均精度) 値および合計マップ値によってモデルがどのように実行されたかについての概要情報を示すレポートです。
このサンプル ワークフローを使用して、このモデルを試すことができます。まずモデルを自分のテナントにデプロイします。次に、このワークフローを任意の画像とともに使用して、画像をワークフローに送信し、その画像内のオブジェクトを自動的に識別します。
依存関係
- UiPath.MLServices.Activities v1.1.3
- UiPath.Web.Activities v1.4.5
「YOLOv3: An Incremental Improvement (YOLOv3: 段階的な改善)」Joseph Redmon、Ali Farhadi