Azure Machine Learning パイプラインを使用した自動機械学習ライフサイクルの例 (SDK v2)

2月 28, 2023

Azure Machine Learning

1. イメージ
2. 準備
3. ノートブックの実行
4. パイプラインの公開
5. パイプラインの使用

Azure Machine Learning SDK v2 を使用し、以下の Azure Machine Learning パイプラインの利用例について紹介させていただきます。今回紹介するライフサイクルは次の通りです。

自動機械学習を実行
ベストモデルを選択して Managed Online Endpoint にデプロイ

今後、以下が実行できるよう更新予定です。

公開したパイプライン実行時に、データアセットの最新バージョンを使用して AutoML が実行されるようにする
パイプライン実行毎に既存のエンドポイントが更新されるようにする

イメージ

// ライフサイクルは以下のようなイメージです。これを参考に後述の手順をご確認ください。

準備

以下リンクより sample-pipeline-sdkv2.zip ファイルをダウンロードし、ローカル上で解凍します。解凍後のフォルダーを、Azure Machine Learning Studio の Notebooks メニューのファイルツリーのうち、任意の場所にアップロードします。

sample-pipeline-sdkv2.zip

※ 保存されているファイル一覧
　・ data フォルダー
　　 ├ MLTable ファイル
　　 └ training-machine-dataset.csv ファイル
　・ aml-pipeline-sample-sdkv2.ipynb ファイル
　・ test.json ファイル

// フォルダーを配置した状態

// 上記ファイルを使って以下のような処理を行うパイプラインを作成します。

ノートブックの実行

sample-pipeline-sdkv2.zip の解凍後、aml-pipeline-sample-sdkv2.ipynb を選択し [カーネルを再起動し、すべてのセルを実行する] をクリックします。実行時には cpu-cluster という名前の STANDARD_DS3_V2 のコンピューティングクラスターが作成されます。既に存在する場合はそのコンピューティングクラスターを使用します。また、AutoML によって生成されたモデルをデプロイしたマネージドオンラインエンドポイントが作成されます。

パイプラインの公開

実行が終了すると、以下の通りエンドポイントとパイプラインが作成されるため、正常に実行が終了していることを確認して [公開] ボタンをクリックし、任意の名前で実行します。実行後、パイプラインエンドポイントが作成されます。(サンプルでは automl_regression_and_deployment という名前になります。)

// ノートブックで定義したパイプラインの実行結果 (この画面で [公開] ボタンを押す)

// 外部から呼び出せるように公開されたパイプラインのエンドポイント

// 自動機械学習によって作成されたモデルをデプロイしたリアルタイムエンドポイント

パイプラインの使用

※ 現在作成中となります。

変更履歴
2023/02/28 created by Narita
2023/03/01 modified by Mochizuki

※ 本記事は「jpmlblog について」の留意事項に準じます。
※ 併せて「ホームページ」および「記事一覧」もご参照いただければ幸いです。

パイプラインライフサイクル SDK v2

prev： parquet ファイル形式のデータアセットを使用した場合に発生する既知の問題について next： v2 API の有効化に伴う Azure Machine Learning Workspace への影響について