データセットの名前に漢字などの全角文字を使用した場合、登録後に Azure Machine Learning スタジオから参照できなくなる事象が報告されています。Azure Machine Learning の利用における名前付け規則などを踏まえ、現在確認されている事象について紹介いたします。
名前付け規則について
Azure Machine Learning で使用するリソースの名前付け規則として、下記公開情報をのとおり、ワークスペースのリソースと、これを作成するリソース グループに名前付けの規則がございます。
- Azure リソースの名前付け規則と制限事項 #Microsoft.MachineLearningServices
Entity Scope 長さ 有効な文字 workspaces resource group 3-33 英数字とハイフン workspaces / computes ワークスペース 2-16 英数字とハイフン
また、Azure Machine Learning スタジオ上でコンピューティング リソースを作成する場合には、下記画像のように有効な文字の情報が表示され、名前の検証が行われますので、これに従い名前を指定下さい。
エラー例 1.
エラー例 2.
エラー例 3.
データセットの名前付けで発生する事象について
データセットを登録する際に指定する名前には、上述のような公開情報や、機械的な名前検証が行われません。しかしながら、UTF-8 の 1 バイト コード以外の文字 (漢字などの全角文字や異なる言語の文字) を使用した場合、登録後に Azure Machine Learning スタジオで参照できなくなるといった現象が報告されています。
例えば、下記の通り全角の “Dataset” という名前で登録するとします。
これをクリックすると、以下の通り HTTP 404 エラーが表示されます。
対処方法について
このデータセットを Azure Machine Learning スタジオ上で登録解除しようとしても、正常に処理が進まず失敗します。この事象は、現在 (2020/10/19) 弊社開発部門にフィードバックを行い調査中となります。
回避策として、Azure Machine Learning の CLI 拡張機能をすることでこれを登録解除することが出来ます。下記公開情報に従い、拡張機能のインストールおよびデータセットの登録解除をお試しください。
Azure Machine Learning の CLI 拡張機能のインストールと使用
実行例:
Azure CLI がインストール済みの環境では以下の実行します。1
2az extension add -n azure-cli-ml
az extension update -n azure-cli-ml初回アクセス時には、以下のコマンドでワークスペースにアタッチします。
1
az ml folder attach -w "ワークスペース名" -g "リソース グル―プ名"
以下のコマンドでデータセットの登録を解除します。
1
az ml dataset unregister -n "データセット名"
変更履歴
2020/10/19 created by Mochiszuki
※ 本記事は 「jpmlblog について」 の留意事項に準じます。
※ 併せて 「ホームページ」 および 「記事一覧」 もご参照いただければ幸いです。