Windows Virtual Desktop #77 The remote name could not be resolved で セッションホストの展開に失敗

この記事のWVDは”Windows Virtual Desktop Spring 2020 Release”が対象です。

昨日、2021年4月2日、に Windows Virtual Desktop の Session Host を新規に追加しようとしたところ失敗しました。

エラーメッセージの詳細は以下。

“拡張機能 ‘Microsoft.PowerShell.DSC’ の処理中に VM でエラーが報告されました。エラー メッセージ: “The DSC Extension failed to execute: Error downloading https://wvdportalstorageblob.blob.core.windows.net/galleryartifacts/Configuration_3-10-2021.zip after 29 attempts: The remote name could not be resolved: ‘wvdportalstorageblob.blob.core.windows.net’. More information about the failure can be found in the logs located under ‘C:\WindowsAzure\Logs\Plugins\Microsoft.Powershell.DSC\2.83.1.0’ on the VM.\”トラブルシューティングの詳細については、https://aka.ms/VMExtensionDSCWindowsTroubleshoot を参照してください”

エラーコードはありませんが、Virtual Machine のデプロイ後の DSC Extension の実行で失敗していることがわかります。

そして失敗した理由は以下の通りで、Configuration_3-10-2021.zip のダウンロードに失敗したためとわかります。

Error downloading https://wvdportalstorageblob.blob.core.windows.net/galleryartifacts/Configuration_3-10-2021.zip after 29 attempts

さらにダウンロードに失敗した理由は名前解決が出来なかったからとのこと。

The remote name could not be resolved: \’wvdportalstorageblob.blob.core.windows.net’ とのことで、

名前解決に失敗した原因ですが、思い当たることがありあます。丁度同日の2021年4月2日、日本時間の早朝から Azure では大規模な障害が発生していました。

https://status.azure.com/ja-jp/status/history/

上記内容を以下に転記します。

Summary of Impact: Between approximately 21:30 UTC and 22:30 UTC on 01 Apr 2021, customers may have experienced intermittent issues accessing Microsoft services, including Azure, Dynamics, and Xbox Live.

この障害のは影響は日本時間の6:30から7:30まで Azure や Dynamic、Xboxを含む Microsoft Services に接続不可。

Preliminary Root Cause: We are continuing to investigate the underlying cause for the DNS outage but we have observed that Microsoft DNS servers saw a spike in DNS traffic.

原因は調査中となるが、DNSがサービス不能になったこと、DNSトラフィックのスパイクは確認されているとのこと。

Mitigation: Microsoft engaged resilient DNS capabilities to absorb the spike in DNS traffic.

緩和策として、DNSトラフィックのスパイに対応出来る能力を持つDNSへ変えている。

Next Steps: We apologize for the impact caused by this outage. We are continuing to investigate to establish the root cause and additional preliminary details will be published in the next 24 hours. Stay informed about Azure service issues by creating custom service health alerts: https://aka.ms/ash-videos for video tutorials and https://aka.ms/ash-alerts for how-to documentation.

今後の方針。 引き続き原因調査にあたるとのこと。

上記のとおり、障害の発生時間は 日本時間の06:30-07:30 です。 私が Windows Virtual Desktop でデプロイしたのは日本時間で 19:43 です。マイクロソフトが言う障害発生時間から約12時間は経過しています。 ということで、一夜明けた 2021年4月3日の9時から再度デプロイを試してみます。  まあ、日本時間の07:30以降も色々なサービスで問題があるという声はチラホラ聞こえていましたし、DNSのキャッシュが更新されるまでは問題が継続することもありますし、まずは現時点で解消されているかを確認します。

ただ、 Session Host の展開前に一度、エラーメッセージで失敗していた名前解決を実行できるか確認してみます。wvdportalstorageblob.blob.core.windows.net の名前解決は成功しました。

名前解決の問題は解消していそうです。 Session Host の展開を実行します。

結果は失敗でした。

原因は昨日と同じく、BLOBにある構成用のZIPファイルをダウンロードできないとのこと。

The DSC Extension failed to execute: Error downloading https://wvdportalstorageblob.blob.core.windows.net/galleryartifacts/Configuration_3-10-2021.zip after 29 attempts:

試しに、自分のパソコンから https://wvdportalstorageblob.blob.core.windows.net/galleryartifacts/Configuration_3-10-2021.zip をダウンロードすることは出来ました。

ZIPの中身は3つの PowerShell スクリプトとエージェントのインストーラ2つをまとめた ZIP ファイルです。

この PowerShell スクリプトを読んでいくと Session Host 展開時の DSC Extension 実行フェーズで何をやっているかわかります。 まあ、特段を面白い処理はなかったですが。  Configuration_3-10-2021.zip という名前から、中身に変更があると年月日が更新されているのだと思います。

とりあえず、Session Host の展開には失敗する状況が続いています。時間をおいて Retry します。  また、Host Pool も昨日作成した新しいものなのですが、Host Pool から再作成して問題が解消されるかもと思いやってみましたが同じエラーで失敗しました。 

最終的にエラーは解消され、 Session Host の展開に成功しました。 原因は Azure の障害ではありませんでした。 単純に、VNet のカスタムDNSで指定している DNS サーバを起動していないだけでした。。。 当方の単純ミスです。

ちょっと恥ずかしいミスからの展開失敗でしたが、The remote name could not be resolved のエラーメッセージで展開が失敗した場合は VNet に設定している DNS サーバが正常に動作しているかを確認しましょう、ということが今回の教訓というかノウハウになります。 以下の設定の部分となります。 また、丁度、近いタイミングで Azure の障害があった中、思い込みせず基本に忠実に1つ1つ確認すれば問題の原因もすぐにわかったはずでした。

以上