XenServerで発生する vNIC障害[XenServer]

このエントリーをはてなブックマークに追加


2013-08-27


ツチノコブログ / XenServerによるmemcachedパフォーマンス
http://tsuchinoko.dmmlabs.com/?p=464

でも触れられていますが、XenServer では、ごくごくまれに仮想マシンに割り当てられた vNIC がおかしくなることがあります。
ただ、再現条件がわからず、起きないVMは全然起きないので、特定のトラフィックパターンに起因する可能性もあるのかも…

もともと、XenServerはネットワーク回りに不安を抱えており、dmmでも
ちょくちょくXenServerのネットワークが定期的にフリーズしています。


具体的には、XenServerの、というよりは、VMの仮想NICがおかしくなります

どうおかしくなるのか?ですが

 例えば、XenServer側の vif と、VM側の NIC は下記のような関係になっています。

[vif10.0] XenServer
 RX TX
 | |
 | |
 TX RX
[ eth0 ] CentOS5.5(PV)


  この問題が発生した時に、ifconfig で、RXおよびTXのカウンタを眺めていると、vif10.0 のTX と、eth0 のRX のカウンタは上がるものの、eth0の TX と vif のRXのカウンタは上がりませんでした。
  実際、vif10.0と eth0 で tcpdump してみても、XenServer側から、VM の方向には、ARPパケットが流れていきますし受信もされていますが、その逆は全くで、上図でいうところの eth0/TX も、vif10.0/RX のカウンタも上がりませんし、arp packet の応答も見えません。

  DMMさんでは

その都度、ネットワークインターフェースのdeactivate→activateで復旧させなければいけません。


  と言われていますが、このキモは対象 vif の再生成です。なので、VMの再起動や、XenMotion によるホストの移動でも、復旧します。
  また仮想マシンの eth0 を down/up しても、残念ながら復旧しません。

  ともあれ、明確な対策が打てないものの如何にも割り込み周り系っぽい&NICの offload 機能で幸せになった試しがないので、最近は 物理NIC, vif, 仮想マシンNIC で、考えられるだけNICの off load機能をすべて off にしてます。効果があったような気がちょっとする今日このごろ。

  で、最近これに対応するっぽい記述のパッチが出ました。
  
http://support.citrix.com/article/CTX135623

Customers may experience a loss of network connectivity, if the environment, across multiple VMs, is creating high network load. This is due to the VM being unable to send packets. However, ifconfig (run from the control domain - dom0) will show that packets are still sent to the VM.


が、どうも違うみたい
  
http://forums.citrix.com/thread.jspa?threadID=305894&start=90&tstart=0

Hi,
I applied this hotfix and for me didn't resolv this issue
Still, from time to time my XS lose network connectivity.


うーん、残念。



IPv4/IPv6 meter
検索キーワードは複数指定できます
ChangeLogを検索
Google
Web www.kunitake.org
思ったより安い……時もある、Amazon

カテゴリ