Всем привет!
Сервер - Xeon 2.4 5620, Supermicro X8DTN. 48Gb DDR3 - 1333 (6*8), Adaptec 6405 (RAID10 4*WD 1TB RE4). ESXi 5.1 1157734.
Уже 2 раза с сервером случалась такая проблема - перестает отвечать локальный датастор - машины отваливаются, хост пингуется, можно зайти по ssh и запустить на ребут, но он не ребутится, помогает только ресет.
В логах перед возникновением этой траблы куча вот этого:
2013-10-02T11:34:11.858Z cpu0:5858)ScsiDeviceIO: 2331: Cmd(0x4124007998c0) 0x4d, CmdSN 0x1c from world 5298 to dev "mpx.vmhba2:C0:T0:L0" failed H:0x0 D:0x2 P:0x0 Valid sense data: 0x5 0x20 0x0.
На vmware нашел решение: VMware KB: vHBAs and other PCI devices may stop responding in ESXi 5.x and ESXi/ESX 4.1 when using Interrupt Remappi…
Если коротко, то When using Interrupt Remapping on some servers, you may experience these symptoms...ну и как у меня.
Several server vendors have released fixes in the form of Server BIOS updates. Contact your server vendor to see if they have a fix available - биос последний, 2.1с.
Вообщем, надо сделать iovDisableIR = TRUE.
Было ли у кого подобное?
Может кто знает, что такого специфичного может быть в сервере (или в настройках биоса), что interrupt mapping (который по дефолту включен) надо отключать?
Как это может сказаться на производительности или повлиять на какие-либо полезные фишки?