字体:  

EMC CX3-40风扇故障期间导致磁盘IO读写大幅度下降

psocnlightning 发表于: 2008-8-27 15:07 来源: DOIT博客

请教1下大家,前一段我们的EMC CX3-40存储坏了一个风扇(一共4个),在故障期间值班人员告知:在存储上的同一个文件系统内压缩和传输文件速度大幅度下降,原来2分钟能传30G的东西,现在连3G都传不完.
后来风扇换完速度就正常了,来换风扇的硬件工程师也说自己不清楚,不知道大家有没有碰到这种情况?

最新回复

冬瓜头 at 2008-8-27 15:19:29
找emc工程师支持,打电话发邮件,一遍遍的发,直到回答出结果为止。
ender at 2008-8-27 15:26:19
风扇坏了不至于把write cache给禁用了吧,那也太搞笑了
klin121628 at 2008-8-27 15:37:06
一般来说,服务器里面,风扇平时都工作在不太高的负荷。如果有风扇挂了,冗余的那个会全速运行,保证系统散热。CX3-40要是出这个问题,可能是散热设计冗余度不够,造成CPU过热降速,以至于整个存储降速

[ 本帖最后由 klin121628 于 2008-8-27 15:39 编辑 ]
psocnlightning at 2008-8-27 15:41:00
现在我问过的EMC工程师都说没碰到这种问题,但是这个问题又确实在我们的生产环境里发生过,只不过我现在没办法冒着影响业务的风险去拔风扇做测试,哎....
prctice666 at 2008-8-27 16:29:07
由于有4个风扇,坏一个风扇对机器基本没有什么影响!玩过几年CX,也从没听说。
big_mammon at 2008-8-27 21:21:07
如果你是管理员的话,可以找个温度计测量一下CX3-40的SP和DAE出风口的温度。看看是不是有点高。
halex1227 at 2008-8-27 21:29:12

QUOTE:

原帖由 klin121628 于 2008-8-27 15:37 发表
一般来说,服务器里面,风扇平时都工作在不太高的负荷。如果有风扇挂了,冗余的那个会全速运行,保证系统散热。CX3-40要是出这个问题,可能是散热设计冗余度不够,造成CPU过热降速,以至于整个存储降速
Klin121628, 最近在播《大宋提刑官II》,估计你是看多了,这么会推理。自己说的话还是要付些责任吧,到底都是做技术的。

“CX3-40 SPE采用4个260-W电源,支持每个存储器N+1电源和N+1冷却。电源带有热量传感器,用于监测周围温度。冷却通过一个连接到每个电源模块的高速风扇实现。

单个电源可以为一个存储处理器供电,单个风扇可以为一个存储处理器降温。每个存储处理器都有一个发生故障时可以维持写的缓存的能力。如果每个SP上有一个电源/风扇模块发生故障或被移除,CX3机型40仍可以运行,并保持高可用性。”


其实CX3-20, CX3-10也都一样。
klin121628 at 2008-8-27 21:52:35
我只是推测一下,halex大侠不用生气。这个case里面,除了过热,我想不到其他合理理由,只能这样推测了,当然这台机器出这一问题不代表其他机器也会,而且很可能是历史上极其特殊的“个例”,就像有的EVA客户说他们的机器习惯2个控制器同时死掉一样,说出来大家都不太信的
冬瓜头 at 2008-8-27 22:02:52
找emc 800,使劲打,发邮件,如果不满意,投诉!
冬瓜头 at 2008-8-27 22:04:28
要说推理,据说柯南更会推理,而且很扯淡,柯南呢,快出来阿
halex1227 at 2008-8-27 22:05:08
“找不到合理理由,就只能这样推测了”
既然你想不到原因,也找不到理由,也不懂具体情况,那就说一句“我不知道”。
gzfrank at 2008-8-29 00:14:50
就是写缓存 disable了。

CX4以前的通病,CX4现在好像解决了这个问题。
prctice666 at 2008-8-29 00:53:04

QUOTE:

原帖由 gzfrank 于 2008-8-29 00:14 发表
就是写缓存 disable了。

CX4以前的通病,CX4现在好像解决了这个问题。
CX3-40里面坏一个PS,write cache不会关闭。
只有同时坏2个PS,而且这两个PS属于一个SPS, 那么write cache 和这个SP都会off.
CX4-120,240,480里面, 和CX3不同, write cache即使发生上面2个PS failed的情况也不off。
arthas at 2008-8-29 07:48:40

QUOTE:

原帖由 klin121628 于 2008-8-27 07:37 发表
一般来说,服务器里面,风扇平时都工作在不太高的负荷。如果有风扇挂了,冗余的那个会全速运行,保证系统散热。CX3-40要是出这个问题,可能是散热设计冗余度不够,造成CPU过热降速,以至于整个存储降速
这个不太可能吧。。
ewen.yang at 2008-8-29 08:44:17
这样的问题也有,真是"李宁”和“阿迪达斯”呀~~
halex1227 at 2008-8-29 11:33:00

QUOTE:

原帖由 arthas 于 2008-8-29 07:48 发表

这个不太可能吧。。
呵呵,所以啊,这个坛子里个人喜好太明显了,严重影响推理判断能力。
冬瓜头 at 2008-8-29 11:34:17
K只不过是开个玩笑而已
mike79 at 2008-8-29 12:15:50
那么请halex1227说说看,是什么原因使得一个风扇坏掉会导致性能下降如此厉害?
halex1227 at 2008-8-29 13:18:42

QUOTE:

原帖由 mike79 于 2008-8-29 12:15 发表
那么请halex1227说说看,是什么原因使得一个风扇坏掉会导致性能下降如此厉害?
很简单,我不知道,也推理不出来。

按照正常情况,不应该发生这种情况。

No other comments.
mike79 at 2008-8-29 15:31:58

QUOTE:

原帖由 halex1227 于 2008-8-29 13:18 发表


很简单,我不知道,也推理不出来。

按照正常情况,不应该发生这种情况。

No other comments.
......
无语。k也不过是根据故障现象提出了一种可能性,既然你不知道确切原因是什么,又怎能武断的认为他提出的可能性不正确?虽然他提出的想法确实匪夷所思,但做售后的总会遇到些在销售说来从来不可能发生的情况。
ps 如果k平时在论坛上少说些IBM的产品,如果k在帖子中不说CX的散热设计有问题......