DS8000红皮书(part29)
上一篇 / 下一篇 2006-10-23 09:17:19 / 天气: 晴朗 / 心情: 高兴 / 个人分类:翻译类文章
4.6.6硬盘scrubbing
DS8000将周期性的读取硬盘所有扇区。这个设计不会有任何的冲突而影响应用性能。如果ECC校验识别了错误的数据位,这个数据位会马上被DS8000校正。这减少了超过ECC能力校正能力的多个坏位堆积在一个扇区之内的可能性。如果一个扇区包含的数据超过ECC纠正的能力,于是RAID被用来重建数据和写一个新的拷贝到spare盘的扇区。这个scrubbing过程适用于阵列成员及spare的DDM。
4.7电源和冷却
DS8000采用完全冗余的电源和冷却系统。DS8000每个电源和冷却风扇工作在大家知道的N+1模式下。这意味着最少比正常运行需要有一个或多个电源,冷却风扇或电池。这简单的在许多条件下意味复制。
Primary power supplies(PPS)
每个机架有2个PPS。每个PPS产生两种不同电压范围:
Ü 产生的208V支持每个I/O enclosure和每个processor complex。这种电压由每个电源安置的2个冗余电源供应。
Ü 产生的12V和5V支持disk enclosure
.xR;h5cd,vTI;z/L0如果任何一个PPS故障,其他的PPS能够继续支持所有必须的电压给所有机架内的power bus。PPS能够被同时替换。DOIT博客fhM4AJ;]*L |
重要:值得注意的是,如果安装DS8000这样2个PPS连接到同一个断路开关或同一个配电盘,因此DS8000将不会得到很好的外部电源失效保护。这是一个非常普遍的引起非正常停机的原因。
后备电池单元BBU
每个机架的I/O enclosure,或者每个机架如果电源线干扰特征(power line disturbance feature)被安装上,将有BBU。每个BBU能被同时安置,倘若在那时候只有一个BBU不可用。DS8000的BBU有最少4年的计划工作生命。
`jA7T+X0机架冷却风扇Rack cooling fans
每个机架有一个冷却风扇plenum位于disk enclosure的上方。在这个plenum的风扇引导空气从DDM前面流动到机架上端排出。每个enclosure有多个冗余的风扇。每个风扇能够在线更换。
-Vwbf#Gq,[b0机架电源控制卡Rack power control card (RPC)
RPC是DS8000电源管理 的一部分。有2个PRC做冗余。每个卡能够独立的控制整个DS8000的电源。DOIT博客4_PU)~2XD(F}+M
4.7.1 Building power loss
DS8000使用服务器的一个内存区域作为非易失性缓存(NVS)。内存的这个区域被用来保存未被写入磁盘子系统的数据。如果Building power失效,在基础机架内的2个PPS会报告失去交流输入电,于是DS8000必须开始保护数据动作。DOIT博客1h*s Y&{/Y[G,xN#y
4.7.2电力波动保护
DS8000基础机架包含后备电池保护,用来保护发生完全失去电力这个事件时修改的数据。如果一个电源波动发生致使发生霎那间电力中断(经常叫做brownout),DS8000将能容忍大约30ms。如果DS8000上的电源线干扰特征(power line disturbance feature)没有购买,在那之后,DDM将停止旋转并且服务器开始拷贝NVS内容到processor complexes的内置SCSI硬盘。使用UPS技术的很多用户,这不是问题。UPS电源调节一般情况下是非常可信赖的,因此另外的冗余连接设备常是没有必要的。DOIT博客7KwEVtI
如果Building power没有可靠的考虑,那么另外的power line disturbance feature需要被考虑。DS8000这个特性增加了2片单独的硬件:
/_ h1IO0li01. DS8000机架内每个PPS,增加一个调压器模块将转换电池电源208V到12V和5V。这直接从电池供给DDM电力。PPS不能正常的从BBU得到电力。
Nr}'Oj%g4UPd02. 添加到没有电池扩展机架里。基础机架和扩展机架以有无I/O enclosure得到电池。没有I/O enclosure的扩展机架一般没有电池。DOIT博客*^&[} f5f0G
增加这个硬件,DS8000能够在电池供电时运行达到50秒,在服务器开始拷贝NVS到SCSI硬盘和停机之前。DOIT博客2n,`Y&V-P(\ I2A h
4.7.3 DS8000电源控制
不像ESS 800,DS8000没有一个白色的电源开关打开或关闭DS8000存储单元。所有电源先后顺序的完成通过SPCN和RPC。如果用户希望关闭DS8000电源,必须使用由S-HMC提供的管理工具。如果S-HMC没有工作,于是它将不可能控制DS8000的电源顺序直到S-HMC功能恢复。购买一个冗余的S-HMC在这里是有益处的。
%{5kMcPCT Y04.7.4紧急电源关闭Emergency power off (EPO)
每个DS8000的机架都有一个紧急电源开关。这个按钮被用来在下列紧急情况下完全切断DS8000电源:
,Y$tP i:c},K}0Ü DS8000位于一个危险环境,例如火灾DOIT博客*x!xy%C0E.m1T
Ü DS8000位于人身安全危险的环境,例如人员发生触电的典型环境。
2ag/u{3zV1A]O+i0除这两种情况(这些情况是发生概率很小的),EPO开关永远不会用到。这是因为DS8000 NVS存储区域不会直接被电池保护。如果Building power失效,DS8000能够使用内置的电池将NVS内存中的数据降级到一个可变大小的硬盘空间来保护数据,直到电源恢复。然而,EPO开关不允许这个降级过程发生和NVS数据丢失。这可能导致数据丢失。
T8Ld rY"Ik0如果需要DS8000下电进行维护,或者移动,总是使用S-HMC完成。
Ey-z]:VW/@~04.8微码升级
DS8000包含许多冗余部件。这些中的大部分部件都有微码并且可以被升级。这些包含processor complexes、DA和HA。每个DS8000服务器也有一个操作系统(AIX)和Licensed Internal Code (LIC)能够被升级。当IBM持续发展和改进DS8000,新发布的firmware和LIC将变为被利用提供改善功能和可用性。DOIT博客E*j%p C u`#w;G^g
DS8000的体系结构允许在线代码升级。这由使用DS8000冗余设计达到。总之,当每个在冗余对的部件被升级时,一小段时间内会失去冗余。
_-L/dXS \L5z `0S-HMC能够支撑6种不同版本的代码。每个服务器能够支撑3种不同版本的代码(之前的版本、运行版本和下一个版本)。DOIT博客u,^!A\6K
安装进程
安装进程包含几个过程。
zhT0rB,W01. S-HMC代码将被升级。新的代码版本将被提供CD或通过FTP下载。这可能潜在的包含升级S-HMC内部Linux版本,省级S-HMC LIC和升级S-HMCfirmware。DOIT博客TA~w.`5lf.H An%C
2. 新DS8000 LIC将被加载到S-HMC以及从这里到每个服务器的内部存储。
$h*U@&@G5n5]Z,LR7s03. 偶尔,新的PPS和RPCfirmware可能被发布。新的firmware能够直接被从S-HMC加载到每个RPC卡和PPS。每个RPC和PPS将静止、升级和一次一个的恢复直到所有的都被升级完成。