4.6.6硬盘scrubbing
DS8000将周期性的读取硬盘所有扇区。这个设计不会有任何的冲突而影响应用性能。如果ECC校验识别了错误的数据位,这个数据位会马上被DS8000校正。这减少了超过ECC能力校正能力的多个坏位堆积在一个扇区之内的可能性。如果一个扇区包含的数据超过ECC纠正的能力,于是RAID被用来重建数据和写一个新的拷贝到spare盘的扇区。这个scrubbing过程适用于阵列成员及spare的DDM。DOIT博客&neRl)F;L"ER*n*G
DS8000采用完全冗余的电源和冷却系统。DS8000每个电源和冷却风扇工作在大家知道的N+1模式下。这意味着最少比正常运行需要有一个或多个电源,冷却风扇或电池。这简单的在许多条件下意味复制。
F%f]oB.h0Primary power supplies(PPS)
/i*^mbF0每个机架有2个PPS。每个PPS产生两种不同电压范围:
f1?X]^:L)U@"?0Ü 产生的208V支持每个I/O enclosure和每个processor complex。这种电压由每个电源安置的2个冗余电源供应。
ju$jn"h
j4s0Ü 产生的12V和5V支持disk enclosureDOIT博客MZ5^iII
如果任何一个PPS故障,其他的PPS能够继续支持所有必须的电压给所有机架内的power bus。PPS能够被同时替换。
vm]s h2a&S_j0重要:值得注意的是,如果安装DS8000这样2个PPS连接到同一个断路开关或同一个配电盘,因此DS8000将不会得到很好的外部电源失效保护。这是一个非常普遍的引起非正常停机的原因。 +GI]-{cI2C S.N }0 |
DOIT博客v],l*x[ dt7p
后备电池单元BBUDOIT博客.vR7`OF]
每个机架的I/O enclosure,或者每个机架如果电源线干扰特征(power line disturbance feature)被安装上,将有BBU。每个BBU能被同时安置,倘若在那时候只有一个BBU不可用。DS8000的BBU有最少4年的计划工作生命。DOIT博客Z`8oF5y&llN
机架冷却风扇Rack cooling fansDOIT博客~5@ _E#Np#X7h
每个机架有一个冷却风扇plenum位于disk enclosure的上方。在这个plenum的风扇引导空气从DDM前面流动到机架上端排出。每个enclosure有多个冗余的风扇。每个风扇能够在线更换。DOIT博客0lX'tXm a+{f5i;nL
机架电源控制卡Rack power control card (RPC)
L,A'WR2\&Dd@ e0RPC是DS8000电源管理 的一部分。有2个PRC做冗余。每个卡能够独立的控制整个DS8000的电源。
`*jsZW+A@_W04.7.1Buildingpower loss
DS8000使用服务器的一个内存区域作为非易失性缓存(NVS)。内存的这个区域被用来保存未被写入磁盘子系统的数据。如果Building power失效,在基础机架内的2个PPS会报告失去交流输入电,于是DS8000必须开始保护数据动作。DOIT博客r*{ KwMtZ
DS8000基础机架包含后备电池保护,用来保护发生完全失去电力这个事件时修改的数据。如果一个电源波动发生致使发生霎那间电力中断(经常叫做brownout),DS8000将能容忍大约30ms。如果DS8000上的电源线干扰特征(power line disturbance feature)没有购买,在那之后,DDM将停止旋转并且服务器开始拷贝NVS内容到processor complexes的内置SCSI硬盘。使用UPS技术的很多用户,这不是问题。UPS电源调节一般情况下是非常可信赖的,因此另外的冗余连接设备常是没有必要的。
.f9hhf3k*q#A0如果Building power没有可靠的考虑,那么另外的power line disturbance feature需要被考虑。DS8000这个特性增加了2片单独的硬件:
$V
BuZ#{,@0j+\l4{01. DS8000机架内每个PPS,增加一个调压器模块将转换电池电源208V到12V和5V。这直接从电池供给DDM电力。PPS不能正常的从BBU得到电力。
c t]1T6~\)?"C-h02. 添加到没有电池扩展机架里。基础机架和扩展机架以有无I/O enclosure得到电池。没有I/O enclosure的扩展机架一般没有电池。DOIT博客#o:Yo}CR"S(Q1BD"t%y
增加这个硬件,DS8000能够在电池供电时运行达到50秒,在服务器开始拷贝NVS到SCSI硬盘和停机之前。
2pY a
}!aMm}0不像ESS 800,DS8000没有一个白色的电源开关打开或关闭DS8000存储单元。所有电源先后顺序的完成通过SPCN和RPC。如果用户希望关闭DS8000电源,必须使用由S-HMC提供的管理工具。如果S-HMC没有工作,于是它将不可能控制DS8000的电源顺序直到S-HMC功能恢复。购买一个冗余的S-HMC在这里是有益处的。
0x2LQh:a?JR4v04.7.4紧急电源关闭Emergency power off (EPO)
每个DS8000的机架都有一个紧急电源开关。这个按钮被用来在下列紧急情况下完全切断DS8000电源:
9xHL)c mEjJ0Ü DS8000位于一个危险环境,例如火灾DOIT博客bb"eyg"hp
Ü DS8000位于人身安全危险的环境,例如人员发生触电的典型环境。DOIT博客eG{qh
}
除这两种情况(这些情况是发生概率很小的),EPO开关永远不会用到。这是因为DS8000 NVS存储区域不会直接被电池保护。如果Building power失效,DS8000能够使用内置的电池将NVS内存中的数据降级到一个可变大小的硬盘空间来保护数据,直到电源恢复。然而,EPO开关不允许这个降级过程发生和NVS数据丢失。这可能导致数据丢失。DOIT博客x$T` [,w%L:BC}M
如果需要DS8000下电进行维护,或者移动,总是使用S-HMC完成。DOIT博客;^1\3zD8zLh$C
sFP
DS8000包含许多冗余部件。这些中的大部分部件都有微码并且可以被升级。这些包含processor complexes、DA和HA。每个DS8000服务器也有一个操作系统(AIX)和Licensed Internal Code (LIC)能够被升级。当IBM持续发展和改进DS8000,新发布的firmware和LIC将变为被利用提供改善功能和可用性。DOIT博客r@
I6X"?-L
dJw
DS8000的体系结构允许在线代码升级。这由使用DS8000冗余设计达到。总之,当每个在冗余对的部件被升级时,一小段时间内会失去冗余。
;l{/cf(X0S-HMC能够支撑6种不同版本的代码。每个服务器能够支撑3种不同版本的代码(之前的版本、运行版本和下一个版本)。
*yU"P1m1K.xi+l0安装进程DOIT博客Rv;c7zFy
安装进程包含几个过程。DOIT博客@_g:xTJ,n
1. S-HMC代码将被升级。新的代码版本将被提供CD或通过FTP下载。这可能潜在的包含升级S-HMC内部Linux版本,省级S-HMC LIC和升级S-HMCfirmware。DOIT博客.t*iz!qQ
2. 新DS8000 LIC将被加载到S-HMC以及从这里到每个服务器的内部存储。DOIT博客8J`:s2M0`#q
nU
3. 偶尔,新的PPS和RPCfirmware可能被发布。新的firmware能够直接被从S-HMC加载到每个RPC卡和PPS。每个RPC和PPS将静止、升级和一次一个的恢复直到所有的都被升级完成。
*Y6Hjm!j2vLt(ks04. 有时候,系统管理程序(hypervisor)、服务处理器、系统平台和I/O enclosure平台的新的firmware可能被发布。这些firmware能够被直接从-S-HMC加载到每个设备。激活这些firmware可能需要每个processor complexes一次一个的停机和重启。这将使在每个processor complexes上的每个服务器fail over它的逻辑子系统到另一个processor complexes上的服务器。确定升级可能不需要这个步骤或它可能不会发生进程重启。DOIT博客Nv8_*nQ9MB
5. 升级服务器操作系统(现在是AIX 5.2)加上升级内部LIC将被完成。在一个存储影像中的每个服务器将被一次一个的升级。每个升级将使得每个服务器fail over它的逻辑子系统到另一个processor complexes上的服务器。这个进程也将升级运行中的属于那个服务器的DA的firmware。
/n5_xYY!j06. 升级HA将被完成。对于FOCON/FCP适配卡,这些升级将影响每个适配卡少于2.5秒,并且不会影响连接。如果一个升级时间超过这个,在主机上的多通路软件或CUIR(对ESCON和FICON),将直接将I/O转到另一个HA上。
,Q"Quv7G4pS4H%v0上面的安装过程的描述也许过于复杂,它将不需要很多用户的干预。代码安装器通常将正确的开始进程和然后使用S-HMC检测它的进展。DOIT博客wGt3m7lE:]