在正常的操作下,DS8000所有的服务器都积极的处理I/O请求。此节描述了在一个异常条件下影响到它们中的一个时,发生在DS8000服务器之间failover和failback的规程。DOIT博客_`5KvZ`1ZP:H1a
FailoverDOIT博客5j6D)I
_G
在图4-4中,描述了服务器0失效。剩下的服务器接管它所有的功能。RAID阵列,因为它们连接到所有的服务器,所以能够被服务器1通过DA卡访问。
Ei INTf)Q0从数据完整性观点,真实的问题是未降级或者修改的数据属于服务器1(它应该在服务器0的NVS上)。自DS8000现在只有一个数据(当前驻留在服务器1的Cache内存中)拷贝以后,它将现在采用以下的步骤:
/{M%T/p5UAw'Ah01. 它的NVS内容降级到磁盘子系统
[(H&YbF,ON8WMi02. 服务器1的NVS和Cache分离成2部分,一半用于奇数LSS,一半用于偶数LSS
|8XRM/L'e0HA03. 服务器1现在开始为所有LSS处理写(以及读)
q5k YUra0
t"K.s/M-qI7B0
DOIT博客qF&~IGi+k's$|x
图4-4服务器0故障转移它的功能给服务器1DOIT博客zZ*|/I.]9na/]7X
这个完整的过程就是为人所知的failover。在failover之后,DS8000现在的运转如图4-4所示。服务器1现在拥有所有的LSS,这意味着所有读和写将通过服务器1服务。服务器1的NVS现在用于奇数和偶数LSS。完整的failover过程对连接的主机是不可见的,除了一些临时的硬盘错误的可能性。
b:dL&wi0Failback
(U_PRNy0当一个失效的服务器被修理和重启后,Failback进程被激活。服务器1再次使用服务器0的NVS,偶数LSS的所有权调转回服务器0。两个控制器重新开始正常的操作。就像failover过程一样,Failback过程也是不会被连接的主机感知的。
%o\2x}g&q4]mq0一般情况下,DS8000的恢复操作不会影响I/O操作的等待时间不会超过15秒。由于配置的某些局限性和高级功能,这种对等待时间的影响能够被限制在8秒以内。逻辑卷没有被配置为RAID-10存储时,确定的有关的RAID恢复能够使等待时间的影响超过15秒。如果你有一个实时响应的需求环境,请联系IBM来确定怎样通过管理你的存储来达到需求。
q.h|j i
X04.4.3在所有电源失去后的NVS恢复
在正常的操作下,DS8000使用NVS拷贝到交替工作的服务器上来保护快速写入的数据。为了确保这些快速写入的数据不会被丢失,DS8000包含了电池后备单元(battery backup units BBU)。如果所有的电池都发生了故障(这是一种不太可能的极端情况,因为电池是N+1冗余配置的),DS8000将失去这种保护,并且因此所有的DS8000服务器都会离线。如果电源失去的是一个单独的主电源供应,那么不会影响其他电源的供应来保证所有电池的带电,因此所有服务器将继续在线。DOIT博客x U(T7^M+B]
电池的唯一目的是保护DS8000服务器内存上的NVS区域,在完全损失输入电源的情况下。如果基础机架内的两个电源都被停止电源输入,服务器将会被通知它们现在运行在电池模式下,立刻开始一个停机程序。除非购买power line disturbance feature,BBU不能被用来保持硬盘旋转。即使它们继续转动,设计也不会将数据从NVS移动到FC-AL硬盘阵列中。作为替代的,每个processor complex都有一定数量的内置SCSI硬盘,可以被用来存储NVS内容。当一个电池供电环境中,相关的停机开始,下面的事件会发生:DOIT博客7Rj$d4bTQ0[ S
1. 所有HA卡I/O被blockDOIT博客1@g.kA2VI
2. 每个服务器开始拷贝它们的NVS数据到内置的硬盘。对于每个服务器,那个服务器制造2个拷贝。
/t5]mJ
M\7AFd\w03. 当拷贝进程结束,每个服务器关闭AIX。DOIT博客0r5N(YaP8}i:l
4. 当每台服务器AIX关闭完成(或一个计时器终止),DS8000被停机。DOIT博客?vZ\/B
当DS8000电源供应恢复时,会发生下面的过程:DOIT博客7t*Y B1y(a8z1k[
1. processor complexes加电,完成电源自检。
UT3WP"x `RB\Q_02. 每个服务器开始启动。
+B[rJ3P ZJk*d(n03. 在某一阶段的启动过程中,服务器检测内置SCSI硬盘中的NVS数据,并且开始将其降级到FC-AL硬盘。DOIT博客T5X
C2E'Fr-Q
4. 当电池充电达到某一水平,服务器开始上线。
kN'|pw'u@~|Z0一个关键点是服务器将不会上线直到电池电力充满。在一些案例中,在供电自检和存储设备影像初始化时完全充电将会发生。然而,如果电池的完全放电发生过,也许会发生如果多路电力损耗发生在一个很短的周期内,那么电池再次充电可能要花费2个小时。DOIT博客po4bh`A0`z,\z
因为NVS的数据写入到了DS8000 processor complexes上的内置SCSI硬盘,并且没有抑制在电池保护的NVS-ROM,NVS上的内容将被无限期保存。这意味着不像DS8000或ESS,在电源必须恢复以前,没有固定的时间要求。DOIT博客e|oG#a%hNO;u
4.5主机连接高可用性
每个DS8000光纤通道主机适配卡提供了4个端口,用来直接连接主机或通过光纤通道交换机。DOIT博客7?t"D+UI!`(r
单或多路经
8SD6l0zA`?3\8X0不像DS6000,DS8000没有使用偏爱路径preferred path概念,因为HA卡被服务器之间共享。用来表示这个原理,图4-5描述了一种可能的产品配置。在这个例子中,DS8100 Model 921有2个I/O enclosures(是enclosures2和3)。每个enclosures有4个HA:2个FC和2个ESCON。I/O enclosure插槽3和6没有描绘出来,因为它们预留给DA卡。如果一个主机只有一条路径连接到DS8000,如图4-5,因而它将能访问属于所有LSS的卷,因为HA将直接的把I/O发送给正确的服务器。然而,如果一个错误发生在HA或HP(host port),或I/O enclosure,所有的连接将失去。明显的HBA连接到主机是一个单点故障。DOIT博客P2m
E^;Ro
So y7d5`~[QRuKD0
;Ypn"DY.c0图4-5单路径主机DOIT博客*?4]*gd[tv~,X