注册有礼
< 返回资讯中心

存储故障让我见识到了真正的存储内部

发布人:it老炮儿 发布时间:2017.03.14 来源:IT故事汇

先说说存储发生什么问题了?

之前服务器内部我们都看过,但我相信很少有人见过存储的主机构造,今天借着维修存储的机会看看存储的内部构造。我这是一台netapp 3250,发生了什么问题呢?接下来和中嘉和信小编一起了解一下。先从系统看。由双机热备(HA)组成的存储有一台已经挂了(failover),另一台接管了发生错误的主机。

北京主机托管

△ 存储管理界面报错
正常来说一台挂了,如果非硬件故障的情况下是可以giveback的,即可以通过giveback切换回来。
但之前已出现过此相同问题,报修后厂家要求我保留当前状态,等厂家上门判断。当然我一点也不担心,毕竟没有影响到业务。
在等待厂家上门的前面我们了解一下,存储的分类。
存储分类
磁盘存储市场上,一般分封闭系统的存储和开放系统的存储:
封闭系统指大型机,AS400等服务器;
开放系统指基于包括Windows、UNIX、Linux等操作系统的服务器;
开放系统的存储分为内置存储和外挂存储;
外挂存储根据连接的方式分为直连式存储(Direct-Attached Storage,简称DAS)和网络化存储(Fabric-AttachedStorage,简称FAS);
开放系统的网络化存储根据传输协议又分为网络接入存储(Network-Attached Storage,简称NAS)和存储区域网络(StorageArea Network,简称SAN)。
而这种存储叫NETAPP存储,属于FAS,它的型号一般就是FAS20xx,FAS30xx,FAS80xx等等。
这款出问题的存储就是NETAPP FAS3250,它的外观是这样的。
正面照

正面照可以看出报警灯已亮。(嘿嘿,面板灰有点大),上面两个是机头,下面是磁盘柜,可以看到亮黄灯的就是坏的主机,放大可以看到标识node2.

北京主机托管

背面照

线比较乱了,当时上线比较急,就不管它乱的问题了,但它的连线方法还是很复杂的。

北京主机托管

好了厂家来了,之前厂家根据错误log已经无法判断是何故障,建议之前发生过此类问题,所以拿出了必杀技。
必杀技:更换主机硬件

首先把主机拆下来,抽出主机,主机是这个样子的:

北京主机托管

这里一一介绍一下:
1-电池:缓存电池,保障存储重要配置数据,防止掉电数据丢失。
2.内存:缓存
3.内存:主机内存。40G、4条。
4.数据卡:这个重要了,所有的配置数据都存在此处,也就是主机的存储。你可以将此卡迁移到相应的型号主机,而配置不变。
5.盖子:这个是个盖子下面是CPU,里面有两个大的散热片。(双CPU)
6.光纤模块卡:这个无法直接拆开,里面包含两个FC卡,也就是光纤模块卡。
更换主机,只要把1、2、3、4、6的设备迁移到新主机内即可。

拆卸过程中的部分图片

北京主机托管

△ CPU上面的散热片

北京主机托管

△ 数据卡

北京主机托管

△ FC卡
安装过程就很简单了,一个机器的配件移到另一台机器。
有人看到这说,问题解决了码?我们想看看如何解决的,其实看了以上的步骤,是否解决问题已经不言而喻了,硬件全换了,您说还会有问题吗?其实呀有些问题还是比较诡异的,对于用户还是厂家最重要的是最快的方法解决问题。
硬件构造大同小异,有空讲讲netapp的存储的系统运维,还是比较复杂的;但每个品牌的存储都有自身的系统命令和配置方法,属于小众中的小众。我一向认为会用即可,不必深研究,毕竟我们还有厂商支持。
今天就说到这里,可能有些人是拆过存储的,反正我是头一次见,以此文留念。
作者简介
作者:it老炮儿。一个混迹IT业十余载IT运维工程师,致力于用通俗易懂的话语描述那晦涩难懂的IT技术,只希望这点经验与你有用,分享技术交个朋友。

来源:IT故事汇(ID:ithelpyou)

相关推荐《如何保护数据中心网络安全

热门新闻

版权所有©2018年北京中嘉和信通信技术有限公司京ICP备09037838号-6京公网安备11010602110005号