分享好友 最新动态首页 最新动态分类 切换频道
Megacli详解
2024-12-26 10:20

通常,我们使用的DELL/HP/IBM三家的机架式PC级服务器阵列卡是从LSI的卡OEM出来的,DELL和IBM两家的阵列卡原生程度较高, 没有做太多封装,可以用原厂提供的阵列卡管理工具进行监控;而HP的阵列卡一般都做过封装了,因此需要使用自身特有的管理工具来监控。本文以几种常用的阵列卡为例,展示其阵列卡及硬盘监控的方法。

DELL SAS 6/iR卡,全称LSI Logic SAS1068E,只支持RAID 0, RAID 1, RAID 1+0, 不支持RAID 5等高级RAID特性,不支持阵列卡电池。
DELL PERC PERC H700卡,全称LSI Logic MegaRAID SAS 2108,支持各种RAID级别及高级特性,可选配阵列卡电池。
DELL PERC H310 Mini卡 ,全称LSI Logic / Symbios Logic MegaRAID SAS 2008,支持常见RAID级别,不支持高级RAID特性,不支持阵列卡电池。
IBM ServeRAID M5014 SAS/SATA Controller卡,全称LSI Logic / Symbios Logic MegaRAID SAS 2108,支持各种RAID级别及高级特性,可选配阵列卡电池。
IBM ServeRAID-MR10i SAS/SATA Controller卡,全称LSI Logic / Symbios Logic MegaRAID SAS 1078,支持常见RAID级别,不支持高级RAID特性,可选配阵列卡电池,这个卡其实和DELL的PERC 6/i卡是一样的,都是基于LSI MegaRAID SAS 1078基础上OEM出来的。

上面是几种常见的阵列卡型号,更多的可以自行查看官方的技术手册。下面我们要继续的是,这些阵列卡以及硬盘如何监控,阵列卡的管理也请查看官方技术手册,不在本文讨论范畴。一般地,支持RAID 5的卡,我们称其为阵列卡,都可以使用LSI官方提供的MegaCli工具来管理,而不支持RAID 5的卡,我们称其为SAS卡,使用lsiutil工具来管理。HP的服务器使用其特有的hpacucli工具来管理。

MegaCli -adpallinfo -aall — 查看阵列卡信息

-a 参数指定阵列卡的编号,一般服务器上只会配一个阵列卡,因此我们通常指定为 -a0(阵列卡适配器编号,从0开始) 即可,主要关注下面几个信息

状态值对应含义Product Name : PERC H710 Mini阵列卡名称FW Package Build: 21.2.0-0007阵列卡firmware版本号,版本如果太低,建议升级以提高稳定性及性能BBU : Present是否有配BBU电池

MegaCli -cfgdsply -aall — 查看阵列配置

状态值对应含义Memory: 512MB阵列卡cache大小,2的N次方,如果不是,说明阵列卡有异常Number of dedicated Hotspares: 0阵列是否有专用/独享热备盘(如果有多个逻辑磁盘组/disk group,则可以指定一个硬盘用于全局热备,那么该disk group上的专用热备盘数量为0也不用担心,除了RAID 1/RAID 1+0一般不指定热备盘以外,其他几个阵列级别建议都要指定热备盘State : Optimal阵列状态,如果不是 Optimal 就要关注了Current Cache Policy: WriteBack, ReadAheadNone, Direct, Write Cache OK if Bad BBU阵列读写cache策略,建议写策略设置为FORCE WB,最起码是WB,预读策略可以关掉,意义不大,几乎没影响Disk Cache Policy : Disabled硬盘cache策略,建议关闭,防止意外时数据丢失Current Power Savings Policy: None节电策略,建议关闭Media Error Count: 0三个错误计数器,任何一个值大于100就要立刻引起关注,尤其要关注起增长速度。1T以上SATA盘,计数值不够精确,可能所有盘上该值都会大于0,一般重启就会重新清0,如果重启后还是大于0的话,赶紧报修吧。SAS盘的计数值则比较准确。Other Error Count: 0Predictive Failure Count: 0Firmware state: Online, Spun Up查看硬盘状态,如果是unconfigured表示该硬盘未分配加入到阵列中;如果是 unconfigured(bad)表示该盘不但是未分配,而且还坏了,正是“出师未捷身先死”;如果是failed,表示该盘故障无法识别;如果是 rebuilding,表示该盘正在重建数据

MegaCli -adpbbucmd -aall — 查看阵列卡电池信息

状态值对应含义Temperature: 39 C查看电池温度,如果相比上一次查看高出不少,就需要关注了,或者可以根据经验设置一个基线值Battery State: Optimal电池状态,如果不是为Optimal,就需要关注了Charger Status: Complete电池充放电状态isSOHGood: Yes电池状态,如果不是为Yes,需要关注Relative State of Charge: 93 %当前电量,当电量低于15%,或者电池坏掉时,默认都会将写策略从WB改成WT,除非设定为FORCE WB策略Max Error = 0 %电池是否有错误信息Next Learn time: Tue Oct 14 22:06:50 2014电池充放电时间,注意这是美国时间。另外,新的阵列卡电池很多改成电容式的了,也就不需要重复充放电了

lsiutil有交互和非交互两种方式,作为监控,我们肯定选择非交互模式。想要使用交互模式的,可以根据非交互模式自行练习。

lsiutil -p 1 -a 20,12,0,0 — 查看硬盘计数器

Invalid DWord Count 2,563 — 任何一个值大于0,都需要引起关注

Running Disparity Error Count 2,366

Loss of DWord Synch Count 0

Phy Reset Problem Count 0

lsiutil -p 1 -a 21,1,0,0,0 — 查看逻辑卷状态

状态值对应含义Volume State: optimal, enabled逻辑卷健康状况Volume draws from Hot Spare Pools: 0是否有热备Volume Size 139392 MB, 2 Members由几块硬盘组成Primary is PhysDisk 1 (Bus 0 Target 9)物理硬盘1Secondary is PhysDisk 0 (Bus 0 Target 3)物理硬盘0

lsiutil -p 1 -a 21,2,0,0,0 — 查看物理硬盘状态

状态值对应含义PhysDisk 0 is Bus 0 Target 3编号PhysDisk State: online状态Error Count 13, Last Error: Command = 28h, Key = 3, ASC/ASCQ = 11h/00h错误计数器,大于0的话,就需要引起关注

hpacucli工具查看阵列、硬盘、电池信息,其实就只要一条指令

hpacucli ctrl all show config detail — 查看阵列详细信息、配置

状态值对应含义Controller Status: OK阵列卡状态Firmware Version: 1.18firmware版本,太低了建议升级,以提高稳定性及性能Cache Board Present: True是否配备了cache模块Cache Status: OKcache模块状态Cache Ratio: 100% Read / 0% Writecache策略,此处只有读cache,不用于写cache,因为没有bbu电池,见下方结果Drive Write Cache: Disabled关闭磁盘cacheTotal Cache Size: 256 MBcache大小Total Cache Memory Available: 208 MB实际可用cache大小,和理论cache大小不一样,说明cache模块可能有问题No-Battery Write Cache: Disabled关闭FORCEWB策略Battery/Capacitor Count: 0阵列卡BBU电池数量为0,也就是没有BBU模块Battery/Capacitor Status: Failed (Replace Batteries)阵列卡BBU电池状态,这里显示是错误状态,需要及时更换Array: A第一个乌列阵列,编号从A开始,依次是A、B、CStatus: OK物理阵列状态Logical Drive: 1第一个逻辑卷,编号从1开始Fault Tolerance: RAID 5第一个逻辑卷的阵列级别Status: OK第一个逻辑卷状态Caching: Enabled第一个逻辑卷是否启用了cache策略physicaldrive 1I:1:1第一块物理硬盘,编号从1开始Status: OK第一块物理硬盘状态Firmware Revision: HPDA第一块物理硬盘firmware,如果太低,也需要及时升级,HP的硬盘每个批次都有不同的firmware

如果磁盘在RAID卡上

(1)先获取磁盘的device id

这里的输出,会有ES信息,同时还会有device id

(2)根据device id,查询smart信息

这里的11就是磁盘的device id,哪怕后面的/dev/sdc不存在,获取是这颗磁盘不属于sdc,也能输出正确的信息,只要device id是正确的就行。

如果不在RAID卡上,直接

shell

 
 

shell

 
 

如果有热备,则 Firmware State会显示为hotspace

RAID Level对应关系

shell

 
 

shell

 
 

shell

 
 

shell

 
 

一般在没有BBU情况下, 要执行如下命令进行修改

shell

 
 

Device : Normal --> Damage --> Rebuild --> Normal

Virtual Drive : Optimal --> Degraded --> Degraded --> Optimal

Physical Drive : Online --> Failed Unconfigured --> Rebuild --> Online

Rebuild 中的物理磁盘状态中会显示:“Firmware state: Rebuild”

屏幕显示类似下面的内容

shell

 
 

返回结果类似下面这样

shell

 
 

or

 ,关注里面的error/fail/warn等多个关键字

最新文章
2024史上最强AI作曲编曲唱歌工具只需要输入歌词即可
2023傻瓜AI音乐制作软件只需要输入歌词自动作曲编曲并且演唱,HAO简单音乐网(haojiandanbianqu.com) 站: 不需要你懂音乐会乐理输入歌词自动编曲作曲演唱软件,就可-----下面请看 视频演示 功能介绍- https://www.bilibili.com/video/BV1a
Delivery Optimization in Windows 10
Delivery Optimization is designed to automatically adjust the amount of network bandwidth it uses to upload and download updates, Store apps, and other Microsoft products. But if you’re worried about data usage, or you wa
ChatAvatar
ChatAvatar是一个基于DreamFace开发的3d虚拟形象在线生成器,能够帮助我们非常方便的在线制作3D人物形象,并且还可以随心所欲地控制它的表情、动作和语音,通过这个在线,就可以让你通过简单的文本指令,生成一个独一无二的3D人物形象,并
AI在SEO中的关键词优化策略与应用分析
在数字化时代,人工智能(AI)与搜索引擎优化(SEO)之间的结合日益紧密。AI技术在SEO中的应用主要体现在关键词优化方面,这不仅是为了提升网站的可见性,也是为了更好地满足用户的需求。通过智能算法,AI能够快速处理和分析海量数据,从而
excel数据比较:如何做一个完美的多条件排名方案
编按:排名,简单;但如果有多个项目类别,并且可能存在业绩相同,怎么快速找出各个分享排名第一的人物呢?这就要通过多条件去匹配,才能找出需要的排名第一者。这里提供了两个方案,但都不够完美,你能把它们完善吗?一年一度的表彰大会马
AI绘画|Stable Diffusion高质量提示词收集
使用平台:comfyui 模型:AlbedoBase-XL 图片尺寸:768x1280 图1提示词 score_9, score_8_up, score_7_up, score_6_up, cute girl, musical note, tunic, magical staff, red hair, big hat, epic pose, light smile, bright pupils, particle
emmmm···昊然弟弟系的这条围巾,全靠颜值!
最近刷微博时看到昊然弟弟在冰岛的一组照片惊艳了时光明明是一身怎么穿都穿不好看的军绿色大衣却因为围巾增加了整体的造型感emmmm当然颜值起了很大的作用如果这围巾系在你脖子上就不一定这么好看了所以在寒冷的冬季一条好看的围巾不仅是御
AI辅助社会实践报告生成器操作指南与使用技巧
随着人工智能技术的发展辅助社会实践报告生成器应运而生为广大学生和社会实践参与者提供了便捷高效的报告撰写工具。本文将详细介绍辅助社会实践报告生成器的操作指南与采用技巧帮助大家更好地利用这一工具,加强报告优劣。(1)打开辅助社
AI绘画怎么喂图 | 教你使用触站AI来绘画
在过去,绘画是需要通过一定的技巧和手绘工具才能完成的。但现在,随着人工智能技术的发展,AI绘画成为了一个新兴的绘画方式。那么,如果想使用AI绘画,怎么喂图呢?本文将教你如何使用触站AI完成绘画。一、什么是触站AI触站AI是一款由触站
AI写作生成器,你的创意加速器
在当今数字化时代,人工智能(AI)正逐渐渗透到各个行业。AI技术的迅速发展为我们提供了无尽的可能性,而其中之一便是AI写作生成器。作为一款革命性的创意加速器,它以其独特的方式为写作工作者提供了全新的工具和体验。ai写作生成器凭借其
相关文章
推荐文章
发表评论
0评