近期某局点出现存储空间满的问题,存储使用率达到100%,导致业务系统异常,业务中断。
【原因分析】
上述问题是由于存储使用了自动精简配置,自动精简配置可以用小的物理容量为操作系统提供超大容量的虚拟存储空间,每个卷均仅在使用时才会要求物理资源。现场使用自动精简配置容量超分配,在使用过程中存储使用率过高告警,并且存储设备未及时扩容,存储写满导致业务系统业务中断。
该问题通过在存储上将厚配置卷转换为精简配置的卷,节省出一定的空间,使存储的使用率低于100%后,业务系统恢复正常运行。考虑到后期数据的持续写入,建议及时扩容存储空间。
【规避措施/解决方案】
针对以上局点出现的由于使用了自动精简配置,存储写满导致业务系统业务中断的问题,在存储上将厚配置卷转换为精简配置的卷,节省出一定的空间,使存储的使用率低于100%后,业务系统恢复正常运行。考虑到后期数据的持续写入,建议及时扩容存储空间。
针对存储自动精简配置的使用,有以下几点需要注意:
1、对于存储空间足够的存储设备,如果存储卷类型既支持厚配置又支持自动精简配置,建议所有卷全部使用厚配置模式。
2、对于存储空间不足,必须使用自动精简配置的存储设备,管理员需要密切关注存储的空间使用率以及告警信息,存储空间一旦出现使用率过高时,需要及时扩容存储空间,否则存储一旦写满,会导致业务中断。
3、对于有些存储系统,比如H3C CAS平台的共享文件系统,由于虚拟机的虚拟磁盘文件需要支持快照等高级特性必须使用QCOW2格式(自动精简配置)的,建议在共享存储池上创建磁盘文件时,做好存储池空间的规划,保证所有磁盘文件大小的总和不超过存储池的大小。