全国服务热线:400-168-1663
行业应用服务器优选定制开发商
软件开发商/服务集成商携手合作伙伴

首页 服务器百科

机架式服务器隐藏宕机怎么检测?【立尔讯】

2019-01-03 10:30:22 

说到机架式服务器宕机,很多人都知道,一般发生宕机,很快都能知道,但是总有一些时候,机架式服务器发生宕机不能及时被发现。

像这种时候想要及时获知机架式服务器是否宕机,就需要进行机架式服务器宕机实时检测了。

机架式服务器宕机检测

我们知道,进行全网物理机宕机准确探测与实时发现,可以给宕机分析提供第一现场,获取第一现场的日志。也可以尽早将宕机数据推送给业务或运营感知并处理,如自动报修,业务迁移等,从而尽可能将业务影响降到最低。

更重要的是,准确的宕机发现数据可以为宕机预测提供准确的标注数据,为后期宕机预测提供数据基础,并且这些数据提供给运营部门进行整体分析,提升处理效率。

接下来机架式服务器定制厂家告诉您如何可以准确发现宕机,减少误报

机架式服务器

网络干扰排除

宕机分析中,较多误报是由于网络问题干扰,无法准确判断出物理机是否宕机,有可能是网络问题。

排除上联网络设备异常导致的误报,包括机房断网演练,小面积网络故障,上联网络故障,如通过探测丢包情况,使用一些逻辑初步判断网络问题。

目前,宕机感知是宕机分析的基础,通过机架式服务器宕机实时检测,会把相应的宕机原因分布整理出来,明确具体的原因,提高机架式服务器的可靠性。

机架式服务器

异常排除

排除非物理机器,将系统中暂时不关注的VM等产生的异常信息排除掉。

排除非业务状态的机器,如装机状态中的,包括生产中,维修中,迁移中,重装中,销毁中,重启中,无管控状态,只监控正常状态的机器。

排除非正在工作的机器,如非working状态机器。

心跳源检测异常

顾名思义,通过心跳源,初步发现异常。通常心跳变化会有三类消息,update消息,delete消息和insert消息。

心跳逻辑在于,正常情况下SA服务端与NC建立长连接,每数秒缓存一次心跳,每几分钟打包上报一次,但当NC异常时,长连接感知后,立即上报异常,并修改路由表。所以心跳异常做到秒级感知。

通过以上的方式可以更好的检测机架式服务器宕机,避免风险的进一步提升,造成更大的损失。

24小时客户服务热线:如果您对以上机架式服务器感兴趣或有疑问,请点击联系我们网页右侧的在线客服,或致电:0755-23104880,服务器定制厂家——立尔讯,您全程贴心的服务器采购顾问。

文章来源: 服务器定制厂家——立尔讯(www.learsun.com),转载请注明出处。

匠心服务器定制,从立尔讯开始