加入收藏 | 设为首页 | 会员中心 | 我要投稿 开发网_新乡站长网 (https://www.0373zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 安全 > 正文

监控系统故障定位之事件关联分析的设计介绍

发布时间:2021-01-07 23:24:02 所属栏目:安全 来源:网络整理
导读:副标题#e# 《监控系统故障定位之事件关联分析的设计介绍》要点: 本文介绍了监控系统故障定位之事件关联分析的设计介绍,希望对您有用。如果有疑问,可以联系我们。 作者介绍 本文作者是吴城?联系方式:autohomeops@autohome.com.cn,主要负责汽车之家云平台

同时,在监控系统的“最新问题”页面,点击“现场快照”,上面的信息会直接呈现在页面上,并且点击“历史数据”,页面上会显示问题发生时刻前后30分钟的历史数据曲线,包括CPU,内存,硬盘,IO,网络流量,等等,方便运维快速定位问题.

日志追踪

通过ELK构建日志分析系统,在如下两个方面满足故障定位的需求

  1. 搜索服务器A某个时间段内的B应用程序的日志,通过上文“最新问题”页面可以直接跳转过来.
  2. 通过TraceID搜索单个用户请求的全流程.

四、小结

监控系统的建设真是个任重道远的活,上文只是部分实现了事件关联分析的内容,下一步我们计划在“决策推理”方面进行研发,以提高定位的精准度,为后续的故障自愈打下基础.文中有任何不妥之处,欢迎大家指出.

文章出处:运维帮(订阅号ID:yunweibang)

(编辑:开发网_新乡站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!