搜索

IT故障的定位、报警与识别恢复在智能监测运维实践中解决方法

[复制链接]
查看: 149|回复: 0
  • TA的每日心情
    奋斗
    2017-7-29 17:54
  • 签到天数: 30 天

    [LV.5]常住居民I

    87

    主题

    99

    帖子

    517

    积分

    IT码奴

    Rank: 3Rank: 3

    积分
    517
    发表于 2016-12-6 16:40:43 | 显示全部楼层 |阅读模式
    IT故障的定位、报警与识别恢复在智能监测运维实践中解决方法
    像用SITEVIEW轻松运维一类的网管软件与IT运维管理系统来监测管理IT所有的资源、设备、环境。
    预防问题远比解决问题重要;
    解决问题的套路远比解决重要;
    知道问题点的根源远比套路直接;
    而最牛的就是能从运行的状态趋势中研判问题可能的发生的情况与持续向好的状态,或者降低问题发生临界点。
    不可否认,这才是未来智能要推动IT管理技术革新的目标所在,这也是我用SITEVIEWITOSS这个软件之所见,愿朋友们也能用过之后有新的见解与收获。
    围绕IT故障的几个解决途径来看一下我截的几张图,顺便组合了一下:

    对于故障来说,首先要定位其发生的地方,也就是寻根问源了,如何找有几种方式,一是可以进行全天侯不间断的监控某个运行状态,达到预设的阀值就可以进行警报,另外根据运行的一个趋势来智能判断来或者智能响应主动去恢复故障,这个可以是根据以往人工操作的经验,从共享知识库或者机器从以往监测运维的大数据中分析得来,还有可以通过监测的系统日志、设备日志、业务应用系统的日志信息来分析获取有价值的信息和智能识别问题,如何智能识别,这其实就是监测运维的数据进行重复利用和深度挖掘的意思,有了数据才能做人工智能学习和智能报障,智能恢复故障的。
    报警设置:

    知识库:

    日志信息采集监测搜索分析:


     懒得打字嘛,点击右侧快捷回复 您的回复就是对攀登者IT俱乐部的最好支持!
    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条

    版权所有:金德网络科技工作室 投诉受理:185-7060-2743 合作热线:185-7060-2743

    备案信息:湘ICP备13002922号Powered by 金德网络  © 2008-2015 攀登者IT俱乐部

    友链/广告联系QQ:877630758 邮箱:[email protected]

    快速回复 返回顶部 返回列表