57AliYun--阿里云最新优惠活动
阿里云优惠码丨阿里云代金券

巧用机器学习定位云服务器故障

对于每一单母机故障我们都需要定位出背后真实的故障原因,以便对相应的部件进行更换以及统计各种部件故障率的情况,因此故障定位和分析消耗的人力也越来越多。

希望能借助机器学习的方法对历史故障母机的日志数据进行学习,沉淀出一些模型出来实现自动化的分析新的母机故障的原因,进而提高母机工单的处理效率解放人力,同时也能分析出故障的一些规律,进而实现对故障的预测等。

查看三类日志,分析是否每一种日志对故障定位都有存价值。剔除无价值的日志;根据业务需求,选择特定的故障类别。因为某些故障的工单数量特别少,难以建立机器学习模型做分类。

保留三种日志不全为空的故障工单,完全无记录的工单是无法利用的;根据工单编号ticket_id将日志及故障工单整合,工单和母机应该是一一对应的。

赞(0) 打赏
未经允许不得转载:吾趣阿里云网 » 巧用机器学习定位云服务器故障

评论 抢沙发

评论前必须登录!

 

强烈推荐

高性能SSD云服务器ECS抗攻击,高可用云数据库RDS