|
论文:
摘要:云计算正在迅速发展。数据中心是云服务和JointCloud结构的重要基础设施。DRAM故障是导致数据中心节点中断的主要原因之一。本文提出了一种基于决策树的大型云服务数据中心DRAM故障预测方法。我们利用了2021 PAKD AIOps竞赛中发布的第一个公共可用DRAM故障预测数据集。我们基于系统内核日志数据和MCA日志数据构建了一套手工制作的功能。本文详细介绍了特征工程,这可以启发和促进该领域的未来研究。利用最先进的分类器(即XGBoost)的能力,我们的方法可以有效和及时地预测DRAM故障。我们的解决方案在PAKDD 2021数据集上具有良好的性能,在验证阶段通常可以达到60%以上的精度。大量实验研究了我们方法的变体的性能,以验证所提出的解决方案中不同策略的重要性。 |
|