BPF

Linux 内核 RAS 原理剖析与实践案例

本篇介绍 Linux 内核 RAS, MCE, AER 等硬件故障检查原理。HUATUO 华佗项目依赖该检测机制实现了通用硬件故障监控。

继续阅读

新特性!支持 AI 计算硬件故障检测

本篇介绍了 HUATUO 项目的新特性,支持 AI 计算场景下硬件故障检测能力,包括故障指标,实际案例,原理分析等。

继续阅读