腾讯操作系统 OC 和滴滴 HUATUO (华佗) 项目深度集成

最后更新: 2025-11-16, 作者: 官方小编

HUATUO 技术创新:操作系统内核级观测

HUATUO(华佗) 是由滴滴开源并依托 CCF 开源发展技术委员会孵化的云原生操作系统可观测性项目,专注于为复杂云原生环境提供操作系统内核级深度观测能力。该项目基于 eBPF 实现内核的全景观测,异常事件捕获,全自动追踪,以及持续性能剖析。 在 HUATUO 1.0版本中,累计支持了近 200 项数据指标监控,涉及CPU,内存,网络,IO等,详情见:https://huatuo.tech/docs/metrics/

子系统类型 监控指标
CPU 涵盖 CPU 利用率、容器 CPU 统计、负载均衡、软中断延迟、进程调度延迟等
内存(Memory) 包含内存分配、容器内存事件、页面回收、VM 状态、内存异常事件等
IO 主要为磁盘 IO 延迟统计(宿主 / 容器维度,含驱动、硬件、RAID 操作等场景)
网络(Network) 覆盖 TCP/UDP 套接字状态、网络包收发统计、TCP 连接事件、网络错误计数、网卡硬件丢包、链路状态异常、接收发送延迟等

注:除了内核指标,还支持内核异常事件,以及自动化追踪CPUIdle, CPUSys, IO, Memory 等。

腾讯操作系统 OC 深度集成华佗

HUATUO 已全面支持 OpenCloudOS 8 与 OpenCloudOS 9 版本所对应的 5.4 及 6.6 内核。同时,OpenCloudOS 已完成对 HUATUO 的深度集成,实现一键部署、开箱即用。对用户,部署 HUATUO 可显著提升内核级问题的诊断效率,有效降低运维成本,增强业务稳定性。

1. 极简部署,开箱即用

用户只需执行一条命令即可完成安装与集成,将原本需数小时甚至数天的部署调试过程缩短至分钟级别。OpenCloudOS 社区确保 HUATUO 与特定内核版本的兼容性,避免因自行编译可能引发的系统不稳定或内核崩溃风险。

2. 构建统一、全栈的监控数据平面

传统监控方案(如 Zabbix、Prometheus Node Exporter)通常仅能采集 CPU、内存使用率等表层指标。HUATUO 则直探内核,能够深入揭示性能问题的根本原因,例如:

  • CPU 利用率高是由于调度延迟、软中断,还是锁竞争?
  • 内存访问缓慢是频繁缺页异常,还是内存回收压力过大?

HUATUO 自动识别 Kubernetes 容器标签,将内核事件(如 IO 等待、网络丢包)与具体 Pod、容器甚至服务关联。当应用容器出现性能抖动时,用户可快速定位是应用本身问题,还是底层内核资源争抢所致。在性能问题发生时,运维与开发人员只需通过统一的 Grafana 界面,即可完成从应用到内核的完整调用链追踪与根因定位。

安装指南

若使用 OpenCloudOS 9 系统且未配置 OpenCloudOS epel 源,请先执行:

sudo dnf install epol-release

随后安装 HUATUO:

sudo dnf install huatuo-bamai

详细步骤请参考:https://mp.weixin.qq.com/s/Gmst4_FsbXUIhuJw1BXNnQ

最终前端效果图:


篇尾: