DeepFlow

DeepFlow 是由云杉网络(Yunshan Networks)研发的 全栈可观测性平台,面向云原生、分布式系统以及 AI 应用,提供从底层网络到业务层的统一监控、追踪和性能剖析能力。

收录时间:
2024-03-24
DeepFlowDeepFlow

DeepFlow 是由云杉网络推出的开源全栈可观测性平台,面向云原生、容器化环境及 AI 应用场景,提供深度监控与分析能力。该平台以 eBPF 技术为基础,实现对主机、容器、Kubernetes 集群以及微服务间通信的无侵入式数据采集,无需修改业务代码即可自动获取指标、日志、调用链和性能剖析信息。

DeepFlow官网入口网址:http://deepflow.io/zh

DeepFlow插图

核心功能与技术特点

  • 零插桩数据采集:依托 eBPF 技术,自动捕获网络流量、系统调用、文件 I/O 等底层运行数据,避免在应用中嵌入 SDK 或代理组件。
  • 全栈拓扑关联:通过智能标签机制,将基础设施、容器平台、服务网格与业务逻辑各层的数据统一建模,支持跨层级的一键式调用链追踪与可视化。
  • 多协议解析能力:内置对 HTTP、gRPC、MySQL、Redis、Kafka 等主流协议的自动识别与解析,并可通过 WebAssembly(Wasm)扩展自定义私有协议。
  • 高性能时序存储:采用自研存储引擎,在写入吞吐与查询响应方面相较传统方案如 ClickHouse 提升约一个数量级,适用于高并发、大规模监控场景。
  • 可观测性工具集成:提供统一仪表盘、灵活的告警规则配置界面及内置异常检测模型,辅助运维人员高效识别与诊断系统异常。

DeepFlow 支持多种部署方式,包括 Helm Chart 快速安装于 Kubernetes 或 OpenShift 环境,也提供 Docker 镜像(deepflowce/deepflow-agent、deepflowce/deepflow-server)及二进制包,适配裸金属服务器等非容器化生产环境。

针对分布式 AI 训练场景,DeepFlow 还专门优化了联邦学习监控能力,利用 eBPF 实时采集训练任务中的资源消耗、网络带宽使用及模型参数同步状态,为 AI 工程团队提供端到端的可观测性支持。

通过“零插桩采集 + 全栈数据关联 + 高效存储架构”的技术组合,DeepFlow 为 千流导航 用户提供覆盖从硬件层到业务层的统一监控视图,显著提升云原生与 AI 工作负载的可观测性水平与故障排查效率。

相关导航