将AI推理能力下沉到距用户最近的边缘节点,大幅降低延迟和带宽成本,Cloudflare将自己定位为AI时代的边缘平台。

上游依赖

骨干网络、边缘服务器

服务下游

AI应用终端用户

赛道受益 AI 逻辑

AI工作负载的运维比传统应用复杂得多——需要管理GPU集群调度、模型版本控制、训练任务编排、推理服务扩缩容等。云原生运维工具(Kubernetes、可观测性平台、AIOps)是管理这些复杂基础设施的必需品。 因果链:AI基础设施规模和复杂度暴增 → 传统运维方式无法应对 → Kubernetes成为GPU调度的标准 → 可观测性(Datadog、Dynatrace)帮助发现性能瓶颈 → AIOps用AI自动处理告警和故障 Datadog在云监控市场一骑绝尘,2024年收入超$25亿。AI工作负载的监控需求(GPU利用率、推理延迟、模型漂移)是新增长点。

全球可观测性市场

~$250亿

2024年

Datadog收入

$25亿+

FY2024

K8s在AI场景渗透率

80%+

AI/ML工作负载

市场格局与竞争态势

云原生运维市场分为几个子领域:可观测性(Datadog、Dynatrace、Splunk/Cisco)、容器编排(Kubernetes生态、Red Hat OpenShift)、AIOps(PagerDuty、BigPanda)。 Datadog是综合实力最强的玩家,覆盖监控、日志、APM、安全等多个模块。Dynatrace在企业级AIOps领域有独特的AI引擎。Splunk被Cisco以$280亿收购后整合到Cisco的安全和可观测性体系中。 格局特征:可观测性市场高增长、高毛利(75%+),但竞争激烈。开源方案(Prometheus、Grafana、OpenTelemetry)是持续的竞争威胁。

主要厂商市场份额

Datadog (DDOG)
~18%
Splunk/Cisco
~15%
Dynatrace (DT)
~8%
New Relic (NEWR)
~5%
Grafana Labs(未上市)
~5%
其他
~49%

关键变量与不确定性

核心驱动因素

AI基础设施复杂度推动可观测性需求AIOps用AI自动化运维多云和混合云环境管理需求安全与运维融合趋势

主要不确定性

开源可观测性方案的替代压力Cisco收购Splunk后的竞争格局变化企业运维预算增速放缓AI本身能否大幅降低运维人力需求

云原生运维是SaaS行业中确定性较高的赛道——云计算和AI越复杂,运维需求越大。Datadog估值一直较高(15x+ P/S),需要持续高增长支撑。Dynatrace在AI运维自动化上更深入,但增速不如Datadog。

代表性公司解读

所在产业链位置

数据中心硬件 5条
云计算平台 3条
软件与安全 3条
上游 下游
预设链路:
双指放大查看产业链地图

产业链联动

云原生运维是基础设施层的'管理层'——监控和管理AI服务器、网络、数据中心等所有基础设施。与超大规模云赛道紧密相关——大部分运维工具运行在云上且为云工作负载服务。 下游的模型层(训练平台、推理服务)也需要运维监控。与基础设施安全赛道有交集——安全监控和运维监控正在融合。

相关赛道

下一步研究建议