模型层·第4

边缘推理

将大模型压缩量化后部署到手机、汽车或边缘芯片上运行,将AI体验扩展到无网络连接的离线场景。

上游依赖

基础大模型

服务下游

边缘AI芯片厂商、移动应用

赛道受益 AI 逻辑

AI推理(模型运行)正在从云端向边缘设备(手机、PC、IoT设备、汽车)扩展。边缘推理的优势是低延迟、保护隐私、不依赖网络。Apple Intelligence、高通AI引擎和NVIDIA Jetson是代表性的边缘AI方案。 因果链:AI应用对实时性和隐私的要求 → 云端推理延迟和带宽成本过高 → AI推理向边缘设备迁移 → 需要专用的边缘AI芯片和轻量化模型 → 高通、联发科、Apple在手机AI芯片领域竞争 → NVIDIA Jetson在工业和机器人边缘AI领先 2024年Apple Intelligence、Windows Copilot PC的发布标志着边缘AI从概念走向落地。手机SoC中NPU(神经网络处理单元)性能成为新的竞争焦点。

边缘AI芯片市场

~$200亿

2024年,含手机/PC/IoT

AI PC渗透率

~20%

2024年新出货PC

AI手机渗透率

~30%

2024年新出货手机

市场格局与竞争态势

边缘推理市场按终端分为几个维度:手机端(高通Snapdragon、联发科天玑、Apple A/M系列)、PC端(Intel、AMD、Qualcomm Snapdragon X)、IoT/工业端(NVIDIA Jetson、Intel Movidius)。 高通在手机和PC端边缘AI芯片中布局最广——Snapdragon 8 Gen 3的NPU能运行70亿参数的本地LLM。Apple的Neural Engine在iPhone和Mac上提供了最好的端侧AI体验。NVIDIA Jetson在机器人和工业视觉领域是标准方案。 格局特征:边缘AI目前最大的挑战不是硬件而是'Killer App'——消费者还没有感受到足够强的边缘AI需求来推动大规模换机。

主要厂商市场份额

高通 (QCOM)
~25%
Apple (AAPL)
~22%
联发科 (2454.TW)
~18%
Intel (INTC)
~10%
NVIDIA Jetson
~5%
其他
~20%

关键变量与不确定性

核心驱动因素

AI手机和AI PC驱动NPU芯片需求端侧LLM运行能力提升隐私和低延迟场景的刚需自动驾驶和机器人的边缘计算需求

主要不确定性

边缘AI Killer App何时出现端侧模型能力与云端差距AI手机/PC换机周期的节奏高通vs联发科vs Apple的竞争格局

边缘推理是一个长期确定性强但短期缺乏催化剂的赛道。AI手机和AI PC概念已经推出,但消费者付费意愿不强。高通Snapdragon X在PC市场的表现低于预期。长期看机器人和自动驾驶的边缘AI需求更有确定性。

代表性公司解读

所在产业链位置

数据与工具 2条
大模型 2条
模型衍生 4条
上游 下游
预设链路:
双指放大查看产业链地图

产业链联动

边缘推理与AI算力芯片赛道互补——一个负责云端训练,一个负责端侧运行。边缘推理芯片同样依赖晶圆代工(台积电)和先进封装。 下游对接所有需要端侧AI能力的应用:自动驾驶、工业机器人、AI手机、AI PC等。与开源大模型赛道关系紧密——端侧运行的通常是开源的小模型(如LLaMA 7B/13B的量化版本)。

相关赛道

下一步研究建议