机器人模型
让机器人理解自然语言指令并操控物理世界,是AI走向物理场景的核心能力突破,Figure AI、Covariant是重要参与者。
上游依赖
仿真环境、传感器数据
服务下游
工业机器人、人形机器人、物流自动化
赛道受益 AI 逻辑
机器人基础模型(Robot Foundation Model)是将LLM的通用智能延伸到物理世界的关键技术。它让机器人能够理解自然语言指令、感知环境、规划动作并执行任务,而无需为每个任务单独编程。 因果链:LLM展现出强大的推理和规划能力 → 将语言理解与机器人控制结合 → 多模态基础模型(视觉+语言+动作)出现 → Google RT-2、NVIDIA GR00T等机器人基础模型发布 → 人形机器人和通用操作机器人成为新焦点 这是AI从'数字世界'向'物理世界'跨越的关键一步。2024年NVIDIA发布的Project GR00T人形机器人基础模型和Figure AI的Figure 02标志着这个领域加速发展。
机器人AI市场
~$30亿
2024年,早期阶段
Figure AI估值
$26亿
2024年融资
人形机器人原型数
10+家
全球主要公司
市场格局与竞争态势
机器人基础模型处于极早期阶段。主要参与者包括:NVIDIA(GR00T平台+Isaac Sim仿真)、Google DeepMind(RT-2多模态机器人模型)、Figure AI(人形机器人+OpenAI合作)、Tesla(Optimus人形机器人)。 中国方面,优必选(UBTech)、宇树科技(Unitree)在人形机器人硬件方面进展快,但基础模型能力不如美国。 格局特征:这是一个技术探索阶段的赛道,离商业化落地还有很长距离。但长期潜力巨大——如果通用人形机器人成功,将是一个万亿美元级别的市场。
主要厂商市场份额
关键变量与不确定性
核心驱动因素
主要不确定性
机器人基础模型是AI领域最具想象力但也最不确定的赛道。99%的公司处于烧钱做Demo阶段,离量产和盈利非常遥远。但NVIDIA通过提供平台级工具(Isaac Sim仿真+GR00T模型)在这个赛道中是确定的'卖水人'。Tesla Optimus如果成功量产将改变整个制造业。
代表性公司解读
所在产业链位置
产业链联动
机器人基础模型依赖前沿大模型赛道的技术突破——LLM的推理和规划能力是机器人智能的核心。训练需要大量仿真数据(与工业仿真赛道关联)和GPU算力。 下游直接对接工业机器人和自动驾驶赛道——基础模型赋予机器人通用智能后,才能部署到制造、物流、家庭等具体场景。边缘推理赛道提供机器人端侧运算能力。
相关赛道
下一步研究建议
前沿大模型
研发和运营最顶尖的通用大语言模型,OpenAI的GPT-4o和Anthropic的Claude是当前行业标杆,是整个AI产业的能力来源。
开源大模型
开放模型权重和代码,让任何开发者可免费使用和微调,Meta的Llama系列推动AI能力快速商品化,降低行业进入门槛。
翻译与语言
提供高质量机器翻译和本地化服务,AI全球化加速翻译需求,DeepL凭借质量优势在专业场景领先谷歌翻译。
边缘推理
将大模型压缩量化后部署到手机、汽车或边缘芯片上运行,将AI体验扩展到无网络连接的离线场景。
训练平台
管理大规模模型训练任务、GPU资源调度和实验记录,提升AI研究团队的研发效率和复现能力。
数据标注
为模型训练提供高质量人工标注数据和合成数据,数据质量直接决定模型能力上限,Scale AI是行业领军。