2024 STRATEGY


编者按:短短两年多时间,特斯拉已经推出第二代人形机器人Optimus Gen2,身体更轻盈,行走更快速,手指灵巧似真人。马斯克预计这款机器人最终价格可能低于2万美元,3-5年内实现量产,产量达到数百万台,未来市场空间比电动车还大。


继智能手机、电动汽车之后,人形机器人能否成为下一代爆发的超级终端?加速过程中,哪些环节会遭遇“卡脖子”,哪些环节具有高贝塔?以下是先进制造二组在本年度策略会上的解析,整理成文,与投资者共飨。


要理解AI对于人形机器人的作用,首先要引入具身智能的概念,这个概念最早由图灵在1950年提出。


举例来说,要让一台机器去认识一个盒子,如果是传统的机器智能,我们需要给这个机器输入很多标注好的盒子来进行训练,输入的数据越多,机器识别盒子的能力就越强。依赖外部输入的方式来提升,这种智能也被称为“第三人称”的智能。


而具身智能其实是“第一人称”的智能。具备这种智能的机器人通过打开盒子从而认识到,盒子可以装东西。这和人的学习模式相似,就是通过亲身感受物理世界,并由此得出经验来持续提升自己。这种第一人称的智能是持续进化的源泉。


具身智能本质上是一个拥有物理载体的AI,像人类一样去感知和理解环境并完成任务。

中国人工智能战略科学家朱松纯提出,具身智能的实现(感知、决策、执行、反馈)涵盖六个学科的知识,融合极为复杂,而大模型的出现使以上学科的融合成为可能,AI有望迈入具身智能时代


1

大模型开拓应用场景

量产时代临近



斯坦福大学李飞飞教授提出将语言大模型和视觉模型相结合,来实现具身智能。实验中,研究人员给出指令:打开最上面的抽屉,注意花瓶。


大语言模型(LLM)由此拆解指令,将任务分为三个步骤:1)抓住最上面的抽屉把手;2)把手向外平移;3)要远离花瓶。


然后,视觉语言模型(VLM)开始发挥作用,分别赋予抽屉手柄(目标物)和花瓶周围(回避区)高值和低值,再把高值区域作为运动规划的目标函数来生成相应的运动轨迹。


在这个逻辑下,不需要对每个任务训练数据,而是根据生成的目标函数自动规划运动轨迹,最终能0样本学习的条件下完成目标任务。


谷歌的机器人团队将多模态的大模型植入机械臂,使之具备了很强的推理能力。比如指令是“把香蕉放在2+1总和的位置”,它就会把香蕉放到编号3的地方。


此外是视觉推理能力,比如指令是“把草莓放到正确的碗当中”,虽然没有解释什么样的碗是正确的碗,但是它通过观察发现某个碗里已经装有草莓,于是就推断出这是正确的碗。由此可见,它的理解能力已经和人类的语言常识以及行为常识非常接近了。

大模型的出现对于人形机器人的进化是关键的一步,使得机器人未来大概率能够应用到制造业或者人类生活的各个场景当中。


在AI研究层面,李飞飞团队和谷歌都处于领先地位,但是在量产能力上,特斯拉有着明显的优势。首先是硬件架构设计的能力,特斯拉引入了直线关节来提升人形机器人的爆发力,迭代速度也非常快。

从目前展示的视频来看,Optimus已经具备了运动控制、路径规划还有物品操作等能力,而它的短板在于AI层面。但是在2023年7月,特斯拉宣布成立XAI,弥补AI能力的短板。有理由相信,特斯拉入局后,人形机器人量产的时代极有可能会很快来临。


2

寻找认知差,拥抱确定性



人形机器人的核心环节大概率还是整机,因为人形机器人和智能汽车类似,功能的实现依赖于AI能力,规模量产也在很大程度上依赖于产业链的降本能力。所以我们认为,智能驾驶能力比较强的主机厂在人形机器人赛道会有天然的优势


和智能车对比,人形机器人的移动速度更慢,轻感知重推理,所以感知和决策环节比智能车的机会相对少一些。我们主要关注增量的运动执行器件、结构件和力学传感器等。


运动控制是人形机器人产业链中成本占比较高,也是国内制造业拥有成本优势的环节,其中的核心零部件竞争格局好,市场空间也较大,包括旋转关节的减速器、直线关节的丝杠、手指关节里的空心杯电机以及电机磁材等等。结构和功能件方面, 3D打印和复合材料拥有一定空间。


人形机器人产业发展至今分为两个阶段,一个是概念初期,二是量产前夕。


在概念初期,策略是研究驱动,寻找认知差。


第一个案例是减速器。特斯拉最早提出人形机器人概念时,市场认为谐波减速器是非常合适的产品。


2023年出现两个变化。一是,年初加州大学的朱博士提出髋腿部的低速高扭矩电机+行星减速器的方案(朱博士毕业后去了特斯拉的机器人事业部任职)。二是,国内很多创业公司所设计的人形机器人也采用了行星减速器的方案。


行星减速器的特点是结构简单,成本较低。市场认为基于量产考虑,行星减速器可能取代谐波减速器。


但我们对此保留不同的意见,我们认为,谐波减速器大概率依然会是人型机器人中核心的零部件,原因有三。

首先,人形机器人产业链的核心玩家是特斯拉,按照规划,特斯拉机器人的第一个应用场景是自己的制造工厂。用在工厂端,机器人对于输出扭矩和运动精度有较高的要求。从该角度出发,行星减速器并不合适,因为其精度明显低于谐波减速器。


第二,谐波减速器虽然售价高,但结构简单,由波发生器、刚轮和柔轮三个主要部件构成。在未来大规模标准化量产时,降本空间较大,能够降低和行星减速器的价格差异。

第三,谐波减速器在结构上有很多创新空间,产业链内企业在积极地配合主机厂做结构的创新,能更好满足人型机器人的需求。


第二个案例是稀土磁材。电动车辆已经大量使用稀土磁材,以特斯拉的Model3车型为例,电机总功率194KW,使用的稀土磁材约1.5到2.0公斤。

人形机器人对于电机的功率密度的要求更高,而且在结构设计上做了很多创新,转子生产工艺更加复杂,磁材用量及转子模组价值量得到大幅提升


目前还有一些假设没有被市场所验证,例如3D打印和轻量化复合材料

首先,人形机器人对轻量化的需求远高于新能源汽车,人形机器人在运动时克服重力势能,而新能源车是克服滚动摩擦。所以从节能、运动稳定性角度,人形机器人对轻量化的需求远大于新能源车。


其次,人形机器人在运动时可能会有摔倒或者磕碰的场景,对轻型材料的强度要求也明显高于新能源车。


由此可以推断,高强度的轻量化材料很可能会应用到人形机器人中,对于该类材料的加工方式,3D打印可能是很好的途径。


产业界已经有企业和研究机构将3D打印技术应用到人形机器人。Poppy机器人全身通过3D打印技术完成,生产成本相比于传统机器人降低了1/3,而且结构更加复杂,甚至可以模仿人的脊柱关节特征。上海交通大学也使用3D打印技术制作了微型六足仿生机器人,体积小,结构复杂。这些案例都表明3D打印在机器人领域大概率会有非常好的应用前景。


展望2024年,人形机器人产业可能会进入小批量产的阶段。哪些企业能为主机厂提供配套、能够拿到订单,都是可量化、可验证的,很多潜在的推测都会被证伪,核心零部件的确定性在一定程度上则会增强,包括运动控制领域的减速器、丝杠等。


数据来源:上海交通大学、特斯拉AI DAY、谷歌机器人、voxposer、《Design of a Highly Dynamic Humanoid Robot》

图片

注:本文件非基金宣传推介材料,仅作为本公司旗下基金的客户服务事项之一。

本文件所提供之任何信息仅供阅读者参考,既不构成未来本公司管理之基金进行投资决策之必然依据,亦不构成对阅读者或投资者的任何实质性投资建议或承诺。本公司并不保证本文件所载文字及数据的准确性及完整性,也不对因此导致的任何第三方投资后果承担法律责任。基金有风险,投资需谨慎。

本文所载的意见仅为本文出具日的观点和判断,在不同时期,朱雀基金可能会发出与本文所载不一致的意见。本文未经朱雀基金书面许可任何机构和个人不得以任何形式转发、翻版、复制、刊登、发表或引用。