2024年,具身智能可以说是AI领域最火热的赛道之一。
所谓具身智能,可以理解为人工智能和机器人技术深度结合的产物,是“长了身体的智能”,能够直接与物理世界进行交互。目前业内普遍认为,人形机器人是具身智能落地的最佳硬件载体。
也正因此,以机器人为主体的具身智能在全球彻底火了,机器人公司如雨后春笋般出现,具身智能领域的投融资也非常火热。
据公开资料显示,2024年上半年做具身智能机器人的公司可能已超过70家,其中,华为等大厂也开始布局该赛道,创企们则频频获得融资,甚至产品尚未落地,就已经估值数十亿元。
今年11月5日,成立不到一年,致力于“将通用人工智能带入物理世界”具身大模型企业Physical Intelligence宣布新一轮4亿美元融资,估值达到24亿美元。9月,李飞飞老师创立的空间智能公司World Labs在完成1亿美元融资后,两个月内又完成了新一轮2.3亿美元融资;7月,致力于“开发扎根于物理世界的通用人工智能(AGI)”企业Skild AI宣布完成3亿美元A轮融资,估值达到15亿美金。
那么,在这一轮具身智能赛道中,创业企业究竟该如何走出差异化竞争优势?具身智能背后的技术发展路径又是如何?未来机器人时代到底将会在什么时间到来?
近期,我们与具身智能新锐企业智澄AI创始人兼CEO胡鲁辉进行了一场深度交流,这位行业大咖对具身智能的技术发展和行业趋势,给出了自己的思考和解法。
智澄AI创始人兼CEO胡鲁辉
“我们是一家通用人工智能公司,核心技术是理解物理的世界模型,对标斯坦福李飞飞老师的公司。”胡鲁辉如此说道,“但是我们产品形态并非是模型,而是具身智能机器人。”
在胡鲁辉看来,世界模型和主流的多模态大模型主要有两方面不同之处,一是世界模型主要通过包括摄像头在内的传感器直接感知外部环境信息,相比于多模态大模型,其输入的数据形式以实时感知的外部环境为主,而多模态大模型则是以图片、文字、视频、音频等信息交互为主。
另一方面,世界模型输出的结果,更多的是时间序列数据(TSD),并通过这个数据可以直接控制机器人。而多模态大模型输出的结果仍是以信息为主。同时物理智能需要与世界进行实时交互,其对时效性要求较高,而多模态大模型更多是与人交互,对时效性要求较低。
也正因此,世界模型也被行业人士看做是迈向AGI(通用人工智能)的必经之路。
作为曾在微软、亚马逊、华为美国研究院、Meta这样的顶尖科技巨头担任高管的行业专家,胡鲁辉其实早就意识到AI能够与物理世界结合,并一直寻找合适的创业机会。
2024年年初,智澄AI正式成立。胡鲁辉对公司的整体发展规划,也分为两部分:一是以打造世界模型为核心,持续进行技术创新和研发突破;二则是要真正的实现产品落地应用,“我们现阶段也在与客户进行深度合作,今年将以产品升级迭代为主,明年将开始真正落地商业化应用。”
据悉,今年5月开始,智澄AI的人工智能机器人原型一(TR1)、原型二(TR2)相继完成。胡鲁辉将智澄AI的人工智能机器人命名为TR,即Transforming Robot(即意为“改变机器人”)。