本报25日讯(记者程瑶)25日,2025中国计算机大会各项活动在哈尔滨如火如荼地进行,一场主题为“具身智能”的大会论坛广泛吸引了各界参会者的目光。
当前,具身智能与大模型的深度融合已成为推动机器人技术实现产业落地的核心方向,可以说,大模型时代为具身智能的发展注入了全新动能,推动其从概念构想迈向能与物理世界深度交互的可行实体。在这一背景下,本届CNCC特设具身智能大会论坛,旨在汇聚顶尖智慧,共探智能体“感知—决策—行动”闭环的实现路径与核心挑战,勾勒通向通用人工智能的具身之路。
中国科学院大学教授蒋树强,哈尔滨工业大学人工智能学院执行院长、教授张伟男,西安交通大学教授薛建儒,北京工业大学信息科学技术学院副院长、教授马楠,北京大学计算机学院前沿计算研究中心研究员、银河通用创始人兼CTO王鹤围绕具身智能话题展开了交流与讨论,分别从大模型认知、环境交互、人机共融及产业落地等多维视角,分享了前沿洞察与战略思考。
论坛伊始,专家们首先从人工智能的发展、具身智能的历史沿革和应用场景等方面对具身智能的研究对象和科学内涵进行了阐释。具身智能是在从前只在数字世界中交互的智能基础上,以不同形态的智能体通过跟物理世界耦合,去理解动态物理世界,使其具备自适应能力与持续学习能力,并可通过跨模态感知与周边环境实时互动的人工智能系统。
人工智能的安全性和可信性受到社会广泛关注,作为人工智能的一个特定研究方向,具身智能在这方面又会面临哪些问题?针对这一议题,专家们认为,具身智能作为一个软硬件耦合的系统,其安全问题是多层次的复合问题,解决的路径也应当从计算安全、网络安全、神经网络的可信、执行安全等各层面去拆解,或是从当下到未来不同时间点可能面临的主要安全问题去分析,这也是未来业界需要长期努力的研究方向。从目前的产业实践来看,搭建一个标准的平台对安全可信进行分级是一个思路,从自身安全和外延安全两方面去排除危险因素,实现内外兼修也是一个思路。
对具身智能与大模型之间关系的未来走向议题,专家们结合各自领域实践进行了颇有建树性的思辨。语言大模型或者多模态视觉语言动作模型等大模型对具身智能的推动毋庸置疑,但结合自然界中很多生物智能行为的观察,会发现语言是智能的,但要具备智能不是必须通过语言,这也就意味着VLA是否是具身智能的最终范式仍有探讨的空间,要看具体的应用场景,而建立通用的框架和评判标准是学界应该尽快完成的工作。
畅想具身智能未来的发展之路,专家们一致认为,通用具身智能是具身智能行业发展的长远和核心目标,但囿于硬件和数据等方面的限制,要实现这个目标还有很长一段路要走。而在此之前,适合特定应用场景的专用具身智能的研究路线也应不断推进。