点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
9月17日,以“让AI更安全,让安全更AI”为主题的2025年国家网络安全宣传周人工智能安全治理分论坛在云南昆明举行。会上,阿里巴巴集团安全部副总裁薛晖表示,面对AI发展带来的“复合型风险”,要以“设计即安全”和“开放共治”的理念共同应对。
阿里巴巴集团安全部副总裁薛晖
薛晖指出,AI安全是一个复合型挑战,其首要特征为交叉性。不同类型的“安全”问题往往相互交织,既有传统攻防问题,也有模型内生的安全与失控问题,并延伸影响社会的可持续发展。
“与此同时,复合型风险还超越了我们的治理能力。”他表示,应用增加导致安全边界被不断扩大;AI从“思考”向“行为”的演进,也带来权限、记忆等新问题;同时,AI安全的能力目前落后于模型能力的发展,如何兼顾安全与发展,成为亟需解决的难题。
面对这些问题,薛晖认为,不能仅依赖单一手段,应辩证、系统化地推进“设计即安全”,通过辩证施策保障大模型智能可信:强化安全评估,提倡守门员策略(统一的安全基准)与挑战者策略(安全红队)相结合;以实战检验防御效果,从错误中演化模型的内生安全能力,通过围栏机制实现明确和冗余的保障;深化机理研究,以理解驱动的方式解决安全问题。
薛晖呼吁各界加大在AI安全基础研究上的投入,例如应在安全前提下提升响应的有效性和帮助性,同时以模型隐空间为切入点,定位与风险相关的神经元,纳入AI自我复制、失控冲突等新型风险。(赵鹏超 张锐)