点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:薛晖:以“设计即安全”理念应对AI复合型风险
首页> 网安频道> 技术前沿 > 正文

薛晖:以“设计即安全”理念应对AI复合型风险

来源:光明网2025-09-19 18:46

  9月17日,以“让AI更安全,让安全更AI”为主题的2025年国家网络安全宣传周人工智能安全治理分论坛在云南昆明举行。会上,阿里巴巴集团安全部副总裁薛晖表示,面对AI发展带来的“复合型风险”,要以“设计即安全”和“开放共治”的理念共同应对。

薛晖:以“设计即安全”理念应对AI复合型风险

阿里巴巴集团安全部副总裁薛晖

  薛晖指出,AI安全是一个复合型挑战,其首要特征为交叉性。不同类型的“安全”问题往往相互交织,既有传统攻防问题,也有模型内生的安全与失控问题,并延伸影响社会的可持续发展。

  “与此同时,复合型风险还超越了我们的治理能力。”他表示,应用增加导致安全边界被不断扩大;AI从“思考”向“行为”的演进,也带来权限、记忆等新问题;同时,AI安全的能力目前落后于模型能力的发展,如何兼顾安全与发展,成为亟需解决的难题。

  面对这些问题,薛晖认为,不能仅依赖单一手段,应辩证、系统化地推进“设计即安全”,通过辩证施策保障大模型智能可信:强化安全评估,提倡守门员策略(统一的安全基准)与挑战者策略(安全红队)相结合;以实战检验防御效果,从错误中演化模型的内生安全能力,通过围栏机制实现明确和冗余的保障;深化机理研究,以理解驱动的方式解决安全问题。

  薛晖呼吁各界加大在AI安全基础研究上的投入,例如应在安全前提下提升响应的有效性和帮助性,同时以模型隐空间为切入点,定位与风险相关的神经元,纳入AI自我复制、失控冲突等新型风险。(赵鹏超 张锐)

[ 责编:曾震宇 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 迎开学

  • 舞炮龙 庆新春

独家策划

推荐阅读
民族文化宫里珍宝千千万,但说到“镇馆之宝”,首先想到的便是1300多年前文成公主带到西藏的长鼓,许多观众慕名而来只为一睹它的“芳容”。
2025-11-28 13:02
为庆祝新疆维吾尔自治区成立70周年,“异元汽车杯”首届新疆国际摄影大赛9月28日正式启动。
2025-09-29 14:31
2025年4月10日,安徽省芜湖市无为市昆山镇三公山茶叶种植基地,千亩高山野生杜鹃在翠绿的茶园之间绚丽绽放,美轮美奂,美不胜收
2025-04-10 15:13
2025年4月1日,北京怀柔慕田峪长城内外山花盛开,美丽的春花把古长城打扮的多姿多娇,犹如春天里一幅壮美的风景画
2025-04-02 15:44