点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:薛晖:以“设计即安全”理念应对AI复合型风险
首页> 网安频道> 技术前沿 > 正文

薛晖:以“设计即安全”理念应对AI复合型风险

来源:光明网2025-09-19 18:46

  9月17日,以“让AI更安全,让安全更AI”为主题的2025年国家网络安全宣传周人工智能安全治理分论坛在云南昆明举行。会上,阿里巴巴集团安全部副总裁薛晖表示,面对AI发展带来的“复合型风险”,要以“设计即安全”和“开放共治”的理念共同应对。

薛晖:以“设计即安全”理念应对AI复合型风险

阿里巴巴集团安全部副总裁薛晖

  薛晖指出,AI安全是一个复合型挑战,其首要特征为交叉性。不同类型的“安全”问题往往相互交织,既有传统攻防问题,也有模型内生的安全与失控问题,并延伸影响社会的可持续发展。

  “与此同时,复合型风险还超越了我们的治理能力。”他表示,应用增加导致安全边界被不断扩大;AI从“思考”向“行为”的演进,也带来权限、记忆等新问题;同时,AI安全的能力目前落后于模型能力的发展,如何兼顾安全与发展,成为亟需解决的难题。

  面对这些问题,薛晖认为,不能仅依赖单一手段,应辩证、系统化地推进“设计即安全”,通过辩证施策保障大模型智能可信:强化安全评估,提倡守门员策略(统一的安全基准)与挑战者策略(安全红队)相结合;以实战检验防御效果,从错误中演化模型的内生安全能力,通过围栏机制实现明确和冗余的保障;深化机理研究,以理解驱动的方式解决安全问题。

  薛晖呼吁各界加大在AI安全基础研究上的投入,例如应在安全前提下提升响应的有效性和帮助性,同时以模型隐空间为切入点,定位与风险相关的神经元,纳入AI自我复制、失控冲突等新型风险。(赵鹏超 张锐)

[ 责编:曾震宇 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 文化中国行 | 西安城墙的数字守护人

  • 浙江杭州:市民手写春联福字迎新春

独家策划

推荐阅读
【优秀案例展示|海报】“AI筑梦基础教育”公益项目
2025-12-28 11:10
【优秀案例展示|海报】“AI筑梦基础教育”公益项目
2025-12-28 11:10
【优秀案例展示|海报】阿里公益天天正能量
2025-12-28 11:10
【优秀案例展示|海报】淘宝手艺人·星火扶持计划
2025-12-28 11:10
由中央网信办网络社会工作局与中国互联网发展基金会共同发起的2024年网络公益行动项目征集活动开始展示。
2025-12-28 10:21