点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

全部导航

正在阅读：突破瓶颈 RealSafe-R1树立大语言模型安全新标杆

首页>

网安频道> 数字安全 > 正文

突破瓶颈 RealSafe-R1树立大语言模型安全新标杆

来源：光明网2025-02-24 13:55

　　2024年2月23日，清华大学与瑞莱智慧联合团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练，在确保性能稳定的基础上，显著提升了安全性，表现优于Claude3.5、GPT-4o等闭源大模型，为开源大模型的安全发展与风险治理提供了创新性解决方案。

突破瓶颈 RealSafe-R1树立大语言模型安全新标杆

　　近日来，国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力，但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此，清华瑞莱联合团队提出了基于模型自我提升的安全对齐方式，将安全对齐与内省推理相结合，使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险，实现基础模型自身能力的自主进化。

　　基于该方法，团队对DeepSeek-R1系列模型进行后训练，正式推出RealSafe-R1系列大模型。实验数据表明，RealSafe-R1安全性提升显著，在多个基准测试中有效增强了对各种越狱攻击的抵抗力，并减轻了安全与性能之间的“跷跷板”现象，表现优于被认为安全性较好的闭源大模型Claude3.5、GPT-4o等。

　　据悉，RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。瑞莱智慧首席执行官田天表示：“大模型的安全性瓶颈是本质的，只有通过持续投入和攻坚补齐短板弱项，人工智能产业才能真正实现高质量发展。”这一创新成果将为开源大模型的安全性加固提供有力支持，也为政务、金融、医疗等严肃场景的应用提供更为可靠的坚实基座。

　　RealSafe-R1的推出标志着开源大模型在安全领域的重大突破，不仅为DeepSeek生态添砖加瓦，也为大语言模型树立了新的安全标杆。（记者曾震宇）

[ 责编：李飞 ]

阅读剩余全文（）

相关阅读

您此时的心情

光明云投

新闻表情排行日/周

开心

0
难过

0
点赞

0
飘过

0

视觉焦点

倒计时2天！人工智能安全治理分论坛即将举行

最热文章

独家策划

推荐阅读

杜鹃花海茶飘香

2025年4月10日，安徽省芜湖市无为市昆山镇三公山茶叶种植基地，千亩高山野生杜鹃在翠绿的茶园之间绚丽绽放，美轮美奂，美不胜收

2025-04-10 15:13

慕田峪长城山花烂漫

2025年4月1日，北京怀柔慕田峪长城内外山花盛开，美丽的春花把古长城打扮的多姿多娇，犹如春天里一幅壮美的风景画

2025-04-02 15:44

引江济淮菜巢线复航

2025年4月1日，船舶航行在安徽省合肥市庐江县境内的引江济淮航道上，标志着菜子湖湿地候鸟越冬季禁航结束，菜（子湖）巢（湖）线恢复通航

2025-04-01 15:40

太湖之滨春景如画

2025年3月31日，江苏苏州吴中区光福镇，太湖之滨，桃花、樱花、油菜花等竞相绽放，生态优美，春景如画

2025-04-01 15:31

用镜头记录城市更新青岛首届“百家媒体看改变”活动圆满闭幕

用镜头记录城市更新青岛首届“百家媒体看改变”活动圆满闭幕

2025-03-20 10:14

“昭君杯”首届全国老年合唱大赛在京启动

"昭君杯"首届全国老年合唱大赛在北京国家大剧院正式启动

2025-03-19 16:10

金沙江特大桥抢抓施工

2025年2月25日，云南省昭通市绥江县，新市金沙江特大桥施工现场，工人正加紧施工。

2025-02-26 15:41

梅花绽放报春来

2025年2月7日，重庆市巫山县曲尺乡月明村一大片梅花竞相开放、灿若红霞，游客和市民前来游玩打卡，尽享春日的快乐和惬意

2025-02-08 14:52

非遗进景区助推文旅融合

2025年2月5日，福建省福清市石竹山风景区，一场非遗英歌舞、建瓯挑幡等非遗表演正在进行，让游客感受中华优秀传统文化魅力，丰富景区文化内涵和游览品质

2025-02-06 15:55

湿地公园生态美

2025年1月20日，江西省赣州市章贡区城市中央公园内，游船与湖水、植被、高楼相互映衬，呈现出一幅冬日多彩美丽生态画卷

2025-01-20 15:30

盐湖绽放“硝花”景观

2025年1月16日，受低温天气影响，山西省运城盐湖出现冬季独特的“硝花”景观，水面上的硝花形态各异晶莹剔透，美不胜收。

2025-01-16 15:56

《龟兹》：从千年壁画穿越而来的灵魂之舞

一位“行者”行走在广袤的沙漠中，遮掩着绝世的面庞，一面“古镜”掩埋于厚重的沙下，刻满了时间的裂痕。

2025-01-13 17:25

雪后森林裹银装

2025年1月9日，重庆市酉阳土家族苗族自治县桃花源国家森林公园白雪皑皑，雪景如画

2025-01-09 15:24

关爱卡寒假公益行助力云南各族青少年儿童梦想起航

关爱卡寒假公益行助力云南各族青少年儿童梦想起航

2025-01-08 14:42

集大原旅游专列首发

2025年1月5日，在山西太原南站开往呼和浩特东站的D4022次列车前，游客自拍合影。

2025-01-06 16:01

生态田园

2024年12月8日，广西梧州岑溪市岑城镇木榔村，生态田园中阡陌纵横线条分明，冬韵如画。

2024-12-10 16:48

冬日景美

2024年12月10日，贵州省黔西市绿化白族彝族乡大海子村，青山环绕树木葱茏，构成一幅美丽的生态画卷。

2024-12-10 16:40

色彩斑斓映姑苏

2024年12月6日，古城苏州街头，成片的银杏、红枫等树木色彩斑斓满目缤纷，成为一道迷人的风景。

2024-12-06 15:48

“美丽经济”助力乡村振兴

2024年12月6日，初冬时节，山东省青岛市即墨区灵山街道花卉种植基地的大棚里一片繁忙，种植户忙着管护花卉。

2024-12-06 15:48

河南南阳：冬日景美如画

2024年11月30日，初冬时节，河南省南阳卧龙岗文化园内，树木换上"新装"，宛如一幅五彩斑斓的画卷，吸引不少市民、游客前往赏景。

2024-11-30 18:34