安全加强版的 DeepSeek-R1-Safe

2025-09-24点滴生活17

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

作者: 莫自高    时间: 2025-9-21 23:03
DeepSeek-R1-Safe是由浙江大学网络空间安全学院和华为合作的基于DeepSeek衍生的安全大模型,在华为昇腾芯片和MindSpeedLLM等框架的基础上开发。
该模型的训练流程如下:
训练数据生成:构建安全、合规的数据集
安全监督训练:在训练过程中引入安全约束
安全强化学习:通过 RLHF 等方法优化模型行为
模型性能评测:对安全性能和通用性能进行全面评估
https://github.com/ZJUAISafety/DeepSeek-R1-Safe
20250921_225918.jpg (366.01 KB, 下载次数: 0)下载附件2025-9-21 23:01 上传
作者: 江大桥    时间: 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
作者: npcjy    时间: 2025-9-22 07:42
江大桥 发表于 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
自己给自己出题打分,别人不承认也不使用,主打一个中国特色的AI。

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

“安全加强版的 DeepSeek-R1-Safe” 的相关文章

最近支付宝碰一碰减1.28活动大家都天天参加吧

作者: 八个鸭卤    时间: 前天 13:36啥时候结束?作者: pwrln    时间: 前天 13:56哪有1.28,你第一次吧,一般都是两三毛作者: 八个鸭卤    时间: 前天 14:31p...

大年初一从扬州机场出发,车停哪

作者: 大蓝京人    时间: 3 天前要停5天,只能停机场吗或是不是找车送划算些,大年初一也不好意思叫人送。作者: 吧吧炸    时间: 3 天前顺风车过去就是了 。。。。作者: Copenhage...

严介和家族企业又被强制执行!

作者: 弱电门禁    时间: 3 天前千亿营收却还不了数百万元的“小账单”什么情况?大而不倒、赖而不倒?AA1xiOcf.jpg (48.32 KB, 下载次数: 0)下载附件3 天前 上传作者:...

小红书反应过来了

作者: 8080难民    时间: 3 天前以前那些直白的,直接对线的帖子看不到了!现在都是岁月静好,有些帖子都是ai,哎!!作者: 数码爱好者    时间: 3 天前铁拳开始出来了,让外国难民看看,...

中药是否天然具有无法集采属性?

作者: npcjy    时间: 前天 09:44组方不确定,药效一致性不确定,完全凭医生个人的经验值。LP低密度脂蛋白高,人民医院开了他汀类药物,几十块钱,省中医院开了中药,900多。作者: fjm...