安全加强版的 DeepSeek-R1-Safe

2025-09-24点滴生活120

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

作者: 莫自高    时间: 2025-9-21 23:03
DeepSeek-R1-Safe是由浙江大学网络空间安全学院和华为合作的基于DeepSeek衍生的安全大模型,在华为昇腾芯片和MindSpeedLLM等框架的基础上开发。
该模型的训练流程如下:
训练数据生成:构建安全、合规的数据集
安全监督训练:在训练过程中引入安全约束
安全强化学习:通过 RLHF 等方法优化模型行为
模型性能评测:对安全性能和通用性能进行全面评估
https://github.com/ZJUAISafety/DeepSeek-R1-Safe
20250921_225918.jpg (366.01 KB, 下载次数: 0)下载附件2025-9-21 23:01 上传
作者: 江大桥    时间: 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
作者: npcjy    时间: 2025-9-22 07:42
江大桥 发表于 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
自己给自己出题打分,别人不承认也不使用,主打一个中国特色的AI。

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

“安全加强版的 DeepSeek-R1-Safe” 的相关文章

昨天女邻居把她家钥匙给我了。。。

作者: Lautumn    时间: 3 天前标题: 昨天女邻居把她家钥匙给我了。。。真不催牛逼,催牛逼烂JJ昨天女邻居找我借个剪刀,然后我就把我家钥匙又给她了,上次我家德施曼的锁突然打不开了,我就把...

油价上涨

作者: 天空很蓝    时间: 3 天前喜迎作者: greatyin    时间: 3 天前95号涨两毛九作者: 1069    时间: 3 天前过年前要解决亏损作者: laogeda    时间:...

国家医保局:欢迎医务 人员当好吹哨人

作者: 搞搞    时间: 前天 15:03在今年的地方两会上,集采药品的质量和疗效问题受到了上海、北京等地医药领域政协委员们的高度关注,委员们基于临床一线的实践和感受,对优化集采制度,让患者用上好药...

我来给大家伙交个底,房价什么时候基本跌到稳定状态

作者: 阿里克斯    时间: 3 天前 本帖最后由 阿里克斯 于 2025-1-18 12:58 编辑 基本均价一平方和该城市城镇居民每月可支配收入相差无几时候,就差不多了,大家可以对应看看,走着瞧...

我就想在年前吃两个大瓜,懂王能不能给点力

作者: topskycn    时间: 前天 10:19公布 萝莉岛,吹牛老爹两个案子的处理结果,不能早吊着呀,到底到哪一步了,什么证据都应该摆出来,可别搞个内参,不透明呀 作者: wuyue770 ...