安全加强版的 DeepSeek-R1-Safe

2025-09-24点滴生活95

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

作者: 莫自高    时间: 2025-9-21 23:03
DeepSeek-R1-Safe是由浙江大学网络空间安全学院和华为合作的基于DeepSeek衍生的安全大模型,在华为昇腾芯片和MindSpeedLLM等框架的基础上开发。
该模型的训练流程如下:
训练数据生成:构建安全、合规的数据集
安全监督训练:在训练过程中引入安全约束
安全强化学习:通过 RLHF 等方法优化模型行为
模型性能评测:对安全性能和通用性能进行全面评估
https://github.com/ZJUAISafety/DeepSeek-R1-Safe
20250921_225918.jpg (366.01 KB, 下载次数: 0)下载附件2025-9-21 23:01 上传
作者: 江大桥    时间: 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
作者: npcjy    时间: 2025-9-22 07:42
江大桥 发表于 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
自己给自己出题打分,别人不承认也不使用,主打一个中国特色的AI。

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

“安全加强版的 DeepSeek-R1-Safe” 的相关文章

刚社区人讲一个退休老太,爱好捡废品堆在家

作者: 八个鸭卤    时间: 前天 16:01fire了把自己搞gg了作者: 莱斯    时间: 前天 16:07 本帖最后由 莱斯 于 2025-1-15 16:08 编辑 这玩意儿没法说,之前住...

版友们大a又起来了

作者: 大母鸡    时间: 前天 09:38干作者: 亚洲小海    时间: 前天 09:40@小白鸽 不愧为股神。作者: 那无阿弥    时间: 前天 10:46干个jB,今天会绿的作者: 嘉品惠...

昨天刚下载小红书,氛围很奇怪

作者: cavaliercc    时间: 3 天前  没有tiktok难民 以前也是这样的氛围吗?还是如图片上说的一样,上面的人都开始装起来了,居然上面还有互帮写作业的。主要是看评论越刷越好玩f62...

论坛的黑名单设置有BUG了,会闹出误会

作者: wuyue770    时间: 昨天 23:10但是我引用他的话呢,就可以正常回复9090.jpg(60.97 KB, 下载次数: 0)下载附件昨天 23:10 上传作者: wuyue770 ...

这大体格子,你们这些小卡拉米,有几个能搞得过她?

作者: Allen    时间: 前天 09:37这大体格子,你们这些小卡拉米,有几个能搞得过她?.jpg (71.98 KB, 下载次数: 0)下载附件前天 09:37 上传作者: worldly_...