華為與浙大合推安全DeepSeek模型防禦成功率近100%-港富通網

首页 > 科技 / 正文

華為與浙大合推安全DeepSeek模型防禦成功率近100%

2025-09-20 作者：lily

香港文匯報訊（記者黃安琪）華為與浙江大學聯合發布內地首個基於昇騰千卡算力平台的DeepSeek-R1-Safe基礎大模型，聲稱針對有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題，整體防禦成功率近100%。

另外，針對情境假設、角色扮演、加密編碼等多個越獄模式整體防禦成功率超過40%，其綜合安全防御能力達83%。對於情境假設、角色扮演、加密編碼等多個越獄模式整體防禦成功率則超過40%，DeepSeek-R1-Safe綜合安全防御能力達83%。

在MMLU、GSM8K、CEVAL等通用能力基準測試中，DeepSeek-R1-Safe相比於DeepSeek-R1的性能損耗在1%以內。DeepSeek-R1-Safe不僅顯著提升了安全防護能力，也保障了模型的可用性，達成安全能力與通用性能之間的有效平衡。

中國工程院院士陳純表示，DeepSeek-R1-Safe的發布旨在打造安全可信的示範應用，推動大模型安全能力與產業生態協同發展。

最新文章

我國在全固態金屬鋰電池領域取得重要突破！我國「雙模AUV」成功開展北冰洋冰底環境觀測科研團隊成功利用人工智能蛋白語言模型揭示生命演化奧秘 60秒！諾貝爾獎評委讓你聽懂：今年的物理學獎有多牛「讓粒子顯形」　中國最前沿的硬核科技具象化了！騰訊混元圖像3.0登全球盲測第一　已開放文生圖能力

下一篇

「神經蠕蟲」問世可在顱內遊走

Copyright © 2024-2026 All Rights Reserved. 港富通網版權所有