首页 > 科技    /    正文

華為與浙大合推安全DeepSeek模型 防禦成功率近100%

香港文匯報訊(記者 黃安琪) 華為與浙江大學聯合發布內地首個基於昇騰千卡算力平台的DeepSeek-R1-Safe基礎大模型,聲稱針對有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題,整體防禦成功率近100%。

另外,針對情境假設、角色扮演、加密編碼等多個越獄模式整體防禦成功率超過40%,其綜合安全防御能力達83%。對於情境假設、角色扮演、加密編碼等多個越獄模式整體防禦成功率則超過40%,DeepSeek-R1-Safe綜合安全防御能力達83%。

在MMLU、GSM8K、CEVAL等通用能力基準測試中,DeepSeek-R1-Safe相比於DeepSeek-R1的性能損耗在1%以內。DeepSeek-R1-Safe不僅顯著提升了安全防護能力,也保障了模型的可用性,達成安全能力與通用性能之間的有效平衡。

中國工程院院士陳純表示,DeepSeek-R1-Safe的發布旨在打造安全可信的示範應用,推動大模型安全能力與產業生態協同發展。

最新文章

我國在全固態金屬鋰電池領域取得重要突破! 我國「雙模AUV」成功開展北冰洋冰底環境觀測 科研團隊成功利用人工智能蛋白語言模型揭示生命演化奧秘 60秒!諾貝爾獎評委讓你聽懂:今年的物理學獎有多牛 「讓粒子顯形」 中國最前沿的硬核科技具象化了! 騰訊混元圖像3.0登全球盲測第一 已開放文生圖能力

Copyright © 2024-2026 All Rights Reserved. 港富通網版權所有