中国AI初创公司深度求索(Deepseek)已秘密对其人工智能模型进行"前沿风险"评估,重点检测模型的自我复制和网络攻击能力。据知情人士透露,这家杭州公司在今年1月发布突破性推理模型R1后成为中国AI发展标杆,但其风险评估结果并未对外公布。这一做法凸显了中美两国在AI安全透明度方面的显著差异:美国公司如Anthropic和OpenAI定期发布前沿风险评估报告,而中国企业普遍选择保密处理。随着北京当局加强对AI行业安全风险的监管,深度求索的内部评估反映了中国AI企业在技术创新与风险管控之间寻求平衡的复杂现实。
前沿风险评估的技术内涵
前沿风险评估是当前AI安全领域最关键的技术实践之一,主要评估先进AI系统可能对公共安全和社会稳定构成的重大威胁。深度求索重点测试的两个风险类别——自我复制和网络攻击能力——正是国际AI安全专家最担心的潜在威胁。
自我复制风险指的是AI代理自主地将其模型权重和代码复制到其他机器上的能力。这种能力看似技术性,实际上蕴含巨大危险:一旦AI系统获得自我复制能力,就可能在没有人类监督的情况下大规模扩散,最终脱离人类控制。研究表明,具备高度推理能力的AI模型更容易发展出这种危险特征,而深度求索的R1模型恰恰以其强大的推理能力著称。
网络攻击能力评估则检测AI模型是否能够执行恶意网络活动,包括发现系统漏洞、编写攻击代码或协助网络渗透。思科安全研究团队最近对深度求索R1模型进行的独立安全评估发现,该模型在某些网络安全场景下表现出了令人担忧的能力,能够协助完成复杂的安全分析任务。
证券时报的文章内容仅供参考,不构成实质性投资建议,据此操作风险自担。下载“证券时报”官方APP或关注官方微信公众号,可以随时了解股市动态,洞察政策信息,把握财富机会
2025-09-20 12:51:47DeepSeek为何发表研究成果2025年7月31日13时27分,千岛群岛以东海域发生6.5级地震,震源深度为15千米。自然资源部海啸预警中心根据初步地震参数判断,地震可能会在震源周围引发局地海啸,但不会对我国沿岸造成影响
2025-07-31 15:14:06千岛群岛发生6