DeepSeek-R1模型的开源发布再次引发了全球对大语言模型(LLM)人工智能的关注。DeepSeek以远低于OpenAI的成本训练出了效果接近甚至部分优于OpenAI-o1的模型,并通过“蒸馏”技术提供了一系列参数规模相对较小、效果劣化不严重且有一定实用价值的衍生模型,例如国家超算互联网平台SCNet部署并免费向公众开放的Qwen-7B和Qwen-32B等。
根据实验和估算,部署运行DeepSeek-R1 671B模型用于内部研究实验,每小时成本在300元以上或每月十几万元;如果采用有监督微调方法进行训练,成本还会增加几倍。尽管这个成本仍然超出大部分个人和小微企业的承受能力,但对于大型企业和国家来说已经完全可以接受。
这意味着大语言模型被DeepSeek高度“民主化”了:任何国家都能训练并部署一个很大程度上自主可控、体现本国价值观且能结合本国实际情况的大模型AI。几个月前,这几乎只有美国和中国能做到。
一些国家政府已经意识到这一转变的重要性。印度政府计划投入计算基础设施、数据和资本支持,在农业和气候变化等领域构建与人工智能相关的应用,据说其大模型将在DeepSeek-R1的基础上构建。韩国宣布加快国家级人工智能计算基础设施建设,目标是成为“全球第三大AI强国”,显然认识到各国都有可能在短期内建成自己的“主权AI”,而DeepSeek的开源大大加速了这一进程。
巴西UFABC大学教授Sergio Amadeu指出,DeepSeek的开源使那些在技术上依赖美国发展的国家能够制定有利于自身发展的战略,但开源并不能解决建设对地方和国家发展至关重要的主权基础设施的问题。数字主权是一个系统工程,仅靠一两项立法或“杀手应用”的突破无法实现全面提升。
原标题:坚持打铁必须自身硬——论学习贯彻习近平总书记二十届中央纪委四次全会重要讲话精神“新时代新征程,必须坚持用改革精神和严的标准管党治党,努力取得更大成效”。
2025-01-10 10:08:47人民日报评论员:坚持打铁必须自身硬原标题:坚定信心,民营经济发展前景广阔、大有可为——论学习贯彻习近平总书记在民营企业座谈会上重要讲话“新时代新征程民营经济发展前景广阔、大有可为”。
2025-02-20 08:26:56人民日报评论员:坚定信心台湾评论员:中国航天科技崛起令中国人自豪继神舟十九号成功发射后,11月4日凌晨,神舟十八号载人飞船返回舱在东风着陆场成功着陆
2024-11-06 10:33:47台湾评论员:中国航天科技崛起令中国人自豪新华社北京11月30日电题:不断谱写马克思主义中国化时代化新篇章新华社评论员“马克思主义理论研究和建设工程是党的思想理论建设的基础工程、战略工程。
2024-12-01 19:06:34新华社评论员:不断谱写马克思主义中国化时代化新篇章乌克兰总统泽连斯基近期对媒体表示,随着特朗普出任美国总统,俄乌冲突将会更快结束。他强调战争会结束但日期并不确定,并且和平必须以公平的方式实现,特别是对于乌克兰而言
2024-11-18 08:07:56评论员:乌克兰的这个冬天不好过