DeepSeek的“火”与一体机的“热”
翻看2024年大模型的竞争格局,暂时还维持着“乾坤未定,你我皆是黑马”的浓烈氛围。
然而一个春节,市场情绪突变为“六小龙无首,DeepSeek才是黑马。”
DeepSeek的崛起,已是国内AI圈反复被提及的“现象级”事件。
从初代DeepSeek Coder,到DeepSeek-V3,再到被业界称作“R1系列”的强化学习模型,每一款发布都伴随着“算力成本更低”“推理速度更快”的争论。
DeepSeek与其他大模型不同的一大特色,就是全面的“开源化”与“成本优化”。
一开始很多人并不相信“小厂”能做好“开源+商用”的结合,而DeepSeek的团队却在几项主流基准测试中屡屡跑出能比肩GPT-4或Claude的成绩。
在编码任务领域号称*成功率、在数学推理方面挤进了“世界前三”……这些“成绩单”迅速让DeepSeek成为国民级应用,长期霸榜各大应用商店。
再加上DeepSeek宣布可支持128K长上下文、多语言编程、联网搜索等功能,尤其是R1全面引入强化学习框架,模型在逻辑推理时貌似有了“顿悟时刻”,在一些专业题库上不输OpenAI最新版本。
“性价比极高、开源免费可商用”的标签,打动了很多企业。
坊间传闻,“不少给六小龙下订单的客户,年后看到DeepSeek的火热,纷纷按住了合同,要等等观察下,再决策要不要跟六小龙签约。”
只可惜,DeepSeek官方线上算力有限,用户大增后,经常出现服务异常。
为满足庞大用户的访问需求和对数据安全的考量,企业“本地部署”呼声开始走高。
一体机大爆发:各厂商集体“抬轿子”
巧合的是,几家国内软硬件巨头看准了这股“私有化部署”的浪潮,纷纷推出 “DeepSeek 一体机”系列产品。
华为:推出DS版FusionCube A3000训/推超融合一体机,满血版可匹配DeepSeek-R1、V3的671B模型,搭载昇腾AI处理器;
加拿大心理学家、麦吉尔大学教授德比·莫斯考维茨指出,周四是一周里工作效率最低的一天,人们在这一天感到特别疲惫和烦躁。为了调节这种情绪,可以先回想本周已经完成的工作,将注意力集中在有成就感的事情上
2025-03-28 09:03:12建议每周四适度摸鱼2025年1月9日,云南省楚雄彝族自治州公安局官方微信公众号发布了一则通报,批评了四只警犬
2025-01-12 12:47:16四只警犬被通报11月18日晚,莫言的新书《不被大风吹倒》首发式在抖音直播间举行。直播中,莫言谈到了与老朋友余华的往事。两人曾在一个房间共处两年半时间,莫言觉得余华写的东西和自己完全不同,他当时的作品是自己无法写出的
2024-11-19 10:57:58莫言回应和余华被称摸鱼CP