北京时间1月28日早上,近期备受关注的DeepSeek(深度求索)传出两件大事:遭受大规模恶意攻击以及其产品在图像生成基准测试中超越了OpenAI的DALL-E 3模型。这家中国公司再次引起全球瞩目。
DeepSeek是一家由量化幻方运营的创新性大模型公司。幻方量化自2016年起推出首个AI模型,并于2023年成立了DeepSeek。2024年12月,DeepSeek发布了最新的AI模型DeepSeek-V3,并同步开源,训练成本仅为557.6万美元,整个训练只需要280万个GPU小时。这一低成本高性能的特性使其迅速吸引了硅谷的关注,脸书母公司Meta甚至为此成立了四个专门研究小组来研究DeepSeek的工作原理,并基于此改进自己的Llama模型。
DeepSeek的产品不仅在技术上表现出色,在市场上也获得了巨大成功。1月27日和28日,DeepSeek在中国区和美国区苹果App Store免费榜均位列首位,超越了包括ChatGPT在内的多个知名AI产品。然而,由于用户访问量激增,DeepSeek曾出现两次宕机现象。对此,公司回应称问题已在数分钟内得到解决。
面对大规模恶意攻击,DeepSeek采取了限制非+86手机号注册的方式以确保服务持续。尽管如此,一些用户仍然遇到了登录失败的问题。记者尝试通过官网和微信扫码登录,但未能成功。
DeepSeek的影响还波及到了美股市场。当地时间周一,由于对DeepSeek R1模型及其低成本优势的担忧,科技股遭遇抛售,导致纳斯达克综合指数下跌3.07%。英伟达股价更是创下历史最大单日跌幅,市值蒸发近5900亿美元。
美国总统特朗普表示,DeepSeek的崛起应为美国企业敲响警钟,但也可能带来积极信号。他认为这表明可以用更少资源实现同样效果。英伟达虽然股价受挫,但依然称赞DeepSeek是一项出色的人工智能进步,并认为这将为英伟达带来更多需求。
本周,中国互联网上洋溢着喜悦的气氛。2017年,谷歌旗下“深层思维”公司战胜中国顶尖围棋选手,展示了西方在人工智能领域的辉煌
2025-02-02 12:54:10一文看懂DeepSeek的中国式创新过去一周,中国的人工智能大模型成为硅谷乃至全球科技界的热议话题。引发这场讨论的是中国人工智能初创公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震惊硅谷中国人工智能实验室DeepSeek推出的人工智能语言模型R1引起了巨大反响。它在所有应用商店榜单上超越了美国的竞争对手ChatGPT,触发科技股市高达1万亿美元的抛售,并在硅谷引发末日般的评论
2025-02-13 19:19:20通过思维链看懂DeepSeek为何强