北京时间1月28日早上,近期备受关注的DeepSeek(深度求索)传出两件大事:遭受大规模恶意攻击以及其产品在图像生成基准测试中超越了OpenAI的DALL-E 3模型。这家中国公司再次引起全球瞩目。
DeepSeek是一家由量化幻方运营的创新性大模型公司。幻方量化自2016年起推出首个AI模型,并于2023年成立了DeepSeek。2024年12月,DeepSeek发布了最新的AI模型DeepSeek-V3,并同步开源,训练成本仅为557.6万美元,整个训练只需要280万个GPU小时。这一低成本高性能的特性使其迅速吸引了硅谷的关注,脸书母公司Meta甚至为此成立了四个专门研究小组来研究DeepSeek的工作原理,并基于此改进自己的Llama模型。
DeepSeek的产品不仅在技术上表现出色,在市场上也获得了巨大成功。1月27日和28日,DeepSeek在中国区和美国区苹果App Store免费榜均位列首位,超越了包括ChatGPT在内的多个知名AI产品。然而,由于用户访问量激增,DeepSeek曾出现两次宕机现象。对此,公司回应称问题已在数分钟内得到解决。
面对大规模恶意攻击,DeepSeek采取了限制非+86手机号注册的方式以确保服务持续。尽管如此,一些用户仍然遇到了登录失败的问题。记者尝试通过官网和微信扫码登录,但未能成功。
过去一周,中国的人工智能大模型成为硅谷乃至全球科技界的热议话题。引发这场讨论的是中国人工智能初创公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震惊硅谷DeepSeek在大模型领域备受关注,其用人逻辑与其他公司相似,侧重于年轻且有潜力的人才,通常年龄在1998年左右出生,工作经验不超过五年。这些人才具备聪明、理工科背景和较少的工作经验
2025-01-27 10:33:46DeepSeek能一直火下去吗日前接受媒体采访时,奥运冠军潘展乐表示希望未来创造更多震惊世界的成绩。
2024-08-22 16:32:26潘展乐希望创造震惊世界的成绩