眼下最受关注的AI新星、DeepSeek创始人梁文锋正与张一鸣背道而驰。1月28日,DeepSeek发布了新一代多模态大模型Janus-Pro,分为70亿和15亿参数量两个版本,并且均为开源。发布后不久,该模型便登上了知名AI开源社区Hugging Face的热门榜前列。
相比去年11月发布的JanusFlow,Janus-Pro优化了训练策略、扩展了训练数据,模型更大,在多模态理解和文本到图像的指令跟踪功能方面取得重大进步,同时增强了文本到图像生成的稳定性。根据DeepSeek的测试结果,这款文生图大模型在多项基准测试中表现出色,甚至强于OpenAI旗下的DALL-E 3以及Stable Diffusion。尽管用户指出Janus-Pro并不全面超越DALL-E 3,但其以较小的参数量展现了不俗潜力。
本月早些时候,DeepSeek还发布了R1大模型。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能号称可以比肩OpenAI当前最强的o1模型正式版。更重要的是,DeepSeek仅花费了相当于OpenAI零头的资金和资源,就拿出了堪与o1比肩的产品。这表明“小力出奇迹”的策略在DeepSeek身上屡试不爽。
这种低成本高效率的做法对行业产生了冲击。例如,1月27日美股交易中,英伟达股价暴跌17%,市值蒸发约4.3万亿人民币。然而,长期来看,芯片依然是AI大模型发展的基石,英伟达作为这一领域技术壁垒最坚固的公司,其“卖铲者”的长期价值依然坚挺。
字节跳动自2023年进军AI大模型以来,投入大量资金和资源,快速扩充AI业务矩阵,发布十几款大模型及十几个AI应用。尽管如此,“小力出奇迹”的DeepSeek让字节看似无可置疑的“大力”打法遭遇挑战。DeepSeek不仅在AI技术和产品上打破了旧思维,也在不经意间点破了“大力出奇迹”并非放诸四海皆准的商业真理。
春节期间,国产AI独角兽DeepSeek意外走红,其创始人梁文锋的家乡广东湛江吴川覃巴镇米历岭村吸引了众多游客前来“打卡”。甚至有建筑风水师拿着罗盘研究起村庄和梁文锋家宅的布局,科技与玄学在此巧妙结合
2025-02-08 01:40:40DeepSeek梁文锋的第一桶金在科技领域风起云涌的今天,一家名为DeepSeek的AI公司突然成为了全球关注的焦点
2025-02-11 14:32:25DeepSeek梁文锋身家暴涨