开源=最强大模型!Llama3.1发布,405B超越闭源GPT-4o,扎克伯格:分水岭时刻
7月23日晚,Meta宣布推出开源大模型Llama 3.1系列,该系列包含8B、70B及450B三种参数规模,旨在缩小开源与闭源模型之间的差距。尤其值得注意的是,450B参数的模型在多项基准测试中超越了OpenAI的GPT-4o,并可与顶尖闭源模型如Claude 3.5 Sonnet相抗衡。
同期,Meta创始人兼CEO扎克伯格在其官网博客中强调,Llama 3.1的发布标志着行业转折点,预示着开源AI将成为未来的主流趋势。英伟达高级研究科学家Jim Fan也对此表示祝贺,认为这是一个具有历史意义的时刻,开源技术正将GPT-4级别的能力带入现实。
Llama 3.1在技术层面实现了显著提升,所有模型的上下文窗口扩大至128K,增加了对8种语言的支持。405B版本更是历经大规模训练,使用了超过15万亿个tokens,并动用了1.6万块H100 GPU,成为首个达到如此训练规模的Llama模型。
Meta在官方博客中详细对比了Llama 3.1与其他模型的性能,旗舰模型405B不仅在常识理解、操作性、数学任务上表现出色,能与GPT-4、GPT-4o及Claude 3.5 Sonnet竞争,8B和70B的小型模型也在同类参数模型中保持竞争力。实际应用中,Llama 3.1 405B在人工评估中展现出优于GPT-4o和Claude 3.5 Sonnet的整体性能。
6月7日,阿里云在技术博客上宣布了一个重要进展:他们发布了名为Qwen2-72B的开源模型,这款模型在全球范围内以其卓越的性能脱颖而出
2024-06-07 10:49:47阿里云发布开源模型Qwen2金融领域正成为大型模型应用的重要潜在场景。度小满公司近期在金融大模型的实践上取得显著进展,致力于解决该领域落地的实际难题,并把握信息技术进步带来的机遇,加速推进大模型的研发与应用,以强化其技术基础
2024-06-27 13:34:44中国大模型登顶全球开源第一