DeepSeek和李飞飞之后,英伟达也看上阿里千问? 千问潜力引关注!在全球开源大模型生态圈中,阿里无疑是备受瞩目的存在。上周,继DeepSeek和“AI教母”李飞飞之后,英伟达也选择了与阿里合作。在最新的“混合推理模型”千问3宣布开源当日,英伟达迅速接入适配,并于5月9日开源了全新的代码推理模型Open Code Reasoning(简称OCR),包括7B、14B、32B三种尺寸,基础模型均基于通义千问。
在LiveCodeBench评测中,英伟达的OCR-Qwen-32B-Instruct模型成功超越了Open AI公司的o3-mini和o1模型,该模型正是基于Qwen2.5-32B微调形成的。尽管通义千问已迭代至3.0版本,性能再度突破,但英伟达仍基于上一代千问模型做出了比肩全球一流水平的模型,这让人不禁好奇千问究竟还有多少隐藏潜力待发掘。
目前,英伟达开源的OCR系列模型的代码及数据集已在Hugging Face平台上公开分享,供开发者们免费浏览学习。其中,OCR-Qwen-32B-Instruct在LiveCodeBench的pass1测试中获得了61.8%的成绩,超过了OpenAI的O3-Mini-2025-01-31(Low)和O1-2024-12-17(Low)。长期以来,人们普遍认为闭源模型在能力上远超开源模型,但英伟达此次开源的OCR模型反驳了这一观点。只要底座模型足够好,即使不是最新版本的开源模型,在经过高质量训练和优化后,也能超越闭源模型。
此前,斯坦福大学人工智能研究院院长李飞飞团队也曾基于阿里通义千问Qwen2.5-32B-Instruct,训练出与OpenAI o1、DeepSeek R1等尖端推理模型数学及编码能力相当的s1-32B模型。今年4月,李飞飞团队的研究报告显示:中美两国模型性能差距由2023年的17.5%大幅缩小至0.3%,近乎持平。阿里的六大模型入选报告,贡献度仅次于OpenAI和Google,排名全球第三、中国第一。
现如今机器人既能跑步又能后空翻,但何时才能真正承担起家务,帮助人类养老呢?李飞飞团队带来了具身智能研究的最新成果——一个解决机器人在家庭任务中全身操作问题的综合框架。其核心组件的成本不到500美元
2025-03-14 13:16:17李飞飞团队造保姆机器人人工智能的故事并不始于硅谷,而是可以追溯到五亿年前的生命起源。在巴黎人工智能峰会上,斯坦福大学教授李飞飞发表了演讲,探讨了人工智能从观察者转变为行动者的意义,并呼吁构建以人为中心的人工智能生态系统
2025-02-25 18:11:17李飞飞呼吁构建以人为中心的AI生态2025年伊始,中国迎来了自己的ChatGPT时刻。DeepSeek-R1模型以其卓越的能力引起了全球关注,从硅谷到中国、从老人到小孩,各行各业的人都在使用DeepSeek
2025-02-18 09:48:48人均DeepSeek之后AI应用还能怎么做