注册登录

中华网 china.com

新闻

国内国际社会体育专题军事财经滚动政务冬奥

AI大牛卡帕西盛赞DeepSeek 强化学习展现巨大潜力(2)

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2025-02-13 12:54:17 智东西

虽然OpenAI的一些模型也使用了RL技术，性能与DeepSeek-R1相当，但卡帕西表示他大约80%-90%的查询依然由GPT-4o完成，只有遇到非常困难的代码和数学问题时才会使用思考模型。

强化学习是一种强大的学习方式，这一点已在围棋领域得到验证。DeepMind开发的AlphaGo通过自博弈和强化学习突破了人类棋手的实力上限。AlphaGo通过广泛尝试制胜策略，甚至超越了顶级玩家李世石。理论上，强化学习可以持续运行，但由于成本原因，DeepMind团队选择在某些时候停止。通过DeepSeek-R1，我们开始看到强化学习在大语言模型推理问题上的巨大潜力。

未来，如果我们继续在大语言模型领域扩展强化学习，可能解锁那些让人类难以理解的解决方案。这可能包括发现新的类比、思考策略，甚至是发明一种更适合思考的语言。实现这些的前提是为模型创造足够大的问题集，让其不断优化和完善解决问题的策略。

卡帕西还预言了未来几大AI趋势，包括多模态AI和测试时训练。由于音频、图片、视频等内容都可以被token化，采用大语言模型的训练逻辑将提升模型在相关领域的表现。此外，测试时训练将成为AI研究的前沿方向，允许模型根据新数据微调参数，更好地应对特定问题。

强化学习作为上一个世代AI能力突破的重要方向，由DeepSeek在生成式AI时代再度发扬光大。尽管有一些质疑声音，但许多专注于技术本身的AI开发者认为，DeepSeek的开源突破对整个AI界的发展是有利的，他们期待DeepSeek带来更多惊喜。AI大牛卡帕西盛赞DeepSeek！(责任编辑：卢其龙 CN070)

首页上一页 12共 2 页

关闭

女子按摩肩颈后急性脑梗死进了ICU

女子按摩肩颈后急性脑梗死进了ICU2025-03-04 09:13:33

《仁心俱乐部》，笑着笑着就默泪了医生的笑与泪

仁心俱乐部,笑着笑着就默泪了2025-03-04 09:11:55

意甲：尤文2-0完胜维罗纳图拉姆破门库普梅纳斯建功尤文豪取5连胜

意甲,尤文2-0完胜维罗纳图拉姆破门库普梅纳斯建功2025-03-04 09:11:37

特朗普再言“忍不了”泽连斯基争执未停歇

特朗普再言忍不了泽连斯基2025-03-04 08:17:20

村民家中煤气罐泄漏喷火消防出手厨房用火需谨慎

村民家中煤气罐泄漏喷火消防出手2025-03-04 09:04:30

泰国政府研究建隔离墙探讨边境管控新措施

泰国政府研究建隔离墙2025-03-04 08:16:57

没等大陆动手，马斯克先收了“台独”分子的饭碗

没等大陆动手,马斯克先收了台独分子的饭碗2025-03-04 08:16:38

泽连斯基10年间从意气风发到憔悴命运巨变

泽连斯基10年间从意气风发到憔悴2025-03-04 08:18:56

赖因德斯：能在来到米兰一年半之后续约我真的很自豪感激与期待未来

赖因德斯,能在来到米兰一年半之后续约我真的很自豪2025-03-04 09:06:15

中方谈美国鼓动他国对华加税贸易战无赢家

中方谈美国鼓动他国对华加税2025-03-04 09:11:19

美再次对华加征10%关税中方坚决反对强烈不满美方威胁

美再次对华加征10%关税中方坚决反对2025-03-04 09:04:07

网易游戏发文致歉网络故障已解决

网易游戏发文致歉2025-03-04 09:03:46

阿诺拉奥斯卡最佳原创剧本五项大奖闪耀颁奖夜

阿诺拉奥斯卡最佳原创剧本2025-03-04 09:09:10

特朗普:对泽连斯基不会再忍了美乌关系紧张升级

特朗普,对泽连斯基不会再忍了2025-03-04 08:59:07

大V：乌克兰将面临三大严峻情况盟友或成幕后推手

大V,乌克兰将面临三大严峻情况2025-03-04 08:23:21

女子按摩肩颈后急性脑梗死进了ICU

女子按摩肩颈后急性脑梗死进了ICU2025-03-04 09:13:33

巴菲特罕见发声关税或引发通胀

巴菲特罕见发声2025-03-04 08:19:38

陈晓离婚后状态首次公开露面精神饱满

陈晓离婚后状态2025-03-04 09:02:22

外媒称特朗普上任后欧盟和中国走近大国博弈新篇章

外媒称特朗普上任后欧盟和中国走近2025-03-04 08:19:15

外卖员雪天路边睡着误会解开身体无恙

外卖员雪天路边睡着2025-03-04 09:01:53

《仁心俱乐部》，笑着笑着就默泪了医生的笑与泪

仁心俱乐部,笑着笑着就默泪了2025-03-04 09:11:55

外交部驳斥鲁比奥涉华言论回击冷战思维

外交部驳斥鲁比奥涉华言论2025-03-04 08:48:05

专家：美加征汽车关税想“一石三鸟” 盟友反弹强烈

专家,美加征汽车关税想一石三鸟2025-03-04 08:23:10

意甲：尤文2-0完胜维罗纳图拉姆破门库普梅纳斯建功尤文豪取5连胜

意甲,尤文2-0完胜维罗纳图拉姆破门库普梅纳斯建功2025-03-04 09:11:37

中国空军赴哈瓦那看望古巴飞行员老爷爷温暖的双向奔赴

中国空军赴哈瓦那看望古巴飞行员老爷爷2025-03-04 08:19:26

泽连斯基发视频感谢美国白宫会晤风波后示好

泽连斯基发视频感谢美国2025-03-04 09:11:03

是否会向乌克兰派遣维和部队？中方回应支持和平解决危机

是否会向乌克兰派遣维和部队,中方回应2025-03-04 08:24:42

阚清子被曝怀孕后现身机场孕后状态成焦点

阚清子被曝怀孕后现身机场2025-03-04 09:00:28

金价大跳水入手即亏金饰价格断崖式下调

金价大跳水入手即亏2025-03-04 09:02:05

特朗普确认对加墨征收关税美股重挫市场恐慌情绪升高

特朗普确认对加墨征收关税美股重挫2025-03-04 08:21:26

巴格拉姆空军基地被中国接管？阿富汗驳斥美方情绪化言论遭批

巴格拉姆空军基地被中国接管,阿富汗驳斥美方2025-03-04 08:26:27

美乌谈崩北约或成最大输家美国两党内斗外溢

美乌谈崩北约或成最大输家2025-03-04 08:23:49

欧洲提出的俄乌和平方案能实现吗欧洲挺身而出争夺主导权

欧洲提出的俄乌和平方案能实现吗2025-03-04 08:23:32

网友留言贾乃亮多关心甜馨重视女儿心理健康

网友留言贾乃亮多关心甜馨2025-03-04 09:00:02

一男子全家六人患肠癌：兄妹7人5人确诊肠癌

兄妹7人5人确诊肠癌,一男子全家六人患肠癌2025-03-04 09:06:41

相关新闻

今日热点

揭秘5部精品微短剧的流量密码真实温情引共鸣

美商务部长：移民金卡已收入50亿美元，计划引发热议

前台南县长谈大罢免：台湾将陷入疯狂大内斗格局不利竞争力

《原子陨落》获IGN 8分融合辐射与艾尔登法环精髓

频道热点

主编邮箱
网上不良信息举报电话：010-56177181

关于中华网 | 广告服务 | 联系我们 | 招聘信息 | 版权声明 | 豁免条款 | 友情链接 | 中华网动态
版权所有中华网