中华网 china.com

新闻

OpenAI诈骗?GPT-4.1正式上线ChatGPT,网友实测却大呼失望 上下文窗口缩水引发不满

关键词:
2025-05-16 09:14:02  凤凰科技

OpenAI诈骗?GPT-4.1正式上线ChatGPT,网友实测却大呼失望 上下文窗口缩水引发不满。OpenAI宣布GPT-4.1现已在ChatGPT中可用。这个模型擅长编码任务和遵循指令,是o3和o4-mini的绝佳替代品。一个月前,GPT-4.1刚推出时仅通过API向开发者开放,现在所有Plus、Pro和Team用户可以通过模型选择器中的“更多模型”下拉菜单访问它。企业版和教育版用户将在未来几周内获得访问权限。此外,OpenAI还将在ChatGPT中为所有用户引入GPT-4.1 mini来取代GPT-4o mini。

由于超长的上下文能力,现在可以将整段代码放入GPT-4.1进行分析。GPT-4.1和GPT-4.1 mini已经通过了OpenAI最新的标准安全评估,在不产生不安全输出和遵循良性请求方面表现良好。在幻觉评估以及指令遵循方面,GPT-4.1也表现出色,但在越狱评估方面表现不佳。

此次放出GPT-4.1响应了用户的呼声。早在4月底,就有用户表示GPT-4.1是他们最喜欢的OpenAI模型,使用体验甚至比GPT-4.5还要好。不断有开发者称GPT-4.1是测试过的最好的编码模型之一,认为它是一个被低估的模型。上个月,OpenAI专为开发者推出了GPT-4.1系列新模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,这些模型均拥有最高100万Token的超大上下文窗口,在代码、指令跟随等核心能力上全面超越GPT-4o及GPT-4o mini,并且知识截止日期更新至2024年6月。

随着很多ChatGPT用户开始使用GPT-4.1,全网涌现了不少实测报告。例如,沃顿商学院教授Ethan Mollick用一道考遍各大模型的经典难题考验GPT-4.1,结果令人满意。另一位开发者发现GPT-4.1处理庞大代码任务的速度更快,不仅准确完成任务,还清理了未使用的代码。实测显示,GPT-4.1在代码生成速度方面达到了新的高度,如生成博客首页或Python动画都能迅速完成。对于推理问题,GPT-4.1同样表现出色,能够快速解决多步骤年龄计算问题和逆向思考问题。

然而,试用后许多网友表示失望,因为ChatGPT(Pro)中的GPT-4.1最大上下文长度仅为128k token,远低于API中的100万token。尽管如此,仍有人发现ChatGPT 4.1在某些特定场景下表现优秀,比如在API Playground中成功运行直播演示中的提示词。一些开发者依然选择使用自己的助手,因为用户界面更好。OpenAI此前已发布GPT-4.1的prompt指南,总结了一系列内部测试得出的重要技巧供用户参考。

(责任编辑:0882)
关闭

苏超爆火不仅仅因为“造梗” 赛事流量转化为文旅增量

苏超爆火不仅仅因为造梗2025-06-10 18:36:08

特朗普下令向洛杉矶增兵 联合国发声 呼吁局势降级

特朗普下令向洛杉矶增兵联合国发声2025-06-10 18:33:28

男子尾随女童进电梯还捂嘴?警方通报 非人贩子,传言为假

男子尾随女童进电梯还捂嘴,警方通报2025-06-10 18:30:36

台军扬言效仿乌克兰,将用无人机先发制人? 采购美制无人机借口

台军扬言效仿乌克兰,将用无人机先发制人2025-06-10 16:57:01

加州州长称特朗普是彻头彻尾的骗子 因非法调遣国民警卫队引发争端

加州州长称特朗普是彻头彻尾的骗子2025-06-10 18:19:39

抗议已在美国三个大州爆发 移民突袭引发大规模抗议

抗议已在美国三个大州爆发2025-06-10 16:59:13

中小国家对枭龙战机兴趣高涨,印巴冲突大显身手

专家:中小国家对枭龙战机兴趣高涨2025-06-10 17:08:24

环保少女被以色列军方拦截,去向不明 国际援助行动受阻

环保少女被以色列军方拦截,去向不明2025-06-10 16:50:27

1号台风蝴蝶或直吹广东 华南需警惕强降雨影响

1号台风蝴蝶或直吹广东2025-06-10 18:20:05

洛杉矶暴乱升级,特朗普派兵平叛!加州想独立,会导致南北战争吗

洛杉矶暴乱发生有何深层次原因2025-06-10 16:54:39

台独分子被曝把台独当成一门生意!

台独分子被曝把台独当成一门生意2025-06-10 16:52:09

韦东奕与合作者在数学顶刊发文 揭示波动方程新解

韦东奕与合作者在数学顶刊发文2025-06-10 18:03:19

韩国能否走出内部阵营对立的困境 李在明的外交新路径

韩国能否走出内部阵营对立的困境2025-06-10 16:57:33

特朗普下令向洛杉矶增兵 联合国发声 呼吁局势降级

特朗普下令向洛杉矶增兵联合国发声2025-06-10 18:33:28

国足vs巴林:王钰栋谢文能先发 首发阵容公布

国足vs巴林,王钰栋谢文能先发2025-06-10 18:14:43

李在明会推进中日韩合作吗 韩国内政外交新动向

李在明会推进中日韩合作吗2025-06-10 16:43:40

中美伦敦会谈有什么看点 稀土成焦点议题

中美伦敦会谈有什么看点2025-06-10 18:05:22

澳总理回应澳媒记者被橡皮子弹击中 已向美方提出交涉

澳总理回应澳媒记者被橡皮子弹击中2025-06-10 17:05:31

特朗普绕过州长向洛杉矶派兵是越权吗 特朗普在宪政边界的又一次试探?

特朗普绕过州长向洛杉矶派兵是越权吗2025-06-10 18:03:36

台湾网红馆长陈之汉将到上海 开启大陆充电之旅

台湾网红馆长陈之汉将到上海2025-06-10 16:48:00

媒体:苏超爆火不仅仅因为“造梗” 赛事流量转化为文旅增量

媒体,苏超爆火不仅仅因为造梗2025-06-10 18:24:52

AI监考发现高考生作弊记0分?假的 警惕诈骗短信

AI监考发现高考生作弊记0分,假的2025-06-10 18:05:49

苏超爆火不仅仅因为“造梗” 赛事流量转化为文旅增量

苏超爆火不仅仅因为造梗2025-06-10 18:36:08

唐嫣方曾回应迟到一个月未进组 已按约定时间进组

唐嫣方曾回应迟到一个月未进组2025-06-10 18:22:35

婚检查出艾滋医生该不该告知配偶 隐私权与知情权的法律博弈

婚检查出艾滋医生该不该告知配偶2025-06-10 18:17:07

北美原住民说土地被美政府非法抢走!

北美原住民说土地被美政府非法抢走2025-06-10 17:03:15

加州公民选的民主党站了外国人 马斯克成意外盟友

加州公民选的民主党站了外国人2025-06-10 16:55:08

美媒:每架F-35战机需要50磅钐,中国对这种稀土的控制暴露美国军事供应链漏洞 稀土依赖成隐患

美媒,每架F-35战机需要50磅钐,中国对这种稀土的控制暴露美国军事供应链漏洞2025-06-10 17:14:22

美国移民危机将如何演变?“内战”式博弈走向何方?

美国移民危机将如何演变2025-06-10 17:11:25

河南公布高考查分时间 6月25日揭晓成绩

河南公布高考查分时间2025-06-10 18:08:18

国足vs巴林感受球迷热情 荣誉之战全力以赴

国足vs巴林感受球迷热情2025-06-10 18:28:11

《长安的荔枝》口碑出圈成黑马喜剧 全员狠人飙戏

长安的荔枝口碑出圈成黑马喜剧2025-06-10 18:00:02

得州数百名抗议者与警方发生冲突 反对移民搜捕行动

得州数百名抗议者与警方发生冲突2025-06-10 17:02:46

男子尾随女童进电梯还捂嘴?警方通报 非人贩子,传言为假

男子尾随女童进电梯还捂嘴,警方通报2025-06-10 18:30:36

相关新闻