丰色发自凹非寺
量子位|公众号QbitAI
有网友找到了GPT-4变“笨”的又一证据。
他质疑:
OpenAI会缓存历史回复,让GPT-4直接复述以前生成过的答案。
最明显的例子就是讲笑话。
证据显示,即使他将模型的temperature值调高,GPT-4仍重复同一个“科学家与原子”的回答。
就是那个“为什么科学家不信任原子?因为万物都是由它们编造/构造(make up)出来的”的冷笑话。
在此,按理说temperature值越大,模型越容易生成一些意想不到的词,不该重复同一个笑话了。
不止如此,即使咱们不动参数,换一个措辞,强调让它讲一个新的、不同的笑话,也无济于事。
发现者表示:
这说明GPT-4不仅使用缓存,还是聚类查询而非精准匹配某个提问。
这样的好处不言而喻,回复速度可以更快。
不过既然高价买了会员,享受的只是这样的缓存检索服务,谁心里也不爽。
还有人看完后的心情是:
如果真这样的话,我们一直用GPT-4来评价其他大模型的回答是不是不太公平?
当然,也有人不认为这是外部缓存的结果,可能模型本身答案的重复性就有这么高:
此前已有研究表明ChatGPT在讲笑话时,90%的情况下都会重复同样的25个。
具体怎么说?
证据实锤GPT-4用缓存回复
不仅是忽略temperature值,这位网友还发现:
更改模型的top_p值也没用,GPT-4就跟那一个笑话干上了。
(top_p:用来控制模型返回结果的真实性,想要更准确和基于事实的答案就把值调低,想要多样化的答案就调高)
唯一的破解办法是把随机性参数n拉高,这样我们就可以获得“非缓存”的答案,得到一个新笑话。
针对早前微信被爆在后台反复读取用户相册的事件,1月5日,马化腾回应称:“应该是21年10月的事了,图片缓存加速造成的误会,后面应该用iOS新的解决卡顿的API解决了。
2024-01-08 11:23:45马化腾谈早期微信“偷窥”相册苏有朋转发回复舒淇:“妈妈说美丽的女人都会吓人而且很吓” 都给咱有朋哥吓到模糊了
2023-11-23 11:01:19苏有朋回复舒淇原标题:没有立春是“寡妇年”,不宜结婚?官方回应近日,有网友在民政部官网上留言,建议民政部或其他部委联合发文,引导居民不受迷信影响龙年正常结婚。
2024-01-25 08:03:47民政部回复龙年不宜结婚原标题:林俊杰回复Angelababy引发网友狂欢,两人友情超甜近日,歌手林俊杰在微博上回复了演员Angelababy的一条评论,引发了网友们的热烈讨论和关注。
2023-08-21 13:26:25林俊杰回复Angelababy官方回应冰雪大世界主持人疑打广告1月14日,有网友发布视频称,哈尔滨冰雪大世界大舞台“感觉变味道了”,主持人在节目中疑似多次植入广告,感觉非常影响游玩体验,建议取消。
2024-01-15 15:51:18官方回应冰雪大世界主持人疑打广告