不过,它的“代价”是回复速度变慢,毕竟生成新内容会带来一定延迟。
值得一提的是,还有人似乎在本地模型上也发现了类似现象。
有人表示:截图中的“prefix-match hit” (前缀匹配命中)似乎可以证明确实是用的缓存。
那么问题就来了,大模型到底是如何缓存我们的聊天信息的呢?
好问题,从开头展现的第二个例子来看,显然是进行了某种“聚类”操作,但具体如何应用于深度多轮对话咱不知道。
姑且不论这个问题,倒是有人看到这里,想起来ChatGPT那句“您的数据存在我们这儿,但一旦聊天结束对话内容就会被删除”的声明,恍然大悟。
这不禁让一些人开始担忧数据安全问题:
这是否意味着我们发起的聊天内容仍然保存在他们的数据库中?
当然,有人分析这个担忧可能过虑了:
也许只是我们的查询embedding和回答缓存被存下来了。
因此,就像发现者本人说的:
缓存这个操作本身我不太担心。
我担心的是OpenAI这样简单粗暴地汇总我们的问题进行回答,毫不关心temperature等设置,直接聚合明显有不同含义的提示,这样影响很不好,可能“废掉”许多(基于GPT-4的)应用。
当然,并不是所有人都同意以上发现能够证明OpenAI真的就是在用缓存回复。
他们的理由是作者采用的案例恰好是讲笑话。
毕竟就在今年6月,两个德国学者测试发现,。
像“科学家和原子”这个更是尤其出现频率最高,它讲了119次。
因此也就能理解为什么看起来好像是缓存了之前的回答一样。
因此,有网友也提议用其他类型的问题测一测再看。
不过作者坚持认为,不一定非得换问题,光通过测量延迟时间就能很容易地分辨出是不是缓存了。
最后,我们不妨再从“另一个角度”看这个问题:
GPT-4一直讲一个笑话怎么了?
一直以来,咱们不都是强调要让大模型输出一致、可靠的回答吗?这不,它多听话啊(手动狗头)。
所以,GPT-4究竟有没有缓存,你有观察到类似现象吗?
针对早前微信被爆在后台反复读取用户相册的事件,1月5日,马化腾回应称:“应该是21年10月的事了,图片缓存加速造成的误会,后面应该用iOS新的解决卡顿的API解决了。
2024-01-08 11:23:45马化腾谈早期微信“偷窥”相册苏有朋转发回复舒淇:“妈妈说美丽的女人都会吓人而且很吓” 都给咱有朋哥吓到模糊了
2023-11-23 11:01:19苏有朋回复舒淇原标题:没有立春是“寡妇年”,不宜结婚?官方回应近日,有网友在民政部官网上留言,建议民政部或其他部委联合发文,引导居民不受迷信影响龙年正常结婚。
2024-01-25 08:03:47民政部回复龙年不宜结婚原标题:林俊杰回复Angelababy引发网友狂欢,两人友情超甜近日,歌手林俊杰在微博上回复了演员Angelababy的一条评论,引发了网友们的热烈讨论和关注。
2023-08-21 13:26:25林俊杰回复Angelababy官方回应冰雪大世界主持人疑打广告1月14日,有网友发布视频称,哈尔滨冰雪大世界大舞台“感觉变味道了”,主持人在节目中疑似多次植入广告,感觉非常影响游玩体验,建议取消。
2024-01-15 15:51:18官方回应冰雪大世界主持人疑打广告