4训练作弊爆出惊天丑闻,AI大佬愤而辞职,代码实测崩盘全网炸锅 Llama 4翻车引发热议!Meta刚发布了Llama 4,紧接着就有高层请辞。有消息称,经过多次训练后,Llama 4未能达到顶尖水平,与顶级大模型相比存在明显差距。为了短期内提升指标,高层甚至建议在后训练阶段将多个基准测试集混入训练数据中。一位内部员工dliudliu表示无法接受这种做法,并在辞职信中明确要求不在Llama 4的技术报告中挂名。
同时,扎克伯格给全员下达了死命令,要求4月底前完成Llama 4的交付。在这种高压下,已有高管提出辞职。网友Flavio Adamo使用相同的提示词让Llama 4 Maveric和GPT-4制作旋转多边形动画。结果显示,Llama 4生成的多边形不规则且没有开口,小球也不符合物理规律。相比之下,GPT-4的动画虽然不完美,但表现更好。
还有人指出,Llama 4在LMarena上存在过拟合现象,涉嫌作弊。沃顿商学院教授Ethan Mollick认为,经常使用AI模型的人可以分辨出哪些是针对基准测试优化的,哪些是真正的进步。不过,另一位内部员工表示并没有遇到这种情况,建议让事情发展一段时间再看。
几位AI研究人员在社交媒体上批评Meta在其公告中提到的LM Arena上的Maverick是一个“实验性的聊天版本”。在Llama官网的性能对比图中,最下面一行写着“针对对话优化的Llama 4 Maverick”,这让人感到有些投机取巧。这种区别对待使开发人员难以准确预测模型在特定上下文中的表现。AI研究人员发现可公开下载的Maverick与LM Arena上托管的模型在行为上有显著差异。
据报道,Llama 4内部训练多次仍未能达到开源SOTA基准。领导层决定在后训练过程中混合各种基准测试集,以期望在测试中取得好成绩。爆料者可能来自Meta公司内部。此外,Meta AI研究部副总裁Joelle Pineau申请5月底辞职,但她所在的FAIR组织实际上与负责Llama项目的GenAI独立。GenAI的副总裁Ahmad Al-Dahle并未辞职。
近日,中国富商钟仁海在新加坡设立的家族办公室“熊猫企业”(Panda Enterprise)遭遇员工侵吞4亿资产事件引起广泛关注
2025-03-23 17:16:57浙江富豪被员工坑走4亿资产尽管大家都知道,互联网时代的信息传播速度非常快,但有时候,这种速度还是快得超出了一般人的想象。比如这一次的易建联疑似嫖娼事件
2024-10-18 16:45:15猝不及防的24小时!易建联被爆出丑闻4月5日,美国科技巨头Meta宣布推出新一代开源大模型Llama 4。该模型有两个混合专家架构的版本,分别为Scout和Maverick,而更强大的Llama 4 Behemoth仍在训练中
2025-04-12 13:03:55LIama4疑似作弊加油机作为特种设备,从生产到安装再到使用甚至维修,每个环节都受到严格监管。通常情况下,加油站没有作弊的机会。然而,一些加油站却能突破层层监管,将不可能变为可能。这背后隐藏着一条黑色利益链
2025-01-07 11:27:11打击加油机作弊12月14日,韩国国会通过弹劾尹锡悦动议。12月23日前,尹锡悦需提交有关弹劾案的答辩。12月27日,韩国宪法法院将举行弹劾案首场听证会。
2024-12-18 00:35:09尹锡悦