近期,上海人工智能实验室的官方微博分享了一则消息:司南评测体系OpenCompass启动了首次针对大模型的“语数外”高考全科目能力测评,使用的是全国新课标I卷作为测试基准。这次特别挑选了六个开源模型,以及OpenAI的GPT-4o参与,所有开源模型的公开时间均早于高考日期,以保障测试环境的封闭性和公正性。评分工作则委托给具有实际高考阅卷经验的教师执行,确保评估结果贴近真实的阅卷标准。测试结果揭晓,阿里通义千问Qwen2-72B、OpenAI的GPT-4o以及书生·浦语2.0文曲星(InternLM2-20B-WQX)在众多模型中脱颖而出,分列前三名,它们的得分率分别是72.1%、70.5%和70.4%。从整体表现看,这些模型在语言类科目上展现了较强的能力,语文科目的平均得分率达到67%,英语更是高达81%。相比之下,数学成为多数模型的弱项,平均得分率低至36%。其中,InternLM2-20B-WQX在数学上获得了最高分75分,尽管如此,这一成绩仍未能跨过及格线。
6月13日,第六届阿里巴巴全球数学竞赛揭晓决赛名单,亮点之一是17岁的江苏涟水中等专业学校学生姜萍,她不仅成功跻身全球前30名,更是该组别中唯一的女性选手
2024-06-16 12:40:59AI和姜萍答同一份卷2024年的高考中,全国乙卷将被河南、陕西、内蒙古、宁夏、青海及新疆等地使用。教育部门提醒,具体考试安排请考生关注当地教育考试院的最新通知,因为试卷使用情况可能有所调整
2024-06-07 18:14:19今年高考没有全国乙卷了2024年,新高考1卷将在多个省份实施,涉及的地区包括浙江、江苏、河北、山东、广东、福建、湖北、湖南、安徽、江西等。
2024-06-07 13:17:12没有浙江卷了