此次评测遵循全国新课标I卷的标准,全面考核了客观题与主观题,由具有高考阅卷经验的教师匿名评分。阅卷过程中,教师们并不知道回答来自AI模型,以确保评价的公正性。然而,大模型的错误模式与人类不同,这给教师评分带来一定挑战,故每题至少由三位教师评分并取平均值,对于评分差异大的题目还进行了复核。
阅卷完成后,教师们得知他们评分的对象实为AI模型,并受邀对模型的表现进行了综合分析,为未来模型的改进提供了方向。教师们的反馈揭示了模型在各个科目上的强项与不足:模型在现代文阅读理解上表现良好,但在文言文理解和作文创意表达上显现出局限;数学解题虽能记忆公式,却缺乏灵活运用;英语虽总体表现良好,但在特定题型和作文字数控制上仍有待提高。此外,由于电子文本的特性,作文评分可能存在细微的主观偏差。
高考语文科目的考试已经落幕,通过对多地考生的采访反馈,普遍认为今年的试卷难度较为适中。考生们离开考场时的神情轻松愉快,笑容满面,显示出他们对考试表现的信心,几乎没有沮丧的迹象
2024-06-07 21:35:30考完数学老实了昨日,一场别开生面的线上祝福活动吸引了众多即将步入高考考场的学生们的注意。
2024-06-07 17:18:00祖冲之评论区变许愿池