为了验证这道题的难度,有机构用6个主流AI模型做了实测。
6个AI做全国I卷,原卷扫描直接输入,模拟学生拍照上传,不做任何预处理。全程无网络、无外挂,纯靠模型自己的推理能力,解答题按“过程分+结果分”双维度人工阅卷。
前10道基础题,6家全部答对,谁都没掉队,但从第11题开始,差距慢慢显现。真正的分水岭是压轴第19题,一道新定义题型,涉及集合、逻辑推理和反证法,需要现场理解规则、现学现卖。这种题,靠死记硬背是没用的。
最终成绩千问150分,是唯一拿到满分的,其他模型在此题均有不同程度失分。
千问在第19题的表现确实稳。第一问集合推导滴水不漏,第二问奇函数性质推理严谨,第三问反证法构造精妙,最后验算也没有纰漏。
整个过程步骤完整、逻辑清晰,符合高考数学对“严密性”的高要求。
其他模型有的在分类讨论环节卡了壳,有些是过程与结果上失误。
以前大家担心AI会不会做题,现在发现AI最怕的是做题不“稳”。基础题大家都对,真正拉开差距的是最后那道“一步错步步错”的压轴题,数学考的不只是知识,压轴题更是推理能力的试金石,和面对陌生题型的迁移能力。
对考生来说,这套测评也说明一件事,高考数学考的不是你见过多少题,是你没见过的时候能不能推出来,AI也一样。千问能拿到满分,靠的不是参数大,是扎实的训练基础。
AI数学测评 高考数学




