高考数学难上热搜？6家AI实测谁是真学霸

数学高考刚结束，热搜就炸了。“数学一卷喜提大专”刷屏，考生们集体吐槽最后一道题难到离谱，甚至有人给它封了个“史上最难高考压轴题”的名号。

为了验证这道题的难度，有机构用6个主流AI模型做了实测。

6个AI做全国I卷，原卷扫描直接输入，模拟学生拍照上传，不做任何预处理。全程无网络、无外挂，纯靠模型自己的推理能力，解答题按“过程分+结果分”双维度人工阅卷。

前10道基础题，6家全部答对，谁都没掉队，但从第11题开始，差距慢慢显现。真正的分水岭是压轴第19题，一道新定义题型，涉及集合、逻辑推理和反证法，需要现场理解规则、现学现卖。这种题，靠死记硬背是没用的。

最终成绩千问150分，是唯一拿到满分的，其他模型在此题均有不同程度失分。

千问在第19题的表现确实稳。第一问集合推导滴水不漏，第二问奇函数性质推理严谨，第三问反证法构造精妙，最后验算也没有纰漏。

整个过程步骤完整、逻辑清晰，符合高考数学对“严密性”的高要求。

其他模型有的在分类讨论环节卡了壳，有些是过程与结果上失误。

以前大家担心AI会不会做题，现在发现AI最怕的是做题不“稳”。基础题大家都对，真正拉开差距的是最后那道“一步错步步错”的压轴题，数学考的不只是知识，压轴题更是推理能力的试金石，和面对陌生题型的迁移能力。

对考生来说，这套测评也说明一件事，高考数学考的不是你见过多少题，是你没见过的时候能不能推出来，AI也一样。千问能拿到满分，靠的不是参数大，是扎实的训练基础。

AI数学测评高考数学

塔斯娱乐资讯网

高考数学难上热搜？6家AI实测谁是真学霸

热门分类