当大模型参加高考数学,谁是最会答题那一个?
6月7日下午,随着2025年全国高考数学科目考试落幕,数学相关话题迅速成为网络热议焦点。

当看到正式公布的高考数学题时,小编瞬间感到“眼前一黑又一黑”,于是决定组织一场大模型解题能力测试,看看它们能否扛住这波难度暴击。
本次参与测试的大模型包括豆包、夸克、文心 X1 Turbo、DeepSeek-R1和Kimi。测试所选考卷为2025年数学新课标Ⅰ卷,涵盖单选题、多选题及填空题,卷面满分73分。
先来看测试结果,下图所示:

经过角逐,综合单选题、多选题和填空题的得分,豆包以63分获得了本第一名,夸克、DeepSeek-R1、文心 X1 Turbo以及Kimi则紧随其后,依次位列第二至第五名。
接下来,我们来看测试细节:
一、单选题
首先是单选题,共设置8道题目,每题5分,合计40分。
第一题:正确答案是C


五款大模型全部回答正确。
第二题:正确答案是C


五款大模型全部回答正确。
第三题:正确答案是D


五款大模型全部回答正确。
第四题:正确答案是B


五款大模型全部回答正确。
第五题:正确答案是A


五款大模型全部回答正确。
第六题:正确答案是A


五款大模型全军覆没。
第七题:正确答案是B


五款大模型全部回答正确。
第八题:正确答案是B


五款大模型全部回答正确。
在单选题测试环节,五款大模型处第六题外,全部回答正确,均获得35分。
二、多选题
接下来是多选题,包含3道试题,每题6分,评分规则为答错不得分、少选会根据正确选项数量按比例得分,该部分合计18分。
第一题:正确答案是B、D


豆包和Kimi少选,其他大模型全部答对。
第二题:正确答案是A、C、D


本题只有夸克和文心X1 Turbo全部选对,相较之下,参与测评的其他大模型均存在不同程度的漏选问题。
第三题:正确答案是A、C、D


本题只有豆包选对。
在多选题测试环节,豆包获得13分、夸克获得16分、文心 X1 Turbo获得14分、DeepSeek-R1获得10分、Kimi获得7分。
三、填空题
最后来看填空题,共3道,每题5分,合计15分。
第一题:正确答案是4


五款大模型全部回答正确。
第二题:正确答案是±2
![]()

五款大模型全部回答正确。
第三题:正确答案是61/25
![]()

五款大模型全部回答正确。
在填空题测试环节,五款大模型在这部分均获得15分。
写在最后:
在单选题部分除第六题外全部答对,显示出大模型对基础知识点的掌握较为牢固,尤其是前5题和后两题的高正确率,印证了其在常规题型中的稳定性;填空题则实现全对,无论是整数答案还是分数结果,均能精准输出,体现了对公式应用和计算细节的把控能力。
但多选题成为明显分水岭,夸克和文心 X1 Turbo在多选题中表现最为出色,显示出更强的综合分析和逻辑推理能力;豆包和DeepSeek-R1表现较为中规中矩,但在某些关键细节上还需要进一步提升;而Kimi则在多选题中存在明显的短板,需要进一步优化对复杂选项的判断能力。
在高考这场青春的试炼中,每一道题目都是对考生们思维深度与广度的考量。在此,也祝愿广大考生得偿所愿,顺利进入心仪的学府,在更广阔的天地中续写属于自己的精彩篇章。
相关阅读
- 大模型市场2024年盘点:站在岔路口,未来将走向何方?
- Gartner:2024年全球IT总支出预计将达5万亿美元
- 研华推出面向生成式 AI 的边缘 AI 服务器解决方案
- 全球首个!优必选Walker S2人形机器人实现自主换电 7*24小时打工
- 鼎阳科技:发布两款数字示波器,高分辨率数字示波器产品线趋于完善
- 得益于HBM需求激增,SK海力士有望超越三星电子在内存市场的地位
- 比特网早报:DeepSeek发布最新文档识别模型,存储芯片行业高景气2026年仍将持续
- 【数智石油一线行】① 破壁:“磨刀石”上磨出智慧刃
- 三星电子获美47.45亿美元芯片补贴
- 思特威正式发布子品牌飞凌微,首发产品定位智驾视觉处理