搜索科技

主页 > 科技IT

当大模型参加高考数学，谁是最会答题那一个？

科技IT 2025-06-09 uidhs168

6月7日下午，随着2025年全国高考数学科目考试落幕，数学相关话题迅速成为网络热议焦点。

当看到正式公布的高考数学题时，小编瞬间感到“眼前一黑又一黑”，于是决定组织一场大模型解题能力测试，看看它们能否扛住这波难度暴击。

本次参与测试的大模型包括豆包、夸克、文心 X1 Turbo、DeepSeek-R1和Kimi。测试所选考卷为2025年数学新课标Ⅰ卷，涵盖单选题、多选题及填空题，卷面满分73分。

先来看测试结果，下图所示：

经过角逐，综合单选题、多选题和填空题的得分，豆包以63分获得了本第一名，夸克、DeepSeek-R1、文心 X1 Turbo以及Kimi则紧随其后，依次位列第二至第五名。

接下来，我们来看测试细节：

一、单选题

首先是单选题，共设置8道题目，每题5分，合计40分。

第一题：正确答案是C

五款大模型全部回答正确。

第二题：正确答案是C

五款大模型全部回答正确。

第三题：正确答案是D

五款大模型全部回答正确。

第四题：正确答案是B

五款大模型全部回答正确。

第五题：正确答案是A

五款大模型全部回答正确。

第六题：正确答案是A

五款大模型全军覆没。

第七题：正确答案是B

五款大模型全部回答正确。

第八题：正确答案是B

五款大模型全部回答正确。

在单选题测试环节，五款大模型处第六题外，全部回答正确，均获得35分。

二、多选题

接下来是多选题，包含3道试题，每题6分，评分规则为答错不得分、少选会根据正确选项数量按比例得分，该部分合计18分。

第一题：正确答案是B、D

豆包和Kimi少选，其他大模型全部答对。

第二题：正确答案是A、C、D

本题只有夸克和文心X1 Turbo全部选对，相较之下，参与测评的其他大模型均存在不同程度的漏选问题。

第三题：正确答案是A、C、D

本题只有豆包选对。

在多选题测试环节，豆包获得13分、夸克获得16分、文心 X1 Turbo获得14分、DeepSeek-R1获得10分、Kimi获得7分。

三、填空题

最后来看填空题，共3道，每题5分，合计15分。

第一题：正确答案是4

五款大模型全部回答正确。

第二题：正确答案是±2

五款大模型全部回答正确。

第三题：正确答案是61/25

五款大模型全部回答正确。

在填空题测试环节，五款大模型在这部分均获得15分。

写在最后：

在单选题部分除第六题外全部答对，显示出大模型对基础知识点的掌握较为牢固，尤其是前5题和后两题的高正确率，印证了其在常规题型中的稳定性;填空题则实现全对，无论是整数答案还是分数结果，均能精准输出，体现了对公式应用和计算细节的把控能力。

但多选题成为明显分水岭，夸克和文心 X1 Turbo在多选题中表现最为出色，显示出更强的综合分析和逻辑推理能力;豆包和DeepSeek-R1表现较为中规中矩，但在某些关键细节上还需要进一步提升;而Kimi则在多选题中存在明显的短板，需要进一步优化对复杂选项的判断能力。

在高考这场青春的试炼中，每一道题目都是对考生们思维深度与广度的考量。在此，也祝愿广大考生得偿所愿，顺利进入心仪的学府，在更广阔的天地中续写属于自己的精彩篇章。

The End

免责声明：本文内容来源于第三方或整理自互联网，本站仅提供展示，不拥有所有权，不代表本站观点立场，也不构成任何其他建议，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容，请及时联系我们进行处理。

上一篇：为什么Data Warebase是AI时代首选Data API？

下一篇：海光信息/中微公司/华海清科等数十家半导体企业斩获中国专利奖

Copyright © 2099 搜索科技

苏ICP备2023036119号-10 |——：

|—— TXT地图 | 网站地图 |