这个大模型高考测试结果，还真是没想到

8个月前发布

1 15 0

这个大模型高考测试结果，还真是没想到卡兹克团队跑了大模型的高考数学测试
结果豆包和星火第一。
qwen3 也不错
而垫底的小虎需要加加油了…

#ai #大模型高考 #大模型 #人工智障与人工智能

豆包包逗豆包模型什么能力大家DDDD

文章版权归作者所有，未经允许请勿转载。

没有相关内容!

15 条评论

小蕾蕾读者

人类真的危险了

8个月前无记录

回复
花花猫小妹读者

o3排第七吗，很难信任

8个月前无记录

回复
五边吾记读者

真的难绷，多模态模型和纯文本模型放在一起比较。。。

8个月前无记录

回复
海棠读者

冲击啥啊，ai能做出来，不代表考生能在考场上做出来。

8个月前无记录

回复
德扑圈读者

民间答案都参差不齐而且不必定有过程

8个月前无记录

回复
十八罗读者

的确，更别说还能搜索答案了

8个月前无记录

回复
不易青年读者

[g=bangbangtang] 豆包实则挺靠谱的

8个月前无记录

回复
清梓桐读者

[g=fendou][g=fendou] 正确答案也是民间版吧，高考是个热点，能确定没有在他们测试前大模型们就把最新高考题训练好了吗，或者把民间版答案收入数据库了吗？

8个月前无记录

回复
范吸吸投稿者

o3有博主测出来满分，有视频，可信度还蛮高的

8个月前无记录

回复
高升伴车安抵押车屏蔽器读者

我关注的是对教育体系的冲击

8个月前无记录

回复
你说的铁柱儿读者

[g=jingxi] 千问一直猛

8个月前无记录

回复
回眸秋波风尘读者

肯定不稳定啊同样提示词出来的答案都不必定一样，何况不同人不同提示词测试

8个月前无记录

回复
梦V鱼BL 投稿者

这段时间够更新模型了所以测试还是得拿权重在此之前发布的，所以我比较信任qwen3

8个月前无记录

回复
暗区突围投稿者

感觉最好用自己部署的模型，不然很容易作弊

8个月前无记录

回复
鑫鑫淼淼多多多投稿者

感觉前三里只有千问3是真实实力…

8个月前无记录

回复

这个大模型高考测试结果，还真是没想到

没有更多了...

没有更多了...

相关文章

15 条评论

热门网站

3699小游戏

小苹果网页助手

中国版首页

商丘网 —— 商丘网络第一媒体

丫丫影院-2025免费观看电视剧

Shopee

热门文章

易懂案例：用班费记账来理解区块链Paxos算法、Basic Paxos算法、Cheap Paxos算法、Egalitarian Paxos算法、Fast Paxos算法、Multi-Paxos算法、B

昆廷夫夫日常合集：昆廷夫妇全集免费直通车1080P超速播-未删减百度云秒拉缓存-高清画质自由看-可影视全网极速播放昆廷夫夫日常合集-昆廷夫妇全集在线点播免VIP高清未删减版-可影视秒播

锦州方言——语音的基本特征

佳能 EOS R3 VS索尼 A1对比来啦，神仙打架，针尖对麦芒，该怎么选？

重磅推荐：2024各行各业开源免费项目大全

新印尼燕窝正品溯源码燕盏礼盒马来西亚进口干盏孕妇滋补品100g精选

这个大模型高考测试结果，还真是没想到

没有更多了...

没有更多了...

相关文章

15 条评论

热门网站

3699小游戏

小苹果网页助手

中国版首页

商丘网 —— 商丘网络第一媒体

丫丫影院-2025免费观看电视剧

Shopee

热门文章

易懂案例：用班费记账来理解区块链Paxos算法、Basic Paxos算法、Cheap Paxos算法、Egalitarian Paxos算法、Fast Paxos算法、Multi-Paxos算法、B

昆廷夫夫日常合集：昆廷夫妇全集免费直通车1080P超速播-未删减百度云秒拉缓存-高清画质自由看-可影视全网极速播放昆廷夫夫日常合集-昆廷夫妇全集在线点播免VIP高清未删减版-可影视秒播

锦州方言——语音的基本特征

佳能 EOS R3 VS索尼 A1对比来啦，神仙打架，针尖对麦芒，该怎么选？

重磅推荐：2024各行各业开源免费项目大全

新印尼燕窝正品溯源码燕盏礼盒马来西亚进口干盏孕妇滋补品100g精选

标签云