当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
如何评价鸿蒙电脑无法编写其自身运行的程序?
为什么用 electron 开发的桌面应用那么多?
2025年小米su7 性价比很低了,为何还不更新改款?
软路由怎么没有人玩了?
未过门的孙媳妇需要给男方爷爷出殡吗?
鸿蒙电脑会在国内逐渐取代windows电脑吗?
女生可以在家中裸居吗?
作为独立开发者,有哪些可以分享的经验?
自己拥有一台服务器可以做哪些很酷的事情?
Firefox 浏览器是否还有可能浴火重生?
如何将docker目录挂载到宿主机上?
如何评价Cursor?
中了一个亿 你会做什么?
编程能够做的副业有哪些?有什么小活可以做?
J***a 除了 Spring 还有什么?
这种裙子是不是对直男爆杀?
做客孩子临走时带走几只玩具,我的孩子抗拒并一直哭,要怎么开导?
科学怎么解释中医把脉孕检,并且知道怀的男孩女孩?
几年前吹得神乎其神的福建舰电磁弹射为什么现在销身匿迹了?
张元英的颜值在内娱属于什么水平?
有没有根据题库自动生成考卷的软件?
Flutter 为什么没有一款好用的UI框架?
有什么树莓派的代替品吗?
为什么人到中年,很少有身材苗条的?
哪张照片让你觉得刘亦菲美得不可方物?
遭遇生理性涨奶该怎么办?
网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)?
为什么《绝区零》打磨了那么多细节的同时,却有一个灾难性的UI设计?
各位历史发烧友,介绍一下你知道的冷门史实或逆天史实?
如何自己搭建家庭服务器?