当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
如何评价Cursor?
如果SSD硬盘闲置很多年,内部数据会不会丢失?
女生什么状态才体现出她已经爱上你了?
为什么重庆的房子这么便宜?
国内大厂现在用rust的多吗?
女明星陪酒真的存在吗?
为什么国内的uni***一直没人讨论呢?
妈妈去世后,外婆家的亲戚集体不来,我还要跟他们交往吗?
postgres集群的选择?
美国率领北约敢和中国开战吗?
作为一个程序员你觉得是业务重要还是技术重要?
如何评价陈楚生?
自己拥有一台服务器可以做哪些很酷的事情?
苏联就中国一个能打的“小弟”,为什么要逼走中国?
笨、傻、蠢有什么区别?
为什么“柴犬”从万人迷,变成万人嫌?
小学生学编程,学c++好还是python好?学编程可以参加强基***吗?
为什么《绝区零》打磨了那么多细节的同时,却有一个灾难性的UI设计?
为什么bilibili后端要用go来写?
现在个人开发ios还有机会吗?
有一个***约你出去,你会去吗?
现在个人博客不能备案了吗?
北京多所高校建议舍弃罗马仕充电宝,品牌方称正调查,罗马仕充电宝质量如何?如何排查所用充电宝是否安全?
腰肌劳损怎嘛治啊?
为什么小男孩小时候要比小女孩难养好多?
一名女子在杭州万象城遭挟持被捅 20 多刀,隆胸***体救了一命,这反映出哪些公安系统的问题?
为什么有的人好像什么都知道但现实中却一事无成?
Rust、Go、Zig、Dart、C3、C++、C,仓颉、moonbit、凹语言哪个语言更有未来?
现在读写速度最快的硬盘,能在30年前的计算机上当做内存使用吗?