当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
这个社会为什么老实人都混得不好?
如何评价DuckDB?
为什么感觉四***明很空洞?
如何实现USB2.0比USB3.0更快?
有哪些BI工具惊艳了你?
除了厚重,你拒绝折叠屏的理由还有哪些?什么样的折叠屏才能打动你?
有个学舞蹈的女朋友是什么体验?
你会从mac转向Windows吗?
新手准备养鱼,请教大神需要什么东西?
为什么剪映是剪辑软件鄙视链的最底层?
在广州,找个对象是不是真的很难?
为什么很多程序员没有升级到架构师?
前端移动端开发***需要那些技术?
为什么没人提微软裁员?
为什么老一辈人厌恶游戏?
为什么电脑厂商用了二十多年时间才发现电源应该放在机箱下部?电源下置这么显而易见的结构这么晚才出现?
苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗?
你最真实(很少吐露)的择偶标准是什么?
如果让“成飞”和“沈飞”的六代机打一架,谁更厉害?
为什么那么多人用GO?GO语言的优势在哪里?
如何评价迈阿密最终世俱杯小组赛晋级淘汰赛?
为什么有些前端一直用 div 当按钮,而不是用 button?
SwiftUI 是不是一个败笔?
老公加班过多,是逃避家庭责任吗?
如何在不重装系统和软件的情况下换系统盘?
golang比j***a编码效率高太多,为什么各大厂还在继续用j***a而不是重构整个项目?
为什么董明珠攻击小米空调,而公牛却没有攻击小米插座?
吃爽了是怎样一种体验?
年纪轻轻为什么会得腰肌劳损?
鸿蒙折叠屏笔记本为什么敢卖26999?