当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
公式背得溜,做题一塌糊涂,五年级孩子数学不是很好,尤其图形方面,该怎么提升?
有哪些小众的开源项目养活了一大批人?
游戏是否正在毁掉中国部分的年轻人?
你们在编程时遇到过什么离谱的bug吗?
华为中年粉丝都是什么样子的?
有没有一款音乐播放器,能连接nas音乐,创建音乐库,自动匹配歌词封面等等?类似infuse的概念呢?
韦东奕的牙怎么没了?
为什么程序员独爱用Mac进行编程?
想开一个100cm或者120cm的溪流缸或者水草缸,有没有大佬指导一下,有哪些注意事项?
为什么软件公司很少用python开发web?
毕设答辩,老师说node不可能写后台怎么办?
装了飞牛NAS,除了存资料看电影还能干什么?
如何看待某日本小学校园餐只有一小块鸡肉?
独立开发者都使用了哪些技术栈?
为什么 Bun 选择了 Zig 以及 JSCore?
前端如何设计网页?
Golang与Rust哪个语言会是今后的主流?
现在学习Django做web开发过时了吗?
胸大的女孩子有什么烦恼?
养了近十年的草龟要不要放生?
如何在Mac m1中部署openwrt软路由虚拟机?
想要入行音***开发,但是没有相关项目经验怎么办?
最近,你有什么顿悟?
独立开发***能盈利吗?感觉好累...
什么是 5G 固定无线接入(FWA)?
四口之家100M的宽带够用吗?
为什么感觉德国在中国的名声比英法美日好一点?
obsidian用一两年后会有多大?全文搜索还快吗?
有没有GUI框架开发难度小,***消耗又不多,而且又跨平台?
Golang vs Rust vs Dlang 哪个更有前途,哪位大牛这 3 门语言都用过?