当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
和女生旅游开一间房有什么注意事项?
有一个***约你出去,你会去吗?
SwiftUI 是不是一个败笔?
国产手机AI「好用」的背后,是技术差距还是文化差异?
MacOS的哪个设计让你非常恼火?
golang总体上有什么缺陷?
如何评价特厨隋坡对鲁菜根的评价?
怎么国内车企都要去跑纽北呢,纽北也就是个普通赛道?
要不要帮导师装服务器?
空战的时候可不可以先击落预警机?
为什么说中国是基建狂魔?
穿瑜伽裤去爬山好吗?
有哪些好的低代码开发平台?
你的鱼缸里养过什么奇怪的鱼?
如何评价“寡姐”斯嘉丽·约翰逊的身材?
有个自闭症的孩子,该放弃吗?
吴柳芳的真实水平如何?
导师给了1.4W要我给工作室买个主机,是整机还是自己配?
胸大的女孩子有什么烦恼?
国家电网以后以后会和昔日的粮站一样吗?
如何寻找到相对完整的真正的游戏的源码用来学习?
你的内衣丢过吗?
做一个中国的微软到底有多难?
Node.js是谁发明的?
冬天也要穿胸罩吗?
怎么看待B站舞蹈区和某些风格比较暴露的up?
超小团队选择Django还是Flask?
拒绝情绪输出,大家觉得有什么办法可以让国足堂堂正正进入世界杯?
你见过哪些智障的反人类的设计?