两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
代码:
俄罗斯妹子***漂亮热情,中国男人是不是很喜欢娶?
国内的银行软件搞所谓的“安全键盘”是不是有什么大病?
布鲁斯音阶到底是1 3b 4 5b 5 7b 1还是1 2 3b 3 5 6?
什么是 5G 固定无线接入(FWA)?
count(*) count(1)哪个更快?
成都目前存在的最大的问题在哪里?
女朋友送的switch被亲戚要求送小孩我该怎么办?
你有哪个瞬间决定这辈子再也不买苹果的产品?
27寸显示器是否有必要到4K?
怎么隔离dify和RAGflow ?
公式背得溜,做题一塌糊涂,五年级孩子数学不是很好,尤其图形方面,该怎么提升?
为什么华为价值2.3W的鸿蒙电脑用的是美国西数的SN740固态硬盘?
在现实中,普通人仿照***《一拳超人》中琦玉老师的锻炼方法锻炼三年会怎么样?
鸿蒙电脑正式发布,今年的大一新生会不会扎堆购买鸿蒙电脑?
你会从mac转向Windows吗?
请问HDFS、TFS、GFS等分布式文件系统,哪个更适合用来做***存储?
如何证明散片 CPU 比盒装 CPU 差?
对于一般用户来说,日常娱乐选择2K显示器还是4K显示器好?如何选才能不后悔?
为什么中医一千多年没有出现理论大创新了?
程序员想搭建自己的服务器求指教。?
能够自己一个人创业的全栈web码农fullstack developer要会哪些技术?
华为自研的仓颉编程语言将于 7 月 30 日开源,这款语言将如何影响未来的开发趋势?
前端怎么实现预览pdf文件?
程序中提升几毫秒、节省几 kB 的内存有必要吗?
和女生合租,都会发生什么事情?
新手做独立站,流量从哪里来?
字节跳动会超越腾讯吗?
现在真的是在裁员、降薪吗?