核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
代码:
5 月 28 日 DeepSeek R1 模型完成小版本试升级并开源,具体有哪些提升?使用体验如何?
伊朗和以色列为什么此时爆发冲突?背后有哪些深层原因?
为什么鸿蒙PC要排斥Linux生态?
30岁了,你在深圳过着什么样的生活?
你的亲戚提过什么过分的要求?
匿名说一下你最近的烦恼吧?
systemd吞并了什么?
苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗?
***拍大尺度片子时摄影师不会看光吗?
如何评价字节跳动开源的 HTTP 框架 Hertz ?
为什么现在的药品名都不直接写明治什么病,而是用一堆奇怪的音译名?
如何看待亮亮丽君夫妇中的女主又怀孕?
你做过最抽象的事情是什么?
以色列是如何从三天前的不可一世要灭了伊朗到今天的哭哭啼啼要“为生存而战”的?
有哪些外行看起来很陋(low),但是内行人却觉得很高大上的东西?
如何看待rust编写的zed编辑器?
中年夫妻有多少生活和谐的?
如何评价字节跳动开源的 Netpoll?
大街上看到大白腿,忍不住瞄了两眼,算不算不尊重女性?
为什么QQ上的网络状态没有了?
为什么小爱音箱只能播放qq音乐免费音乐?
苏炳添在 2025 全国田径大奖赛蚌埠站 100 米预赛中止步小组第三,背后的原因可能有哪些?
稿定设计这个平台的兼职怎么样?
PHP和Node.js哪个更爽?
你们学校的校花都是怎么样的?
你在出租房屋发现过什么前租客留下的“宝藏”?
如何评价前端框架 Solid?
我国新一代载人飞船「梦舟」零高度逃逸飞行试验成功,该实验有怎样的意义?「梦舟」在未来会发挥哪些作用?
目前最具性价比的全栈路线是啥?