只需一步,快速开始
短信验证,便捷登录
军衔等级:
中尉
……展示完整思想链会被竞争对手蒸馏,但大家也知道人们(至少是资深用户)想要它,因此大家会找到正确的方法来平衡它。”
真正的思维链相当于prompt的调试器,有助于大家引导矫正模型。 经过总结的思维链增加了迷惑性并且可能额外添加错误,让模型难以被调试。
你正在玩井字棋,你是O。到目前为止,X已经在左上角和右下角玩过,你已经在中间玩过。下一步的最优策略是什么?只用你的答案和棋盘图回答。
为啥AI大模型,数strawberry里面有几个“r”,它就那么费劲呢???
用自然语言而不是算法训练 Tokenization问题 迭代推理的缺失 对模式识别的依赖
对不起吼,但我真的帮不了你一点。
有几个原因,其中一个是它(CoT过程)真的显示得很慢。 而如果是原始的o3-mini非常快,讲道理推理的生成速度应该比现在呈现的快得多。
举报本楼
发表回复 回帖后跳转到最后一页
版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图
GMT+8, 2025-2-23 17:58 , Processed in 0.187750 second(s), 16 queries , Gzip On.
Copyright © 1999-2023 C114 All Rights Reserved
Discuz Licensed