我的OpenAI-o1初步总结 - 600字看完~
o1(之前代号为草莓)的亮点及相关背景:
- 大模型过往最大的挑战之一是无论遇到复杂还是简单的问题都只会用“系统1”来思考(也就是脱口而出),而我们人类在遇到复杂问题的时候会使用“系统2”的深度思考模式(这也是为什么COT的提示词技巧能带来模型结果的提升);
- o1是一个在给出最终答案之前进行思考的模型,可以通过强化学习(RL)训练模型以获得更好的思维链。这为scaling开辟了一个新的维度:基座模型可以不再受预训练的瓶颈限制,现在也可以从scale推理计算着手来提升性能;
- 虽然目前o1的思考时间以十几秒为单位,但想象一下,未来AI如果能像人一样思考数小时、数天甚至数周,是否能有可能解决复杂的科学问题,带来新的突破?


