レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。
技術的特異点/シンギュラリティ【総合】避難所 25
-
自ら思考してどんどん賢くなって行くってことやね
思考の連鎖
人間が難しい質問に回答する前に長い時間考えるのと同じように、o1 は問題を解決しようとするときに思考の連鎖を使用します。強化学習を通じて、o1 は思考の連鎖を磨き、使用する戦略を洗練することを学びます。間違いを認識して修正することを学びます。難しいステップをより単純なステップに分解することを学びます。現在のアプローチが機能しない場合は、別のアプローチを試すことを学びます。このプロセスにより、モデルの推論能力が劇的に向上します。
掲示板管理者へ連絡
無料レンタル掲示板