レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。
技術的特異点/シンギュラリティ【総合】避難所 27
-
最近推論時間、テスト時間方向へのllmスケーリングが調査されてきている。
・14倍大きなモデルよりも推論時間を増やした小さなモデルのほうが簡単な問題では効果的。
・また、推論時間を増やす方法としてはbest-of-Nサンプリングがよく用いられるが、そうじゃなくプロセスベースの報酬モデル(PRM)や出力をllmが自己改善的に修正する手法を上手く組み合わせる(計算最適な手法)と4倍効率が良い。
最近他にも推論時間に関するスケーリング則も報告されている。
エージェント時代前夜という感じだ。
https://x.com/bioshok3/status/1821010777903636629
掲示板管理者へ連絡
無料レンタル掲示板