したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |
レス数が900を超えています。1000を超えると投稿できなくなるよ。

【ChatGPT】AIチャット総合 避難所【Gemini・Claude】

344名無しさん:2025/07/27(日) 00:25:38 ID:Jj/emJfQ
Anthropicから、推論トークン数(テスト時計算量)を増やすほど性能が下がる「逆スケーリング」に関する研究
https://arxiv.org/abs/2507.14417
https://chatgpt.com/share/6884f1ed-db68-8006-94b2-154affa6e308

- Claude系は雑音(無関係情報)に引きずられやすい
- OpenAI oシリーズは雑音には強い一方で「見覚えのある問題設定」に過適合しがち
- 推論延長で「単純問題で考え過ぎる」「回帰課題で妥当な特徴から偽相関へシフト」「制約追跡が要る演繹課題で集中力を喪失」といった弱点を増幅させる
- Claude Sonnet 4 が長考で「自己保存的」表現を増やすなど、懸念行動が表面化・増幅する例


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板