【ChatGPT】AIチャット総合避難所【Gemini・Claude】

774：名無しさん：2025/09/15(月) 09:56:24 ID:Eojri6aw: Grok 4.1 coming soon
https://x.com/elonmusk/status/1967323429889265703

これはGrok V7か？
だとすればネイティブマルチモーダル
https://x.com/elonmusk/status/1954573440234422752
775：名無しさん：2025/09/15(月) 15:03:49 ID:nZPH6mwg: The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs
https://arxiv.org/abs/2509.09677
https://chatgpt.com/share/68c6e317-c39c-8006-91a0-2ba092db8caa

従来LLMではモデルサイズの増大に対して単一ステップ精度の向上は逓減するとされてきた
→実社会で重要なのは長いマルチステップのタスクを破綻なく実行し続けられる能力ではないか？
という観点から、タスク完遂可能長（horizon length）を評価尺度として定式化

「一歩ごとの精度がわずかに改善するだけで、実行可能なタスク長は指数的に伸びる」と指摘
https://i.imgur.com/TVGO7Xt.jpeg
https://i.imgur.com/M3zzUND.jpeg

（GPT-5がHorizonと呼ばれていたのは、偶然か？）

新着レスの表示

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

（画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります）

掲示板管理者へ連絡無料レンタル掲示板