したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

【ChatGPT】AIチャット総合 避難所【Gemini・Claude】

774名無しさん:2025/09/15(月) 09:56:24 ID:Eojri6aw
Grok 4.1 coming soon
https://x.com/elonmusk/status/1967323429889265703

これはGrok V7か?
だとすればネイティブマルチモーダル
https://x.com/elonmusk/status/1954573440234422752

775名無しさん:2025/09/15(月) 15:03:49 ID:nZPH6mwg
The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs
https://arxiv.org/abs/2509.09677
https://chatgpt.com/share/68c6e317-c39c-8006-91a0-2ba092db8caa

従来LLMではモデルサイズの増大に対して単一ステップ精度の向上は逓減するとされてきた
→実社会で重要なのは長いマルチステップのタスクを破綻なく実行し続けられる能力ではないか?
という観点から、タスク完遂可能長(horizon length)を評価尺度として定式化

「一歩ごとの精度がわずかに改善するだけで、実行可能なタスク長は指数的に伸びる」と指摘
https://i.imgur.com/TVGO7Xt.jpeg
https://i.imgur.com/M3zzUND.jpeg

(GPT-5がHorizonと呼ばれていたのは、偶然か?)


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板