[
板情報
|
カテゴリランキング
]
したらばTOP
■掲示板に戻る■
全部
1-100
最新50
|
1-
101-
201-
301-
401-
501-
601-
701-
この機能を使うにはJavaScriptを有効にしてください
|
【ChatGPT】AIチャット総合 避難所【Gemini・Claude】
774
:
名無しさん
:2025/09/15(月) 09:56:24 ID:Eojri6aw
Grok 4.1 coming soon
https://x.com/elonmusk/status/1967323429889265703
これはGrok V7か?
だとすればネイティブマルチモーダル
https://x.com/elonmusk/status/1954573440234422752
775
:
名無しさん
:2025/09/15(月) 15:03:49 ID:nZPH6mwg
The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs
https://arxiv.org/abs/2509.09677
https://chatgpt.com/share/68c6e317-c39c-8006-91a0-2ba092db8caa
従来LLMではモデルサイズの増大に対して単一ステップ精度の向上は逓減するとされてきた
→実社会で重要なのは長いマルチステップのタスクを破綻なく実行し続けられる能力ではないか?
という観点から、タスク完遂可能長(horizon length)を評価尺度として定式化
「一歩ごとの精度がわずかに改善するだけで、実行可能なタスク長は指数的に伸びる」と指摘
https://i.imgur.com/TVGO7Xt.jpeg
https://i.imgur.com/M3zzUND.jpeg
(GPT-5がHorizonと呼ばれていたのは、偶然か?)
新着レスの表示
名前:
E-mail
(省略可)
:
※書き込む際の注意事項は
こちら
※画像アップローダーは
こちら
(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)
スマートフォン版
掲示板管理者へ連絡
無料レンタル掲示板