したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

【ChatGPT】AIチャット総合 避難所【Gemini・Claude】

775名無しさん:2025/09/15(月) 15:03:49 ID:nZPH6mwg
The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs
https://arxiv.org/abs/2509.09677
https://chatgpt.com/share/68c6e317-c39c-8006-91a0-2ba092db8caa

従来LLMではモデルサイズの増大に対して単一ステップ精度の向上は逓減するとされてきた
→実社会で重要なのは長いマルチステップのタスクを破綻なく実行し続けられる能力ではないか?
という観点から、タスク完遂可能長(horizon length)を評価尺度として定式化

「一歩ごとの精度がわずかに改善するだけで、実行可能なタスク長は指数的に伸びる」と指摘
https://i.imgur.com/TVGO7Xt.jpeg
https://i.imgur.com/M3zzUND.jpeg

(GPT-5がHorizonと呼ばれていたのは、偶然か?)

776名無しさん:2025/09/15(月) 23:47:15 ID:5HMJsMrU
35 ななしのAIさん 2025/09/15(月) 23:38:15.69 ID:hUBcpo9E0
Anthropicが継続的に出している報告「Economic Index」の第3弾
https://www.anthropic.com/research/economic-index-geography
https://chatgpt.com/share/68c816b8-5630-8006-9a27-58fc785eb24f

777名無しさん:2025/09/15(月) 23:47:48 ID:5HMJsMrU
>>776

36 ななしのAIさん 2025/09/15(月) 23:39:41.65 ID:hUBcpo9E0
>> 35
タイミングが被ったのは偶然だと思うけど、ChatGPTの利用実態について初の大規模調査

How people are using ChatGPT
https://openai.com/index/how-people-are-using-chatgpt/
https://chatgpt.com/share/68c823ab-bdbc-8006-a171-1c6a8386775f

778名無しさん:2025/09/15(月) 23:48:22 ID:5HMJsMrU
37 ななしのAIさん 2025/09/15(月) 23:46:43.70 ID:hUBcpo9E0
Anthropicが新機能、コードネーム「Konmari」を準備中
Anthropic Consoleの大幅な改修が来るか
https://x.com/btibor91/status/1967547143708930174

779名無しさん:2025/09/16(火) 00:15:13 ID:5HMJsMrU
38 ななしのAIさん 2025/09/16(火) 00:13:32.14 ID:wK3bvJcq0
LLaDA-VLA
ロボット制御用のVLA(視覚言語モデル)に、拡散モデルを応用する試み
https://wenyuqing.github.io/llada-vla/
https://chatgpt.com/share/68c82cfe-f648-8006-820b-12fda1c96715

780名無しさん:2025/09/16(火) 02:15:51 ID:5HMJsMrU
42 ななしのAIさん 2025/09/16(火) 02:14:13.75 ID:wK3bvJcq0
gpt-5-codex low
gpt-5-codex medium
gpt-5-codex high
https://pbs.twimg.com/media/G05rhngXUAAz8cT.png

TechCrunchの記事
> OpenAIは、AIコーディングエージェントであるCodexの新しいバージョンであるGPT-5-Codexをリリースしました。
https://techcrunch.com/2025/09/15/openai-upgrades-codex-with-a-new-version-of-gpt-5/
https://poe.com/s/4pcv4kSJUNF15Do8PMIY

781名無しさん:2025/09/16(火) 02:28:56 ID:5HMJsMrU
>>780

43 ななしのAIさん 2025/09/16(火) 02:28:14.13 ID:wK3bvJcq0
>> 42
公式発表とシステムカード
https://openai.com/index/introducing-upgrades-to-codex/
https://openai.com/index/gpt-5-system-card-addendum-gpt-5-codex/
https://chatgpt.com/share/68c84bf7-39f0-8006-85f2-3e95d04fdc96

GPT-5をベースにソフトウェアエンジニアリングに特化して最適化された新モデル


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板