したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

【ChatGPT】AIチャット総合 避難所【Gemini・Claude】

510名無しさん:2025/08/10(日) 03:24:10 ID:xMlS72kE
セルフプレイによる自己学習型LLMの研究が増えている

Self-Questioning Language Models

> モデルは「提案者(proposer)」と「解答者(solver)」の2役割を担い、それぞれ強化学習により訓練される。

https://arxiv.org/abs/2508.03682
https://chatgpt.com/share/689790d5-447c-8006-b457-2b7fc5309ee7


R-Zero: Self-Evolving Reasoning LLM from Zero Data
(R1-Zeroとは無関係なので注意)
https://arxiv.org/abs/2508.05004
https://chatgpt.com/share/68979191-515c-8006-becc-60585df594f9

Challenger(課題提供者)とSolver(解答者)の共進化(co‑evolution) によって、自動的かつ段階的なカリキュラムが生成され、モデルは反復学習を通じて推論能力を向上させます


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板