[
板情報
|
カテゴリランキング
]
したらばTOP
■掲示板に戻る■
全部
1-100
最新50
|
1-
101-
201-
301-
401-
この機能を使うにはJavaScriptを有効にしてください
|
技術的特異点/シンギュラリティ
293
:
名無しさん
:2025/05/16(金) 20:45:02
RLでクリエイティブライティングを強化する場合、単語の非重複度合いを測ったりできますよね?それを報酬モデルとして作ればいい。ただ、ランダムな単語を滅茶苦茶な順序で出力するだけの言語モデルになってしまう可能性もあるのでイン
ストラクションフォロイングやグラマーも測定する必要がありますよね?もし、数学やプログラミング以外の検証が難しい領域で強化学習する場合、どんな領域があり、どんな検証方法が考えられますか?また超人的レベルに至るにはどうしたら
良いと思いますか?私は自己回帰トランスフォーマーと強化学習で基本的に全てのことは学習出来ると信じています。
https://chatgpt.com/share/6826c394-3b74-800e-9f1e-88ac88c104e4
新着レスの表示
名前:
E-mail
(省略可)
:
※書き込む際の注意事項は
こちら
※画像アップローダーは
こちら
(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)
スマートフォン版
掲示板管理者へ連絡
無料レンタル掲示板