[
板情報
|
カテゴリランキング
]
したらばTOP
■掲示板に戻る■
全部
1-100
最新50
|
1-
101-
201-
301-
401-
この機能を使うにはJavaScriptを有効にしてください
|
技術的特異点/シンギュラリティ
157
:
名無しさん
:2025/05/12(月) 18:54:51
これらの現象は、ベースモデルのRLをTabula Rasa RLと根本的に異なります。ここでは、ポリシーのオンラインエクスペリエンスがモデルの環境表現を形作る上で主要な義務を果たさなければなりません。 「トレーニング前の
天井」を過ぎて破るには、おそらくループ内の人間とモデルの両方を備えた現実世界のアプリケーションに基づいたシステムに基づいて、おそらく新しいタスクと環境を継続的に収集して発明する必要があります。ブートストラップこのアクティ
ブなデータ収集ループは、モデルと並行して、継続的に改善された緊急性の向上につながる真のオープンエンド学習を達成するための鍵となります。重要なことに、この継続的な学習体制では、トレーニング前またはトレーニング後の間には実際
には区別されていませんが、トレーニングのみが区別されていません。
2025年05月10日 21:12
https://pbs.twimg.com/media/GqljvRxXkAAYOVC.png
https://x.com/MinqiJiang/status/1921176396228952253
新着レスの表示
名前:
E-mail
(省略可)
:
※書き込む際の注意事項は
こちら
※画像アップローダーは
こちら
(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)
スマートフォン版
掲示板管理者へ連絡
無料レンタル掲示板