中国の精華大学と北京人工知能総合研究所、ペンシルベニア大学が開発した外部データを必要としない完全ゼロデータ言語モデルAbsolute Zero ReasonerはDeepMindのAlphaZeroを一般化したもので、現在の時点ではコーディングに限定したモデルがテストされている。
これは生成したコードが正常に機能するかどうかをすぐに確かめることができるからだ。
Absolute Zero Reasonerはプロポーザー(提案者)とソルバー(回答者)からなり、問題の提案とその解決つまり自問自答を繰り返すことで再帰的に自己進化する。
この過程で重要なのは問題の作成と解決を繰り返すことで進化したモデルはより優れた、よりAIの進歩を加速する問題を提案するようになるということだ。
より優れた問題つまり、AIにとって簡単過ぎたり、難し過ぎたりして、AIの進歩に結び付かない問題の提案が徐々に減り、ちょうどよい問題が提案される頻度が上昇していくことでAIの進歩が速くなるのだ。 https://x.com/DGetback47618/status/1927877824129683467