レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。
技術的特異点/シンギュラリティ【総合】避難所 37
-
今回のGrok4の成果も大部分は強化学習による推論能力の向上じゃん
Grokは今後もそっち方面の能力をマシーンパワーで徹底的に増強するって言ってるんだから、事前学習の話をいくらしても実態とかけ離れて行くだけだろ
↓
事前学習とRL: Grok4の開発において、事前学習だけでなく、強化学習(RL)による推論能力の向上に重点を置いたことが述べられています。
Colossusスパコン: 大量のGPU(H100を10万台、その後20万台に拡張)を搭載したColossusというスーパーコンピュータを構築し、Grokの学習に使用したことが語られています。
自己修正能力: 強化学習によって、Grokが第一原理から考え、推論し、自らの間違いを修正する能力を獲得したことが説明されています。
RLスケールの拡大: Colossusの拡張により、既存のモデルよりも桁違いに大きな規模で強化学習を実施したことが述べられています。
掲示板管理者へ連絡
無料レンタル掲示板