レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。
技術的特異点/シンギュラリティ【総合】避難所 32
-
本日、当社は、最先端の推論モデル (DeepSeek-R1 など) に匹敵する、わずか 320 億のパラメータを持つ新しい推論モデル QwQ-32B をリリースしました。
ブログ: https://qwenlm.github.io/blog/qwq-32b
HF: https://huggingface.co/Qwen/QwQ-32B
モデルスコープ: https://modelscope.cn/models/Qwen/QwQ-32B
デモ: https://huggingface.co/spaces/Qwen/QwQ-32B-Demo Qwen
チャット: https://chat.qwen.ai
今回は、RL をスケーリングするためのレシピを調査し、Qwen2 に基づいてQwQ2.5-32Bでいくつかの印象的な結果を達成しました。RL トレーニングにより、特に数学とコーディングのパフォーマンスが継続的に向上することがわかり、RL の継続的なスケーリングにより、中規模のモデルが巨大な MoE モデルに対して競争力のあるパフォーマンスを実現できることが観察されました。新しいモデルについてお気軽にチャットし、フィードバックをお寄せください。
https://x.com/Alibaba_Qwen/status/1897361654763151544
https://pbs.twimg.com/media/GlTGp0ka4AMiW_Q?format=jpg&name=4096x4096
掲示板管理者へ連絡
無料レンタル掲示板