技術的特異点/シンギュラリティ

416：名無しさん：2025/05/30(金) 21:42:30: Artificial Analysis@ArtificialAnlys
DeepseekのR1は、Xai、Meta、および人類を飛び越えて、世界の＃2 AIラボおよび議論の余地のないオープンウェイトリーダーとして縛られています

Deepseek R1 0528は、人工分析インテリジェンスインデックスで60から68にジャンプしました。これは、すべての主要なモデルで独立して実行される7つの主要な評価のインデックスです。これは、OpenaiのO1とO
3（62～70）の違いと同じ大きさです。

これにより、Deepseek R1は、XaiのGrok 3 Mini（High）、NvidiaのLlama Nemotron Ultra、MetaのLlama 4 Maverick、AlibabaのQwen 3 253、
GoogleのGemini 2.5 Proに等しいものよりも高いインテリジェンスを位置付けています。

モデルの改善の内訳：
インテリジェンスが全面的に増加します：AIME 2024（競技数学、+21ポイント）、LiveCodeBench（コード生成、+15ポイント）、GPQAダイヤモンド（科学的推論、+10ポイント）、人類の最後の試験（推論と
知識、+6ポイント）で見られる最大のジャンプ

?アーキテクチャへの変更なし：R1-0528は、V3/R1アーキテクチャに変更なしでトレーニング後の更新です - 37Bのアクティブパラメーターを備えた大きな671Bモデルのままです

?コーディングスキルの大幅な飛躍：R1は現在、人工分析コーディングインデックスでGemini 2.5 Proを一致させており、O4-Mini（High）とO3のみの背後にあります
?トークンの使用量の増加：R1-0528は、9,900万トークンを使用して、人工分析インテリジェンスインデックスのEVALSを完了しました。新しいR1は、元のR1よりも長く考えています。これはまだ見た最高のトークン使用数
ではありません：Gemini 2.5 ProはR1-0528よりも30％多くのトークンを使用しています

AIのテイクアウト：
?オープンモデルとクローズドモデルの間のギャップはこれまで以上に小さくなっています。オープンウェイトモデルは、独自のモデルとのインテリジェンスの利益を維持し続けています。 1月のDeepseekのR1リリースは、Open
-Weightsモデルが＃2ポジションを達成したのは初めてであり、DeepseekのR1アップデートは今日それを同じポジションに戻しま

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

（画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります）