したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

技術的特異点/シンギュラリティ

416名無しさん:2025/05/30(金) 21:42:30
Artificial Analysis@ArtificialAnlys
DeepseekのR1は、Xai、Meta、および人類を飛び越えて、世界の#2 AIラボおよび議論の余地のないオープンウェイトリーダーとして縛られています

Deepseek R1 0528は、人工分析インテリジェンスインデックスで60から68にジャンプしました。これは、すべての主要なモデルで独立して実行される7つの主要な評価のインデックスです。これは、OpenaiのO1とO
3(62〜70)の違いと同じ大きさです。

これにより、Deepseek R1は、XaiのGrok 3 Mini(High)、NvidiaのLlama Nemotron Ultra、MetaのLlama 4 Maverick、AlibabaのQwen 3 253、
GoogleのGemini 2.5 Proに等しいものよりも高いインテリジェンスを位置付けています。

モデルの改善の内訳:
インテリジェンスが全面的に増加します:AIME 2024(競技数学、+21ポイント)、LiveCodeBench(コード生成、+15ポイント)、GPQAダイヤモンド(科学的推論、+10ポイント)、人類の最後の試験(推論と
知識、+6ポイント)で見られる最大のジャンプ

?アーキテクチャへの変更なし:R1-0528は、V3/R1アーキテクチャに変更なしでトレーニング後の更新です - 37Bのアクティブパラメーターを備えた大きな671Bモデルのままです

?コーディングスキルの大幅な飛躍:R1は現在、人工分析コーディングインデックスでGemini 2.5 Proを一致させており、O4-Mini(High)とO3のみの背後にあります
?トークンの使用量の増加:R1-0528は、9,900万トークンを使用して、人工分析インテリジェンスインデックスのEVALSを完了しました。新しいR1は、元のR1よりも長く考えています。これはまだ見た最高のトークン使用数
ではありません:Gemini 2.5 ProはR1-0528よりも30%多くのトークンを使用しています

AIのテイクアウト:
?オープンモデルとクローズドモデルの間のギャップはこれまで以上に小さくなっています。オープンウェイトモデルは、独自のモデルとのインテリジェンスの利益を維持し続けています。 1月のDeepseekのR1リリースは、Open
-Weightsモデルが#2ポジションを達成したのは初めてであり、DeepseekのR1アップデートは今日それを同じポジションに戻しま


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板