[
板情報
|
カテゴリランキング
]
したらばTOP
■掲示板に戻る■
全部
1-100
最新50
|
1-
101-
201-
301-
401-
この機能を使うにはJavaScriptを有効にしてください
|
技術的特異点/シンギュラリティ
416
:
名無しさん
:2025/05/30(金) 21:42:30
Artificial Analysis@ArtificialAnlys
DeepseekのR1は、Xai、Meta、および人類を飛び越えて、世界の#2 AIラボおよび議論の余地のないオープンウェイトリーダーとして縛られています
Deepseek R1 0528は、人工分析インテリジェンスインデックスで60から68にジャンプしました。これは、すべての主要なモデルで独立して実行される7つの主要な評価のインデックスです。これは、OpenaiのO1とO
3(62〜70)の違いと同じ大きさです。
これにより、Deepseek R1は、XaiのGrok 3 Mini(High)、NvidiaのLlama Nemotron Ultra、MetaのLlama 4 Maverick、AlibabaのQwen 3 253、
GoogleのGemini 2.5 Proに等しいものよりも高いインテリジェンスを位置付けています。
モデルの改善の内訳:
インテリジェンスが全面的に増加します:AIME 2024(競技数学、+21ポイント)、LiveCodeBench(コード生成、+15ポイント)、GPQAダイヤモンド(科学的推論、+10ポイント)、人類の最後の試験(推論と
知識、+6ポイント)で見られる最大のジャンプ
?アーキテクチャへの変更なし:R1-0528は、V3/R1アーキテクチャに変更なしでトレーニング後の更新です - 37Bのアクティブパラメーターを備えた大きな671Bモデルのままです
?コーディングスキルの大幅な飛躍:R1は現在、人工分析コーディングインデックスでGemini 2.5 Proを一致させており、O4-Mini(High)とO3のみの背後にあります
?トークンの使用量の増加:R1-0528は、9,900万トークンを使用して、人工分析インテリジェンスインデックスのEVALSを完了しました。新しいR1は、元のR1よりも長く考えています。これはまだ見た最高のトークン使用数
ではありません:Gemini 2.5 ProはR1-0528よりも30%多くのトークンを使用しています
AIのテイクアウト:
?オープンモデルとクローズドモデルの間のギャップはこれまで以上に小さくなっています。オープンウェイトモデルは、独自のモデルとのインテリジェンスの利益を維持し続けています。 1月のDeepseekのR1リリースは、Open
-Weightsモデルが#2ポジションを達成したのは初めてであり、DeepseekのR1アップデートは今日それを同じポジションに戻しま
新着レスの表示
名前:
E-mail
(省略可)
:
※書き込む際の注意事項は
こちら
※画像アップローダーは
こちら
(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)
スマートフォン版
掲示板管理者へ連絡
無料レンタル掲示板