レス数が900を超えています。1000を超えると投稿できなくなるよ。

【ChatGPT】AIチャット総合避難所【Gemini・Claude】

343：名無しさん：2025/07/27(日) 00:12:21 ID:Jj/emJfQ: xAIからの委託でEpoch AIがGrok 4の数学性能を独立評価したレポート
- 高校中級～上級レベルの計算系コンテスト（AIME/HMMT など）でSOTA
- 証明系（USAMO/IMO）では先端に近いが、まだ大きな伸び代
- 数学文献検索は「現行モデル中で最高クラス」
- 自分の誤答を部分的に検知できる傾向
- 人間的な直観・創造性は乏しく、計算ゴリ押しの傾向
https://epoch.ai/blog/grok-4-math
https://i.imgur.com/uDWKtTn.png
https://i.imgur.com/SAlsAib.png
https://chatgpt.com/share/6884ef64-2f78-8006-b2cc-553c5f4ce951

新着レスの表示

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

（画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります）

掲示板管理者へ連絡無料レンタル掲示板