したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |
レス数が900を超えています。1000を超えると投稿できなくなるよ。

【ChatGPT】AIチャット総合 避難所【Gemini・Claude】

343名無しさん:2025/07/27(日) 00:12:21 ID:Jj/emJfQ
xAIからの委託でEpoch AIがGrok 4の数学性能を独立評価したレポート
- 高校中級〜上級レベルの計算系コンテスト(AIME/HMMT など)でSOTA
- 証明系(USAMO/IMO)では先端に近いが、まだ大きな伸び代
- 数学文献検索は「現行モデル中で最高クラス」
- 自分の誤答を部分的に検知できる傾向
- 人間的な直観・創造性は乏しく、計算ゴリ押しの傾向
https://epoch.ai/blog/grok-4-math
https://i.imgur.com/uDWKtTn.png
https://i.imgur.com/SAlsAib.png
https://chatgpt.com/share/6884ef64-2f78-8006-b2cc-553c5f4ce951


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板