したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

【ChatGPT】AIチャット総合 避難所【Gemini・Claude】

823名無しさん:2025/09/23(火) 02:39:41 ID:LvhlPuEM
122 ななしのAIさん 2025/09/23(火) 02:10:59.67 ID:dsUBl/8B0
AI Developers Accurately Report GPQA Diamond Scores for Recent Models
https://epoch.ai/data-insights/self-reported-gpqa
https://chatgpt.com/share/68d18306-8d48-8006-a7fa-553400fa892b

AI開発各社が公表する GPQA Diamondの自己申告スコアは、第三者の標準化された独立評価と整合しているのか?を検証
→今回検証した全モデルでp>0.05


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板