レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。
技術的特異点/シンギュラリティ【総合】避難所 32
-
GPT-4.5のSWEベンチのスコア38点…まあGPT-4oの31点よりはマシだけどイマドキo1は48点、o3-miniは61点、Sonnet3.7は62点。Llama3-SWE-RL-70Bでさえ41点でメッチャ負けてます。通夜ムードの配信から感じた通り、GPT-4.5という名前の迫力からするとなさけないスコア。GPT-4.1にしといた方がよかった
https://x.com/umiyuki_ai/status/1895209101799633051
掲示板管理者へ連絡
無料レンタル掲示板