レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。

技術的特異点/シンギュラリティ【総合】避難所 25

545：名無しさん (ｵｯﾍﾟｹ 103b-9291)：2024/09/13(金) 12:19:24 ID:TyF7eQ1ISr: ところで私は研究者ということもあり、OpenAIのChatGPT、Google Gemini pro、Anthropic Claudeの全てに課金している稀有なユーザー（周りの研究者は意外と一部は切ってる）なので、OpenAI o1を含め東大数学試験を解かせてみました
結果として確かにOpenAI o1はかなり精度よく解けました。
2024年前期試験の理系数学の第２問
OpenAI o1：正答2.5（問3の二つめだけ間違い）
ChatGPT GPT-4、GPT-4o：正答1
Gemini pro：正答2（強い！）
Claude3.5：正答1

サンプル数が少なすぎてなんとも言えないのと、さすがに自分では本格的に検証する時間が取れないのですが、以前に「現在の生成AIは東大の数学試験は解けん。まだまだ」としていた企画は、OpenAI o1で今やれば相当な域に達する気はします。

https://x.com/ImAI_Eruel/status/1834399272277811419

掲示板管理者へ連絡無料レンタル掲示板