レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。
技術的特異点/シンギュラリティ【総合】避難所 25
-
ところで私は研究者ということもあり、OpenAIのChatGPT、Google Gemini pro、Anthropic Claudeの全てに課金している稀有なユーザー(周りの研究者は意外と一部は切ってる)なので、OpenAI o1を含め東大数学試験を解かせてみました
結果として確かにOpenAI o1はかなり精度よく解けました。
2024年前期試験の理系数学の第2問
OpenAI o1:正答2.5(問3の二つめだけ間違い)
ChatGPT GPT-4、GPT-4o:正答1
Gemini pro:正答2(強い!)
Claude3.5:正答1
サンプル数が少なすぎてなんとも言えないのと、さすがに自分では本格的に検証する時間が取れないのですが、以前に「現在の生成AIは東大の数学試験は解けん。まだまだ」としていた企画は、OpenAI o1で今やれば相当な域に達する気はします。
https://x.com/ImAI_Eruel/status/1834399272277811419
掲示板管理者へ連絡
無料レンタル掲示板