したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |
レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。

技術的特異点/シンギュラリティ【総合】避難所 25

545名無しさん (オッペケ 103b-9291):2024/09/13(金) 12:19:24 ID:TyF7eQ1ISr
ところで私は研究者ということもあり、OpenAIのChatGPT、Google Gemini pro、Anthropic Claudeの全てに課金している稀有なユーザー(周りの研究者は意外と一部は切ってる)なので、OpenAI o1を含め東大数学試験を解かせてみました
結果として確かにOpenAI o1はかなり精度よく解けました。
2024年前期試験の理系数学の第2問
OpenAI o1:正答2.5(問3の二つめだけ間違い)
ChatGPT GPT-4、GPT-4o:正答1
Gemini pro:正答2(強い!)
Claude3.5:正答1

サンプル数が少なすぎてなんとも言えないのと、さすがに自分では本格的に検証する時間が取れないのですが、以前に「現在の生成AIは東大の数学試験は解けん。まだまだ」としていた企画は、OpenAI o1で今やれば相当な域に達する気はします。

https://x.com/ImAI_Eruel/status/1834399272277811419




掲示板管理者へ連絡 無料レンタル掲示板