レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。
技術的特異点/シンギュラリティ【総合】避難所 34
-
>>829
ダリオ・アモデイ(Anthropic CEO)
アモデイ氏によれば、2024年初頭にはSWE-bench(ソフトウェア工学ベンチマーク)でのモデルの正答率が約3%だったのが、10ヶ月後には50%に達し、さらに1年で90%に到達する可能性があると述べている。 この急速な進歩は、既存のベンチマークがすぐに飽和することを示唆している。
サム・アルトマンの主張
アルトマン氏は、AIの進歩が一部で停滞していると見られるのは、従来のベンチマークがAIの能力を正確に評価できなくなっているためだと述べている。 彼は、AIがこれらのベンチマークを「飽和」させており、評価方法自体が時代遅れになっていると指摘している。
また、彼は2024年10月に、大規模言語モデル(LLM)が2025年にはすべての主要なベンチマークを飽和させると予測している。
掲示板管理者へ連絡
無料レンタル掲示板