レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。

技術的特異点/シンギュラリティ【総合】避難所 34

831：名無しさん (ｽﾌﾟｰ ec69-b52c)：2025/05/25(日) 20:44:05 ID:nSkp3N6kSd: >>829
ダリオ・アモデイ（Anthropic CEO）

アモデイ氏によれば、2024年初頭にはSWE-bench（ソフトウェア工学ベンチマーク）でのモデルの正答率が約3%だったのが、10ヶ月後には50%に達し、さらに1年で90%に到達する可能性があると述べている。この急速な進歩は、既存のベンチマークがすぐに飽和することを示唆している。

サム・アルトマンの主張

アルトマン氏は、AIの進歩が一部で停滞していると見られるのは、従来のベンチマークがAIの能力を正確に評価できなくなっているためだと述べている。彼は、AIがこれらのベンチマークを「飽和」させており、評価方法自体が時代遅れになっていると指摘している。

また、彼は2024年10月に、大規模言語モデル（LLM）が2025年にはすべての主要なベンチマークを飽和させると予測している。

掲示板管理者へ連絡無料レンタル掲示板