したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |
レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。

技術的特異点/シンギュラリティ【総合】避難所 34

831名無しさん (スプー ec69-b52c):2025/05/25(日) 20:44:05 ID:nSkp3N6kSd
>>829
ダリオ・アモデイ(Anthropic CEO)

アモデイ氏によれば、2024年初頭にはSWE-bench(ソフトウェア工学ベンチマーク)でのモデルの正答率が約3%だったのが、10ヶ月後には50%に達し、さらに1年で90%に到達する可能性があると述べている。 この急速な進歩は、既存のベンチマークがすぐに飽和することを示唆している。

サム・アルトマンの主張

アルトマン氏は、AIの進歩が一部で停滞していると見られるのは、従来のベンチマークがAIの能力を正確に評価できなくなっているためだと述べている。 彼は、AIがこれらのベンチマークを「飽和」させており、評価方法自体が時代遅れになっていると指摘している。

また、彼は2024年10月に、大規模言語モデル(LLM)が2025年にはすべての主要なベンチマークを飽和させると予測している。




掲示板管理者へ連絡 無料レンタル掲示板