したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |
レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。

技術的特異点/シンギュラリティ【総合】避難所 33

969名無しさん (アウアウ 622a-2a3b):2025/04/28(月) 18:18:19 ID:.xa9cXhASa
この支援システムは「ハーネス」と呼ばれる。 ハーネスは、画面だけでは判別しづらい情報をAIに与えたり、経路探索やテキスト情報保存などの専用ツールを提供することでAIを助ける、いわゆる足場だ。 実際はこの影響が非常に大きく、ゲームプレイを大きく左右する。そして、その足場はそれぞれ違う。

ある研究者が独自のハーネスを使って様々なAIモデルをテストした結果、「注釈なしの画面だけでは、主人公の寝室から出ることすら困難」だったと報告している。 つまり、現在出ている「Gemini 2.5 Proは8つのバッジを獲得し、残りは四天王」というのは、実際にはハーネスの力を多大に借りての成果だ。

なので、「Claude 3.7 Sonnetはバッジ3つまでで、Gemini 2.5 Proは8つ獲ったから、Geminiの方が凄い」とはならず、実際はそれぞれが立っている足場が違うのだから比較はできない。 また、人間は補助なしでゲームをプレイできるので、その意味でフェアに比較すると、AIはまだまだという結論だ。

足場による補助なしでは著しく能力が落ちるという同様の結果は、ARC-AGIでも確認されているとのこと。 このギャップはわりと深刻かもしれない。




掲示板管理者へ連絡 無料レンタル掲示板